מודל (סטטיסטיקה)

בסטטיסטיקהמודל הוא תיאור מתמטי של תהליך הסתברותי שממנו התקבל מדגם, המגלם בתוכו אוסף של הנחות לגבי התהליך. במקרים רבים, המודל הסטטיסטי מייצג את התהליך שייצר את הנתונים במידה ניכרת של הפשטה.

המודל הסטטיסטי מורכב ממשפחה של התפלגויות הסתברות התואמות להנחות המגולמות בו, מתוך הנחה שלפחות חלק מההתפלגויות דומות מספיק להתפלגות שממנה נדגמו הנתונים. התפלגויות ההסתברות הכרוכות במודלים סטטיסטיים הן מה שמבדיל בין מודלים סטטיסטיים לבין מודלים מתמטיים אחרים, שאינם סטטיסטיים.

המודל הסטטיסטי מוגדר בדרך כלל על ידי משוואות מתמטיות שמעורב בהם משתנה מקרי אחד או יותר ואולי גם משתנים שאינם מקריים. מתוך כך אומרים לפעמים כי המודל הסטטיסטי הוא "ייצוג פורמלי של תאוריה"[1]

מודל סטטיסטי עומד בבסיסה של כל בדיקת השערות וכל אמידה סטטיסטית. באופן כללי יותר, מודלים סטטיסטיים הם אחד מיסודותיה של ההסקה הסטטיסטית.

הגדרה

באופן פורמלי, מקובל להגדיר מודל כזוג הסדור , כאשר הוא מרחב כל התצפיות האפשריות (או: מרחב הנתונים), ו- הוא אוסף התפלגויות הסתברות על .[2] בהקשרים מסוימים, עשויים לוותר על הציון המפורש של , וקוראים מודל סטטיסטי לאוסף .

ניתן להבין הגדרה זו, תחת ההנחה שיש התפלגות הסתברות "אמיתית" המשויכת לתהליך שיצר את הנתונים שהתקבלו. במקרה זה, מסמנים ב- קבוצה (של התפלגויות) אשר מכילה התפלגות שהיא קירוב מספיק טוב של ההתפלגות האמיתית.  לא חייבת בהכרח להכיל את ההתפלגות האמיתית, ובפועל היא מכילה אותה רק לעיתים נדירות. אכן, כפי שטענו ברנהם ואנדרסון, "מודל הוא הפשטה או קירוב של המציאות, ולכן איננו משקף את כלל המציאות"[3] – ומכאן מגיעה גם האמרה: "כל המודלים שגויים".

לקבוצה  כמעט תמיד יש פרמטר סטטיסטי שמשמש לה כאינדקס: . הקבוצה  מגדירה את הפרמטרים האפשריים של המודל. בדרך כלל, דורשים מהפרמטריזציה של שתהיה חד-חד-ערכית: כל זוג פרמטרים השונים זה מזה מהווים אינדקס להתפלגויות שונות. כלומר, בהכרח . במקרה כזה אומרים שהמודל ניתן לזיהוי.

דוגמה

נניח אוכלוסייה של תלמידי בית ספר, כך שגילם של הילדים באוכלוסייה מתפלג באופן אחיד. גובהו של כל ילד קשור באופן סטוכסטי לגילו: למשל, אם ילד הוא בן 7, זה משפיע על הסיכוי של הגובה שלו להיות מטר וחצי. ניתן להציג את מערכת היחסים הזו בצורת מודל רגרסיה ליניארית, למשל:

כאשר הוא גובהו של התלמיד ה-,‏ הוא גילו,  הוא החיתוך של קו הרגרסיה עם הציר האנכי (הקו )‏, הוא פרמטר שיש להכפיל בו את הגיל כדי לקבל תחזית לגובה, ו- הוא איבר שגיאה. המודל מניח שניתן לנבא את גובהו של תלמיד על ידי גילו, עד כדי שגיאה כלשהי.

מודל קביל חייב להיות עקבי עם כל הנתונים. לפיכך, הקו ישר () לא יכול להיות המשוואה עבור מודל הנתונים, כי הוא אינו מתאים בדיוק לכל הנתונים – התאמה תתקיים רק אם כל הנתונים נמצאים בדיוק על הקו. לכן, כדי שהמודל יהיה תואם לכל הנתונים, משוואת המודל כוללת גם איבר שגיאה .

כדי לבצע הסקה סטטיסטית, יש קודם כל להניח לאיזו משפחה של התפלגויות הסתברות שייך איבר השגיאה . למשל, ניתן (ולפעמים מקובל) להניח כי  הם משתנים מקריים נורמליים שווי-התפלגות בלתי-תלויים (לשם הקיצור: ש"ה ב"ת), בעלי תוחלת 0. במקרה זה, למודל יש 3 פרמטרים: , , והשונות של ההתפלגות הנורמלית ().

ניתן להגדיר את המודל באופן רשמי בצורה כדלקמן: מרחב הנתונים של המודל, , הוא קבוצת כל הזוגות (גיל, גובה) האפשריים. כל ערך אפשרי של  קובע התפלגות על ; נסמן את התפלגות זו ב-. אם היא קבוצת כל הערכים האפשריים של , אז . קל לבדוק שפרמטריזציה כזו היא ניתנת לזיהוי.

המודל נקבע על ידי: (א) קביעה של , (ב) קביעת כמה הנחות רלוונטיות עבור . בדוגמה לעיל, מניחים כי ניתן לקרב את הגובה כפונקציה ליניארית של הגיל וכי השגיאות של הקירוב מתפלגות נורמלית והן בלתי-תלויות. הנחות אלו מספיקות כדי לקבוע את , כנדרש.

ממדי המודל

נניח מודל סטטיסטי ונסמן . נאמר כי המודל הוא פרמטרי אם הממד של  סופי. באופן פורמלי, מסמנים , כאשר k הוא מספר חיובי ( מציין את שדה המספרים הממשיים; באופן עקרוני, ניתן להשתמש גם בקבוצות אחרות במקומו). כאן, k נקרא הממד של המודל.

למשל, אם נניח כי הנתונים מגיעים מהתפלגות גאוסית חד־ממדית, אז אנו מניחים כי

.

בדוגמה זו, הממד k שווה ל-2.

כדוגמה נוספת, נניח כי הנתונים הם אוסף של נקודות (x, y), אנחנו מניחים שההתפלגות שלהם מתוארת על ידי קו ישר עם סטיות נורמליות שוות-התפלגות בלתי-תלויות (עם תוחלת אפס). במקרה כזה, הממד של המודל הסטטיסטי הוא 3: נקודת החיתוך של הקו, השיפוע של הקו, והשונות של הסטיות.

אם הממד של אינו סופי, אומרים שהמודל הוא לא-פרמטרי או א-פרמטרי. למשל, במודל שמניח שלנתונים יש צפיפות הסתברות רציפה על קטע , אז היא קבוצת כל הפונקציות הרציפות על הקטע (), שהיא בעלת ממד אינסופי.

סטטיסטי מספיק

ערך מורחב – סטטיסטי מספיק

כל פונקציה של המדגם שאינה תלויה בפרמטר נקראת סטטיסטי. אומרים שסטטיסטי הוא מספיק, אם ההתפלגות המותנית של הנתונים בסטטיסטי היא קבועה ביחס לפרמטרים של המודל.

אינטואיטיבית, סטטיסטי הוא מספיק עבור מודל, אם הערך של הסטטיסטי מכיל את כל המידע לגבי ההתפלגות שממנה נלקח המדגם.

משפחות מודלים

מודלים מעריכיים

ערך מורחב – משפחה מעריכית

מודלים רבים ניתן לכתוב בצורה

ובכלל זה, מודלים שמבוססים על הרבה התפלגויות "מפורסמות", כמו ההתפלגות הנורמלית והתפלגות פואסון.

מודל רגרסיה

מודל שמטרתו לזהות יחס בין קבוצת משתנים ("מסבירים") למשתנה אחר ("מוסבר") נקרא מודל רגרסיה. לרגרסיה צורות רבות, אבל הנפוצה והמפורסמת מביניהן היא רגרסיה ליניארית (ראו דוגמה לעיל), שמניחה שהמשתנה המוסבר הוא פונקציה ליניארית של המשתנים המסבירים.

מקורות

לקריאה נוספת

  • Davison A.C. (2008), Statistical Models, Cambridge University Press.
  • Freedman D.A. (2009), Statistical Models, Cambridge University Press.
  • Helland I.S. (2010), Steps Towards a Unified Basis for Scientific Models and Methods, World Scientific.
  • Kroese D.P., Chan J.C.C. (2014), Statistical Modeling and Computation, Springer.
  • Stapleton J.H. (2007), Models for Probability and Statistical Inference, Wiley-Interscience.

קישורים חיצוניים

ויקישיתוף מדיה וקבצים בנושא מודל בוויקישיתוף

הערות שוליים

  1. ^ קנת בולן (Kenneth A. Bollen), לפי ציטוט של הרמן אדר [Herman J. Adèr]).‏(Adèr 2008, p. 280)
  2. ^ McCullagh 2002.
  3. ^ Burnham & Anderson 2002, §1.2.5

Read other articles:

Departemen, teritori seberang laut, dan klaim Antartika Prancis Artikel ini merupakan bagian dariPembagian administratif Prancis Region (termasuk region seberang laut) Departemen (termasuk departemen seberang laut) Arondisemen Kanton Interkomunalitas Komunitas urban Komunitas aglomerasi Komunitas komune Sindikat Aglomerasi Baru Komune Gabungan komune Arondisemen kota Lainnya dalam Prancis Seberang Laut Jajahan seberang laut Jajahan sui generis Negara seberang laut Teritori seberang laut Pulau...

 

Marsekal YugoslaviaJosip Broz TitoTito saat berkunjung ke India tahun 1954. Presiden Yugoslavia ke-1Masa jabatan14 Januari 1953 – 4 Mei 1980Perdana MenteriJosip Broz Tito (1953–1963)Petar Stambolić (1963–1967)Mika Špiljak (1967–1969)Mitja Ribičič (1969–1971)Džemal Bijedić (1971–1977)Veselin Đuranović (1977–1980)Wakil PresidenAleksandar Ranković (1963–1966)Koča Popović (1966–1967) PendahuluIvan Ribar(sebagai Presiden Kepresidenan Majelis Rakyat Republi...

 

Voce principale: Avezzano Calcio. Football Club AvezzanoStagione 1978-1979Sport calcio Squadra Avezzano Allenatore Feliciano Orazi Franco Panzieri Guido Liberati Presidente Ugo Graziani Francesco Fedele e Gino Lolli Serie C216º posto nel girone C. 1977-1978 1979-1980 Si invita a seguire il modello di voce Questa pagina raccoglie le informazioni riguardanti il Football Club Avezzano nelle competizioni ufficiali della stagione 1978-1979. Stadio dei Marsi di Avezzano Indice 1 Rosa 1.1 Ros...

Wrestling Ernest HemingwayTheatrical release posterSutradaraRanda HainesProduserTodd BlackDitulis olehSteve ConradPemeranRobert DuvallRichard HarrisPiper LaurieSandra BullockShirley MacLaineSinematograferLajos KoltaiPenyuntingPaul HirschDistributorWarner Bros.Tanggal rilisDecember 17, 1993Durasi123 menitNegaraAmerika SerikatBahasaInggrisAnggaran$4,500,000Pendapatankotor$278,720 Wrestling Ernest Hemingway adalah film Amerika Serikat produksi tahun 1993 bergenre drama romantik yang disutradarai...

 

Франц Саксен-Кобург-Заальфельдскийнем. Franz von Sachsen-Coburg-Saalfeld герцог Саксен-Кобург-Заальфельдский 8 сентября 1800 — 9 декабря 1806 Предшественник Эрнст Фридрих Саксен-Кобург-Заальфельдский Преемник Эрнст I Саксен-Кобург-Заальфельдский Рождение 15 июля 1750(1750-07-15)Кобург, Сакс...

 

2020年夏季奥林匹克运动会波兰代表團波兰国旗IOC編碼POLNOC波蘭奧林匹克委員會網站olimpijski.pl(英文)(波兰文)2020年夏季奥林匹克运动会(東京)2021年7月23日至8月8日(受2019冠状病毒病疫情影响推迟,但仍保留原定名称)運動員206參賽項目24个大项旗手开幕式:帕维尔·科热尼奥夫斯基(游泳)和马娅·沃什乔夫斯卡(自行车)[1]闭幕式:卡罗利娜·纳亚(皮划艇)&#...

Alain Mimoun Datos personalesNacimiento Telagh (Argelia francesa, Argelia)1 de enero de 1921Nacionalidad(es) FrancesaFallecimiento Saint-Mandé (Valle del Marne, Francia)27 de junio de 2013Carrera deportivaDeporte Atletismo[editar datos en Wikidata] Medallero  Francia Atletismo masculino Juegos Olímpicos Plata Londres 1948 10000 metros Plata Helsinki 1952 5000 metros Plata Helsinki 1952 10000 metros Oro Melbourne 1956 Maratón Campeonato Europeo Plata Bruselas 1950 5000 metros...

 

American photographer (1914–2001) O. Winston LinkBornOgle Winston Link(1914-12-16)December 16, 1914Brooklyn, New York, U.S.DiedJanuary 30, 2001(2001-01-30) (aged 86)Katonah, New York, U.S.OccupationPhotographerYears active1937–1983Spouses Vanda Link ​ ​(m. 1942; div. 1950)​ Conchita Link ​ ​(m. 1983; div. 1996)​ ChildrenWinston Conway Link Ogle Winston Link[1] (December 16, 19...

 

Shootingat the Games of the XIX OlympiadDates18-23 October 1968← 19641972 → Shooting at the 1968 Summer Olympics in Mexico City comprised seven events. A second shotgun event, Skeet, was introduced. They were held between 18 and 23 October 1968. For the first time, women competed alongside men.[1] Shooting at the1968 Summer OlympicsRifle300 m rifle three positionsMixed50 m rifle three positionsMixed50 m rifle proneMixedPistol25 m rapid fire pistolMixed50 m pisto...

Алтай Республиканыҥ ГимныLagu kebangsaan Republik AltaiPenulis lirikA. AdarovaKomponisV. PeshnyakaPenggunaan11 September 2001Sampel audioLagu kebangsaan Republik Altaiberkasbantuan Sampel audioLagu kebangsaan Republik Altaiberkasbantuan Rekaman instrumental lagu kebangsaan Lagu kebangsaan Republik Altai (Bahasa Altai: Алтай Республиканыҥ Гимны, Altay Respublikanıň Gimnı) adalah lagu kebangsaan Republik Altai, salah satu subjek federal Rusia. La...

 

List of events ← 1806 1805 1804 1807 in the United States → 1808 1809 1810 Decades: 1780s 1790s 1800s 1810s 1820s See also: History of the United States (1789–1849) Timeline of United States history (1790–1819) List of years in the United States 1807 in the United States1807 in U.S. states States Connecticut Delaware Georgia Kentucky Maryland Massachusetts New Hampshire New Jersey New York North Carolina Ohio Pennsylvania Rhode Island South Carolina Tennessee Vermont Virginia ...

 

PoascofrazionePoasco – Veduta LocalizzazioneStato Italia Regione Lombardia Città metropolitana Milano Comune San Donato Milanese TerritorioCoordinate45°24′05.67″N 9°13′56.31″E45°24′05.67″N, 9°13′56.31″E (Poasco) Altitudine102 m s.l.m. Abitanti4 000 (2022) Altre informazioniCod. postale20097 Prefisso02 Fuso orarioUTC+1 Nome abitantipoaschesi PatronoSanta Maria Assunta CartografiaPoasco Modifica dati su Wikidata · Manuale Poasc...

الحب سنة 70معلومات عامةالصنف الفني كوميديتاريخ الصدور 8 ديسمبر 1969 مدة العرض 107 دقيقةالعرض أبيض وأسود البلد  مصرالطاقمالمخرج محمود ذو الفقار الكاتب إلهامي سيف النصرالبطولة  القائمة ... أحمد رمزي محمد عوض نيللي نوال أبو الفتوح حسن عفيفى ناهد يسري ميمي جمال علية عبد المنع�...

 

Defunct American automobile manufacturer that designed a purpose-built police car Carbon Motors CorporationCompany typePrivateIndustryAutomotiveFounded2003; 21 years ago (2003)FoundersStacy Dean StephensWilliam Santana LiDefunctApril 2013 (2013-04)FateClosedHeadquartersConnersville, Indiana, U.S.Area servedUnited StatesKey peopleWilliam Santana Li(CEO)ProductsE7 Police carWebsitecarbonmotors.com The Carbon Motors Corporation was an American automobile manufacturer ...

 

2015 UK local government election Cotswold District Council Election, 2015 ← 2011 7 May 2015 2019 → All 34 seats to Cotswold District Council   First party Second party   Leader Lynden Stowe Joe Harris Party Conservative Liberal Democrats Leader since 9 May 2006 October 2014 Leader's seat Campden and Vale Cirencester St Michael's Last election 27 12 Seats before 30 11 Seats won 24 10 Popular vote 26,442 16,105 Percentage 54.8% 33.4...

American diplomat His ExcellencyCharles H. Price IIUnited States Ambassador to the United Kingdom In officeDecember 20, 1983 – February 28, 1989PresidentRonald ReaganGeorge H. W. BushPreceded byJohn J. Louis Jr.Succeeded byHenry E. Catto Jr.United States Ambassador to Belgium In officeJuly 3, 1981 – November 15, 1983PresidentRonald ReaganPreceded byAnne Cox ChambersSucceeded byGeoffrey Swaebe Personal detailsBorn(1931-04-01)April 1, 1931Kansas City, Missouri, U.S.DiedJan...

 

《故事新编》是鲁迅的一部短篇小说集,1936年由上海文化生活出版社出版。小说集收录了鲁迅在1922年—1935年间根据古代神话、传说、传奇所改写的短篇小说八篇,包括: 《补天》,曾题名《不周山》,收录在《呐喊》初版,后改名《补天》并抽出。文章讲述女娲造人及补天的故事,借用“女娲造人”这一神话解释创作——人和文学——的缘起,也用“古衣冠的小丈夫”这�...

 

日豪汽車客運股份有限公司原文名称日豪客運公司類型股份有限公司成立2019年8月9日,​4年前​(2019-08-09)代表人物董事長:林建良總部 中華民國(臺灣)新北市三重區河邊北街168號1樓業務範圍基隆市:仁愛區臺北市:內湖區桃園市:大園區 新竹市:東區产业運輸業產品國道客運网站日豪客運官方網站 日豪汽車客運股份有限公司(英文: Ri Hao Bus Company, Ltd.)�...

Cet article est une ébauche concernant l’art et une chronologie ou une date. Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants. Chronologies Données clés 1854 1855 1856  1857  1858 1859 1860Décennies :1820 1830 1840  1850  1860 1870 1880Siècles :XVIIe XVIIIe  XIXe  XXe XXIeMillénaires :-Ier Ier  IIe  IIIe Chronologies géographiques Afrique Afrique du S...

 

1864 naval battle of the Second Schleswig War Battle of JasmundPart of the Second Schleswig WarSjælland (right) engaging with the paddlewheel steamer Loreley and the corvette Nymphe. Painting by Alex Kircher.Date17 March 1864LocationOff of Rügen, Bay of Pomerania54°18′N 13°51′E / 54.300°N 13.850°E / 54.300; 13.850Result Tactical Danish victory Blockade of the Prussian coast maintainedBelligerents Prussia  DenmarkCommanders and leaders Eduard von Jachmann...