שיעור התגליות השגויות

שיעור התגליות השגויות (FDR - False Discovery Rate) הוא שמה של שיטה סטטיסטית לבדיקת השערות מרובות, שפותחה בידי שני סטטיסטיקאים מאוניברסיטת תל אביב, הפרופסורים יואב בנימיני ויוסף הוכברג. שיטה זו הוצעה על ידי בנימיני והוכברג כבר ב-1989 אך בתחילה היא נתקלה בהתנגדות, עד שב-1995 מאמרם התקבל בכתב העת Journal of the Royal Statistical Society, ומאז הוא דורג בין 25 המאמרים המצוטטים ביותר בסטטיסטיקה.[1] בנימיני זכה בפרס ישראל לשנת 2012 בעיקר עקב תגליותיו בנושא זה.[2]

הצורך בשיטה

כמעט כל תחומי המדע המודרני מבוססים על בדיקת השערות בניסויים או בתצפיות, בהתבסס על מדגם מקרי. בתחום הסטטיסטי של בדיקת השערות פותחו כללים לקבל או לדחות השערה מדעית, באמצעות עימותה עם השערה שמרנית המכונה "השערת האפס". למשל, בבדיקה האם תרופה חדשה שפותחה מאריכה את תוחלת החיים של החולים המשתמשים בה, קיימות שיטות מקובלות לדגום חולים המשתמשים בתרופה וחולים שאינם משתמשים בתרופה, למדוד את תוחלת החיים שלהם ולהכריע בין השערת האפס : "תוחלת החיים של המשתמשים בתרופה אינה ארוכה יותר" ולבין ההשערה החלופית : "תוחלת החיים של המשתמשים בתרופה ארוכה יותר", אשר תוביל לפרסום תגלית מדעית שהתרופה יעילה. בשיטות טיפוסיות נוהגים לחשב מהי ההסתברות p לקבל את תוחלות החיים שנמדדו בפועל בהנחה שהשערת האפס נכונה, ולדחות השערה זו אם ורק אם p קטן מרמת מובהקות שרירותית כלשהי. רמת מובהקות מקובלת מאוד בתחומי הרפואה והביולוגיה הוא 0.05, כלומר רק אם הסיכוי p יהיה קטן מ-0.05 תידחה השערת האפס, וניתן יהיה לפרסם מאמר מדעי המדווח על תגלית - התרופה יעילה באופן "מובהק סטטיסטית". הערך 0.05 הוא שרירותי, שכן עקרונית ניתן היה להחליט כל ערך אחר, והוא מקובל במדע בזכות שמרנותו - הוא מקל בהרבה על קבלת השערת האפס מאשר על דחייתה, ולמעשה מכתיב כי תוכרז תגלית שגויה לכל היותר ב-0.05 (היינו 5%) מן המקרים בהם השערת האפס נכונה.

ואולם השיטות המסורתיות של בדיקת השערות אינן מספקות כאשר יש צורך בבדיקת השערות מרובות. למשל, נניח שבעת ביצוע מחקר בגנטיקה מעוניינים לבדוק את ההשפעה של 10,000 גנים. לשם כך דוגמים פרטים מן האוכלוסייה ומודדים את ההשפעה של 10,000 גנים בכל אחד מהם, כך שיש לבדוק 10,000 השערות: לכל גן נבדקת השערת האפס שאין לו השפעה לעומת ההשערה שיש לו השפעה. רמת מובהקות של 0.05 נראית שמרנית דיה לבדיקת השערה יחידה, אך אם תאומץ לבדיקת כל אחת מ-10,000 ההשערות יש לצפות שאפילו אם אין לאף גן השפעה כלשהי, תתקבלנה בממוצע 0.05×10,000=500 תגליות שגויות של גנים שהם כביכול בעלי השפעה "מובהקת סטטיסטית". מכאן עולה הצורך במבחן סטטיסטי מתוקן להשוואות מרובות. תיקון מסורתי כזה הוא תיקון בונפרוני (על שם המתמטיקאי האיטלקי קרלו אמיליו בונפרוני) אשר דוחה את השערת האפס רק אם ההסתברות p לקבלת התוצאות קטנה מרמת המובהקות המקורית מחולקת במספר ההשערות, במקרה זה ערך מתוקן של 0.05/10,000=0.000005 בלבד. הוכח ששימוש בתיקון בונפרוני מבטיח שההסתברות לקבל ולו תגלית שגויה אחת לא תהיה גדולה מרמת המובהקות.

החסרון בתיקון בונפרוני היא העוצמה הסטטיסטית הנמוכה מאוד שלו. היינו, על מנת להבטיח שאפילו תגלית שגויה אחת לא תעשה, תיקון בונפרוני הוא שמרן מדי, ונוטה להחמיץ תגליות מדעיות אמיתיות. בשל כך נמנעו מדענים רבים מן השימוש בו, או בכל תיקון אחר להשוואות מרובות, וחשפו את עצמם לתגליות שגויות. מצב זה החמיר במיוחד מאז סוף המאה ה-20, משום שההתקדמות הטכנולוגית מאפשרת מדידה אוטומטית של יותר ויותר משתנים בכל ניסוי ותצפית. בשנת 1995 הציעו בנימיני והוכברג להחליף את תיקון בונפרוני ב"שיעור התגליות השגויות" (FDR, ראשי תיבות באנגלית של False Discovery Rate), והראו שהעוצמה הסטטיסטית שלו גדולה בהרבה. כלומר, גם במחקרים המודדים משתנים רבים מאוד בו-זמנית ניתן להבטיח "שמרנות מדעית" ועדיין לקבל תגליות אמיתיות.

הרעיון בבסיס השיטה שהתוו בנימיני והוכברג היה לבקר את היחס שבין מספר התגליות השגויות לבין סך התגליות, במקום את ההסתברות לעשות תגלית שגויה אחת ויחידה. על פי רעיון זה ככל שמתקבלות פחות תגליות, הביטחון באמיתותן יורד, ולכן יש לדרוש שמרנות מחמירה יותר. למעשה, כאשר מספר התגליות הוא אחד בלבד, שיעור התגליות השגויות מתנהג כמו תיקון בונפרוני. לעומת זאת ככל שמתקבלות תגליות רבות יותר, הביטחון שלפחות חלק מהן נכונות עולה, ולכן ניתן לדרוש פחות שמרנות. המשפט שהוכיחו בנימיני והוכברג קובע שקיים כלל הכרעה אשר השימוש בו מסוגל להבטיח כל רמה נדרשת של שיעור תגליות שגויות.

תיאור השיטה

בהינתן מדגם והשערות מרובות , נסמן ב- את מספר התגליות, ונסמן ב- את מספר התגליות השגויות מתוכן (שאיננו יודעים מהו). בהינתן רמת מובהקות , סביר לדרוש מכלל ההכרעה לקיים . כלומר נרצה למצוא כלל הכרעה כזה שיבטיח לנו שאם נפעל לפיו אז תוחלת שיעור התגליות השגויות מתוך כלל התגליות לא תעלה על .

סימון: נסמן לכל השערה -ית את הערך-p שלה ב-. נבצע אינדוקס מחודש של ערכי-p כך שיהיו בסדר עולה, ונניח לשם הפישוט שהם כולם שונים זה מזה, כך שמתקיים לכל .
כלל ההכרעה: נגדיר , ונקבע את כלל ההכרעה "לדחות כל את כל ההשערות שהערך-p המתאים להן הוא בקבוצה ".

כלל הכרעה זה הוא הכלל שלגביו הוכיחו בנימיני והוכברג שהוא מקיים את הדרישה שהזכרנו. עם זאת זה לא תקף באופן מוחלט ותמיד, אלא בתנאי מסוים שנגדיר כעת.

הגדרה: אומרים שקבוצה של משתנים מקריים הם PRDS ‏ (Positive Regression Dependence on each one from a Subset of variables) אם לכל פונקציה שהיא לא-יורדת, לכל מתקיים כי הפונקציה אינה יורדת ב-.
ניתן להוכיח שאם משתנים מקריים כנ"ל הם PRDS, אז גם הפונקציה אינה יורדת ב-.
המשפט שהוכיחו בנימיני והוכברג קובע שאם הערכי-p, כלומר המשתנים המקריים , הם PRDS, אז שימוש בכלל ההכרעה הזה מבטיח את הדרישה .

דוגמאות

כאשר יש בידינו מספר השערות רב, תחילה יש לבדוק p-value עבור כל השערה בנפרד. לאחר מכן, יש למיין את ה-p-value שהתקבלו בסדר עולה (נסמן ב-(p(i את ה-p-value ה-i ברשימה הממוינת).

על מנת לקבוע מהן ההשערות שיידחו – נמצא את ה-i הגדול ביותר עבורו מתקיים: . אם מתקיים – דוחים את כל ההשערות j כך ש: . בשתי הדוגמאות להלן נניח שרמת המובהקות של הבדיקה היא: .

בטבלה הבאה מובאת דוגמה עבור 3 השערות:

השערה p-value מסודרים מהקטן לגדול היחס של המנה החלטה
1 0.01 0.01667 לדחות
2 0.03 0.0333 לדחות
3 0.07 0.05 לא לדחות

במקרה זה נדחו שתי השערות, בעוד לפי תיקון בונפרוני (שלפיו היינו משווים את כל ערכי ה-p-value ל-0.01667) רק ההשערה הראשונה הייתה נדחית.

בטבלה הבאה מובאת דוגמה עבור 15 השערות[3]:

השערה p-value מסודרים מהקטן לגדול היחס של המנה החלטה
H(1) 0.0037 0.0033 לדחות
H(2) 0.0050 0.0067 לדחות
H(3) 0.0105 0.0100 לדחות
H(4) 0.0110 0.0133 לדחות
H(5) 0.0150 0.0167 לדחות
H(6) 0.0278 0.0200 לא לדחות
H(7) 0.0298 0.0233 לא לדחות
H(8) 0.0344 0.0267 לא לדחות
H(9) 0.0459 0.0300 לא לדחות
H(10) 0.3240 0.0333 לא לדחות
H(11) 0.4262 0.0367 לא לדחות
H(12) 0.5719 0.0400 לא לדחות
H(13) 0.6528 0.0433 לא לדחות
H(14) 0.7590 0.0467 לא לדחות
H(15) 1.0000 0.0500 לא לדחות

במקרה זה נדחו חמש השערות, בעוד לפי תיקון בונפרוני (שלפיו היינו משווים את כל ערכי ה-p-value ל-0.0033) אפילו השערה אחת לא הייתה נדחית.

שימו לב שהערך גדול מה-p-value של H(i) עבור i=1,3, אך אלו אינם רלוונטיים, כיוון שמעניין אותנו רק מהו ה-i הגדול ביותר עבורו גדול או שווה מה-p-value של ההשערה ה-i, בהתאם לנוסחה:

הוכחה

ההוכחה המובאת אינה זו המקורית של בנימיני והוכברג, אלא של Helmut Finner, ‏Thorsten Dickhaus ו-Markus Roters.

נסמן . נשים לב שמתקיים השוויון הקבוצתי .

נניח ללא הגבלת הכלליות כי ההשערות הנכונות הן עבור ונשים לב שבסימונים שלנו מתקיים . כמו כן קל לראות כי , ולכן נסיק בהתאם לתוחלת של פונקציה בשני משתנים ומהגדרת הסתברות מותנית:

כעת נשים לב שהצבה של משתנה מקרי בפונקציית ההתפלגות שלו עצמו חסומה על ידי ההתפלגות האחידה,[4] ולכן , ונקבל את החסם:

אם נפרק את הסכום שקיבלנו לאיבר הראשון, , ועוד שאר האיברים, נקבל את הסכום הטלסקופי:

כעת נשים לב שמכך שהקבוצה היא PRDS ומכך ש היא פונקציה לא עולה ב נובע כי:

נשים לב עוד כי מהגדרת כלל ההכרעה נובע שעבור דוחים, כלומר , ולכן . מכאן נקבל בדיוק את החסם הנדרש במשפט:

ראו גם

קישורים חיצוניים

הערות שוליים

  1. ^ Ryan, T. P.; Woodall, W. H. (2005). "The most-cited statistical papers". Journal of Applied Statistics 32 (5): 461.
  2. ^ פרופ' יואב בנימיני, באתר פרס ישראל
  3. ^ הדוגמה מבוססת על הדוגמה שבמאמר: Benjamini, Yoav; Hochberg, Yosef (1995). "Controlling the false discovery rate: a practical and powerful approach to multiple testing". Journal of the Royal Statistical Society, Series B. 57 (1): 289–300. MR 1325392, עם שינויים קלים.
  4. ^ במקרה שבו המשתנה המקרי רציף זו בדיוק ההתפלגות .

Read other articles:

Blackfield & LangleyNama lengkapBlackfield and Langley Football ClubJulukanThe WatersidersBerdiri1935StadionGang Warily Rec, Blackfield(Kapasitas: 1,500 (180 seated)[1])KetuaHans McDonald (Acting)ManajerFawzi Saadi Kostum kandang Kostum tandang Blackfield & Langley Football Club adalah klub sepak bola yang berbasis di desa Blackfield, dekat Southampton, Inggris. Berafiliasi dengan Asosiasi Sepak Bola Hampshire, mereka saat ini adalah anggota Divisi Selatan Liga Premier Selatan...

 

Artikel ini sebatang kara, artinya tidak ada artikel lain yang memiliki pranala balik ke halaman ini.Bantulah menambah pranala ke artikel ini dari artikel yang berhubungan atau coba peralatan pencari pranala.Tag ini diberikan pada Februari 2023. Acacia blayana Klasifikasi ilmiah Kerajaan: Plantae (tanpa takson): Angiospermae (tanpa takson): Eudikotil (tanpa takson): Rosidae Ordo: Fabales Famili: Fabaceae Genus: Acacia Spesies: A. blayana Nama binomial Acacia blayanaTindale & Court Si...

 

河南省Hénán Shěng Singkatan: 豫 (pinyin: Yù) Asal nama 河 hé - Sungai Kuning 南 nán - selatan selatan Sungai Kuning Tipe administrasi Provinsi Ibu kota Zhengzhou Kota terbesar Zhengzhou Sekretaris PKT Wang Guosheng Gubernur Chen Run'er [1] Wilayah 167,000 km² (ke-17) Populasi (Tahun)  - Kepadatan 96,670,000 (ke-2) 579/km² (ke-6) PDB (2003) - per kapita CNY 704.9 miliar (ke-6) CNY 7290 (ke-19) Suku-suku utama (2000) Suku Han - 98.8%Suku Hui - 1% Jumlah perfektu...

German military officer (1891-1945) Walter ModelModel c. 1940sBirth nameOtto Moritz Walter ModelBorn(1891-01-24)24 January 1891Genthin, Prussia German EmpireDied21 April 1945(1945-04-21) (aged 54)near Duisburg, Nazi GermanyBuriedHürtgenwald (reinterred)AllegianceGerman EmpireWeimar RepublicNazi GermanyBranchImperial German ArmyReichswehrGerman ArmyYears of service1910–1945RankGeneralfeldmarschallCommands held 3rd Panzer Division XLI Panzer Corps Ninth Army Army Group North Army ...

 

Tower or spire in Indian temple architecture This article is about the type of architecture. For the wooden boats of Jammu and Kashmir, see Shikara. For other uses, see Shikara (disambiguation). Not to be confused with Chikara (disambiguation). Latina in Khajuraho Shikhara (IAST: Śikhara), a Sanskrit word translating literally to mountain peak, refers to the rising tower in the Hindu temple architecture of North India, and also often used in Jain temples. A shikhara over the garbhagriha cham...

 

Voce principale: Alma Juventus Fano 1906. Fano CalcioStagione 1995-1996Sport calcio Squadra Fano Allenatore Ettore Donati poi Bruno Giordano poi Ettore Donati Presidente Rosettano Navarra (amministratore unico) Serie C210º posto nel girone B. Maggiori presenzeCampionato: Mancon (34) Miglior marcatoreCampionato: Antonello (9) 1994-1995 1996-1997 Si invita a seguire il modello di voce Questa pagina raccoglie le informazioni riguardanti il Fano Calcio nelle competizioni ufficiali della st...

115th edition of Major League Baseball's championship series For other uses, see 2019 World Series (disambiguation). 2019 World Series Team (Wins) Manager(s) Season Washington Nationals (4) Dave Martinez 93–69 (.574), GB: 4 Houston Astros (3) A. J. Hinch 107–55 (.660), GA: 10DatesOctober 22–30VenueMinute Maid Park (Houston)Nationals Park (Washington)MVPStephen Strasburg (Washington)UmpiresAlan Porter (Games 1–2),[note 1] Doug Eddings, Gary Cederstrom (crew chief), James Hoye, ...

 

Chemical compound Calcium gluconateClinical dataPronunciationKAL-see-um GLUE-koe-nate AHFS/Drugs.comMonographLicense data US DailyMed: Calcium gluconate Routes ofadministrationBy mouth, intravenous, topicalATC codeA12AA03 (WHO) (Oral), D11AX03 (WHO), B05XA19 (WHO) (Parenteral)Identifiers IUPAC name calcium (2R,3S,4R,5R)- 2,3,4,5,6-pentahydroxyhexanoate CAS Number299-28-5PubChem CID9290DrugBankDB11126ChemSpider8932UNIISQE6VB453KKEGGD00935ChEBICHEBI:3309ChEMBL...

 

Municipality in Lapland, FinlandKittilä GihttelKittâlKihttelMunicipalityKittilän kuntaKommunen KittiläView from the top of Kätkätunturi Coat of armsLocation of Kittilä in FinlandCoordinates: 67°39′N 024°54.5′E / 67.650°N 24.9083°E / 67.650; 24.9083Country FinlandRegionLaplandSub-regionFell LaplandCharter1854Government • Municipality managerAntti JämsénArea (2018-01-01)[1] • Total8,262.97 km2 (3,190.35...

Radio station in Martinsburg, West VirginiaWLTFMartinsburg, West VirginiaBroadcast areaEastern Panhandle of West VirginiaPotomac Highlands of West VirginiaCentral MarylandNorthern Shenandoah ValleyNorthern VirginiaFrequency97.5 MHzBrandingToday's 97-5ProgrammingFormatAdult contemporaryOwnershipOwnerWVRC Media(West Virginia Radio Corporation of the Alleghenies)Sister stationsWEPMWICLHistoryFirst air date1949 (75 years ago) (1949)Former call signsWEPM-FM (1949–1973)[1]W...

 

この項目には、一部のコンピュータや閲覧ソフトで表示できない文字が含まれています(詳細)。 数字の大字(だいじ)は、漢数字の一種。通常用いる単純な字形の漢数字(小字)の代わりに同じ音の別の漢字を用いるものである。 概要 壱万円日本銀行券(「壱」が大字) 弐千円日本銀行券(「弐」が大字) 漢数字には「一」「二」「三」と続く小字と、「壱」「�...

 

  提示:此条目页的主题不是中華人民共和國最高領導人。 中华人民共和国 中华人民共和国政府与政治系列条目 执政党 中国共产党 党章、党旗党徽 主要负责人、领导核心 领导集体、民主集中制 意识形态、组织 以习近平同志为核心的党中央 两个维护、两个确立 全国代表大会 (二十大) 中央委员会 (二十届) 总书记:习近平 中央政治局 常务委员会 中央书记处 �...

Blanco County, TexasThe 1916 courthouse was the first permanent courthouse built after the county seat moved to Johnson City in 1890.Lokasi di negara bagian TexasLokasi negara bagian Texas di Amerika SerikatDidirikanFebruary 12 1858Asal namaThe Blanco RiverSeatJohnson CityWilayah • Keseluruhan713 sq mi (1.848 km2) • Daratan711 sq mi (1.842 km2) • Perairan2 sq mi (6 km2), 0.30%Populasi • (2010)10....

 

2008 2015 (départementales) Élections cantonales de 2011 en Moselle 26 des 51 cantons de la Moselle 20 et 27 mars 2011 Type d’élection Élections cantonales Majorité départementale – Philippe Leroy Liste UMPDVDNCMoDem Sièges obtenus 31  2 Opposition départementale Liste PSDVGPCF Sièges obtenus 20  2 Président du Conseil général Sortant Élu Philippe Leroy UMP Philippe Leroy UMP modifier - modifier le code - voir Wikidata  Les élections canto...

 

  هذه المقالة عن أحد الجنسين. لمعانٍ أخرى، طالع ذكر (توضيح). كائن ذكرالشعارمعلومات عامةصنف فرعي من كائن حيحقيقيات النوى جزء من تكاثر جنسي ممثلة بـ ذكرالصبغي Xسبيرماتوزون لديه جزء أو أجزاء الصبغي Y النقيض أنثى تعديل - تعديل مصدري - تعديل ويكي بيانات رمز الذكر. الذَكَر (ورم...

George Mifflin Dallas George M. Dallas adalah Wakil Presiden AS ke 11 (Masa Jabatan: 4 Maret 1845 - 3 Maret 1849) (lahir di Philadelphia, Pennsylvania tgl. 10 Juli 1792; wafat tgl. 31 Desember 1864) adalah Senator dari Pennsylvania dan Wakil Presiden AS, mendampingi James K. Polk. Dallas lulus dari the College of New Jersey (sekarang: Princeton University) pada tahun 1810. Ia menjadi pengacara pada tahun 1813, dan menjadi sekretaris pribadi Albert Gallatin, Duta Besar untuk Rusia. Dallas kemb...

 

A Fight for LoveIklan surat kabarSutradaraJohn FordProduserPat PowersSkenarioEugene B. LewisCeritaEugene B. LewisPemeranHarry CareySinematograferJohn W. BrownBen F. ReynoldsDistributorUniversal StudiosTanggal rilis 24 Maret 1919 (1919-03-24) Durasi60 menitNegaraAmerika SerikatBahasaBisu (intertitel Inggris) A Fight for Love adalah sebuah film koboi Amerika Serikat tahun 1919 garapan John Ford dan menampilkan Harry Carey. Film tersebut dianggap menjadi film hilang.[1] Referensi ^ ...

 

Questa voce sull'argomento stagioni delle società calcistiche italiane è solo un abbozzo. Contribuisci a migliorarla secondo le convenzioni di Wikipedia. Segui i suggerimenti del progetto di riferimento. Voce principale: Unione Sportiva Lecce. US LecceStagione 1960-1961Sport calcio Squadra Lecce Allenatore Dino Bovoli Presidente Germano Ventura Serie C8º Maggiori presenzeCampionato: Bitetto (33)Totale: Bitetto (33) Miglior marcatoreCampionato: Luna (14)Totale: Luna (14) StadioCa...

Kejuaraan Dunia SupersportMusim atau kompetisi terkini: Kejuaraan Dunia Supersport musim 2023OlahragaOlahraga sepeda motorDidirikan1997 (Seri Dunia)1999 (Kejuaraan Dunia)NegaraSeluruh duniaJuaraterkini Nicolo Bulega (Pembalap) Ducati (Konstruktor) Gianluca Vizziello mengendarai RG Team Yamaha YZF-R6 di Phillip Island Kejuaraan Dunia Supersport, atau disebut juga WorldSSP, adalah kompetisi balap motor di permukaan beraspal, berdasarkan sepeda motor sport berukuran sedang. Mesin kompetisi didas...

 

Hierarchical interface This article relies excessively on references to primary sources. Please improve this article by adding secondary or tertiary sources. Find sources: Synthetic file system – news · newspapers · books · scholar · JSTOR (August 2015) (Learn how and when to remove this message) In computer science, a synthetic file system or a pseudo file system is a hierarchical interface to non-file objects that appear as if they were regular files...