פרדוקס סימפסון

המחשה של פרדוקס סימפסון: ניכרת מגמת עלייה בשתי הקבוצות (האדומה והכחולה) בנפרד אך כשמאחדים אותן המגמה מתהפכת (שחור מקווקו)

פרדוקס סימפסון (או אפקט יוּל-סימפסון) הוא פרדוקס בתחום הסטטיסטיקה בו תוצאה (מתאם או מגמה מסוימת) הבאה לידי ביטוי בקבוצות נתונים, מתהפכת כאשר מאחדים את קבוצות הנתונים השונות. תוצאות כאלה מתקבלות לעיתים במחקרים של מדעי החברה ומחקרים רפואיים, בדרך כלל, על ידי ניתוח נמהר של הנתונים. הפרדוקס נעלם כשבוחנים לעומק את הקשרים הסיבתיים בין הנתונים. דרך אפשרית להתמודד עם הפרדוקס היא להשתמש במבחן קוקראן-מנטל-הנזל.

אדוארד ה' סימפסון תיאר לראשונה את התופעה במאמר בשנת 1951, אך אפקטים דומים הוזכרו כבר בעבודותיהם של הסטטיסטיקאים קרל פירסון (1899) ואדני יול (1903). השם "פרדוקס סימפסון" ניתן על ידי קולין ר' בליית' בשנת 1972.

דוגמאות

משקל לידה נמוך

פרדוקס משקל הלידה הנמוך הוא תצפית פרדוקסלית הקשורה למשקל הלידה של תינוקות (ולתמותת תינוקות) לאימהות מעשנות.

בכל מדינה יש משקל סף אשר תינוקות הנולדים מתחת למשקל זה מסווגים כבעלי משקל לידה נמוך. באוכלוסייה מסוימת, שיעור תמותת התינוקות בקרב תינוקות בעלי משקל לידה נמוך גבוה בהרבה מאשר בקרב שאר התינוקות.

שיעור תמותת התינוקות בקרב תינוקות במשקל רגיל זהה בקירוב בין תינוקות של אימהות מעשנות לבין לא-מעשנות, ושיעור תמותת התינוקות בקרב תינוקות במשקל לידה נמוך הוא דווקא נמוך יותר עבור תינוקות של אימהות מעשנות מאשר עבור אימהות לא-מעשנות. עם זאת, בהסתכלות כוללת שיעור תמותת התינוקות של תינוקות של אימהות מעשנות גבוה מזה של אימהות לא-מעשנות. זאת משום שלאימהות מעשנות נולדים תינוקות בעלי משקל לידה נמוך בשיעור גבוה יותר, ולתינוקות בעלי משקל לידה נמוך שיעור תמותת תינוקות גבוה יותר.

הטבלה הבאה מדגימה את היחסים של תמותת התינוקות בין אימהות מעשנות לאימהות לא-מעשנות:

שיעור תמותת תינוקות
אימהות מעשנות אימהות לא-מעשנות
תינוקות במשקל לידה נמוך פחות יותר
תינוקות במשקל לידה רגיל שווה שווה
כלל התינוקות יותר פחות

אפליה על רקע מגדרי באוניברסיטת ברקלי

אחד המקרים המפורסמים של פרדוקס סימפסון קשור לחשש של אוניברסיטת קליפורניה בברקלי מתביעה נגדה, בטענה שהיא מפלה נשים בקבלה לתואר שני. נתוני הקבלה לסתיו 1973 הראו כי לגבר סיכויים גבוהים יותר להתקבל מאישה. הפער היה כה גדול שלא ניתן היה להסבירו כצירוף מקרים סטטיסטי.

מועמדים התקבלו
גברים 8442 44%
נשים 4321 35%

אולם, כאשר נבחנו הנתונים מכל פקולטה בנפרד, לא נמצאה אף אחת שמפלה נשים, אך נמצאה אחת שמפלה לכאורה גברים.

תחום גברים נשים
התקבלו אחוזי קבלה התקבלו אחוזי קבלה
א 825 62% 108 82%
ב 560 63% 25 68%
ג 325 37% 593 34%
ד 417 33% 375 35%
ה 191 28% 393 24%
ו 272 6% 341 7%

התברר כי ההסבר לפרדוקס הוא שנשים נטו להגיש מועמדות לפקולטות תחרותיות בעלות אחוז קבלה נמוך ואילו גברים העדיפו כאלו שמקבלות את רוב המועמדים המתאימים[1].

טיפול אבנים בכליות

במחקר רפואי שבוצע הושוו שיעורי ההצלחה של שני טיפולים אפשריים עבור אבנים בכליות.

הטבלה הבאה מציגה את שיעורי ההצלחה של שני סוגי הטיפול למול אבנים קטנות או גדולות בכליות. טיפול א' מתייחס לניתוחים פתוחים, בעוד טיפול ב' מתייחס לטיפול פחות חודרני הנעשה בעזרת חור קטן.

הטיפול המוצלח יותר בכל שורה מודגש.

טיפול א' טיפול ב'
אבנים 78%

273/350

83%

289/350

אבנים קטנות קבוצה 1

93%

81/87

קבוצה 2

87%

234/270

אבנים גדולות קבוצה 3

73%

192/263

קבוצה 4

69%

55/80

המסקנה הפרדוקסלית היא שבעוד בעבור כל סוג אבן בנפרד טיפול א' עדיף, כשמסתכלים על הסה"כ טיפול ב' עדיף.

זאת משום שלא התחשבנו ב"משתנה המתערב" - חומרת המקרה.

עבור מקרים "קלים" - אבנים קטנות, העדיפו הרופאים להעניק את טיפול ב', בעוד עבור מקרים "קשים" העניקו את טיפול א'. לכן הקבוצות 2 ו-3 גדולות משמעותית מקבוצות 1 ו-4. כמו כן, סיכויי ההצלחה במקרים קשים של אבנים גדולות הם נמוכים משיעורי ההצלחה עבור אבנים קטנות. כיוון שמספר המקרים הקשים שקיבל את טיפול ב' קטן משמעותית, הוא פחות משפיע על סה"כ אחוזי ההצלחה בלי להפריד למקרים.

בייסבול

דוגמה מפורסמת לפרדוקס בוחנת את נתוני החבטות של שחקני בייסבול. ייתכן מצב בו שחקן אחד חובט בממוצע שנתי יותר משחקן שני במשך שנתיים ברצף אולם אם מאחדים בין השנים דווקא לשחקן השני יהיה ממוצע רב שנתי גבוה יותר. התופעה מתרחשת כאשר יש פער גדול בין כמות המשחקים בין השנים. דוגמה אמיתית לנתונים כאלה בוחנת את נתוני החבטות של דרק ג'יטר מול דייוויד ג'סטיס בשנים 1995/6:

1995 1996 משולב
דרק ג'יטר 12/48 0.25 183/582 0.314 195/630 0.31
דייוויד ג'סטיס 104/411 0.253 45/140 0.321 149/551 0.27

דוגמה עם כדורים

נניח כי יש בידינו ארבעה כובעים (שני שחורים ושני אפורים), 41 כדורים (23 אדומים ו-18 לבנים) ושני שולחנות (A ו-B). הכדורים מסודרים בכובעים באופן הבא:

  • בכובע השחור המונח על שולחן A נמצאים 5 כדורים אדומים ו-6 לבנים.
  • בכובע האפור המונח על שולחן A נמצאים 3 כדורים אדומים ו-4 לבנים.
  • בכובע השחור המונח על שולחן B נמצאים 6 כדורים אדומים ו-3 לבנים.
  • בכובע האפור המונח על שולחן B נמצאים 9 כדורים אדומים ו-5 לבנים.

נניח ונרצה להוציא כדור אדום.

ההסתברות להוצאת כדור אדום מהכובעים הנמצאים על שולחן A:

  • ההסתברות להוצאת כדור אדום מתוך הכובע השחור היא 0.4545 = 5/11 = 35/77.
  • ההסתברות להוצאת כדור אדום מן הכובע האפור היא 0.4285 = 3/7 =33/77.

קיבלנו שההסתברות לכדור אדום גבוהה יותר בכובע השחור.

כעת נחשב את ההסתברות להוצאת כדור אדום מהכובעים הנמצאים על שולחן B:

  • ההסתברות להוצאת כדור אדום מתוך הכובע השחור היא 0.6666 = 6/9 = 28/42.
  • ההסתברות להוצאת כדור אדום מתוך הכובע האפור היא 0.6428 = 9/14 = 27/42.

כלומר קיבלנו שגם כאן הסיכויים לכדור אדום גבוהים יותר בכובע השחור.

ועכשיו נבדוק מה קורה אם נחבר את הכדורים בשני הכובעים השחורים זה עם זה ואת הכדורים בכובעים האפורים אחד עם השני:

  • ההסתברות לקבלת כדור אדום מתוך הכובע השחור היא 0.55 = 11/20 = 231/420.
  • ההסתברות לקבלת כדור אדום מתוך הכובע האפור היא 0.5714 = 12/21 = 240/420.

קיבלנו כי ההסתברות לקבלת כדור אדום גבוהה יותר בכובע האפור מאשר בכובע השחור.

ראו גם

לקריאה נוספת

https://open.spotify.com/episode/6T5uLggK2MTlRBjMQaPy2D

קישורים חיצוניים

ויקישיתוף מדיה וקבצים בנושא פרדוקס סימפסון בוויקישיתוף

הערות שוליים