בסטטיסטיקה, מבחן קוקראן-מנטל-הנזל (CMH) משמש לבדיקת השערת אי התלות בין שני משתנים איכותיים דיכוטומיים (כלומר כל אחד מהם יכול לקבל שני ערכים אפשריים), כאשר ידוע כי הנתונים נאספים בשכבות. במובן מסוים, מבחן זה הוא הרחבה של מבחן מקנמר, ומאידך זהו מקרה פרטי של רגרסיה לוגיסטית מותנית.
וריאציות שונות של המבחן הוצעו על ידי ויליאם קוקראן, נתן מנטל וויליאם הנזל[1][2][3].
תיאור כללי
בדרך כלל, כדי לבחון את ההשערה כי אין קשר בין שני משתנים איכותיים, המבחן המקובל הוא מבחן כי בריבוע. עם זאת, כאשר הנתונים נאספים בשכבות, יש לקחת נתון זה בחשבון, כדי להימנע מפרדוקס סימפסון. מבחן קוקראן-מנטל-הנזל בודק את השערת אי התלות המותנה בשכבה.
לדוגמה, כדי לבדוק את ההשפעה של מסע פרסום למוצר כלשהו (למשל מותג של קפה נמס) על אחוז האנשים שקנו את המותג, נלקח מדגם מהאוכלוסייה, וכל אדם במדגם נשאל האם נחשף לפרסומת והאם קנה את המותג בחודש האחרון. ייתכן ויש הבדלים בתגובה לפרסומת בין אנשים ממעמדות סוציו-אקונומיים שונים, ולכן תועד גם המצב הסוציו-אקונומי של כל המשיבים למדגם. במקרה זה המשתנים ביניהם נמדד הקשר הוא חשיפה לפרסום (נחשף/לא נחשף) וקניית המותג (קנה/לא קנה), והשכבות הן המצב הסוציו אקונומי (למשל מעמד נמוך, בינוני או גבוה).
דוגמה נוספת: היא ניסוי קליני שנערך כדי לבדוק את היעילות של טיפול ניסיוני בהשוואה לטיפול המקובל, ועבור כל חולה מתעדים אם מצבו השתפר לאחר שבוע של טיפול. ניסויים כאלה נערכים בדרך כלל במספר בתי חולים. כאן המשתנים שהקשר ביניהם נבחן הם סוג הטיפול ותוצאת הטיפול, ובתי החולים הם השכבות.
הגדרה
מוטיבציה
בניסוי קליני שנערך בבית חולים מסוים, חלק מהחולים קיבלו טיפול נסיוני למחלתם, בעוד חלק אחר קיבלו את הטיפול המקובל. עבור כל חולה, נבדק האם מצבו השתפר לאחר שבוע של טיפול. ניתן לרכז את הנתונים בטבלה:
סטטוס
|
שיפור
|
ללא שיפור
|
סך הכל
|
טיפול ניסיוני
|
A
|
B
|
A+B
|
טיפול מקובל
|
C
|
D
|
C+D
|
סך הכל
|
A+C
|
B+D
|
N
|
כאשר A הוא מספר החולים שקיבלו טיפול ניסיוני ומצבם השתפר, B הוא מספר החולים שקיבלו טיפול ניסיוני ומצבם לא השתפר, וכן הלאה. כמו כן, N הוא המספר הכולל של החולים שהשתתפו בניסוי.
יחס הסיכויים הוא לכן .
בהנחה כי אין קשר בין הטיפול ומצב החולה, נצפה כי מספר החולים שמצבם השתפר לאחר קבלת הטיפול הניסיוני הוא .
תחת ההנחה כי שולי הטבלה קבועים (כלומר מספר החולים בכל קבוצה נקבע מראש וכן המספר הכולל של החולים שמצבם השתפר והמספר הכולל של החולים שמצבם לא השתפר גם הם קבועים מראש), השערת האפס כי יחס הסיכויים שווה ל-1, , שקולה להשערה כי . סטטיסטי מבחן מתקבל על הדעת לבדיקת השערה זו הוא .
לעומת זאת, אם הניסוי נערך בשני בתי חולים, ניתן לחשב את יחס הסיכויים בנפרד לכל אחד מבתי החולים:
,
.
מבחן קוקראן-מנטל-הנזל משקלל את יחסי הסיכויים של שני בתי החולים לפי מספר החולים בכל אחד מהם. באופן אינטואיטיבי, השקלול צריך להיות ממוצע משוקלל של יחסי הסיכויים משני בתי החולים. אולם, אפשרות אחרת לבדיקת ההשערה כייחס הסיכויים הכולל שווה ל-1 היא לבדק את הערך של . ביטוי זה מהווה את הבסיס להגדרת מבחן קוקראן-מנטל-הנזל, והוא מתקבל לאחר שקלול מתאים של בשונויות של ו-.
הגדרה פורמלית
נתון לוח שכיחות תלת־ממדי מסדר כאשר לכל , לוח השכיחות הדו-ממדי הוא . נסמן
.
מבחן קוקראן-מנטל-הנזל מוגדר על ידי[4]:
.
תחת השערת האפס כי יחס הסיכויים הכולל שווה ל-1, ל- יש התפלגות אסימפטוטית עם דרגת חופש אחת.
דוגמה: אפליה על רקע מגדרי באוניברסיטת ברקלי
באוניברסיטת ברקלי בקליפורניה, נתוני הקבלה לסתיו 1973 הראו כי לגברים יש סיכויים גבוהים יותר להתקבל ללימודים בהשוואה לנשים[5]. מתוך 8442 גברים שביקשו להתקבל ללימודים מתקדמים, התקבלו בערך 44% מהפונים. לעומת זאת, מתוך 4321 נשים שביקשו להתקבל ללימודים, התקבלו רק 35%. לא ניתן להסביר פער זה כצרוף מקרים סטטיסטי (במילים אחרות, השערת אי התלות נדחתה).
ניתן לראות זאת גם בנתוני הקבלה של ששת החוגים הגדולים ביותר:
|
התקבלו
|
נדחו
|
סך הכל
|
גברים
|
1198
|
1493
|
2691
|
נשים
|
557
|
1278
|
1835
|
סך הכל
|
1755
|
2771
|
4526
|
יחס הסיכויים מראה בבירור כי שיעור הקבלה של הגברים גבוה בהרבה מזה של הנשים:
אולם, כאשר נבחנו הנתונים מכל חוג בנפרד, נראה היה ששיעורי הקבלה בכל חוג היו בדרך כלל דומים עבור גברים ונשים, ואף נמצאו חוגים שבהם שיעור הקבלה של גברים היה נמוך יותר מזה של הנשים. בטבלה הבאה מובאים נתוני הקבלה עבור 6 החוגים הגדולים ביותר לכל חוג בנפרד:
חוג
|
מספר הגברים שהתקבלו
|
מספר הגברים שנדחו
|
מספר הנשים שהתקבלו
|
מספר הנשים שנדחו
|
סך הכל
|
1
|
512
|
313
|
89
|
19
|
933
|
2
|
353
|
207
|
17
|
8
|
585
|
3
|
120
|
205
|
202
|
391
|
918
|
4
|
138
|
279
|
131
|
244
|
792
|
5
|
53
|
138
|
94
|
299
|
584
|
6
|
22
|
351
|
24
|
317
|
714
|
סך הכל
|
1198
|
1493
|
557
|
1278
|
4526
|
ערכו של מבחן קוקראן-מנטל-הנזל הוא . חישוב ערך ה-p מעלה כי . בהנחה שקבענו מראש כי רמת המובהקות של המבחן היא לא נדחה את השערת האפס ונסיק כי לא נצפו הבדלים בהעדפות בין גברים ונשים.
הערות שוליים
- ^ Cochran, W. G., Some methods for strengthening the common chi-square tests, Biometrics, 4 10, 1954, עמ' 417-451 doi: 10.2307/3001616
- ^ Mantel, N. and Haensze, W., Statistical aspects of the analysis of data from retrospective studies of disease, Journal of the national cancer institute, 4 22, 1959, עמ' 719-748 doi: 10.1093/jnci/22.4.7191
- ^ Mantel, N., Chi-square tests with one degree of freedom; extensions of the Mantel-Haenszel procedure, Journal of the American Statistical Association, 303 58, 1963, עמ' 690-700 doi: 10.1080/01621459.1963.10500879
- ^
Agresti, Alan, 4.3.4, An Introduction to Categorical Data Analysis, 2nd edition, Hoboken, New Jersey: JohnWiley & Sons, Inc., 2007, עמ' 114-115, ISBN 978-0-471-22618-5
- ^ .Sex Bias in Graduate Admissions: Data from Berkeley, Bickel et al., Science Vol. 187, 1975