Альфа Кронбаха

Альфа Кронбаха
Названо на честь Lee Cronbachd

Тау-еквівалентна надійність ()[1] — коефіцієнт надійності тесту з одноразовим застосуванням (тобто надійність осіб над предметами, які мають фіксований випадок[2]), коефіцієнт, який зазвичай називають альфа або коефіцієнт альфа Кронбаха . є найвідомішим і найчастіше використовується серед коефіцієнтів надійності, але останні дослідження рекомендують не використовувати його беззастережно.[3][4][5][6][7][8] Коефіцієнти надійності на основі моделювання структурних рівнянь часто рекомендуються як його альтернатива.

Формула та розрахунок

Систематична та звичайна формула

Значенням позначають спостережуваний бал предмета і позначають суму всіх предметів тесту, що складається з предметів. Значенням позначають коваріацію між і , позначають дисперсію , і позначають дисперсію . складається з варіацій елементів та міжпозиційних коваріацій. Це є, . Значенням позначають середнє значення міжпозиційних коваріацій. Це є, .

«систематизовано»[1] формулою: > . Більш часто використовується більш важка для розуміння версія формули .

Приклад розрахунку

При застосуванні до відповідних даних

застосовується до наступних даних, які задовольняють умові бути тау-еквівалентом.

Спостережна матриця коваріації

, ,

,

та .

При застосуванні до невідповідних даних

застосовується до наступних даних, які не відповідають умові бути тау-еквівалентом.

Спостережна матриця коваріації

, ,

,

і .

Порівняйте це значення зі значенням застосування конгенеріальної надійності до одних і тих же даних.

Передумови використання тау-еквівалентної надійності

Для використання як коефіцієнт надійності, дані повинні відповідати наступним умовам.

1) Невимірність

2) (істотна) тау-еквівалентність

3) Незалежність від помилок

Умови бути паралельними, тау-еквівалентними та конгенеричними

Паралельна умова

У ході досліджень паралельні дані мають рівні міжрядкові коваріації (тобто недіагональні елементи матриці коваріації) та рівні дисперсії (тобто діагональні елементи матриці коваріації). Наприклад, наступні дані задовольняють паралельній умові. У паралельних даних, навіть якщо замість коваріаційної матриці використовується матриця кореляції, відсутня втрата інформації . Усі паралельні дані також є еквівалентними тау, але зворотне не відповідає дійсності. Тобто серед трьох умов паралельну умову найважче виконати.

Спостережна матриця коваріації
Тау-еквівалентна умова
Тау-еквівалентна модель вимірювання — це особливий випадок моделі вимірювання, яка передбачає, що всі факторні навантаження однакові, тобто

Від самого початку, дані тау-еквівалента мають рівні коваріації, але їх відхилення можуть мати різні значення. Наприклад, наступні дані задовольняють умові бути тау-еквівалентом. Усі пункти, що містяться в тау-еквівалентних даних, мають однакову дискримінацію або важливість. Усі тау-еквівалентні дані також є спільними, але зворотне не відповідає дійсності.

Спостережна матриця коваріації
Початковий стан
Сумірна модель вимірювання

На рівні популяції конгенеричні дані не повинні мати рівних варіацій або коваріацій, за умови, що вони неоднакові. Наприклад, наведені нижче дані можуть бути на початковому етапі. Усі елементи, що знаходяться в загальних даних, можуть мати різну дискримінацію або значення.

Спостережна матриця коваріації

Зв'язок з іншими коефіцієнтами надійності

Класифікація коефіцієнтів надійності одноразового застосування

Звичайні назви

Існують численні коефіцієнти надійності. Серед них умовні назви коефіцієнтів надійності, які пов'язані та часто використовуються, узагальнені так:[1]

Умовні назви коефіцієнтів надійності
Split-half Невимірний Багатовимірність
Паралельний Формула Спірмена-Брауна Стандартизований (Без умовної назви)
Тау-еквівалент Формула Фланагана
Формула Рулона
Формула Фланагана-Рулона
Ґуттмана
Кронбах
коефіцієнт
Ґуттмана
KR-20
Надійність Хойт
Стратифікований
Породжене Коефіцієнт Ангоффа-Фельдта
Коефіцієнт Раджу (1970)
композитна надійність
побудувати надійність
спільна надійність
коефіцієнт
одновимірний
Коефіцієнт Раджу (1977)
коефіцієнт
всього
MdDonald's
багатовимірність

Поєднання назв рядків і стовпців дає передумови для відповідного коефіцієнта надійності. Наприклад, Кронбах і Гуттмана  — коефіцієнти надійності, отримані за умови одновимірності та тау-еквівалента.

Систематичні назви

Звичайні назви невпорядковані та несистемні. Звичайні назви не дають інформації про природу кожного коефіцієнта або не вводять в оману інформації (наприклад, про складову надійність). Звичайні назви непослідовні. Одні — формули, а інші — коефіцієнти. Деякі названі на честь оригінального розробника, деякі названі на честь того, хто не є оригінальним розробником, а інші не містять імені будь-якої людини. У той час як одна формула посилається на кілька імен, на кілька формул посилається однt позначення (наприклад, альфа та омега). Запропоновані систематичні назви та їх позначення для цих коефіцієнтів надійності такі:[1]

Систематичні назви коефіцієнтів надійності
Спліт-половина Невимірний Багатовимірність
Паралельний роздільна половина паралельної надійності () паралельна надійність () багатовимірна паралельна надійність ()
Тау-еквівалент роздільна половина тау-еквівалентна надійність () tau-еквівалентна надійність () багатовимірна тау-еквівалентна надійність ()
Породжене конгенерична надійність з розділеною половиною () вроджена надійність () Біфакторна модель
Надійність біфактора ()
Факторна модель другого порядку
Фактор надійності другого порядку ()
Корельована факторна модель
Відповідність коефіцієнта надійності ()

Зв'язок з паралельною надійністю

часто називають коефіцієнтом альфа і часто називають стандартизованою альфа. Через стандартизований модифікатор часто помиляється за більш стандартну версію, ніж . Немає історичної підстави, на яку можна посилатися як стандартизована альфа. Кронбах (1951)[9] не називав цей коефіцієнт альфа, і не рекомендував його використовувати. рідко використовувався до 1970-х років[10] . Використання не рекомендується, оскільки паралельну умову важко виконати в реальних даних.

Зв'язок з роздільною половиною тау-еквівалентної надійності

дорівнює середньому значенню значення, отримані для всіх можливих розділених половин. Цей взаємозв'язок, доведений Кронбахом (1951)[9], часто використовується для пояснення інтуїтивного значення . Однак ця інтерпретація не відображає того, що недооцінює надійність при застосуванні до даних, які не є тау-рівнозначними. Максимум усіх можливих значення ближче до надійності, ніж середнє серед усіх можливих значення.[6] Цей математичний факт був відомий ще до публікації Кронбаха (1951).[11] Порівняльне дослідження[12] повідомляє, що максимум є найбільш точним коефіцієнтом надійності.

Revelle (1979)[13] відноситься до мінімуму всього можливого значення як коефіцієнт , і рекомендує це надає додаткову інформацію, яка не.[5]

Взаємозв'язок з конгенеріальною надійністю

Якщо припущення про одновимірність та тау-еквівалентності виконуються, дорівнює .

Якщо одновимірність задоволена, але тау-еквівалентність не задоволена, то менше, ніж [6] .

є найбільш часто використовуваним коефіцієнтом надійності після . Користувачі, як правило, представляють і те, і інше, а не замінюють [1] .

Дослідження в яких були представлені обидва коефіцієнта, повідомляє про це на .02 менше, ніж в середньому.[14]

Зв'язок з багатовимірними коефіцієнтами надійності та

Якщо застосовується до багатовимірних даних, його значення менше коефіцієнтів багатовимірної надійності і більше, ніж .[1]

Зв'язок із співвідношенням між класом

дорівнює версії посиленої консистенції коефіцієнта кореляції внутрішньокласового рівня, який зазвичай використовується в спостережних дослідженнях. Але це лише умовно. Щодо дисперсійних компонентів, ця умова стосується вибірки предмета: якщо і лише тоді, коли значення елемента (у випадку рейтингу) дисперсійної складової дорівнює нулю. Якщо цей дисперсійний компонент негативний, буде недооцінювати посилений коефіцієнт кореляції в межах класу ; якщо цей дисперсійний компонент позитивний, переоцінить цей посилений коефіцієнт кореляції внутрішньокласного типу .

Історія[10]

До 1937 року

[15][16] був єдиним відомим коефіцієнтом надійності. Проблема полягала в тому, що оцінки надійності залежали від того, як елементи були розділені навпіл (наприклад, непарні / парні або спереду / ззаду). Критика висловлювалася проти цієї недостовірності, але більше двох десятиліть науковці не могли дійти спільної думки.[17]

Кудер і Річардсон (1937)

Кудер та Річардсон (1937)[18] розробили кілька коефіцієнтів надійності, які могли б подолати проблему . Вони не давали конкретних назв коефіцієнтам надійності. Рівняння 20 у їхній статті є . Цю формулу часто називають формулою Кудера-Річардсона 20 або KR-20. Вони мали справу з випадками, коли спостережувані бали були дихотомічними (наприклад, правильними чи неправильними), тому вираз KR-20 дещо відрізняється від звичайної формули . Огляд цього документу виявляє, що вони не представили загальної формули тому, що їм не потрібно, а не тому, що не могли. Дозволяє позначають правильне співвідношення відповідей предмета , і позначають неправильне співвідношення відповідей предмета (). Формула KR-20 така.

З тих пір , КР-20 і мають однакове значення.

Між 1937 і 1951 роками

Дослідження загальної формуиу KR-20

Кудер і Річардсон (1937) висловили непотрібні припущення . Проведено кілька досліджень іншим способіом, ніж це робили Кудер та Річардсон (1937).

Hoyt (1941)[19] похідний за допомогою ANOVA (аналіз дисперсії). Кирила Хойта можна вважати першим розробником загальної формули КР-20, але він прямо не представив формулу .

Перший вираз сучасної формули з'являється у Джексона та Фергюсона (1941)[20] . Представлена ними версія наступна. Едгертон і Томпсон (1942)[21] використовували ту саму версію.

Ґуттман (1945)[11] вивів шість формул надійності, кожну з яких позначав . Луї Ґуттман довів, що всі ці формули завжди були меншими або рівними надійності, і виходячи з цих характеристик, він назвав ці формули «нижчими межами надійності». Ґуттмана є , і є . Він це довів завжди більше або дорівнює (тобто точніше). У той час усі обчислення проводилися папером та олівцем, а з формули було простіше обчислити, він це згадав був корисний за певних умов.

Гулліксен (1950)[22] дослідив з меншою кількістю припущень, ніж попередні дослідження. Припущення, яке він використав, є суттєвою тау-еквівалентністю в сучасних умовах.

Визнання оригінальної формули та загальної формули KR-20 на той час

Дві формули були визнані абсолютно однаковими, і вираз загальної формули KR-20 не використовувався. Хойт[19] пояснив, що його метод «дає точно такий же результат», як і KR-20. Джексон та Фергюсон[20] констатували, що дві формули є «однаковими». — сказав Гуттман[11] є «алгебраїчно ідентичним» KR-20 (с.275). Гулліксен[22] також визнав, що дві формули є «однаковими».

Навіть дослідження, критичні щодо KR-20, не вказували на те, що оригінальну формулу KR-20 можна було застосувати лише до дихотомічних даних.[23]

Кронбах (1951)

Як і в попередніх дослідженнях[19][11][20][22], Кронбах (1951)[9] винайшов інший метод отримання . Його інтерпретація була інтуїтивно привабливішою, ніж у попередніх дослідженнях. Тобто він довів, що дорівнює середньому значення, отримані для всіх можливих розділених половин. Він критикував те, що назва KR-20 була дивною, і запропонував нову назву, коефіцієнт альфа. Його підхід досяг величезного успіху. Однак він не лише опустив деякі ключові факти, але й дав неправильне пояснення.

По-перше, він позиціонував коефіцієнт альфа як загальну формулу KR-20, але опустив пояснення, що існуючі дослідження опублікували точно однакову формулу. Ті, хто читав лише Кронбаха (1951) без попередніх знань, можуть неправильно зрозуміти, що він першим розробив загальну формулу KR-20.

По-друге, він не пояснив, за якої умови дорівнює надійності. Неексперти можуть помилково вважати загальним коефіцієнтом надійності, який можна було використовувати для всіх даних незалежно від необхідних умов.

По-третє, він не пояснив, чому змінив своє ставлення до . Зокрема, він не дав чіткої відповіді на проблему недооцінки , яку він сам критикував[23] .

По-четверте, він стверджував, що висока цінність у демонстрації однорідності даних.

Після 1951 року

Новік і Льюїс (1967)[24] довели необхідну і достатню умову , що дорівнює надійності і назвали його умовою бути по суті тау-еквівалентом.

Кронбах (1978)[2] зазначав, що причина, по якій Кронбах (1951) отримала багато цитат, була «здебільшого тому, що [він] поставив фірмове найменування на загальний коефіцієнт»[1] . Він пояснив, що спочатку планував називати інші типи коефіцієнтів надійності (наприклад, надійність між рейтингами або надійність тестування для повторного тестування) грецькими буквами (наприклад, , , ), але згодом передумав.

Кронбах та Шавельсон (2004)[25] спонукали читачів скоріше використовувати теорію узагальнення . Вони виступали проти використання імені Кронбах альфа. Безпосередньо заперечували існування поперднх досліджень, які опублікували загальну формулу KR-20 до Кронбаха (1951).

Виведення формули[1]

Припущення 1. Спостережуваний бал предмета складається з істинної оцінки предмета та помилки предмета, яка не залежить від істинної оцінки.

Лема

Припущення 2. Помилки не залежать одна від одної.

Припущення 3. (Припущення, що по суті є тау-еквівалентом) Справжній бал предмета складається з істинного бала, загального для всіх предметів, і константи елемента.

Значенням позначають суму пункту справжніх балів.

Дисперсія називається справжньою дисперсією балів.

Визначення. Надійність — це відношення справжньої дисперсії балів до спостережуваної дисперсії балів.

З наведених припущень встановлюється наступне співвідношення.

Тому матриця коваріації між елементами виглядає наступним чином.

Спостережна матриця коваріації

Відповідно, дорівнює середній коваріації між предметами. Це є,

Значенням позначають надійність при задоволенні зазначених вище припущень. є:

Примітки

  1. а б в г д е ж и Cho, E. (2016). Making reliability reliable: A systematic approach to reliability coefficients. Organizational Research Methods, 19(4), 651—682. https://doi.org/10.1177/1094428116656239
  2. а б Cronbach, L. J. (1978). Citation classics. Current Contents, 13, 263.
  3. Sijtsma, K. (2009). On the use, the misuse, and the very limited usefulness of Cronbach's alpha. Psychometrika, 74(1), 107—120. https://doi.org/10.1007/s11336-008-9101-0
  4. Green, S. B., & Yang, Y. (2009). Commentary on coefficient alpha: A cautionary tale. Psychometrika, 74(1), 121—135. https://doi.org/10.1007/s11336-008-9098-4
  5. а б Revelle, W., & Zinbarg, R. E. (2009). Coefficients alpha, beta, omega, and the glb: Comments on Sijtsma. Psychometrika, 74(1), 145—154. https://doi.org/10.1007/s11336-008-9102-z
  6. а б в Cho, E., & Kim, S. (2015). Cronbach's coefficient alpha: Well known but poorly understood. Organizational Research Methods, 18(2), 207—230. https://doi.org/10.1177/1094428114555994
  7. McNeish, D. (2017). Thanks coefficient alpha, we'll take it from here. Psychological Methods, 23(3), 412—433. https://doi.org/10.1037/met0000144
  8. Raykov, T., & Marcoulides, G. A. (2017). Thanks coefficient alpha, we still need you! Educational and Psychological Measurement, 79(1), 200—210. https://doi.org/10.1177/0013164417725127
  9. а б в Cronbach, L.J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika, 16 (3), 297—334. https://doi.org/10.1007/BF02310555
  10. а б Cho, E. and Chun, S. (2018), Fixing a broken clock: A historical review of the originators of reliability coefficients including Cronbach's alpha. Survey Research, 19(2), 23–54.
  11. а б в г Guttman, L. (1945). A basis for analyzing test-retest reliability. Psychometrika, 10(4), 255—282. https://doi.org/10.1007/BF02288892
  12. Osburn, H. G. (2000). Coefficient alpha and related internal consistency reliability coefficients. Psychological Methods, 5(3), 343—355. https://doi.org/10.1037/1082-989X.5.3.343
  13. Revelle, W. (1979). Hierarchical cluster analysis and the internal structure of tests. Multivariate Behavioral Research, 14(1), 57–74. https://doi.org/10.1207/s15327906mbr1401_4
  14. Peterson, R. A., & Kim, Y. (2013). On the relationship between coefficient alpha and composite reliability. Journal of Applied Psychology, 98(1), 194—198. https://doi.org/10.1037/a0030767
  15. Brown, W. (1910). Some experimental results in the correlation of metnal abilities. British Journal of Psychology, 3(3), 296—322. https://doi.org/10.1111/j.2044-8295.1910.tb00207.x
  16. Spearman, C. (1910). Correlation calculated from faulty data. British Journal of Psychology, 3(3), 271—295. https://doi.org/10.1111/j.2044-8295.1910.tb00206.x
  17. Kelley, T. L. (1924). Note on the reliability of a test: A reply to Dr. Crum's criticism. Journal of Educational Psychology, 15(4), 193—204. https://doi.org/10.1037/h0072471
  18. Kuder, G. F., & Richardson, M. W. (1937). The theory of the estimation of test reliability. Psychometrika, 2(3), 151—160. https://doi.org/10.1007/BF02288391
  19. а б в Hoyt, C. (1941). Test reliability estimated by analysis of variance. Psychometrika, 6(3), 153—160. https://doi.org/10.1007/BF02289270
  20. а б в Jackson, R. W. B., & Ferguson, G. A. (1941). Studies on the reliability of tests. University of Toronto Department of Educational Research Bulletin, 12, 132.
  21. Edgerton, H. A., & Thomson, K. F. (1942). Test scores examined with the lexis ratio. Psychometrika, 7(4), 281—288. https://doi.org/10.1007/BF02288629
  22. а б в Gulliksen, H. (1950). Theory of mental tests. John Wiley & Sons. https://doi.org/10.1037/13240-000
  23. а б Cronbach, L. J. (1943). On estimates of test reliability. Journal of Educational Psychology, 34(8), 485—494. https://doi.org/10.1037/h0058608
  24. Novick, M. R., & Lewis, C. (1967). Coefficient alpha and the reliability of composite measurements. Psychometrika, 32(1), 1–13. https://doi.org/10.1007/BF02289400
  25. Cronbach, L. J., & Shavelson, R. J. (2004). My Current Thoughts on Coefficient Alpha and Successor Procedures. Educational and Psychological Measurement, 64(3), 391—418. https://doi.org/10.1177/0013164404266386

Посилання

Література