Метанаука (також відома як дослідження, засновані на доказах) — це використання наукової методології для вивчення самої науки. Метанаука прагне підвищити якість наукових досліджень, зменшуючи відходи. Вона також відома як «дослідження досліджень» та «наука про науку», оскільки використовує методи дослідження для вивчення того, як проводяться дослідження та де їх можна вдосконалити. Метанаука стосується всіх галузей досліджень і була охарактеризована як «погляд з висоти пташиного польоту на науку».[1] За словами Джона Іоанідіса: «Наука — це найкраще, що трапилося з людьми … але ми можемо це зробити краще».[2]
У 1966 р. у ранніх мета-дослідженнях досліджено статистичні методи 295 праць, опублікованих у десяти відомих медичних журналах. Було встановлено, що «майже у 73% прочитаних звітів ... висновки були зроблені, коли обґрунтування цих висновків було недійсним». Метадослідження протягом наступних десятиліть виявило багато методологічних недоліків, неефективності та поганої практики досліджень у багатьох наукових галузях. Багато наукових досліджень не могли бути відтворені, особливо в медицині та м'яких науках. Термін "криза відтворюваності" був введений на початку 2010-х років як частина зростаючої обізнаності про проблему.[3]
Вжито заходів для вирішення проблем, виявлених метанаукою. Ці заходи включають попередню реєстрацію наукових досліджень та клінічні випробування, а також заснування таких організацій, як CONSORT та EQUATOR Network, які видають вказівки щодо методології та звітності. Продовжуються зусилля щодо зменшення зловживання статистикою, усунення неправильних стимулів з наукових шкіл, вдосконалення академічної експертної оцінки процесу, боротьби з упередженостю в науковій діяльності літератури та підвищення загальної якості та ефективності наукового процесу.
Історія
У 1966 р. у ранніх метадослідженнях досліджено статистичні методи 295 робіт, опублікованих у десяти гучних медичних журналах. Було встановлено, що «майже у 73% прочитаних звітів ... висновки були зроблені, коли обґрунтування цих висновків було недійсним».[4] Пізніші метадослідження виявили широкі труднощі в відтворюваністі результатів у багатьох наукових галузях, включаючи психологію та медицину. Цю проблему назвали "криза відтворюваності". Метанаука зросла як реакція на кризу відтворюваності та на занепокоєння щодо відходів у дослідженнях.[5] Багато видатних видавців зацікавлені у метадослідженні та покращенні якості своїх публікацій. Найкращі журнали, такі як "Nature", "The Lancet" та "Science" забезпечують постійне висвітлення метадослідження та проблеми з відтворюваністю.[6] У 2012 році PLOS ONE розпочав ініціативу щодо відтворення. У 2015 році Biomed Central представив контрольний список мінімальних стандартів звітності з чотирох рядків.
Першою міжнародною конференцією в широкій галузі метадосліджень стала конференція Research Waste / EQUATOR, що відбулася в Единбурзі в 2015 році; першою міжнародною конференцією з питань експертної оцінки була, що відбулася в 1989 році.[7] У 2016 році було запущено журнал Research Integrity and Peer Review. Відкриття редакції журналу закликало до "досліджень, які розширять наше розуміння та запропонують потенційні рішення питань, пов'язаних з експертизою, звітністю про дослідження та етикою досліджень та публікацій".[8]
Області метадосліджень
Метадослідження можна поділити на п'ять основних галузей, що цікавлять: методи, звітність, відтворюваність, оцінка та стимули. Вони відповідають відповідно до того, як проводити, спілкуватися, перевіряти, оцінювати та винагороджувати дослідження.[9]
Метадослідження виявило погану практику звітності, пояснення, поширення та популяризації досліджень, особливо в галузі соціальних та медичних наук. Погана звітність утруднює точну інтерпретацію результатів наукових досліджень, відтворення досліджень та виявлення упередженості та конфлікту інтересів авторів. Рішення включають впровадження стандартів звітності та більшу прозорість наукових досліджень (включаючи кращі вимоги до розкриття конфлікту інтересів). Існує спроба стандартизувати звітність даних та методологію шляхом створення керівних принципів звітними органами, такими як CONSORT та більш широкі EQUATOR. [9]
Відтворюваність
Криза реплікації - це методологічна криза, що триває, коли було виявлено, що багато наукових досліджень важко чи неможливо повторити. [12][13] Хоча криза сягає корінням у метадослідження середини - кінця 1900-х років, фраза "криза відтворюваності" була придумана до початку 2010-х років [3] як частина зростаючої обізнаності про проблему. [9] Криза відтворюваності особливо впливає на психологію (особливо соціальну психологію) та медицину.[14][15] Відтворюваність є невід'ємною частиною наукового процесу, і широко розповсюджені невдачі відтворюваності ставлять під сумнів надійність постраждалих галузей. [16]
Більше того, відтворення дослідження (або неспроможність повторити) вважається менш значимим, ніж оригінальне дослідження, і рідше публікується у багатьох сферах. Це відлякує від звітування про дослідження та навіть спроби їх повторення.[17][18]
Оцінка
Метанаука прагне створити науковий фундамент для експертної оцінки. Метадослідження оцінює систему експертної оцінки, включаючи експертний огляд перед публікацією, експертний огляд після публікації та відкритий експертний огляд. Вона також прагне розробити кращі критерії фінансування досліджень. [9]
Метанаука прагне сприяти кращому дослідженню через кращі системи стимулювання. Це включає вивчення точності, ефективності, витрат та переваг різних підходів до ранжування та оцінки досліджень та тих, хто їх виконує. [9] Критики стверджують, що неправильні стимули створили середовище "опублікуй-або-загинь" в наукових колах, що сприяє виробленню сміттєвої науки, низькоякісних досліджень та хибнопозитивних даних.[19][20] За словами Брайана Носека, "Проблема, з якою ми стикаємося, полягає в тому, що система стимулювання майже повністю орієнтована на опублікування досліджень, а не на правильне виконання досліджень".[21] Прихильники реформ прагнуть структурувати систему стимулювання для вищої якості.[22]
Реформи
Метадослідження, що виявляють недоліки в науковій практиці, надихнули реформ у науці. Ці реформи мають на меті вирішити та виправити проблеми в науковій практиці, які призводять до неякісних чи неефективних досліджень.
Попередня реєстрація
Практика реєстрації наукового дослідження до його проведення називається попередня реєстрація. Він виник як засіб для подолання кризи відтворюваності. Попередня реєстрація вимагає подання зареєстрованого звіту, який потім приймається до публікації або відхиляється журналом на основі теоретичного обгрунтування, експериментальної конструкції та запропонованого статистичного аналізу. Попередня реєстрація досліджень служить для запобігання упередженості публікацій, зменшення просіювання даних та збільшення відтворюваності. [23][24]
Стандарти звітування
Дослідження, що показують погану послідовність та якість звітності, продемонстрували необхідність стандартів та рекомендацій звітності в науці, що призвело до зростання організацій, які виробляють такі стандарти, як CONSORT (Consolidated Standards of Reporting Trials, Консолідовані стандарти звітності про експерименти) та EQUATOR Network.
The EQUATOR (Enhancing the QUAlity and Transparency Of health Research)[25] Network - це міжнародна ініціатива, спрямована на просування прозорої та точної звітності про дослідження в галузі охорони здоров'я для підвищення цінності та надійності літератури з медичних досліджень.[26] EQUATOR Network була створена з метою підвищення обізнаності про важливість належної звітності про дослідження, сприяння розробці, розповсюдженню та впровадженню рекомендацій звітності для різних типів досліджень, моніторингу стану якості звітності науково-дослідних досліджень у науково-дослідницької літератури в галузі охорони здоров'я та проведення досліджень, що стосуються питань, що впливають на якість звітності про дослідження в галузі охорони здоров'я.[27] Мережа виступає як "парасольова" організація, яка об'єднує розробників керівних принципів звітності, редакторів медичних журналів та експертних рецензентів, органів фінансування досліджень та інших ключових зацікавлених сторін, що мають взаємний інтерес у покращенні якості наукових публікацій та самих досліджень.
Програми
Медицина
Клінічні дослідження в медицині часто низької якості, і багато досліджень неможливо повторити.[28][29] За оцінками, 85% фінансування досліджень витрачається марно. [30] Крім того, наявність упередження спонсорування впливає на якість досліджень.[31] Фармацевтичні компанії робить значний вплив на розробку та проведення медичних досліджень. Конфлікти інтересів поширені серед авторів медичної літератури [32] і серед редакторів медичних журналів. Хоча майже всі медичні журнали вимагають від їх авторів розкривати конфлікт інтересів, від редакторів цього не вимагають.[33]Фінансові конфлікти інтересів були пов'язані з більш високими показниками позитивних результатів дослідження. У випробуваннях антидепресантів фармацевтичне спонсорство є найкращим предиктором результатів випробувань.[34]
Засліплення є ще одним напрямком метадослідження, оскільки помилка, викликана поганим осліпленням, є джерелом упередженності. Про засліплення в медичній літературі не надто добре повідомляється, і широке нерозуміння цього предмета призвело до поганого впровадження засліплення в клінічному випробуванні.[35] Крім того, про помилки засліплення рідко вимірюють або повідомляють.[36] Дослідження, що показують неспроможність осліплення в дослідженнях антидепресантів, змусили деяких вчених стверджувати, що антидепресанти не кращі, ніж плацебо.[37][38] У світлі метадосліджень, що показують невдачі сліплення, стандарти CONSORT рекомендують у всіх клінічних випробуваннях оцінювати та повідомляти про якість засліплення.[39]
Дослідження показали, що систематичні огляди існуючих доказів досліджень недостатньо оптимально використовуються при плануванні нового дослідження або узагальнення результатів.[40] Сукупний метааналіз досліджень, що оцінюють ефективність медичних втручань, показав, що багатьох клінічних випробувань можна було б уникнути, якби систематичний огляд наявних доказів проводився до проведення нового випробування.[41][42][43] Наприклад, Lau та ін. [41] проаналізували 33 клінічні випробування (за участю 36974 пацієнтів), оцінюючи ефективність внутрішньовенної стрептокінази для гострого інфаркту міокарда. Їх сукупний метааналіз показав, що 25 з 33 випробувань можна було б уникнути, якби систематичний огляд проводився до проведення нового випробування. Іншими словами, рандомізація 34542 пацієнтів була потенційно непотрібною. Одне дослідження [44] проаналізував 1523 клінічні випробування, включені у 227 метааналізи та дійшов висновку, що "менше ніж чверть відповідних попередніх досліджень" було цитовано. Вони також підтвердили попередні висновки, що більшість звітів про клінічні випробування не містять систематичного огляду для обгрунтування досліджень або підведення підсумків. [44]
Багато методів лікування, які застосовуються в сучасній медицині, виявились неефективними або навіть шкідливими. У дослідженні Джона Іоанідіса в 2007 році було встановлено, що медичному співтовариству в середньому було потрібно десять років, щоб припинити посилання на популярні практики після того, як їх ефективність була однозначно спростована.[45][46]
Психологія
Метанаука виявила значні проблеми в психологічних дослідженнях. Галузь страждає від великої упередженості, низької відтворюваності та широкого поширення зловживання статистикою.[47][48][49] Криза відтворюваності зачіпає психологію сильніше, ніж будь-яку іншу сферу; оскільки дві третини широко розрекламованих висновків неможливо повторити.[50] Метадослідження виявляє, що 80-95% психологічних досліджень підтримують свої початкові гіпотези, що упевнено підтверджує існування упередженості публікації. [51]
Криза відтворюваності призвела до відновлення зусиль для повторної перевірки важливих висновків.[52][53] У відповідь на занепокоєння щодо упередженності публікацій та просіювання даних, в дослідженнях, в яких є попередня рестрація і тих, що публікуються без огляду на їх результати.[54]Аналіз цих реформ підрахував, що 61% результатів сліпих результатів дають нульовий результат, на відміну від 5-20 відсотків у попередніх дослідженнях. Цей аналіз показує, що незрозумілий експертний огляд суттєво зменшує упередженість публікацій.[51]
Психологи звичайно плутають статистичну значимість з практичним значенням, із захопленням повідомляють про велику впевненість у неважливих фактах.[55] Деякі психологи повідомили про більш широке використання ефекту розміру статистики, а не виключно покладаючись на значення P-value.
Фізика
Річард Фейнман зазначив, що оцінки фізичних констант були ближче до опублікованих значень, ніж можна було б очікувати випадково. Вважалося, що це результат підтверджувального упередження: результати, які погоджуються з існуючою літературою, швидше вірять і тому публікуються. Зараз фізики застосовують засліплення для запобігання подібного упередження.[56]
Пов'язані галузі
Журналологія
Журналологія, також відома як видавнича наука, - це наукове вивчення всіх аспектів процесу академічної публікації.[57][58] Галузь прагне покращити якість наукових досліджень шляхом впровадження доказової практики в академічні публікації.[59] Термін "журналологія" був введений Стівеном Локом, колишнім головним редактором "BMJ". Перший Конгрес експертного огляду, що відбувся в 1989 р. в Чикаго, Іллінойс, вважається ключовим моментом у заснуванні журналології як окремої галузі.[59] Сфера журналології впливає на пошук попередньої реєстрації в науці, особливо в клінічних випробуваннях. Реєстрація клінічного випробування зараз очікується у більшості країн. [59]
Наукометрія стосується вимірювання бібліографічних даних у наукових публікаціях. Основні дослідницькі питання включають вимірювання впливу наукових робіт та наукових журналів, розуміння наукових цитат та використання таких вимірювань у політиці та управлінських контекстах.[60]
Наука про наукові дані
Наука про наукові дані - це використання науки про дані для аналізу наукових робіт. Вона охоплює як якісні, так і кількісні методи. Дослідження в галузі наукових даних включають виявлення шахрайства[61] та аналіз мереж цитувань.[62]
↑ абPashler, Harold; Wagenmakers, Eric Jan (2012). Editors' Introduction to the Special Section on Replicability in Psychological Science: A Crisis of Confidence?. Perspectives on Psychological Science. 7 (6): 528—530. doi:10.1177/1745691612465253. PMID26168108. S2CID26361121.
↑Schor, Stanley (1966). Statistical Evaluation of Medical Journal Manuscripts. JAMA: The Journal of the American Medical Association. 195 (13): 1123. doi:10.1001/jama.1966.03100130097026. ISSN0098-7484.
↑Binswanger, Mathias (2015). How Nonsense Became Excellence: Forcing Professors to Publish. У Welpe, Isabell M.; Wollersheim, Jutta; Ringelhan, Stefanie; Osterloh, Margit (ред.). Incentives and Performance(англ.). Springer International Publishing. с. 19—32. doi:10.1007/978-3-319-09785-5_2. ISBN9783319097855. {{cite book}}: Проігноровано |work= (довідка)
↑Simera, I; Altman, DG (October 2009). Writing a research article that is "fit for purpose": EQUATOR Network and reporting guidelines. Evidence-based Medicine. 14 (5): 132—4. doi:10.1136/ebm.14.5.132. PMID19794009. S2CID36739841.
↑Bello, S; Moustgaard, H; Hróbjartsson, A (October 2014). The risk of unblinding was infrequently and incompletely reported in 300 randomized clinical trial publications. Journal of Clinical Epidemiology. 67 (10): 1059—69. doi:10.1016/j.jclinepi.2014.05.007. ISSN1878-5921. PMID24973822.
↑ абLau, Joseph; Antman, Elliott M; Jimenez-Silva, Jeanette; Kupelnick, Bruce; Mosteller, Frederick; Chalmers, Thomas C (1992). Cumulative Meta-Analysis of Therapeutic Trials for Myocardial Infarction. New England Journal of Medicine. 327 (4): 248—54. doi:10.1056/NEJM199207233270406. PMID1614465.
↑Fergusson, Dean; Glass, Kathleen Cranley; Hutton, Brian; Shapiro, Stan (2016). Randomized controlled trials of aprotinin in cardiac surgery: Could clinical equipoise have stopped the bleeding?. Clinical Trials: Journal of the Society for Clinical Trials. 2 (3): 218—29, discussion 229–32. doi:10.1191/1740774505cn085oa. PMID16279145. S2CID31375469.
↑Franco, Annie; Malhotra, Neil; Simonovits, Gabor (1 січня 2016). Underreporting in Psychology Experiments: Evidence From a Study Registry. Social Psychological and Personality Science(англ.). 7 (1): 8—12. doi:10.1177/1948550615598377. ISSN1948-5506.
↑Stokstad, Erik (20 вересня 2018). This research group seeks to expose weaknesses in science—and they'll step on some toes if they have to. Science. doi:10.1126/science.aav4784.
↑ абвCouzin-Frankel, Jennifer (18 вересня 2018). 'Journalologists' use scientific methods to study academic publishing. Is their work improving science?. Science. doi:10.1126/science.aav4758.
↑Leydesdorff, L. and Milojevic, S., "Scientometrics" arXiv:1208.4566Архівована копія. Архів оригіналу за 15 червня 2020. Процитовано 15 червня 2020.{{cite web}}: Обслуговування CS1: Сторінки з текстом «archived copy» як значення параметру title (посилання) (2013), forthcoming in: Lynch, M. (editor), International Encyclopedia of Social and Behavioral Sciences subsection 85030. (2015)
↑Markowitz, David M.; Hancock, Jeffrey T. (2016). Linguistic obfuscation in fraudulent science. Journal of Language and Social Psychology. 35 (4): 435—445. doi:10.1177/0261927X15614605.
↑Ding, Y. (2010). Applying weighted PageRank to author citation networks. Journal of the American Society for Information Science and Technology. 62 (2): 236—245. arXiv:1102.1760. doi:10.1002/asi.21452.