尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️
作者:同人於野
科學領域中,存在很多社會公眾密切關注的問題。對於這些問題,主流科學界也往往會給出一個相應的說法。不過,科學家們肯定免不了會出錯。有時他們的研究結論甚至會彼此矛盾。比如有些研究認為,手機輻射跟腦癌之間存在關聯,有些研究又說這種關聯證據不足。有時候他們說大蒜可以降低有害膽固醇,有時候又說大蒜其實不能降低有害膽固醇。這常常讓公眾感到無所適從。那麼,遇到這種情況應該怎麼辦呢?
a.以最權威科學家,比如諾貝爾獎得主或者Nature雜誌上論文,的意見為主。b.以科學家中的「主流意見」(如果「主流」真的存在的話)為主。c.以最 新髮表的意見為主。d.別當真,科學新聞可以當娛樂新聞看。
如果這條新聞說的是最新的醫學研究,那麼理性的選擇是:(d),別當真,就當娛樂新聞看吧。
那些寫在晚報副刊上的各種所謂健康指南,連看都別看。而那些刊登在主流媒體上,有最新的論文支持的科學新聞,比如說英國某個團隊又發現什麼東西對兒童智力的新影響了,我們大概可以看,但是看完就忘了也沒有太大問題。
更進一步,如果這條新聞說的是最新的營養學研究,比如吃什麼什麼維生素對身體有什麼什麼好處或壞處,那麼哪怕是發表在最權威醫學期刊上的那些高引用率論文,也可以全部忽略。
說這句話的人叫 John P.A. Ioannidis,他去年剛剛被任命為史丹佛大學預防醫學研究中心主任。Ioannidis 說,「ignore them all」. 他攻擊的不僅僅是營養學,而是整個醫學研究。2005年,Ioannidis 發表兩篇論文,證明大部分醫學研究都存在問題。這兩篇論文在醫學界被引用好幾百次,但是沒多少人說他這個看似無比偏激的結論是錯的。甚至沒人表示驚訝。所有搞醫學研究的科學家都知道這個秘密:醫學研究確實算不上嚴密。
John P.A. Ioannidis|med.stanford.edu
不過,這件事一直到2010年底才引起公眾的關注。首先是《亞特蘭大月刊》發表充滿憤怒的長文,標題採用英國首相和馬克吐溫發明的著名句式:「謊言,該死的謊言,和醫學研究」。《時代周刊》立即跟進,並把結論進一步精簡為「90%的醫學研究都是錯的」!《時代周刊》這篇報導說,現在已經有人開始真正認真地重新審視整個醫學科研,而且立即發現了幾個與我們此前的知識完全相反的結論,比如說:沒事兒自己檢查乳房,不但不會降低乳房癌的死亡率,沒準還有壞處;其實科學家並沒有足夠證據說注射流感疫苗對防治流感有效。當然,以上兩個更新的知識也未必可靠,但為什麼Ioannidis做出如此猛烈的攻擊,他說的話是否有道理?我們必須看看他到底說了什麼。
2005年發布在《Plos Medicine》的文章引用次數已經超過三千次
他一篇發表在PLoS Medicine 上的文章說,在醫學研究中被廣泛使用的統計方法,其實是個非常脆弱的體系。如果你的一項研究是考察某種藥物對人的健康是否好處,而你希望能證明有好處的話,你將很容易做到這一點。首先,現在大部分醫學科研研究的效應其實都是比較微弱的,因為「不微弱」的效應別人早就研究完了。其次,也許一個病人的病情並沒有什麼明顯好轉,但因為你希望這個藥物有效,你也許會完全無意識的刻意尋找他好轉的證據,你可能會把本來沒什麼好轉的病人當成好轉的病人。這就是你的偏見。Ioannidis 這篇論文其實全是數學,他做了一番計算,說如果這個微弱效應有10%,而你的偏見有30%的話,你的實驗得到正確結論的概率只有20%。
科學家是有偏見的。他可能因為拿了醫藥公司的資助而希望證明一個藥物的療效,他更可能為了能在發表有轟動效應的論文而追求驚人的結果。鑒於10%的效應率和30%的偏見率差不多就是一般流行病學研究的水平,我們大概可以說80%的流行病學研究都有問題——當然,這些研究僅僅是研究而已,它們是整個醫學研究序列中的一部分,而不是直接指導人類行為的準則。根據同樣的計算,小規模隨機試驗的可信性也只有23%。Ioannidis 這篇文章就是用數學方法證明這種偏見有多可怕。
2005年發表在美國醫學會期刊的文章
光玩數學當然不行,批評現實得有真實證據。Ioannidis另一篇發表在 JAMA 上的論文乾的就是這個。沒有人能把所有醫學論文都研究一遍,所以他的做法相當具有戲劇性:他只看1990到2003年間發表在頂級臨床醫學期刊上的頂級論文,入選標準是被引用超過1000次。符合這個標準的論文一共有49篇,其中45篇聲稱發現了某種有效的藥物或者療法。
我們都知道科學結果理應是可重復的,我們不知道的是有多少科學結果真的被人重復過。這45篇論文雖然都被引用了千次以上,其中只有34篇被重復檢驗過。
而後人檢驗的結果是其中7篇的結論錯誤。比如有一篇論文說維生素E對降低男子冠心病風險有好處,有一篇論文說維生素E對降低女子冠心病風險有好處,而後來的大規模隨機實驗則證明維生素E對降低冠心病風險根本沒好處。另有7篇論文被發現是誇大了有效性。也就是說34篇經過檢驗的論文中的14篇(41%)被發現結論有問題。這45篇最權威的論文中只有20篇扛過了時間的考驗。
頂級論文尚且如此,一般論文又能怎麼樣呢?真有90%都不可靠麼?我從未發現 Ioannidis 說過「90%的醫學研究都錯了」這句話,《時代周刊》的報導的確是標題黨。
事實上,Ioannidis 說的不是90%錯誤,而是431/432存疑。Ioannidis 的做法是選擇一個熱門領域,徹查這個領域內所有的論文。這個領域研究的是男女患各種疾病的風險不同,是否因為基因的影響。在2007年 JAMA 的一篇論文中,Ioannidis 與合作者找到這個領域的所有77篇論文,然後逐篇分析這些論文處理數據的方法是否足夠嚴謹。這些論文一共提出了432個論斷,其中只有60個論斷可以稱得上是方法嚴謹。而這60個拿的出手的論斷中,曾經被其它研究至少重復驗證了兩次的,只有一個。
所以嚴格的說,並不是絕大多數醫學研究的「錯」了,而是不嚴謹,沒有經過考驗。如果我們對正確科學論斷的要求是方法嚴謹,結果至少經過兩次檢驗,那麼這個領域的合格率只有1/432。如果我們放寬要求,只要一篇論文不被證明是錯的,就算它是好論文,那麼發表在最權威期刊上的被引用次數最多的醫學論文中,有7/45是壞論文。
圖片來源:unsplash
在這七篇壞論文中,有兩篇說維生素E可以降低冠心病風險。但隨後於2000年發表在《新英格蘭醫學雜誌》上的一篇文章,通過對超過9000人進行的嚴格隨機實驗證明,維生素E根本不能降低冠心病風險。這一結論從此之後再也沒被推翻過。那麼到底有多少科學家知道這件事兒呢?Ioannidis 等人曾經專門調查了到底有多少論文還在使用「維生素E降低冠心病風險」這個錯誤知識,結論是一直到2005年,仍有50%的 新髮論文還在引用前面那兩篇錯誤的頂級論文,並且以為它們是對的。
把學術論文的結論推廣到真實世界的真理,有時候是非常危險的事情。因為不理解科學研究的思維方式,導致大多數人對科學有兩個重大誤解:第一,認為科學研究絕對真理;第二,認為每一項科研都是在生產我們日常決策的答案。真實的科學研究其實一個充滿曲折,甚至有時候錯進錯出的過程。
不過,很多論文不嚴謹,甚至很多都是錯的,這並不表明科學中沒有正確答案,它只是表明得到和判斷正確答案並不簡單。值得注意的是,醫學研究通常立足於統計學的方法。由於這些方法本身所具有的缺陷,所以出現「不靠譜」的研究結果也並不奇怪。這也並不是說所有醫學研究全都是不靠譜的——因為缺陷並非不可彌補,研究者可以通過擴大研究規模,延長研究時間等方法,盡量減少干擾因素。不同的研究之間,也存在著結果上的互補關係。事實上,醫學研究就是通過這樣千千萬萬的可能會有些不靠譜的研究,逐漸明晰起來,無限逼近最終的正確解。從上述維生素E的研究案例中,我們就可以清楚地看到這一點。
科學報導都是用人類語言寫成的,而科學研究使用的卻不是人類傳統語言。所謂「科學方法」其實是另一套很不一樣的思維方式。往後的幾篇小文會介紹一下「科學方法」——這種超越了人類本能的思維方式。一個簡單的問題是,我們憑什麼相信「維生素E不能降低冠心病風險」這個結論是對的?因為有些科學方法比另一些科學方法更可信。我們將說明為什麼看新聞不如看論文,為什麼看一篇論文不如把多篇論文綜合在一起看(稱為meta-analysis),以及為什麼這麼看還是不行。
註:有一個叫做 Cochrane Collaboration 的國際組織,就正在專門嚴格審視各種醫學研究,並且推出了很多報告,而且他們也采納了 Ioannidis 提出的審查方法。這個組織特別強調經費只來自於政府,大學和私人捐款,而不拿醫藥公司的錢。
編者按:這是一篇內容看起來很聳動的文章,希望讀者不要因此產生科學研究很不靠譜的觀念。事實上這篇文章的目的,並非攻擊整個醫學研究,而是介紹國外關於醫學研究的大討論,更重要的是,讓我們開始思考,什麼樣的科學研究方法更加合理,讓我們更加接近真理。這也是一個死理性派真正應該達到的境界。接下來作者也會從物理學開始,逐步展開這個問題。也感謝很多生物醫學專業的同學對本文提出的寶貴意見。
排版:陳小磚
題圖來源:unsplash
原文鏈接:https://www.guokr.com/article/49901/
本文版權屬於果殼網(guokr.com),禁止轉載。如有需要,請聯繫果殼。
歡迎個人轉發到朋友圈
喜歡記得點「在看」
【拓展閱讀】飽和脂肪,究竟是好是壞?