21世紀經濟報道記者 唐唯珂 廣州報道
9月29日,由南方財經全媒體集團指導,國內數字化智庫型財經媒體領跑者《21世紀經濟報道》、21世紀新健康研究院主辦,廣發證券聯合主辦的“2022中國大健康產業峰會之醫藥創新峰會暨“健康中國?21CC”優秀案例發布活動上,中科院計算所副研究員、中科計算技術西部研究院常務副院長張春明發表了“AI如何助力新藥研發”主旨演講。
張春明表示,目前數據對生命的“攝像”已經是工業化級別,即數據產生的質量高、速度快、成本低。對人和疾病的反映小到分子,大到組織和系統,包括整個人體,都可以做出數據的“攝像”。生命科學數據是真正的多維度、跨尺度大數據,將占據未來整個全世界數據1/3。但挑戰在于從數據中挖掘規律、輸出靶點等,進而服務疾病診療和醫藥創新。這些數據是我們可以挖掘的金礦,但數據從來不是石油,它是沙子,需要有很高超的提煉技術,才能把沙子中的金子提取出來。
張春明進一步表示,人生物醫學知識和數據太復雜,專家看到的都是“大象”的一部分,希望能夠進行系統的整合額挖掘,爭取在不同分辨率上勾畫出“大象”的全貌,例如如果是1K的分辨率,可能會促進10個IVD層面的診斷,但是當達到1W、1G分辨率的時候,那么向醫藥行業去釋放的產能將更大。
AIDD2.0賦能藥物研發各環節
張春明在演講中指出,從上市公司角度來看,中國上市公司數量是美國1/3,市值是美國1/10,人群醫療消費水平是美國的1/20,所以中美之間差距明顯。要縮短這一差距必須得想新辦法。中國醫藥創新從仿制藥發展到Me-too的過程,一開始是低風險高收益,經過幾十年發展產生了一批藥企,之后行業已經充分競爭,所以仿制藥和Me-too階段變成了低風險和低收益,國家醫保包括政策導引開始加速行業向高風險、高收益階段轉移。
不過,張春明也指出,產生好的研發結果很難,做完分子上臨床后成功率往往不到10%,做一個新藥成本高達20億美元。高失敗率背后的原因,90%以上要歸結于在對疾病和藥物的機制不清楚,因此對疾病和藥物機制的理解不清是整個制藥行業需要解決的問題。
藥企目前也面臨著低回報率的問題。此前德勤報告有統計,研發支出前12的大藥企投資回報率已經低至1.8%,而且銷售峰值在逐年的銳減。張春明認為,如果中國的藥企再圍繞傳統的FIC(首創新藥)思路去創新的話,將面臨著當前的困局。所以各大藥企想提高藥物研發的效率,提高成功率,降低成本,就是必然的趨勢。而AI技術能賦能整個行業的各個環節。
從上世紀90年代的CADD(信息驅動醫療中心)到現在的AIDD(AI輔助藥物研發),藥物的篩選和工藝的控制環節提高了效率和成功率,降低了成本。但是,在解決靶點發現和臨床選擇適應癥和人群施準層面上的問題卻沒有解決。
張春明認為,必須要把AIDD發展到AIDD2.0,2020年是計算醫學的元年,也是AIDD2.0的元年。其目的就是用AI去解決對疾病和藥物機理認知不清的系統性問題,求助于超算、AI算法,包括多組學跨尺度的數據,從疾病的認知,靶點的產生、精準臨床方案的設計,三個環節給行業起效加能,從根本上解決原創性問題。
張春明進一步指出,回過頭看現在社會生產工具是否具備計算醫學賦能的基礎,其實整個科學和技術生態已經做好了準備,就像愛因斯坦當年做廣義相對論,在100年前已經把數學工具準備好了。而算力現在是最快的生產工具,在70年內提升4億倍,很榮幸我們是這個生產工具的弄潮兒,我們做出了世界上最快的超性能計算機。
將知識的孤島變成知識的網絡
同時,張春明也指出,生命醫學的科學家發表了大概4000萬篇文獻,這就是知識的寶庫。 張春明指出,要做醫藥創新,就要利用這些知識,站在巨人的肩膀上去面向未來。要從這些海量的數據里去挖掘知識,把知識的孤島變成知識的網絡,來服務醫藥創新,來服務早篩早診。
英國的UKbiobank(英國生物銀行),已經在用國家的力量整合行業的資源造數據。
張春明指出,“從一開始用芯片的數據,到現在投錢去做藥物研發,這些參與者不斷地感知到不同的數據對他們的藥物研發有絕對促進作用,所以藥企才會出錢去做?!蓖瑫r,張春明也指出,計算醫學想要在整個行業廣泛使用就必須做成APP,而APP是整個計算醫學技術體系,有了這套體系后,就可以充分的利用行業化CIO的能力,以及中國豐富的病人資源和成熟的生物化學實驗室,向行業做出一個差異化、高價值的資產輸出。因此,要做行業的平臺,向行業輸出自己的IP。
而想要順利地輸出IP,實現行業的進步,張春明表示還需要兩個核心的技術。第一是超腦,要將這個行業嘔心瀝血的知識用在技術上,解決早篩的問題,將知識聯絡起來用于藥物的研發和預防。
第二是從數據中挖掘規律。數據攝像是很容易的,但是識別相片里的信息是很難的。因此我們構建了一套創新性的方法,能夠解決用小樣本就可以解決藥物發現和臨床適應癥的開發問題。
張春明指出,這套算法的核心是把一個人在1000個功能的指標上分解成一個數字人,將真實世界的病人直接用超算全部做成數字化病人庫。擁有這套技術基礎之后,再也不需要大規模的投錢收集數據和砸錢。只要在特定的癌種里去收集知識,多組學的數據。數字化人之后,再從環境、方方面面把人進行歸類,用這種歸類方式做靶點的發現以及老藥的拓適應癥。
此外,張春明還表示,在第一代技術時,生物科學家靠的是動物的細胞進行理想的生物學模型。這項技術支撐了當前的生物醫藥產業走到今天的繁榮,但是今天產業遇到的困境也恰恰是第一代技術的紅利接近了尾聲;第二代技術是數據生產和大規模觀察技術。雖然高通量觀察到一些東西,但所用到的洞見還是生物學模型所產生結構化的知識。
張春明表示,前兩代技術都是歐美的同伴們給行業做的貢獻,我們想再超越它很難,但是第三代技術是最有機會引領的,而且是利用4000萬篇文獻和多組學的數據來建立行業的“珠穆朗瑪峰”?!霸谇嗖馗咴想S便長一個小山包都比泰山高,我們用這套技術來建立中國醫藥行業的青藏高原。 ”
(實習生唐菁陽對本文亦有貢獻)