核心閱讀
當人工智能與科學研究“碰撞”,能產生多大的能量?前不久,2024年諾貝爾物理學獎和化學獎授予人工智能相關研究的學者,引起了極大的關注。近年來,我國科學家也在多個領域探索“人工智能驅動的科學研究”,利用人工智能技術縮短研發(fā)周期、降低研發(fā)成本,人工智能技術與科學研究加速融合。
電解液,被稱為電池的“血液”,其設計是尋找到下一代電池的關鍵之一。然而,電解液材料分子組合浩如煙海,逐一篩選效率非常低。借助人工智能手段,科研人員有了快速開發(fā)電解液材料的新方法。
“人工智能驅動的科學研究”是以機器學習為代表的人工智能技術與科學研究深度融合的產物,當前已成為全球科學研究的前沿。今年的諾貝爾物理學獎和化學獎授予人工智能相關研究的學者,表明人工智能在科學研究上的作用越發(fā)顯著。
圖靈獎得主、中國科學院院士姚期智最近在騰訊新基石科學基金會和南方科技大學共同舉辦的一場青年科學家論壇上,以“人工智能的科學視角”為題進行了分享。他認為,人工智能科學未來發(fā)展將呈現兩大趨勢,一是從弱智能走向通用智能,二是為學科間的交叉賦能,如具身智能、AI仿生、AI+量子等新技術、新應用將大量涌現。
變 化
帶動科研范式從經驗主導向數據驅動轉型
隨著新能源產業(yè)快速發(fā)展,人們對電池性能的要求越來越高,而電解液對于電池理論性能的發(fā)揮起著關鍵作用。清華大學化學工程系教授張強與副研究員陳翔合作,帶領團隊提出了“人工智能設計鋰電池電解液”的新方法,實現了先進電解液的高效設計開發(fā)。
在數據方面,團隊開發(fā)了電解液高通量計算方法與軟件,構建了領先的數據庫,涵蓋25萬種以上的電解液分子結構;在算法方面,團隊開發(fā)了領域知識嵌入的電解液大模型及軟件平臺,可以實現億量級分子空間維度的電解液分子性質快速預測與精準定向設計。陳翔說,基于這些工具,科研人員可以根據用戶需求開發(fā)最合適的電解液。
人工智能與科學研究的深度融合,既提升了人工智能應用水平,也帶動了科學研究范式從經驗主導向數據驅動轉型。
對人工智能技術帶來的變革,中國農業(yè)科學院作物科學研究所研究員、國家南繁研究院副院長李慧慧同樣感受深切。
“常規(guī)育種方法依賴經驗,耗時長,且對表現型容易受環(huán)境影響性狀的改良效率較低。通過人工智能算法,科研人員能夠在育種家進行田間試驗前,快速預測作物田間表現,大大縮短育種周期。”李慧慧說。
全球約1750個植物種質庫保存著超700萬份種質資源,受限于分析工具,許多珍貴的遺傳資源尚未得到充分利用。“人工智能輔助的基因組選擇能在幾周內分析上百萬基因型,極大提升了育種流程效率和精度,應用潛力巨大。”李慧慧說。
應 用
縮短周期、降低成本,人工智能賦能科研向深度、廣度拓展
專家表示,物理、化學、材料等學科,是典型的理論和實驗相結合的領域。布局人工智能驅動的科學研究,有助于增強基礎研究的比較優(yōu)勢。
近年來,人工智能技術與科學研究加速融合,正不斷向深度和廣度拓展。張強介紹,2011年左右,國際上嘗試將人工智能技術用于材料開發(fā)。近些年,數據驅動的材料學研究顯著提速。
“目前,人工智能已經應用到電池研究的各個領域,涉及電池工作機理探究、新材料開發(fā)等諸多方面。”張強認為,人工智能在處理海量數據等方面優(yōu)勢顯著,與電池理論、實驗研究方法進一步結合,將有力推動下一代高比能電池、固態(tài)電池、快充電池、寬溫域電池等的開發(fā)與迭代。
利用人工智能技術研究鋰電池,我國總體上處于國際第一梯隊,一些成果受到科學界廣泛關注。比如,電子科技大學團隊開發(fā)了高比能鋰金屬電池狀態(tài)估計與壽命預測的機器學習方法,指導設計了延長電池使用壽命的方法;中國科學院物理研究所團隊與張強/陳翔團隊合作,結合機器學習模型與高通量篩選,開發(fā)了寬溫域電解液新分子。
不僅是材料研發(fā),在生命科學、藥物研發(fā)、半導體、環(huán)境科學等多個領域,科學家都在探索利用人工智能技術,縮短研發(fā)周期、降低研發(fā)成本。
近年來,中國農業(yè)科學院加速推進農業(yè)科技與人工智能技術融合創(chuàng)新,在生物育種、智能農機裝備等領域組建交叉學科團隊。如今,李慧慧帶領團隊致力于開發(fā)基于深度學習算法的基因組選擇模型、全流程智慧育種平臺等算法工具,進而提升水稻、玉米、小麥等主糧作物的育種效率。“我們在智慧育種上初步取得了一些成果。比如,利用機器學習和深度學習算法深度融合基因組、轉錄組和表型數據,識別出控制作物抗逆和高產的關鍵基因。”李慧慧說。
推動人工智能與科學研究融合,技術支撐平臺很重要。上海交通大學人工智能研究院常務副院長楊小康說,為幫助更多老師使用人工智能輔助科研,學校和百度智能云聯合打造了人工智能驅動的科學研究平臺,實現了生成式人工智能與科研場景的結合?;诎俣戎悄茉铺峁┑乃懔?、大模型開發(fā)工具鏈等能力,科研人員在化學合成、流體計算、城市科學、法律等優(yōu)勢學科開展研究,取得了一系列突破成果。
以抗艾滋病病毒(HIV)小分子設計為例,上海交通大學人工智能研究院總工程師金耀輝介紹,過去篩選先導化合物需要2到3年,基于人工智能驅動的科學研究平臺,科研人員2分鐘內就生成超過25萬個全新分子,并在30分鐘內進一步篩選出172個潛在有效的分子,大幅提升分子設計的迭代效率。
展 望
推動人工智能驅動的科學研究,釋放應用潛力
2023年2月,科技部會同國家自然科學基金委啟動了“人工智能驅動的科學研究”專項部署工作,緊密結合數學、物理、化學、天文等基礎學科關鍵問題,圍繞新藥創(chuàng)制、基因研究、生物育種、新材料研發(fā)等重點領域科研需求,布局前沿科技研發(fā)體系,推動人才聚集與國際交流合作。
如何推動人工智能與科學研究更好融合?
在陳翔看來,數據和模型是兩大關鍵因素,“我國鋰電池產業(yè)蓬勃發(fā)展,與電池前沿研究相互促進,為人工智能研究奠定了深厚的數據基礎,這是重要的優(yōu)勢。”
李慧慧表示,將人工智能應用到作物育種上,我國在一些領域展現出強勁的競爭力,但相比國際先進水平,在高質量數據的積累、開放共享上仍存在一定差距。“必須更好地整合跨學科、跨團隊的數據資源,優(yōu)化算法性能,并擴大人工智能技術的應用范圍。”她建議。
“人工智能技術更好助力科研,離不開算力支撐,需要構建高效穩(wěn)定的人工智能異構算力底座。”楊小康說,學校接下來將升級平臺能力,努力開創(chuàng)人工智能與科研場景相結合的創(chuàng)新示范。
受訪專家建議,需要加強相關學科與人工智能交叉領域的復合型人才培養(yǎng)。“可以通過鼓勵不同學科背景深度合作,引導開展交叉研究,發(fā)現研究的真問題、痛點和難題,釋放人工智能應用的潛力。”張強說。
陳翔提醒,一些國家在人工智能大模型開發(fā)、專用芯片開發(fā)等方面占據主導,推動我國“人工智能驅動的科學研究”持續(xù)健康發(fā)展,還需要努力補上這些方面的短板。
近年來,我國“人工智能驅動的科學研究”發(fā)展很快,一些領域逐漸走向國際前沿,不久有望實現更多有價值的突破。張強/陳翔團隊正著力打通從人工智能設計電解液到投入產業(yè)應用的完整鏈條,李慧慧和團隊將重點推進作物雜交種基因組選擇以及環(huán)境適應性預測模型的開發(fā)。“我們對未來研究充滿信心。”他們說。