高文,中國工程院院士,北京大學(xué)博雅講席教授,鵬城實(shí)驗(yàn)室主任。他見證和參與了中國計(jì)算機(jī)行業(yè)的高速發(fā)展,見證了人工智能的成長壯大。他先后主持國家級(jí)科研項(xiàng)目20多項(xiàng),涉及人工智能、視頻編碼與分析、計(jì)算機(jī)視覺等前沿領(lǐng)域。他帶領(lǐng)的數(shù)字視頻編解碼技術(shù)國家工程實(shí)驗(yàn)室,經(jīng)過十余年的潛心研究,憑借完全自主創(chuàng)新,完成了我國具備自主知識(shí)產(chǎn)權(quán)的第二代信源編碼標(biāo)準(zhǔn)體系,達(dá)到了國際標(biāo)準(zhǔn)水平。2021年,他和他的項(xiàng)目團(tuán)隊(duì)?wèi){借“超高清視頻多態(tài)基元編解碼關(guān)鍵技術(shù)”,榮獲2020年度國家技術(shù)發(fā)明獎(jiǎng)一等獎(jiǎng)。他和團(tuán)隊(duì)主導(dǎo)制定的AVS超高清視頻編解碼國家標(biāo)準(zhǔn),還被全球超高清產(chǎn)業(yè)聯(lián)盟采納為國際標(biāo)準(zhǔn)。
人工智能被視為第四次工業(yè)革命的一個(gè)標(biāo)志,發(fā)達(dá)國家和眾多的科技公司,紛紛投入巨資展開研發(fā)和布局,我國也在全力構(gòu)筑人工智能發(fā)展的先發(fā)優(yōu)勢。黨的二十大報(bào)告指出,推動(dòng)戰(zhàn)略性新興產(chǎn)業(yè)融合集群發(fā)展,構(gòu)建新一代信息技術(shù)、人工智能、生物技術(shù)、新能源、新材料、高端裝備、綠色環(huán)保等一批新的增長引擎。什么是人工智能?人工智能將如何改變我們的生活?如何在這場技術(shù)革命中搶占先機(jī)?
什么是人工智能
人工智能的發(fā)展歷史只有六七十年。人工智能也叫人造智能,就是由人制造出來的模仿人的智能,一般通過機(jī)器人、計(jì)算機(jī)等載體表現(xiàn)出來。人工智能有兩個(gè)重要概念:一個(gè)是通用人工智能或者叫強(qiáng)人工智能,如果這種智能系統(tǒng)的功能、能力和人一樣,甚至超過人,就叫強(qiáng)人工智能系統(tǒng);另一個(gè)是專用人工智能或者叫弱人工智能,如果這個(gè)智能系統(tǒng)只能干一件事,盡管可能比人厲害,那它也是弱人工智能。比如常見的刷臉識(shí)別、語音識(shí)別系統(tǒng)。
1956年,10位年輕的學(xué)者,其中許多是圖靈獎(jiǎng)和諾貝爾獎(jiǎng)的獲得者,在美國達(dá)特茅斯市搞了一個(gè)暑期研究所。在兩個(gè)月的討論中,他們針對人工智能應(yīng)該干什么、怎么干進(jìn)行了一番討論,列出了人工智能領(lǐng)域需要研究的自動(dòng)計(jì)算機(jī)、編程語言、神經(jīng)網(wǎng)絡(luò)、計(jì)算規(guī)模理論等問題,并形成了一個(gè)比較前沿的報(bào)告,這被公認(rèn)為是對人工智能一個(gè)比較完整的描述,這一年也被稱為人工智能元年。
從1956年到1976年,這20年是人工智能發(fā)展的第一個(gè)階段,這一時(shí)期的人工智能主要是在模擬大腦工作。這種模擬不是信號(hào)級(jí)的模擬,而是在邏輯推理等更高層面上去模擬大腦。這一階段比較珍貴的一個(gè)成果是數(shù)學(xué)定理證明,也就是用計(jì)算機(jī)自動(dòng)進(jìn)行數(shù)學(xué)定理的證明。包括代數(shù)定理證明和幾何定理證明,都是由兩位華人(王浩、吳文俊)完成的。后來研究人員發(fā)現(xiàn)僅僅通過模擬人的大腦來實(shí)現(xiàn)人工智能這條路太難走。因?yàn)楫?dāng)時(shí)只完成了數(shù)學(xué)定理證明這件事,戰(zhàn)勝國際象棋冠軍、機(jī)器譜曲等其他目標(biāo)都沒完成。人工智能逐漸從高潮跌到低谷,學(xué)者們開始反思是不是人工智能走歪路了,是不是要做點(diǎn)實(shí)事。
學(xué)者們開始嘗試研發(fā)對社會(huì)有影響力的系統(tǒng),比如醫(yī)療診斷專家系統(tǒng)、故障診斷系統(tǒng),可以代替醫(yī)生、專家去做一些診斷。另外就是模擬神經(jīng)系統(tǒng)來做專家系統(tǒng),這在字符識(shí)別、文字識(shí)別領(lǐng)域比較有效。后來應(yīng)用到機(jī)器自動(dòng)識(shí)別、自動(dòng)分揀系統(tǒng),包括今天的語音識(shí)別,基本上都是走的神經(jīng)網(wǎng)絡(luò)這條技術(shù)路線。
這兩條技術(shù)路線使第二次人工智能發(fā)展專家系統(tǒng)的這30年,開創(chuàng)了百花齊放的局面。不過專家系統(tǒng)的高光時(shí)刻并沒有持續(xù)太久,因?yàn)閷<蚁到y(tǒng)雖然做了很多,演示時(shí)效果也不錯(cuò),但真正上線去用的時(shí)候效果并不理想,于是熱度開始下降,直到2006年引發(fā)人工智能領(lǐng)域轟動(dòng)的3篇重量級(jí)文章的問世,人工智能才開始了突飛猛進(jìn)的發(fā)展。
這一年,多倫多大學(xué)教授辛頓、紐約大學(xué)教授楊立昆、蒙特利爾大學(xué)教授本杰奧,幾乎同時(shí)發(fā)表了重量級(jí)的文章,從不同角度說明深度神經(jīng)網(wǎng)絡(luò)是大有可為的,是可以進(jìn)行大規(guī)模學(xué)習(xí)訓(xùn)練的。只要輸入的數(shù)據(jù)好,它就可以解決問題。這一系列論文發(fā)表后,大家摸索了幾年小有收獲,但并沒有重大成果產(chǎn)出。直到2010年以后,斯坦福大學(xué)華裔女教授李飛飛、普林斯頓大學(xué)華人教授李凱,開發(fā)了一個(gè)規(guī)模特別大的圖像數(shù)據(jù)庫,然后拿去參加比賽。當(dāng)時(shí)比賽標(biāo)準(zhǔn)是誰做的系統(tǒng)錯(cuò)誤率更低,誰就勝出。2010年錯(cuò)誤率最低的隊(duì)是28%,2011年是26%,2012年取得了突破,降至16%。原來是辛頓的學(xué)生用辛頓公開發(fā)表文章中的技術(shù)去參加比賽,打敗了所有的對手,這是一個(gè)重大進(jìn)展。到了2013年,深度網(wǎng)絡(luò)這個(gè)技術(shù)普及開來,其它路線無非是使用多深的網(wǎng)、多少個(gè)節(jié)點(diǎn)、參數(shù)怎么設(shè)定等技巧性改進(jìn),而不是方法上的革命了。到2015年系統(tǒng)的錯(cuò)誤率又實(shí)現(xiàn)革命性突破,降至3.6%,而人的平均錯(cuò)誤率是5%,在圖像分類這件事上,神經(jīng)元網(wǎng)絡(luò)已經(jīng)超過人了。這事是誰做的呢?中國學(xué)者孫劍做的,當(dāng)時(shí)他和他的團(tuán)隊(duì)提出了殘差網(wǎng)絡(luò)。這個(gè)殘差網(wǎng)絡(luò),不僅在圖像分類應(yīng)用上是第一名,圍棋里面也是最厲害的?;诖?,在深度網(wǎng)絡(luò)適合的那些弱人工智能是可以進(jìn)行廣泛應(yīng)用研究和產(chǎn)業(yè)化的。
人工智能的特點(diǎn)和成長
從感知到認(rèn)知,人工智能更上一層樓。在智能水平上,感知智能日益成熟。智能可分為感知智能、認(rèn)知智能和決策智能。感知智能是和我們眼看、耳聽、手摸等感官直接相連的智能,現(xiàn)在的臉部和語音識(shí)別、機(jī)器翻譯,以及診斷病人病例、產(chǎn)品殘次識(shí)別,都發(fā)展得非常好,人工智能正在慢慢從一般的感知智能向認(rèn)知智能進(jìn)行升級(jí)。
類腦計(jì)算和量子計(jì)算,兩條突破之路。如果做更大規(guī)?;蛘咦龊驼J(rèn)知有關(guān)的人工智能以及強(qiáng)人工智能,靠現(xiàn)有計(jì)算機(jī)是做不到的,怎么辦?就要尋找出路,在技術(shù)路線上有兩個(gè)比較可能的出路。一個(gè)是類腦智能,人對信息處理的能效比非常之高,現(xiàn)在的計(jì)算機(jī)不行,能效比太低了,類腦計(jì)算能效比會(huì)高一些。另一個(gè)是量子計(jì)算,其能效比是極高的,把量子計(jì)算做成比較穩(wěn)定的一個(gè)系統(tǒng)是有可能的。當(dāng)然不管是類腦、量子計(jì)算,現(xiàn)在還有很大的不確定性,需要繼續(xù)加以研究和積累。
人與機(jī)器,混合智能具備獨(dú)特優(yōu)勢。在智能形態(tài)方面,人和計(jì)算機(jī)混合模式越來越多,這個(gè)叫人機(jī)混合智能。機(jī)器擅長做的事交給機(jī)器,機(jī)器做不好的事,人可以介入一下。這樣人機(jī)混合的智能,是現(xiàn)階段發(fā)展人工智能一個(gè)比較重要的技術(shù)途徑。
應(yīng)用先行,有助于技術(shù)發(fā)展。在應(yīng)用驅(qū)動(dòng)方面,以前是先把技術(shù)做好,然后轉(zhuǎn)化技術(shù)去做應(yīng)用?,F(xiàn)在靠應(yīng)用去拉動(dòng)技術(shù)發(fā)展,這條路是人工智能一個(gè)非常重要的發(fā)展形態(tài)。深度神經(jīng)網(wǎng)絡(luò)出現(xiàn)時(shí),在哪兒好用,不知道,需要找一個(gè)很好的應(yīng)用場景把它用起來。如果不是辛頓的學(xué)生把它拿去參加圖像網(wǎng)絡(luò)比賽,可能神經(jīng)網(wǎng)絡(luò)的熱潮還會(huì)拖許久才會(huì)到來。
未雨綢繆,防止技術(shù)失控。人工智能具有社會(huì)屬性。人類會(huì)不會(huì)被人工智能奴役、擺布?這個(gè)社會(huì)屬性,恰恰是我們在做人工智能時(shí)要認(rèn)真對待的一個(gè)問題,要擺正人和智能系統(tǒng)之間的關(guān)系,對人工智能能干什么、不能干什么進(jìn)行研究和立法,從法律和道德層面去約束和規(guī)范它。否則,將來可能會(huì)很被動(dòng)。
中國人工智能發(fā)展的優(yōu)勢與差距
從2013年起,世界許多國家政府,尤其是發(fā)達(dá)國家紛紛調(diào)研人工智能對社會(huì)、經(jīng)濟(jì)可能帶來的顛覆性影響,相繼發(fā)布符合自身國情的人工智能戰(zhàn)略。在這場事關(guān)未來的技術(shù)革命中,我們的機(jī)會(huì)在哪里?優(yōu)勢和短板分別是什么?
我國已經(jīng)成為人工智能領(lǐng)域的超級(jí)大國之一。改革開放以來,我們國家在基礎(chǔ)研究方面的投入巨大,人工智能的發(fā)展有了非常好的沉淀。一些關(guān)鍵核心技術(shù),中國已經(jīng)走在了世界前列,比如說人臉和語音識(shí)別技術(shù)。中國人工智能的發(fā)展與各行各業(yè)的結(jié)合和滲透是非常高的,其應(yīng)用和推廣比其他國家做得更好。我國人工智能發(fā)展的創(chuàng)新生態(tài)環(huán)境已經(jīng)初步形成。百度的無人駕駛、阿里的城市大腦、騰訊的智能醫(yī)療、科大訊飛的語音識(shí)別、商湯的圖像與視頻處理等開放平臺(tái)以及華為、寒武紀(jì)、海康威視等實(shí)體經(jīng)濟(jì)領(lǐng)域平臺(tái)已經(jīng)創(chuàng)建。全球AI指數(shù)排名,中國屬于第一梯隊(duì),緊隨美國,在人才、教育、專利產(chǎn)出等方面均有所進(jìn)步。中美兩國引領(lǐng)、呈梯次分布的全球人工智能發(fā)展總格局保持不變。
四大優(yōu)勢護(hù)航中國人工智能發(fā)展。第一個(gè)是政策優(yōu)勢,人工智能已被列為國家優(yōu)先發(fā)展事項(xiàng)。第二個(gè)是海量數(shù)據(jù)資源優(yōu)勢,中國人口是美國的四倍多,手機(jī)群體和手機(jī)消費(fèi)、支付量也是最大的,擁有龐大的消費(fèi)、出行、醫(yī)療、旅游、物流等數(shù)據(jù)資源。第三個(gè)是應(yīng)用場景優(yōu)勢,我國是發(fā)展中國家,很多基礎(chǔ)設(shè)施還不夠完善,這恰恰給人工智能的應(yīng)用提供了一些深度場景。比如城鄉(xiāng)的基礎(chǔ)設(shè)施、醫(yī)療、教育、民生服務(wù)等領(lǐng)域的問題,人工智能系統(tǒng)的介入,問題可以快速得到解決。第四個(gè)是青年人才優(yōu)勢,我國高等教育毛入學(xué)率已達(dá)59.6%,而且學(xué)理工科的學(xué)生比例很高,這是一個(gè)非常大的人才儲(chǔ)備庫。國家自然科學(xué)基金委員會(huì)專門設(shè)立人工智能一級(jí)學(xué)科代碼,資助相關(guān)基礎(chǔ)研究、前瞻性探索和應(yīng)用研究。
當(dāng)然,我們也存在一些短板,特別是在四個(gè)薄弱環(huán)節(jié)急需加強(qiáng)。第一,基礎(chǔ)理論和原創(chuàng)算法研究比較薄弱。第二,高端器件研發(fā)能力弱,比如做深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練的GPU(圖形處理器),中國在這方面差距比較明顯。第三,缺乏有影響的人工智能開源開放平臺(tái)。第四,缺乏相應(yīng)的高端人才。據(jù)統(tǒng)計(jì),中國最頂級(jí)的人工智能高端人才數(shù)只有美國的20%,已成為國家關(guān)鍵領(lǐng)域急需的高層次人才。
我們該如何布局未來
未來已來,到底是哪一個(gè)未來來了?過去三十年是變化非常大、非??斓娜辍5谝粋€(gè)是計(jì)算機(jī)的算力增強(qiáng)了約一百萬倍,第二個(gè)是存儲(chǔ)容量增加了約一百萬倍,第三個(gè)是通信速度增加了約一百萬倍。這三個(gè)一百萬倍,讓我們的社會(huì)、工作、生活、學(xué)習(xí)都發(fā)生了天翻地覆的變化。而下一次影響人類社會(huì)的工業(yè)革命時(shí)間可能會(huì)發(fā)生在2030年到2040年之間,其主題將會(huì)是人工智能,人工智能將是未來一個(gè)世紀(jì)的核心技術(shù)。
國家戰(zhàn)略、人才高地、基礎(chǔ)建設(shè)、立法保障,一個(gè)都不能少。要想把人工智能發(fā)展好,就需要我們在很多事上起好步、布好局。一是將發(fā)展人工智能提升至國家發(fā)展戰(zhàn)略,國家、地方和企業(yè),要把其作為戰(zhàn)略性新興產(chǎn)業(yè),給予大力支持。二是健全人工智能的國家研發(fā)體系。三是加快人才培養(yǎng),形成一批人工智能的國家人才高地,進(jìn)而帶動(dòng)整個(gè)人工智能理論和算法的發(fā)展。四是加強(qiáng)智能化基礎(chǔ)設(shè)施建設(shè),推動(dòng)公開數(shù)據(jù)的開放、共享,同時(shí)完善相關(guān)法律法規(guī)保護(hù)數(shù)據(jù)的安全性。五是加快人工智能法律、倫理問題的研究,引導(dǎo)人工智能安全可控發(fā)展。六是深化國際開放合作,主動(dòng)參與全球人工智能的治理和標(biāo)準(zhǔn)制定。
數(shù)據(jù)處理、開源平臺(tái)、應(yīng)用場景,三個(gè)抓手要記牢。利用人工智能為各行各業(yè)賦能,抓手是什么?排在第一位的是數(shù)據(jù),沒有數(shù)據(jù),即便是弱人工智能也沒法做,所以要把數(shù)據(jù)組織起來、清洗出來、利用起來并加以安全防護(hù)。第二位是創(chuàng)建好自己的開源平臺(tái),與我們作為人工智能大國的地位相匹配。第三位是應(yīng)用場景的培育和賦能,現(xiàn)在很多場景還只是投資驅(qū)動(dòng)的,政府要清楚哪些是優(yōu)先發(fā)展的領(lǐng)域,市場能做能決定的事,就交給市場去做去決定,需要政府介入、調(diào)控才能做好的事,政府就要果斷去干預(yù)、去培育,扶上馬,送一程。這是非常關(guān)鍵的一個(gè)步驟。在做大做強(qiáng)自己,補(bǔ)齊自身短板弱項(xiàng)后,我們要和全世界人工智能同步推進(jìn),去迎接人工智能第四次工業(yè)革命的到來。