【摘要】喬姆斯基的生成轉(zhuǎn)換語法(GT語法)是語言學(xué)革命和認(rèn)知科學(xué)革命的基礎(chǔ),今天它又成為ChatGPT的理論依據(jù)。從GT語法到ChatGPT,人工智能到底走了多遠(yuǎn)?從喬姆斯基GT語法分析和語言認(rèn)知入手,我們重新認(rèn)識喬姆斯基語言學(xué)革命的意義,揭示人工智能與人類心智之間的緊密關(guān)聯(lián)、依存關(guān)系和發(fā)展動力。認(rèn)知科學(xué)的建立使我們有可能從多學(xué)科綜合的高度來理解人類心智與人工智能。在此基礎(chǔ)上,我們以ChatGPT為例,分析這款人工智能軟件的利弊得失及其所造成的困惑,提出“人工智能不能做什么”這個終極問題,并嘗試給出我們的回答。人工智能就是人類所建造的非人類的智能,它不過是對人類心智的模仿。人工智能與人類心智的差別,本質(zhì)在于高階認(rèn)知(人類認(rèn)知),在于語言認(rèn)知及其基礎(chǔ)之上的思維認(rèn)知和文化認(rèn)知。人工智能今后的發(fā)展必然是體現(xiàn)語言驅(qū)動的、語言、思維和文化層級的人類心智和認(rèn)知特征的新一代人工智能。語言認(rèn)知、思維認(rèn)知和文化認(rèn)知將在未來的人工智能發(fā)展中扮演重要角色。
【關(guān)鍵詞】人類心智 人工智能 喬姆斯基 GT語法 ChatGPT
【中圖分類號】TB18 【文獻(xiàn)標(biāo)識碼】A
【DOI】10.16619/j.cnki.rmltxsqy.2023.14.002
【作者簡介】蔡曙山,清華大學(xué)社會科學(xué)學(xué)院心理學(xué)系教授、博導(dǎo),清華大學(xué)心理學(xué)與認(rèn)知科學(xué)研究中心主任。研究方向?yàn)檎Z言學(xué)、邏輯學(xué)、心理學(xué)和認(rèn)知科學(xué)。主要著作有《認(rèn)知科學(xué)導(dǎo)論》、《自然語言形式理論研究》、《語言、邏輯與認(rèn)知》、《言語行為和語用邏輯》、《聚合四大科技 提高人類能力:納米技術(shù)、生物技術(shù)、信息技術(shù)和認(rèn)知科學(xué)》(譯著)等。
人工智能近年來的發(fā)展頗有些令人眼花繚亂,從AlphaGo、通用人工智能和生命3.0到ChatGPT,等等,發(fā)展熱潮一浪高過一浪。在這個過程中,一些人似乎忘記了人工智能的本質(zhì)和定義——人工智能是人類創(chuàng)造的機(jī)器智能,是機(jī)器模仿人類心智所產(chǎn)生的智能。據(jù)此定義,我們不能僅就人工智能來說人工智能,而應(yīng)該從人類心智來認(rèn)識人工智能,也就是從認(rèn)知科學(xué)來認(rèn)識人工智能。
起源于20世紀(jì)50年代的人工智能與喬姆斯基語言學(xué)革命、計(jì)算機(jī)和信息技術(shù)革命以及認(rèn)知科學(xué)革命息息相關(guān)。喬姆斯基領(lǐng)導(dǎo)了語言學(xué)、心理學(xué)、計(jì)算機(jī)科學(xué)領(lǐng)域的三場革命,這些革命又相繼引發(fā)哲學(xué)、人類學(xué)和神經(jīng)科學(xué)領(lǐng)域的革命。在這些革命的影響下,1975年前后,認(rèn)知科學(xué)在美國建立,形成由語言學(xué)、心理學(xué)、哲學(xué)、人類學(xué)、計(jì)算機(jī)科學(xué)和神經(jīng)科學(xué)6大學(xué)科構(gòu)成的學(xué)科框架。2000年,科學(xué)家們將另一個與心智密切相關(guān)的學(xué)科——教育學(xué)納入認(rèn)知科學(xué)之中,形成“6+1”的學(xué)科框架。這些學(xué)科在認(rèn)知科學(xué)框架下與認(rèn)知科學(xué)交叉形成新興學(xué)科:認(rèn)知語言學(xué)、認(rèn)知心理學(xué)、心智哲學(xué)、認(rèn)知人類學(xué)、人工智能、認(rèn)知神經(jīng)科學(xué)和心智教育學(xué)。由此可見,人工智能本是認(rèn)知科學(xué)題中之義,是計(jì)算機(jī)科學(xué)與認(rèn)知科學(xué)交叉的產(chǎn)物,是人類賦予機(jī)器(計(jì)算機(jī))的智能。
人工智能誕生以后,其與認(rèn)知科學(xué)剪不斷、理還亂的關(guān)系,始終是理解人工智能的關(guān)鍵點(diǎn)。一是因?yàn)槲鍌€層級的人類心智是人工智能的來源和基礎(chǔ),人工智能如何學(xué)習(xí)和模仿人類心智和認(rèn)知能力,是人工智能過去、現(xiàn)在和未來發(fā)展的根據(jù)。二是作為人類心智和認(rèn)知基礎(chǔ)的語言,人工智能的發(fā)展又具有特殊的意義。當(dāng)前的人工智能新寵C(jī)hatGPT就是一款體現(xiàn)了人工智能與認(rèn)知科學(xué)結(jié)合的語言認(rèn)知軟件。
讓我們從喬姆斯基的生成轉(zhuǎn)換語法(GT語法)開始說起。
喬姆斯基和GT語法
我們先來認(rèn)識語言學(xué)革命的發(fā)起人、認(rèn)知科學(xué)的第一代領(lǐng)袖喬姆斯基(N. Chomsky, 1928-)的語言理論和語言認(rèn)知方法。
什么是語言知識?什么是語言能力?人的語言能力是哪里來的,是先天遺傳的還是后天習(xí)得的?人類如何加工語句,是經(jīng)驗(yàn)主義的還是唯理主義的?自然語言和形式語言的聯(lián)系和區(qū)別在哪里?形式語言和計(jì)算機(jī)語言的關(guān)系又是什么?人類如何通過自己的語言讓計(jì)算機(jī)工作?什么是形式文法?喬姆斯基語言學(xué)革命的主要內(nèi)容和理論貢獻(xiàn)是什么?關(guān)于喬姆斯基和喬姆斯基的語言學(xué)革命,我們可以思考很多重要問題,這些問題至今仍有特別重要的意義。[1]
現(xiàn)在我們來看喬姆斯基的一個重要的語言學(xué)理論——生成轉(zhuǎn)換語法(generative transformational grammar),簡稱GT語法。
喬姆斯基著述豐厚,其理論一直處在不斷的變動之中。第一階段從1950年代中期開始到1970年代中期,這個時期是生成轉(zhuǎn)換語法的形成時期,這個時期的重要語言理論有50年代的句法結(jié)構(gòu)理論(SS)、60年代的標(biāo)準(zhǔn)理論(ST)、70年代的擴(kuò)展的標(biāo)準(zhǔn)理論(EST)和修正擴(kuò)展的標(biāo)準(zhǔn)理論(REST),等等。第二階段是1970年代以后,這個時期的重要理論包括管轄和約束理論(GB)、最簡方案(MP),等等。其中,GB又包括短語結(jié)構(gòu)的X-階標(biāo)理論(X-barT)、θ-理論(θ-T)和功能范疇(FC)、移動和格理論(MCT);MP又包括原則和參數(shù)理論(P&P),等等。
第一階段的代表作是1957年的《句法結(jié)構(gòu)》(Syntactic Structure, SS),這是喬姆斯基以博士論文為基礎(chǔ)撰寫的劃時代著作,本書建立的生成轉(zhuǎn)換語法是喬姆斯基語言學(xué)革命的標(biāo)志,它由以下三個部分構(gòu)成。
(1)短語結(jié)構(gòu)規(guī)則(phrase structure rules)。短語結(jié)構(gòu)規(guī)則也叫重寫規(guī)則(rewriting rules)。它試圖用有限的規(guī)則來生成無限的句子。重寫規(guī)則通過形式化的方法和遞歸定義,生成一系列的短語結(jié)構(gòu)。
(2)轉(zhuǎn)換規(guī)則(transformational rules)。由重寫規(guī)則生成一系列的短語結(jié)構(gòu),可分為詞匯前結(jié)構(gòu)(pre-lexical structure)和詞匯后結(jié)構(gòu)(post-lexical structure)。前者由非終端符構(gòu)成,稱為深層結(jié)構(gòu)(deep structure),后者由終端符構(gòu)成,稱為表層結(jié)構(gòu)(surface structure)。
(3)形態(tài)音位規(guī)則(morphophonemic rules)。按照喬姆斯基的理解,轉(zhuǎn)換規(guī)則將深層結(jié)構(gòu)的邏輯語法關(guān)系映射為表層結(jié)構(gòu)的語言關(guān)系與語音關(guān)系。這樣就可以解釋語言的歧義和釋義現(xiàn)象。歧義是兩個不同的深層結(jié)構(gòu)轉(zhuǎn)換為同一表層結(jié)構(gòu),釋義是同一深層結(jié)構(gòu)轉(zhuǎn)換為兩個不同的表層結(jié)構(gòu)。
喬姆斯基的生成轉(zhuǎn)換語法(generative transformational grammar)由生成語法和轉(zhuǎn)換語法兩部分構(gòu)成。我們先來看生成語法。
(一)生成語法。喬姆斯基在《句法結(jié)構(gòu)》中,給出了如下的句法結(jié)構(gòu)的一個簡單例子。
我們將(1)中每一條形如X→Y的規(guī)則稱為“重寫規(guī)則”,即“重寫X為Y”,并稱這些規(guī)則的集合為一個語法。
我們稱下面的(2)為語句“the man hit the ball”從語法(1)所得出的一個推導(dǎo)。
其中,最右邊的一列給出得出該行符號串所依據(jù)的重寫規(guī)則。例如,第二行的串“NP VP”是根據(jù)重寫規(guī)則(i)得出的,如此等等。
這個推導(dǎo)可以用下面的樹形圖來表示:
注意這是一棵倒置的樹,樹根向上,樹梢向下。不要小看這個簡單的結(jié)構(gòu),這樣一個簡單的結(jié)構(gòu)卻表明了喬姆斯基語言學(xué)革命的開始。
喬姆斯基以前的經(jīng)驗(yàn)主義語言學(xué)是從樹梢開始來分析語言的,即從具體的語句開始,分析語句的結(jié)構(gòu),找出語句的共同特征,最后總結(jié)出一個語言的語法。行為主義語言學(xué)則認(rèn)為人們的語言知識來源于語言的實(shí)踐。喬姆斯基語言學(xué)革命把這個過程倒了過來,即把這棵樹“倒”了過來。他認(rèn)為,兒童并不是一個語句、一個語句地去習(xí)得第一語言知識的,而是相反。兒童具有一種先天的語言能力,語言習(xí)得的環(huán)境和條件只是激發(fā)兒童的這種能力,所以兒童才能夠從一個結(jié)構(gòu)生成無數(shù)多的語句。換句話說,喬姆斯基認(rèn)為語言的這種結(jié)構(gòu)和規(guī)則是先天存在于兒童的頭腦之中的。語言是一種心智現(xiàn)象,這是喬姆斯基唯理主義和心理主義語言學(xué)的最本質(zhì)的特征。
注意在語句的生成過程中,使用了很多短語(Phrase),喬姆斯基用范疇名稱(categorial names)一一將其命名如下:
S:語句(Sentence)
NP:名詞短語(Noun Phrase)
M:情態(tài)詞(Modal)
VP:動詞短語(Verb Phrase)
D:限定詞(Determiner)
N:名詞(Noun)
V:動詞(Verb)
PP:介詞短語(Prepositional Phrase)
P:介詞(Preposition)
ADVP:副詞短語(Adverbial Phrase)
ADV:副詞(Adverb)
AP:形容詞短語(Adjectival Phrase)
A:形容詞(Adjective)
而這些短語也是具有結(jié)構(gòu)的,可以用短語結(jié)構(gòu)規(guī)則來刻畫,其按照這些規(guī)則生成相應(yīng)的短語。關(guān)于自然語言中最常用的是名詞短語規(guī)則、動詞短語規(guī)則、形容詞和副詞短語規(guī)則、時態(tài)和情態(tài)短語規(guī)則,等等。
(二)轉(zhuǎn)換語法。為使語法和規(guī)則盡量簡明,喬姆斯基的生成規(guī)則只負(fù)責(zé)解釋直陳語句的生成,而將其他語句形式如否定句、疑問句、倒裝句和短語成分的移動等的生成統(tǒng)統(tǒng)交給轉(zhuǎn)換規(guī)則完成。下面是一些例子。
(1a)He can hit this ball(他能擊中這個球)。
(1b)This ball, he can hit(這個球他能擊中)。
兩者的區(qū)別在于名詞短語this ball的位置不同。在語句(1a)中,名詞短語處于動詞的賓語位置上,在這個位置上this ball充當(dāng)了hit的賓語。在語句(1b)中,名詞短語this ball在邏輯上仍然應(yīng)該被理解為動詞hit的賓語,但在語法上它的位置卻處于句首,而不是及物動詞的賓語的位置。
對語句(1b)中的這種不一致的可能的解釋是:假設(shè)名詞短語NP原來處于動詞賓語的位置,后來卻被轉(zhuǎn)移到句首的位置上去了。我們可以用下面的推導(dǎo)式來對語句(1b)進(jìn)行解釋:
(2a)He can hit [NPthis ball] →
(2b)[NPthis ball], he can hit
由PS規(guī)則和詞匯插入規(guī)則(Lexical Insertion Rule,簡稱LIR)生成的基本的表達(dá)式是(2a),而將某種具有不同性質(zhì)的規(guī)則應(yīng)用于基本表達(dá)時卻將名詞短語this ball從動詞賓語的位置轉(zhuǎn)移到句首位置上去了。我們把在上面的推導(dǎo)式中使用的轉(zhuǎn)移規(guī)則稱為轉(zhuǎn)換規(guī)則(transformation rule)。在下面的兩個樹圖中,轉(zhuǎn)換規(guī)則將由PS規(guī)則和LIR生成的短語標(biāo)記(3a)轉(zhuǎn)變?yōu)樯陨圆煌亩陶Z標(biāo)記(3b)。
轉(zhuǎn)換規(guī)則(transformation rule)有各種不同的類型。例如,我們把從語句(1a)轉(zhuǎn)變?yōu)檎Z句(1b)所使用的轉(zhuǎn)換規(guī)則稱為主題化(Topicalisation)規(guī)則,它的典型特征是把某一范疇移動到語句的最左端。主題化的轉(zhuǎn)換規(guī)則可以用形式化的方式表達(dá)如下:
X- NP- X 結(jié)構(gòu)描寫(Structural Description)
1 2 3 →
2 1–t– 3 結(jié)構(gòu)變換(Structural Change)
其中,結(jié)構(gòu)描寫(SD)用來表示按照PS規(guī)則和LIR生成的短語結(jié)構(gòu),它與基本表達(dá)式相一致。用NP來表示轉(zhuǎn)換的目標(biāo)范疇,X表示NP左右兩邊的范疇變元(可以為空)。數(shù)字用來幫助我們追溯所發(fā)生的語句變換。結(jié)構(gòu)變換(SC)用來表示根據(jù)主題化規(guī)則導(dǎo)出的短語標(biāo)記,即(3b)所示的導(dǎo)出表達(dá)式。從中可以看出,用數(shù)字2標(biāo)示的目標(biāo)名詞短語NP已經(jīng)被轉(zhuǎn)移到句首的位置,它的原初位置(即在SD中所占據(jù)的位置)用符號t來代替。符號t意味著這個位置發(fā)生了短語結(jié)構(gòu)的轉(zhuǎn)移,從而留下了轉(zhuǎn)移的軌跡(trace)。
以上形式規(guī)則可以用來說明所有類型的轉(zhuǎn)換。當(dāng)然,我們也可以用平常的語言來定義轉(zhuǎn)換規(guī)則。
喬姆斯基的生成轉(zhuǎn)換語法(GT語法)的意義重大:第一,這是歷史上首次使用數(shù)學(xué)邏輯(mathematical logic)的分析方法來分析自然語言的句法結(jié)構(gòu),使20世紀(jì)的語言學(xué)從經(jīng)驗(yàn)主義語言學(xué)進(jìn)入到唯理主義語言學(xué)的發(fā)展階段;第二,喬姆斯基的理論表明語言加工是自上而下的(top-down)而不是經(jīng)驗(yàn)主義語言學(xué)自下而上的(bottom-up),這樣我們就區(qū)分了語言能力和語言知識,并找到了“先天語言能力”(Innate Language Faculty, ILF)這把理解語言認(rèn)知能力的鑰匙;第三,喬姆斯基的形式化分析方法為自然語言理解奠定了基礎(chǔ),并成為人工智能的基本方法。喬姆斯基建立的句法結(jié)構(gòu)理論、形式方法等理論方法從一開始就成為人工智能的基礎(chǔ)理論和基本方法,今天仍然如此。本文稍后將作為案例分析的人工智能新寵——ChatGPT,正是根據(jù)喬姆斯基的GT語法演變而來的。