近年來,人工智能迅猛發(fā)展,即便是沒有深入了解過人工智能技術(shù)的人,想必也或多或少地聽過兩個術(shù)語——符號人工智能和神經(jīng)網(wǎng)絡。隨著人工智能的發(fā)展不斷成熟,MIT-IBM 沃森人工智能實驗室主任 David Cox 認為,如今人們需要重新審視人工智能,他提出將上述二者結(jié)合,開發(fā)一種「神經(jīng)符號人工智能」(Neuro-Symbolic AI)。
本文將詳細介紹神經(jīng)符號人工智能背后的原理,作者為英國科技作家 Luke Dormehl,雷鋒網(wǎng)在不改變原意的基礎上對原文進行了編譯。
想象一下,一個托盤上有 8 個物體:有立方體,有球體,材質(zhì)不同,大小不一。那么我的問題是,托盤上的大件物體和金屬球的數(shù)量是否相同?
你可能會感到不解,覺得我的問題有點兒刁鉆。相反,這并不難,甚至學齡前兒童都能輕松回答。但對于當今最先進的神經(jīng)網(wǎng)絡來說,這太難回答了。因此,即使人工智能對我們來說已經(jīng)再熟悉不過,它還是需要重新開發(fā)。
以上并非我的觀點,而是美國馬薩諸塞州劍橋的 MIT-IBM 沃森人工智能實驗室(MIT–IBM Watson AI Lab)主任 David Cox 的觀點。早前, David Cox 是哈佛大學教授,他的團隊憑著對神經(jīng)科學的洞見,建立了一個受大腦啟發(fā)的機器學習計算機系統(tǒng)。目前,在 IBM,他主要負責沃森人工智能(Watson A.I.)的相關(guān)事務。
提到沃森,不了解的人只知道它是人工智能,曾在美國問答節(jié)目《Jeopardy》中一戰(zhàn)成名。但其實,沃森首先是一個機器學習系統(tǒng),通過大量數(shù)據(jù)而非人為規(guī)則接受訓練。
說回主題,在人工智能準備在未來十年大放異彩的時候,David Cox 說世界需要重新審視它,這聽起來是有點兒奇怪。畢竟,過去十年可以說是人工智能史上最成功的十年——這十年里,幾乎每周都會有新突破,沒有任何“人工智能寒冬”的跡象。但這也正是他認為人工智能需要改變的原因。
對此,他的建議是一個目前還不確定的術(shù)語——“神經(jīng)符號人工智能”——這也很可能會成為 20 年代結(jié)束時大眾熟知的一個詞。
符號人工智能的起與落
嚴格地說,神經(jīng)符號人工智能不是一種全新的人工智能,而是把建立“會思考的機器”的兩種現(xiàn)有的、相互對抗的方法相結(jié)合。
這個名字中的“符號” 指的是創(chuàng)造人工智能的第一種主流方法。從 20 世紀 50 年代到 80 年代,符號人工智能是至高無上的。對于一個符號人工智能研究者來講,所謂智能,是建立在人類通過形成內(nèi)在的符號表征來理解周圍世界的能力之上的。然后,研究者制定規(guī)則處理這些符號表征,而這些規(guī)則可以通過捕獲日常知識的方式被形式化。
如果說大腦類似于計算機,那么不論我們遇到任何情況,都需要運行自身的計算機程序,因為程序會一步步地解釋如何完全基于邏輯來執(zhí)行操作。因此,符號人工智能研究者認為,如果是這樣,他們也能夠發(fā)現(xiàn)那些關(guān)于世界如何組成的相同規(guī)則,然后以算法的形式編碼,以便計算機執(zhí)行。
實際上,符號人工智能在過去表現(xiàn)不錯,令人印象深刻。1964 年,計算機科學家 Bertram Raphael 開發(fā)了一個 SIR 系統(tǒng),即“語義信息檢索”(Semantic Information Retrieval)。SIR 是一個計算推理系統(tǒng),它似乎能夠以一種類似于真正智能的方式來學習對象之間的關(guān)系。比如,你告訴它一些基礎信息——John 是個男孩,男孩是人,一個人有兩只手,一只手有五個手指。然后你問他 John 有幾根手指,它的答案是 10。
20 世紀 80 年代,見證了基于符號人工智能的計算機系統(tǒng)達到頂峰、跌落谷底。那是所謂的”專家系統(tǒng)”的十年,“專家系統(tǒng)”試圖使用基于規(guī)則的系統(tǒng)來解決現(xiàn)實世界的問題,例如幫助有機化學家識別未知的有機分子,幫助醫(yī)生為傳染病患者推薦正確劑量的抗生素等等。
雷鋒網(wǎng)了解到,“專家系統(tǒng)”的基礎堅實,但也存在問題:這些系統(tǒng)價格昂貴,需要不斷更新;而最糟糕的是,規(guī)則越多,系統(tǒng)的準確性就越低。
神經(jīng)網(wǎng)絡的世界
那么,我們再來看看神經(jīng)符號人工智能里的“神經(jīng)”是什么?
實際上,“神經(jīng)”指的是深度學習神經(jīng)網(wǎng)絡,它是受大腦啟發(fā)的計算類型,驅(qū)動了過去十年許多人工智能領(lǐng)域出現(xiàn)的突破——比如人工智能駕駛汽車、把文本翻譯成幾十種不同的語言、智能音箱能夠聽懂指令等等。
神經(jīng)網(wǎng)絡與符號人工智能的工作方式不同。因為神經(jīng)網(wǎng)絡由數(shù)據(jù)驅(qū)動,而非基于規(guī)則。
具體來講,向一個符號人工智能解釋,即明確地向其提供保證正確識別的所有信息。打個比方,想象一下讓朋友幫你去汽車站接你母親,你需要提供一套規(guī)則描述她,以便讓你的朋友從人群中認出她。但是如果要訓練一個神經(jīng)網(wǎng)絡去做這件事,你只需向它展示多張你母親的照片。要是它足夠聰明,不僅能夠識別出你母親,還可組成現(xiàn)實世界中不存在的與她相似的對象。
正如 David Cox 對《數(shù)字趨勢》雜志所說:
不可否認,深度學習神經(jīng)網(wǎng)絡帶來了驚人的進步,但同時也出現(xiàn)了一些問題,令人擔憂。
實際上,David Cox 提到的問題恰恰依賴于讓今天的神經(jīng)網(wǎng)絡變得如此強大的東西——數(shù)據(jù)。就像人一樣,神經(jīng)網(wǎng)絡是根據(jù)例子學習的。但是,一個人可能只需根據(jù)一兩個例子就能正確地記住一件事,但人工智能需要更多例子。同時,準確性的高低取決于是否具有大量的注釋數(shù)據(jù),因為學習每個新任務都基于這些數(shù)據(jù)。
燃燒的交通燈
正是因為神經(jīng)網(wǎng)絡的上述特點,它們并不擅長“黑天鵝”問題,由 Nassim Nicholas Taleb 提出的黑天鵝事件在統(tǒng)計學上是罕見的。David Cox 表示:
目前許多深度學習解決方案盡管非常驚人,但都基于二八定律(雷鋒網(wǎng)注:這一定律認為在任何一組東西中,最重要的只占其中一小部分,約 20%,其余 80% 盡管是多數(shù),卻是次要的)。深度學習在 80% 的情況下是對的,但重要的實際上占少數(shù)。如果你看到一個物體本不該處于目前所在的位置,或者方向有點奇怪,這種情況下,即便是再驚人的系統(tǒng),也起不了作用。
在加入 IBM 之前,David Cox 與別人共同創(chuàng)辦了 Perceptive Automata 公司,為自動駕駛汽車開發(fā)軟件。該團隊在他們名為 Slack 的頻道發(fā)布了數(shù)據(jù)收集過程中偶然發(fā)現(xiàn)的有趣圖片。其中一張照片是在十字路口拍的,照片上的交通燈著火了,對此 David Cox 表示:
這真是一輩子難遇的事情。我不知道 Waymo 和 Tesla 在訓練神經(jīng)網(wǎng)絡的數(shù)據(jù)集中是否有交通燈著火的圖像,但我敢打賭,就算他們有,數(shù)量也會很少。
其實,這就是一件無關(guān)緊要的事,因為它很少發(fā)生,即便發(fā)生了,也并不是很緊要。如果系統(tǒng)推薦一個人去了一家很糟糕的餐廳,這樣自然不太好,但可能還不足以毀掉他的一天,只要系統(tǒng)以前提出的 99 條建議都是不錯的,就沒必要特別沮喪。
但是,如果一輛自主駕駛汽車在十字路口面對燃燒的交通燈或一輛馬車不能做出正確的反應,后果則不堪設想。這可能是小概率事件,但我們也希望它能夠很好地應對這類情況。
David Cox 解釋說:
如果有能力推理、判斷,我們就能輕松應對。如果我看到交通燈著火了,我最起碼會有一些基本判斷,比如目前不能根據(jù)交通燈判斷我是該停還是該走,但我知道要注意安全,因為周圍的司機也會感到困惑。但我可以根據(jù)另一個方向行駛的車輛判斷接下來的行動。在這種以安全完成任務為關(guān)鍵的環(huán)境中,深度學習還不能很好地服務我們。這就是我們需要其他解決方案的原因。
將邏輯與學習相結(jié)合
因此 David Cox 便提出了神經(jīng)符號人工智能的想法。
所謂神經(jīng)符號人工智能,其實就是把以上方法結(jié)合起來,把學習和邏輯結(jié)合起來。
神經(jīng)網(wǎng)絡可以幫助符號人工智能系統(tǒng)變得更聰明——通過將世界分解成符號,而不是依靠人類程序員來為它們做這件事。同時,符號人工智能算法可以結(jié)合常識推理和行業(yè)知識,并運用到深度學習中。這些都會使人工智能更好地處理從自動駕駛汽車到自然語言處理的一切復雜任務,同時訓練所需的數(shù)據(jù)也要少得多。
David Cox 說:
神經(jīng)網(wǎng)絡和符號化的概念之間,存在著非常完美的互補關(guān)系。因為神經(jīng)網(wǎng)絡可以給你答案,將混亂的現(xiàn)實世界變成一個系統(tǒng)性的符號表征,在圖像中找到所有關(guān)聯(lián)。只要有了這種符號表征,就能在推理方面有所突破。
就像文章一開始提到的托盤上的物體的例子,神經(jīng)符號系統(tǒng)利用神經(jīng)網(wǎng)絡的識別能力來識別對象,然后再依賴符號人工智能應用邏輯和語義推理,從而發(fā)現(xiàn)新的關(guān)系。這樣的系統(tǒng)實際上已經(jīng)被證實可以有效工作。
同時,這不僅適用一小部分情況,越來越重要的是,人工智能系統(tǒng)在必要時是可解釋的。神經(jīng)網(wǎng)絡可以非常好地執(zhí)行某些任務,但它的許多內(nèi)部推理是“黑箱”式的,對于那些想知道它是如何做出決定的人來說是難以理解的。
同樣,如果一個機器人在音樂流媒體平臺 Spotify 上推薦錯誤,其實并不太重要。但是,如果你被拒絕銀行貸款,被拒絕工作申請,或者有人在涉及自動駕駛汽車的事故中受傷,我們則需要了解為什么人工智能會提出相關(guān)的建議。這個時候神經(jīng)符號人工智能便能派上用場了。
人工智能研究的未來
幾十年前,符號人工智能和神經(jīng)網(wǎng)絡還是完完全全的兩個世界,相互對立。人工智能領(lǐng)域的大佬們常常各執(zhí)一詞,在支持一種方法的同時,必將否定另一種方法。實際上,他們的做法未必不妥,畢竟資金有限,要解決同樣的問題,兩派必定會競爭。而如今看來,情況似乎正好相反。
另外,David Cox 還表示:
看到年輕一代真的很有意思,我團隊中的很多人都比較年輕,有的剛剛博士畢業(yè),對這個領(lǐng)域保持著新鮮勁兒和興奮感。他們沒有經(jīng)歷過符號人工智能和神經(jīng)網(wǎng)絡相互對立的時代,也不在乎二者曾經(jīng)對立過——其實這種不在乎就非常好,因為它能讓人打開心扉,消除偏見。他們很樂意探索未知,用人工智能做點很酷的事。