簡論人工智能
1. 人工智能是哲學問題
現在,人工智能異?;鸨?。打開電視,翻開報紙,接入微信,點進網站,隨處可以看到人工智能的字眼。人們對人工智能產生出了異常的關注,強烈的期待,甚至嚴重的恐懼。
在我們看來,這是一個很自然的事情,因為“我們是否能在計算機上完整地實現人類智能”,這個命題是一個哲學問題??档抡J為哲學需要回答三個問題:我能知道什么?我應該做什么?我可以期待什么?分別對應著認識、道德、信仰。而是否能夠實現人工智能這個問題,關系到智能,同樣引人關注,發人深思。
以往都是哲學家提出哲學問題,并通過自己的思辨給出答案,形成哲學理論。但人工智能的以上命題卻有些不同,“我們是否能完整地實現人工智能”,它的真偽只有通過人工智能研究人員長期的實踐才能得以驗證。而且,這個命題也許不能證偽,只能證真。
其實,“智能”沒有一個嚴格的定義。當我們談到人工智能時,有時指普通人的感知、認知能力,有時指專家的職業技能,有時指群體的智慧。這里,“完整的人類智能”的概念也很重要,也被稱為“強人工智能”。如果僅是讓計算機在某些方面顯得比較智能,其實不難,已有許多成功的案例,困難的是,讓計算機在整體意義上與人有同等甚至更高的智能。衡量人工智能是否實現的標準也沒有確立,著名的圖靈測試是否能夠成為人工智能實現的標準也充滿爭議。
羅素曾說“科學是我們知道的東西,哲學是我們不知道的東西”。 羅素是分析哲學的代表人物之一,從分析哲學的角度來看,只有三種東西是有意義的:邏輯(數學)、客觀事實、以及兩者的組合,或者說只有科學的東西才是有意義的。所以,以上的人工智能命題是一個“哲學問題”。它的真偽不能,至少現在不能,從邏輯(數學)、客觀事實、以及兩者的組合中證明出來。
當前人工智能很熱,甚至成為巷議街談,茶余酒后的話題。人們發表出各種各樣的言論,在我們看來,這其中有許多都不是“科學”的(不是基于邏輯、客觀事實、以及兩者的組合得到的結論)。對這些言論,我們應該采取的態度,用另一位分析哲學的代表人物,也是羅素的學生,維特根斯坦的話來說,就是“對于不可言說的,我們必須保持沉默”。因為針對任何不是科學的言論,對其進行探討、辯論都是沒有意義的。
我們認為,正確的態度應該是面對實際問題,用科學的方法去解決問題,不斷推動計算機的智能化。這與胡適所說的“多研究些問題,少談些主義”有異曲同工之處。當然我們并不反對對未來科技的發展進行幻想,進行發散式的思考與交流,但這時應該明確自己是在做什么。
綜上,我們說人工智能是哲學問題,有兩層意思,它關系到人的本質,它是不明確的。
2. 為什么實現人工智能是極具挑戰的
可以說,人工智能的歷史與計算機科學的歷史一樣長久,近年人工智能的研究取得了驚人的成果,可以預見,這個趨勢還將會持續,計算機將會變得越來越加智能。另一方面,完整地實現人工智能,即強人工智能,仍是極其困難的。這是為什么?
我們還不知道如何用數學模型表現并刻畫人的智能,包括認知能力、語言能力等,而我們在計算機上實現任何東西都必須基于數學模型。這就是困難所在。
維特根斯坦是二十世紀具有代表性的哲學家,前后發表了(看似)相互矛盾,但又有一定聯系的兩個哲學理論,即他的前期哲學和后期哲學。作為維氏前期哲學和后期哲學的推論,我們就可以導出“人工智能極具挑戰”這一結論。我們看看他的主要觀點。
維氏前期哲學和后期哲學分別發表在《邏輯哲學論》與《哲學研究》
兩部著作里。
《邏輯哲學論》主要從邏輯的角度討論哲學。其主要觀點包括:世界由事實組成。事實可以由邏輯命題表示。思想由命題組成。有意義的思想包含邏輯、事實、及其組合,其他的思想,如形而上學,都是沒有意義的。這部書的結束語就是他的名言“對于不可言說的,我們必須保持沉默”。維氏前期哲學的核心主張是只有科學(邏輯、事實、及其組合)的思想才是有意義的。
《哲學研究》主要從語言的角度討論哲學。其主要觀點有:語言是一種活動,生活的一部分,語言的使用賦之以語義,這種活動如同我們日常進行的游戲,稱之為“語言游戲”(languagegame)。而一個單詞的語義由其所有的使用方法決定。還有,概念不是傳統的內涵與外延所能定義的,比如,我們通常所說的“游戲”這個概念,其實包括各種性質的活動,如象棋、紙牌、集體舞,它們之間并不存在大家共同擁有的屬性,有的只是成員之間的相似性,稱之為“家族相似性”(familyresemblance)。人的語言與概念不遵循規則,如果定義一條規則,那么一定存在例外。
維氏哲學給我們的啟示是,雖然他本人并沒有直接這樣說,人的智能分為兩部分,一部分是數學與科學的能力,一部分是認知、語言等能力??茖W可以用數學來精確地描述,而認知、語言是否能用數學來精確地描述還不是很清楚。幾十年來的人工智能的研究印證了這一點。我們能夠成功實現載人航天,因為這個過程的每個環節,雖然復雜,但可以用數學模型精確地計算出來,相反,我們還不能構建一個真正的“對話機器人”,是因為我們還不知如何基于數學模型這樣做,也不知道這是否可能。
3. 自然語言處理是極具挑戰的
人工智能的目標之一就是讓計算機能夠像人一樣聽說讀寫,也就是擁有使用語言的能力,這也是其子領域自然語言處理的研究對象。自然語言處理被認為是人工智能完全問題(AIComplete),也就是說,如果自然語言處理實現了,人工智能也就實現了。
自然語言處理同人工智能一樣是極其困難的任務。受維特根斯坦后期哲學的影響,被稱為認知語言學(CognitiveLinguistics)的一派形成[3,4],該學派試圖從語言的使用,特別是語匯的使用入手研究語言,建立解釋語言現象的理論。但是該領域還停留在對語言現象的解釋上,遠遠沒有達到建立模型,特別是數學模型的階段。從認知語言學的研究結果中,也可看出實現自然語言的困難。
下面把認知語言學的主要結論做一總結。語言是人的認知的一部分。語義(semantics)在語言中起著重要的作用,應該通過語義來解釋語言現象。語言的概念可以由“原型”(prototype)來說明(源自維特根斯坦的家族相似性概念)。語言的使用是基于“語義相似度”計算產生的,與暗喻(metaphor)、借喻(metonymy)的使用是相通的,同時,語言的使用也是依賴于慣例的。
在中文中,我們說“上廁所”,“下廚房”。這里的“上”和“下”的使用,應該源于不同語義相似度計算產生的比喻,久而久之成為習慣性詞語搭配,在語言中被廣泛使用。這是語匯級別的例子,這種現象在語法等更高層次也依然可以觀察到[3,4]。
語言的使用并不存在嚴格的邏輯關系,如果定義一條規則,那么一定會發現反例。如果認知語言學所主張的是正確的話,即語言使用是基于“語義相似度”計算產生,那么如何模型化這種復雜的計算過程也就變成了極具挑戰的問題,因為我們還不知道其基本原理與機制。讓計算機同人一樣自如地處理自然語言,即使可能,也需要走過漫長而遙遠的歷程。
5.實現人工智能的路徑
總結起來,實現人工智能可能有三條路徑:我們稱之為外觀、內省、模擬。
所謂外觀,指的是觀察人的大腦工作狀況,探求其原理,解明其機制,從而在計算機上“實現”人類大腦的功能。比如,計算神經學(computationalneuroscience)這個學科旨在基于生物和心理學實驗,通過計算機建模的方式,解明大腦信息處理的內容、原理、及原因。計算神經學研究的進展也許可以幫助人工智能的實現,但從現在的研究成果看還有漫長的路要走。
內省就是反思自己的智能行為,將自己意識到的推理、知識等記錄到計算機上,從而“再現”人的智能,比如專家系統(expertsystem)就屬于這一類。內省在一定程度上很有幫助,比如能讓我們很快地構建智能系統需要的知識,包括概念、規則。但是,內省的最大問題是人的智能原理可能不能從自己的意識中發現。我們知道,下意識在整個大腦的思維過程中起著重要的作用,最近的研究表明,下意識其實在很大程度上控制著意識,我們理解的自由意志(freewill),即自己的意識可以掌控自己的行為,可能并不成立。
模擬就是將人的智能行為的輸入與輸出記錄下來,用模型來模仿,使模型給出與人相似的反應,特別是利用統計機器學習(statisticalmachine learning)。模擬的最大優點是它避免對人的智能進行直接地建模,轉而通過數據驅動的方式解決具體問題。特別是統計學習擁有一套完整的理論體系,作為實現智能的方法具有很強的魯棒性和可擴展性,無數事實證明統計學習是實現人工智能的一個非常強大的工具。模擬的最大缺點是它依賴于觀測,數據中隱含的規律一定程度上可以挖掘出來,但從實現人工智能的角度看往往還不夠充分,可能不能觸及問題的本質,特別是高級的智能。
無論是外觀、還是內省、模擬,我們還不清楚哪種方式有可能引領我們最終登上人工智能的頂峰。
5.現實的策略
面對這樣具有挑戰的問題,我們應該采用怎樣的策略,一步一步地推動人工智能的研究,使計算機不斷地智能化?這里提出兩個策略:任務驅動與混合模式。它們主要是面對自然語言處理的,但對人工智能一般也應該適用。
認知語言學與自然語言處理的研究告訴我們,語言的語義具有很強的靈活性,多樣性,很難精準刻畫,但是當具體的任務、具體的場景確定以后,問題往往就變得容易很多。例如,要判斷兩個詞的語義是否相似,往往不好確定,因為站在不同的角度看可能有不同的結論。但是,一旦看問題的角度確定了,這個判斷也就變得容易了。正如哲學家波普爾所說“對象(object)只有在這種情況下可以對它們進行分類,或者作相似性判斷,那就是把它們聯系到具體的興趣或需求上?!彼?,任務驅動是我們應該采用的第一個策略。
自然語言處理的研究成果表明,以統計學習為框架,以人的知識為內容,以人腦為啟發,這種混合模式,或許是最有效的。傳統上,自然語言處理的許多方法基于“統計加規則”,比如用概率上下文句法(probabilisticcontext free grammar)進行句法分析,就等價于使用人定義的語法知識加上自動學習到的概率統計知識來完成這個任務。所以,在統計學習的框架里加入人的知識是非常自然的想法。最近的深度學習的研究進展告訴我們,我們可以進一步將傳統的簡單的統計學習模型擴展到復雜的統計學習(深度學習)模型,大幅度提高人工智能處理的性能。深度學習本質上還是統計學習,但它在很多地方借鑒了人腦的工作原理,能夠幫助我們很快構建復雜的模型,找到適合解決問題的方法,減少不必要的嘗試。所以,借鑒人腦的統計學習也是一個非常有效的手段。綜上,混合模式是我們應該采用的第二個策略。
諾亞方舟實驗室在從事基于深度學習的自然語言處理的研究,以自然語言對話、機器翻譯為主要應用。以上策略正是指導我們研究的基本思想。
6.結束語
完整地實現人工智能是極具挑戰的。但是有一點我們深信不疑,人工智能技術將會不斷發展,計算機將會變得越來越加智能。
人工智能技術未來會發展成什么樣子?我們誰也不能很好地預測,即使是十年以后的情況。舉個例子,得益于大數據和深度學習技術,最近語音識別有了突飛猛進的發現,識別準確率現在達到95%左右。十年以前可能誰也沒有預想到這點,你猜到了,別人也不相信,因為當時的識別準確率只有85%左右?,F在預測十年以后的人工智能技術,我們也會陷入同樣的困境。
人工智能的頂峰有可能是我們永遠無法到達的,正像我們人生中追求的理想一樣。重要的是在向上前進的過程中我們不斷努力,不斷進步。這就是人生,這就是人工智能。
- 上一篇:阿爾法狗 4:1大勝人類冠軍后,也重新定義了人類 2016/3/22
- 下一篇:解密Google Deepmind AlphaGo圍棋算法: 2016/3/22