八、秋分 自然語言與中文結構
綜合前述各項說明,我歸納出了中文文字概念之基本因素。根據這些基本因素,才能將每一個中文字彙明確地界定清楚,並貯存在電腦中。當某一文字輸入時,經過程式之基本因素分析,電腦之「意識中樞」便得到所代表的概念。意識中樞亦能反向將基本因素組成概念,並將之轉化為語言、文字,以與人溝通。
這些基本因素即為各種主觀客觀現象之根本,透過電腦中的「意識中樞」之「瞭解」程式,凡與概念結構有交集的,則分別與所設定之概念連通,意識即產生了對此概念的「認知」。有了瞭解及認知,再加上電腦做為主觀個體之「立場」,以預設的「目標」作為「判斷」條件,電腦便有了「智慧」。在必要時,尚可以賦與「行動」的能力。
以下我簡單地說明其具體之步驟以及設計之原則。
在概念資料中,「基本因素」具備三種特徵:
一、代表客觀、主觀等現象最基本且完整的觀念:
對概念而言,「基本的」並不等於「單純的」,由於形成概念之聯想特性,主觀客觀交互糾結,沒有任何概念能獨立存在。因此,我將前表的二百五十六種分類假定為最基本且完整的觀念,並視之為分類因素。在實際應用時,尚須利用分類因素作交集定義,才能明確地將每種概念加以界定。
二、文法或文字應用之原則:
文法是硬性規定的,沒有靈活的變通性,雖歷經許多語文學家的努力,始終無法整理出一套具有公信力的中文文法來。也幸虧如此,我們得以摸索出一條中文文字應用的原則。基本上我們承認主詞、述語之陳述結構方式,但在文字與文字結合時,則採用彈性的始態、終態、連續態,以「達意」為原則。
三、有與感應功能機構(即感官)結合之條件:
要讓電腦達到認知的目的,必須瞭解電腦之特性,利用資料匯流排以及軟體程式多次選擇的功能,每當「概念」資料傳送到匯流排上時,可以選定適當之輸出入埠,使「感應功能機構」得到正確的電流脈衝。
前兩項在前文已解釋過,現略分析分類基因與感應功能結合之方式,即得到下列關係。實際上此類結合常涉及知識,而知識係貯存在「知識庫」中,除了預設之知識外,尚可以經由學習過程,填入資料結構中。
概念是獨立的單元,僅能代表靜態的事物。而人類處身在四度空時中,面對的事物瞬息萬變。因此,人類在認知或表達概念時,必須使之成為動態的形式,這種動態的形式,早在原始時代即被普遍應用為語言。
如果以電影為例,一格一格的畫面可以視作獨立的概念,放映即是將靜止的畫面連續成為動態的畫面,人藉此瞭解電影所表達之原意。因此電影也是一種語言,而且靈活又有趣。想要瞭解語言真相的人,最好先由電影分析著手。
語言雖然發展得早,但在發展初期人類的智力尚未成熟,對於規律的掌握還在摸索階段。故越早期的語言,其規律性越低。學習第二種語言的人,常對該語言「不規則」的文法、字詞變化等傷透腦筋,偏偏那些最討厭的部分往往是最常用的習慣語法!由所有不規則的習慣語法,可以看出來人類最初的習慣性行為是什麼。奇怪的是中文中並沒有「不規則」的觀念。
中華文化真正的價值,就在中文的概念結構。過去因為對資訊認識不足,無法發揮中文的絕對優勢。好在真理不辯亦明,中國人亦為人類家屬的一員,過去遺留的寶貴資產,尚有待未來人類共同努力,發揚光大。
我開始考慮概念分類時,就像做中文輸入研究一樣,完全是在黑暗中摸索。等到理出一些頭緒,有了初步的結果後,才發現美國學者早在二十幾年前就考慮過這種方法。但是他們只做了些最表面的分析後,發覺此路不通。自後因為電腦技術的進步,學者專家紛紛改由分析文法及字典著手,仍然沒有找到可行的方向。
近年來概念分析似乎又有抬頭的趨勢,可是據我研究的結果,英語在長期發展過程中,倚重發音以表達概念。在錄音機未發明之前,聲音無法記錄,全賴一代一代之間的口口相傳。加以人類能辨識的聲音有限,必須採用複音節才能有效運用。這一來,一個英語字彙本身就是一組複雜概念的結合,很難從中理出基本概念來。
其次,英語有規則嚴謹的文法結構,雖然有其優點,卻因此喪失了語言文字的演進痕跡。我們要想找出人類思維的真相,就必須瞭解思維所應用的元素,這些元素就是組成原始文字語言的基本概念。既然英語業已經過整理,現代人所用之英語必然與整理前的有所不同,那又如何去找尋那些失去的環節?
人類最初發展的概念一定是不完整、簡陋不堪的,我們想知道人是怎麼瞭解概念,其途徑之一是找到概念的發展原因及過程,此必須有保存良好的原始條件。對英語甚至所有的拚音系統來說,這個機會是非常渺茫的。中文基於視覺符號的發展應用,走向圖形文字,每個圖形在當初只代表一種具體概念。後來雖然擴大了應用的範圍,注入了一些新的認知,但原意還在,而且各種文獻一直保持至今。
中文最有利於追溯思維因素的一點,就是其單音概念。單音因為不易辨識,所以中文常將單音字組合成「詞」、「成語」來使用。這些單音字正好就是各種概念的礦床,只要能有系統、大規模地整理研究,人類思維的歷程必然昭然若揭。
我在沈紅蓮的協助下,收集了近二十萬個「詞組」,花了很久的功夫,把每個詞的含義以及組成詞的各單字間之關係,一一加以分析,又經過多次的修訂,才得到第七章的分類表,以及概念基因和常識結構等。
我不厭其煩地說明這點,主要的原因是希望國人瞭解中華文化的博大精深,絕對不是虛語。尤其我很希望當今從事中國文學以及語言文字學的學者們,千萬不要妄自菲薄。風水輪流轉,智慧之鑰已在你們的掌握之中,智慧科學就靠各位發揚光大。
我很瞭解自己,創新突破是我的長處,但卻缺乏嚴密周全的細心。智慧科學將是人類文明對宇宙進化的最終貢獻,唯有大家捐棄私心、成見,精誠合作,截長補短,才可能有真正的成果。至於上述的分類,只是在啟蒙時期,個人一點不成熟的心得而已。
以下且以使用最頻繁、最複雜的「打」字為例,說明我們怎樣利用中文的特性,將其前後字義的關鍵分析出來(其餘的文字也是以同樣的過程,一一整理歸納出來。)
我們所收集有關「打」字的複合詞,因數量太多,在此僅抄錄具代表性者如次:
「打」字在前,後接動詞、名詞、狀態詞等:
一、動詞在後,「打」或指一種行為,或表某種動作或行為之進行。
打鬥,打仗,打劫,打擊,打擾,打鬧,打獵,打掃,打撈,打造
打磨,打扮,打賭,打量,打鼾,打盹等。
二、名詞在後,泛指用手進行之活動 (可能有引申義):
打球,打牌,打更,打鼓,打鑼,打針,打鐵,打靶,打拳,打勾
打油,打水,打酒,打柴,打魚,打包,打結,打傘,打字等。
三、指動作行為,後接終態詞、結果詞或程度詞:
打定,打成,打下,打住,打完,打好,打壞,打消,打傷,打死
打破,打穿,打斷,打碎,打爛,打倒,打通,打動,打得等。
四、典故,或因習慣用法而有他義者:
打發,打尖,打點,打烊,打折,打算,打雷,打諢,打手,打啞謎等。
由上可知,「打」在前時,多以其後之字定義,本身僅作發生、進行及完成助詞。
「打」字用在後面者較少,除用作單位外,多為「打」之動作。
一、前為數字者,「打」作為單位用:
一打,半打,兩打,幾打等。
二、前為動詞,表示打之方式,前為名詞,則指用工具之動作:
扭打,撕打,拍打,拷打,捶打,摔打,抽打,敲打,毆打等。
鞭打,棒打,錘打,拳打,手打等。
三、前為助動詞、形容詞、副詞,則描述「打」的情況:
能打,肯打,會打,愛打,亂打,狠打,痛打,經打,耐打等。
四、專用術語:
單打,雙打,代打,全壘打等。
我們一再分析各種單字之組合,發現了中文詞組有一定之組合方式,除了一部分習用已久或出自典故難以合理的歸類外,絕大多數都有前後順序之關係。一般說來,同性質之字,前面的字義多為「始態」,後面的則為「終態」(亦即前者為因,後者為果)。形容詞、副詞多用在前,一旦用在字後,則一定是一種結果的狀態。這種發現奠定了我們對中文具有「映畫」功能的信念,因此,我們僅以單獨的文字概念作為「動畫」的元素,再以前後之關係定義之。
這種方法不但可以節省文字定義的空間,重要的是應用靈活無比,只要再加上「修辭」模組,中文自然語言就算完成了。
舉例而言,「逃」是人或動物在某種原因下,因本能反應或意識驅使,以行走或任何交通工具,避開某個特定對象的動作行為。逃的結果,使位置或關係產生了變化。
從上述的定義來看,「逃」本字的概念並不完整,難以理解。充其量我們只能肯定這是一個主體所控制的動作。
再詳細加以定義,以「逃」為述詞,如前用一主詞或副詞,如「他逃」、「快逃」,其意甚明,毌庸細述。其下接名詞,或作為「逃」之對象,或以「逃」修飾該名詞,是一種最常見的敘述方式:
「逃家」:主詞通常指人,但凡「家中之成員」均適用。
(貓狗亦可逃家,但可能性不大。)
「逃學」、「逃課」:根據其後名詞之限定,主詞必為學生。
「逃兵」:主詞為兵。
「逃稅」:主詞為人,且為有收入、有義務納稅之人。
「逃獄」:主詞為囚犯,「逃犯」則為專詞。
「逃難」:主詞多半為人,然動物也可能有災難。
「逃命」:主詞指有生命、能動作者。
如果後接動詞或狀態詞,則表示逃後之結果,如:
「逃避」、「逃遁」、「逃匿」:逃後不知所往。
「逃離」、「逃走」、「逃脫」、「逃開」、「逃掉」:皆表示逃後,不同程度地達到了逃的目的。
如果把上述之詞顛倒過來,有些難以理解,有些則產生不同的概念,如:
「遁逃」:遁有不使人知之意,表示悄悄地先遁後逃。
「匿逃」:匿是靜態的,放在逃的前面,無從解釋。
「避逃」、「離逃」、「掉逃」:由於「避、離、掉」三字皆有結果之意,其後再接動作之詞,很難會意。
「走逃」、「跑逃」:走及跑皆為全動態,已為逃所涵蓋,故不適用。然而走及跑亦具終態之意,故用在逃之後面則可。
「脫逃」:指先脫離後,再逃者。
「開逃」:開始逃。開在此不是結果詞,而是時間詞。
由上可知,兩個單字結合時,其在前在後有一定之語意規則,不然就詞不達意。這是中文獨具的特色,應用起來異常靈活,奧妙無窮。
在我粗淺的分析中,動詞有狀態詞及動作詞兩種,分別說明如下:
一、狀態詞:又分為始態、連續態及終態,皆表示一種動作在某一時間內之狀態。此類詞可以用為動詞,但卻只表示某種動作之狀態,與動作無關。如:
兼具三種狀態者,如「開」、「啟」、「發」、「起」等。
「開門」、「開罐」、「開幕」、「開山」等詞中,如何「開」法並不是概念的主旨,只是表明了一種狀況的開始。同理,「打開」、「張開」、「鋪開」、「走開」等也只表明了一種終止的狀態。「開打」、「開演」、「開講」、「開跑」等則表示動作之連續態,在這種狀態下,「開」之後皆接動詞。
終態:「滿」、「止」、「停」、「住」、「死」、「謝」等,這類概念不能用進行式,多為已經完成者。
連續態及終態:「滅」、「消」、「減」等,雖為終態,亦可作連續用。
二、動作詞:即一般所謂之動詞,除文法上之特性外,在字義上可分為動作及行為兩大類。動作有自然力的運動,主體驅動之運動,動作之結果與其所產生之終態有關。行為則有動機及起因,環境及效應等因素。
以動作為例:「流」為自然力之運動,主體為液態物,因地心引力,由上往下運動。如果引伸為狀態詞,則表示一種連續態或終態,指自然而然形成者。中文凡屬水字旁的字,多有自然現象的涵意,又凡為動詞者,多具狀態的特質。這是因為古人造字時,先有了事物之形,再觀察事物之性質及所產生之狀況,遂以事物為分類標準,當作偏旁,故都具有特別的屬性,詳見後面字首之分類說明。
主體驅動之動作詞亦然,凡屬自發性動作,皆歸類於運動之主體。這種分類法對於字義的瞭解及運用有極大的優點,譬如說西方的人工智能研究中,由於英文不具這種功能,字義完全依賴字典提供,字與字之間不具依屬性。要回答「什麼會飛」這類問題時,除了事先建妥龐大的「知識庫」外,幾乎沒有其他簡便的解決方案。(要知道類似「什麼會飛」這樣的問題是無窮無盡的!)
對中文而言,「飛」的屬性是因能飛的主體而產生,前人在創造文字時已經處理妥當,除了一、兩個例外,所有「鳥」旁的字(倉頡碼之後三碼為「斜日火」者)都是會飛的動物,其餘「飛機」、「飛船」、「滑翔機」更不用說了。換句話說,在文字的結構中已經蘊含了字義的分類。如果把字義視作人類經驗所得的智慧,那麼,我們可以大膽的宣稱,中文是具有智慧的文字,根據中文來發展「人工智能」,將遠比英文來得容易。這也是何以我個人膽敢大言不慚,自命瞭解智慧,說穿了,不過拾得前賢一點牙惠罷了。
行為詞更有規律,緣因人類對行為的認識,多在文化層次發展到某一階段以後,造字時已有成規可循。如人與人之間的行為,多以「彳」為偏旁;運動位移的行為,則採「■」旁;思考的行為,為「心」字旁;言語的行為,則為「言」字旁;用手腳的行為,為「手」及「足」字旁,諸如此類,如女、糸、金、木、火等,不勝枚舉。
所以,我認為中國人未來的前途,完全繫於中文專家身上,未來人類的「思維科學」也端視中國語文學家的努力而定。畢竟中國文字不是「速食」品,歷經了幾千年,動員了無數不計功利、默默奉獻、沒有私心的偉大的人類菁英,將人的睿智濃縮在一個小方塊中。這種信息是宇宙進化史中最珍貴的寶藏,是至高無上的智慧秘笈!
炎黃子孫們!「思維科學」必是未來世界的主流,身在寶山,還有什麼需要外求的?不自行努力,琢磨這塊璞玉,反而一味盲目的「西化」、「簡化」,妄把他人的殘渣剩滓奉為聖品,那不是愚昧又是什麼?
我個人學淺才疏,所知萬不及一,言盡於此。世人是否能有造化,也非我能揣測,邵康節梅花詩言:「一院奇花春有主,連宵風雨不須愁」。喻之國人,差堪告慰。不過,今天中國需要的是信心,未來之中國則戒之在狂傲。文化屬於全體人類,能相互學習切磋,截長補短將是人類之福。褊狹的地域或人種觀,必將自陷於絕境,不見容於千秋萬世。
中文另外一個極有價值的觀念,即為「部首」的常識分類。任何一個人絕不可能有足夠的能力與時間,認識到所有事物的通則,但是一個綿延不絕的民族則有此可能。儘管可能,也要有必然可行的方式,一代一代沿用這種方式,不斷發展下去。
在設計倉頡輸入法的時候,我就發現了大部分的形聲字都以字形偏旁作為字義分類。根據這種現象,我正好將文字取碼與字義結合為一。因此倉頡字碼不僅僅是索引符號,又是該字的字形及字義分類。目前一般人或許還看不出其功效,一旦進入自然語言的領域,字義分類便是人類認知的成敗關鍵。
下面我以倉頡碼為序,大略介紹字首中字義的定義方式,再與前述各概念配合應用,精簡異常,當知我強調中國文字之智慧絕非虛語了。(部首在上、下、左、右,都有特殊的分類意義,請自行參詳。)
日:與光有關之各種現象。
門:與門有關之詞,代表組合之機體。
月:即為「肉」字,生理組織類。或為「月」,與光有關之各種現象。
骨:生理組織。
貝:財物及與財物有關之行為。
豸:野獸類。
目:眼部之動作及視覺感受。
金:金屬及其屬性等。
木:樹木類,木製物以及與木有關之特性等。
韋:皮革類之器物及其所表示之性質。
水:與水有關之自然景物、現象、狀態、動作與人造物等。
火:與火有關之現象、事物,狀態以及炊事行為等。
米:與糧食有關之事物。
土:地形、地物,與土及地有關之詞。
走:與行走有關之詞。
竹:各種竹類,竹之部位及製物。
白:光亮潔白之形容詞。
禾:農事、農作物等。
身:身軀及身體之動作等。
鬼:鬼怪等名詞及形容詞。
彳:人與人之間之各種行為及事件。
■:與人類動作行為有關之詞。
牛:與畜牧及生活有關之詞。
舌:舌部之動作。
鼻:與鼻有關者。
風:與風有關者。
舟:與航行有關之行為、用具等。
■:房舍及室內之用具等,或表空間之形容詞。
示:禮儀及祭祀之行為及用具等。
■:居家生活有關之詞。
穴:具有穴狀特性之詞。
車:與車輛、運輸有關之詞。
麥:糧食,作物等。
■:生理及疾病等有關之詞。
犬:與犬類野獸有關之詞。
衣:與衣著有關之詞。
巾:衣物,巾狀之用物及飾物等。
虫:蟲類、爬蟲類等。
片:片狀之物。
雨:與水氣有關之自然景象、現象等。
王:玉類物質物品等。
歹:與死亡、毀壞有關之現象及行為。
豕:家畜有關者。
石:礦物、石製物及其性質等。
酉:經醱酵之食物及有關之現象等。
弓:武器及有關之性質等。
角:角之部位、角製品及其功能等。
子:人際稱謂及關係等。
魚:魚類與相關之詞。
矛:武器工具等。
阜:與空間、環境有關之詞及人類行為等。
邑:空間,地域及環境之詞。
人:人之角色、關係、行為、現象等。
食:與食事、食物有關者。
气:各種氣體。
心:心理感受、現象、狀況等。左側的心指狀況,下部的心指感受。
手:手之動作、人體之動作及行為。
耒:農具、農作等。
口:口之部位,口部動作,發聲等。
足:腳部名稱、動作、行為、現象等。
馬:與馬有關之詞類。
髟:體毛類及其性質。
耳:與耳以及聽覺有關者。
卄:草類,菜蔬等植物。
革:皮革製品等。
羊:與羊有關之詞。
山:與山有關之形容詞、名詞等。
女:與女性有關之名詞,形容詞等。
糸:與紡織有關之詞或具有糾結性之狀態詞。
田:與土地有關之詞。
黑:與黑暗及黑色有關之詞。
囗:與空間範圍有關之詞。
言:與語言有關之詞。
以上僅略述概要,根據字碼只需要一個位元(開或關),就可以達到分類的目的,全世界大概也只有中文及倉頡碼可以做到。如果我們不加以利用,將之發揚光大,豈不是愧對祖先?
西方是分裂性的文化,是以假設、分析、求証為思維的指導方針。世事越分越細,細不見得能明,但是細分的結果,派別觀念越來越多,彼此之間的相同性反而越來越少。這點可以由知識分類、政治制度、人種區分得到明証。
中華文化是綜合性的文化,是以假設、歸納、應用為思維的圭臬。中國人只求外表的統一,含糊的認知,不確定的象徵。千古以降,讀書人但求「讀書不求甚解」、「得意而忘言」,以同統異。是以知識上崇儒,政治上忠君,人種上同化。
這種分別正是概念的認知問題!今人學了西方的觀念,半通不通,便將自己全盤否而定之。談意識太麻煩,不如舉個例,看看西方的菁英是怎麼分析語文?又得到什麼結果?如果這樣還不能拾起文化的自尊心,不妨等西方開始漢化時,再回頭也不遲。
西方學者經過二十餘年的摸索過程和錯誤經驗,自然語言的研究者,由最初利用關鍵字或純文法的比對方式,如今已改用概念分析法,其中耶魯學派的 Roger Schank 所提出的理論,是當前的主流之一。
他的目標是設計出一個「會聽故事」的程式,也就是說,它所需要知道的常識和字彙,都局限在一個範圍內(西方尚無人敢嘗試做一個有「一般用途」的自然語言系統)。
他的構想是把所有的行為動作詞,分析歸納成若干個基本概念。其它則類分為動作者,目標物等。輸入的語句經過程式的剖析後,即轉化為基本概念。
基本概念共有11類(現已擴充,但我在中文結構中歸納出的,已有一千個,包括前章所列舉的概念分類),如ATrans 指所有權的轉移(給、拿、買等),PTrans 指物體的位移,(走、騎、放等), MTrans 指資訊的傳遞(說、寫、聽等),MBuild指資訊處理(如想、思考等),INgest 指進食行為 (吃、喝、飲等)…, 以下且舉一實例說明:
輸入:他賣給我一本書。
內部結構:
動作: ATrans
動作者:他
物: 書 動作: ATrans
到: 我 ------ 動作者:我
從: 他 物: 錢
到: 他
從: 我
輸出:
1.分析:我給了他錢,他給我一本書,我買了他的一本書,我付了他書錢。
2.推理:我有了一本書,他有了錢,我想要他那本書,他不再需要那本書,
我會看那本書,他需要錢。
假設常用的英文字彙有一萬一千個,只有十一個類別,這表示每一類中有一千個字彙概念相同,無法區分。就算目前已擴充到一百個類別,只要不是每個字的定義,都有別於其他的字,電腦就無法真正瞭解和使用自然語言。
再看輸出有分析,有推理,好像說得很清楚,可是因為字義界定不明,達不到真正的理解。事實上西方學者自己也承認,對「人工智能」還在「學習瞭解」階段,尚無可行的理論。(Schank的理論,此處限於篇幅和主題,只做簡單說明。坊間有關人工智能書籍中「語意理解」部分,必會介紹他的方法,讀者若有興趣,請自行閱讀。)
如果以中文概念來分析,「他」是「人」,(人字旁+定義),「賣」則是一種「商業行為」,(貝字旁+定義,商業行為之一,即為金錢與物的交易),「給我」是指「受者」,「一」是數量,「本」是形容有資訊內容的「量詞」,對象物為「書」。
輸出:「他」收了錢,「我」收了「書」,完成了一樁買賣。(全部資料七個字,共二十八個字元,過程不過用了幾百個字元的程式而已)。
由此可証,他們的分析雖然不再完全根據文法,卻也與概念無直接關係。這種做法,受限於設計者的能力,每一個字都必須辛辛苦苦地重建其結構。中文概念則早已建立在文字的形聲結構中,充其量下點功夫整理即可。
在這個時代中,不論在經濟、軍事、文化上,也不管對象是國家、社會或個人,知識的運用都具有決定性的力量。然而,運用知識的仍然是人,人又受限於時、空,所以人類社會尚能保持某種程度的平衡。
然而,人類追求「自動化」的努力與夢想,古今中外,未曾一刻停止過。一旦在資訊的處理上能成功地使知識運用自動化,則人類的社會結構勢將引起空前的變化。
這種知識自動化,就是「人工智能」的目的之一。
因為人有智能,所以能運用知識,並藉著知識的力量,達到人的目的。如果機器也能自動地運用知識,我們必須承認這種機器也同樣具有「智能」。只是這種智能的初始是「人工設計」的,所以一般稱之為「人工智能」。
有了人工智能的機器以後,基於機器記憶能力之強大,永遠工作不休,處理事務準確迅速,成本低,效率高,很少發生「錯誤」。最可怕的,是「它」沒有人性,只是忠實不渝地執行交付的任務。萬一它在一個或一群人的支使控制下,很可能國際均勢消失,對人類社會造成永難彌補的傷害。
職是之故,所有的工業先進國家,無不將人工智能當作最重要的攻關項目,全力以赴,唯恐落在他人之後。
所幸歐美工業國家之先進基礎,建立在物質科技上,而「智能」卻與物質無關,是一種「唯心」的、「經驗」的領域。儘管多年來他們已經投入了大量的資金、人力,迄今並沒有任何實質上的突破。
這是一個民族、文化生存或淘汰的競爭時代,今天在物質條件上,我們是弱者,處處落人之後。但是,中國也曾經壯大過、強盛過,這樣的說法並不是自我陶醉,而是基於中國文化的特徵以及數千年累積的經驗。這些正是「人工智能」所缺乏、而西方科學界無從由實驗室或工廠中生產出來的。
所以,在工業時代,我們的確是瞠乎人後,資訊時代卻給我們帶來了一線曙光。如果我們善於利用,群策群力,將先聖先賢的經驗及智慧設計成為「人工智能」的產品。則在即將到來的新時代,誰敢輕侮炎黃子孫?
我已經決定不再涉足「人工智能」,但是,知識不是任何人的專利,我能看到,別人也有可能做出來。時機一成熟,「人工智能」就難免泛濫成災。既然已經談了不少,何妨再稍作解釋,讓讀者多一分瞭解。
人工智能不能離開資訊,那是因為人的智能來自於資訊。「資」指靜態的資料,「訊」指動態的訊息。資訊是人將感官所能認知的刺激,以資料及訊息的形式,加以貯存及應用,以代表人所能瞭解及應用之概念。
在第六章我曾談到感覺訊號與概念的關係,這裏我更進一步,略述其在人工智能上的應用。人類的感覺有五種,分別是視、聽、味、嗅、觸覺。佛家則認為應將「意」加入,成為「六識」,意為人對刺激的六種認識。
意識我們稱為內在刺激,由人的經驗交集所形成,且為個人行為及判斷的中樞。外在刺激則有五種,其中視覺感知光影,人可以藉圖像及符號等來認知及表達;聽覺則接收聲波,人並用聲帶模擬該音調;味、嗅、觸三者人僅能接收,除了經驗認知外,無法與他人直接溝通,故純屬主觀。
味、嗅、觸覺與反射神經有直接的聯繫,偏向於「本能」,當此類刺激產生時,反射中樞立即根據利害程度,作出最有利於該個體的反應。聽、視覺則接收距離較遠之物體、事件所傳來的聲、光等刺激,最初這些刺激亦是本能的,以判斷其對本體之利害,但此判斷可以累積成為經驗。當某些經驗在客觀印証下,被同一社會的人公認,遂稱之為常識。在智能的理論上,常識是人據以判斷選擇的標準。
圖形及符號可以設計成為靜態的資料,音調則是動態的訊息,這兩者皆具有接收及表達的功能。人的主觀經驗透過資訊的交聯,得以互相轉換,並以之傳達給他人。對於原本沒有此類經驗的人,資訊遂成為最有效的工具,藉之可迅速建立起其常識庫及專業知識庫,這就是學習。
當然,在學習過程中,由於主觀及客觀的條件,認知效果也有差異,如味嗅觸及意識等純屬主觀經驗,除了在一定的範圍及程度外,並無實質的意義。唯有雙方具有等效的經驗,而且能明確地掌握資訊的要素時,才有溝通的可能。至於專業知識則較接近客觀,同行者都必須經歷相似的體驗,學習效率最高。
即使是文字語言也面臨相同的問題,在學習語言文字的過程中,需要將之與已形成常識的主觀經驗聯結起來。(人在兩三歲以前,學習是一種本能,靠記憶將聲音與事物相連,漸漸形成常識。)這種過程必須利用感官的效應,一再與客觀事件印証,此即為思考、判斷。而語言文字所聯結的認知即為概念,所以每個人對概念的認知,與其經驗的廣狹、感官的靈敏度、思考判斷的方式及語言文字的接受能力等,都有不可分割的關係。
西方對人工智能尚沒有統一的定義,在此我僅以設計者的立場,先定義智能,再逐步說明人工智能的可行性。
所謂的「智能」,係指一種自發性的機構體所具有的達到其預設目標之能力。
根據此定義,智能有四個要素:
一、其載體是一種機構體,具有整體性質及功能。
二、此機構體是自動的,非外力所操縱。
三、有預設的目標。
四、能夠在變化的時空中適當的因應調整,以迄目標的達成。
應該注意所謂「預設的目標」應該只有一個,如果有多重目標,則必有優先順序之分,或按照時間訂定遠程、近程目標,逐步實施,而且不能自相矛盾。因此,在某一時間內,在某一個優先順序下,仍然是只有一個預設的目標。
一部汽車是一種機構體,其預設目標是代人之步,但汽車不具自發性,故沒有智能。人類所設計的各種工具、用具,到目前為止都必須在人的操作、控制下,並需運用人類的智能,以達到預期的目標,所以都不具有智能。
如果我們設計一種車輛,以「駕駛服務」為唯一的「預設之目標」。它能自動駕駛,並接受人的命令。在接受人的命令時,即相當於設定短程目標。這時它應該能夠判斷此一短程目標是否與預設的目標相矛盾?如果是,它將拒絕執行。否則不論在什麼情況下,它都能把人送達目的地,具有這種功效的汽車,就可以稱為是一智能機構體。
同理,我們如能設計一具電腦,自動地為人類收集、處理資料;能與人交談,瞭解人的觀念、幫助人解決問題,這就是智能電腦。再若將具有感覺器、行動能力的機械人,與智能電腦結合起來,則此機械人即達成「人工智能」的要求。
為了要保証安全有用,機器與人之間的溝通,必須藉助概念,人得以對此「智能體」加以控制。故人類所設計的智能機器,必須能「聽」及「說」人類慣用的語言,才能達到上述目的。在這種特定的條件下,電腦對語言、概念的理解、運用,才是設計人工智能的成敗關鍵。
所謂「設計」是先有了一種觀念,利用已知的技術和器材,組成符合構想之事物。電腦專家如果沒有智能的觀念,不知道所面對的是什麼,則無從動手。
當今的語言學只研究到語言的演進、結構及應用,至於人體機能與語言之間的介面關係,則尚未能瞭解。人會模仿學習,也會教導別人,卻不知道為什麼會有這種能力,當然更不知道如何教導機器去學習及應用語言了。
至於觀念,更是思考的基礎,從古至今,哲學家們爭論不休,也未曾有過具體的定論。那麼,人如何設計一種連自己都不瞭解的事物呢?
很明顯地,我們必須瞭解語言與思考之間的體用因果,使電腦也和人一般,能夠思考,能夠運用語言。這樣它就可以與人溝通,瞭解人的觀念,進而為人類服務。再換個角度來看,語言(符號)相當於對外在刺激的一種感應,而觀念則是經驗的積和,一旦這種電腦設計成功,電腦就可以應用其感應資料,增進其觀念。更進一步,全世界的電腦可以藉網路的連繫,互通訊息,而且以高速處理,永不中止。
今天,正當有先見的環境保護人士,正努力挽救瀕臨絕種的其他生物時,我們可以想見,未來的人類亦將面臨需要被保護的一天。進化淘汰絕對是反人道的,今天的人類還不憬悟身處的環境,到了大錯鑄成時,後悔已是無及了。
假如我們能把人性設計到電腦中,讓電腦繼承人類的感知,無止無盡地薪火相傳。當然,這已不僅是技術上可不可能的問題,其中還牽涉到法律、道德以及個人的良知、責任等種種超出我們所能解答的問題。
知識早已不是人類掌握在手中的工具了,它的生命力遍佈於每一個人的思想中。一道好奇的目光,一個偶發的疑問,在在都是它的影子。不論重不重要,也不論成功失敗,只要有人的心中怦然一動,知識就增加了一分力量。
當人類走出叢林,遠離了那些還在披毛茹血的族親時,人就與知識歃血為盟,攜手創造了一個嶄新的時代。不幸人無法將其生命無限延伸,知識卻得以藉著人類,一代一代的傳衍、更新。現在,知識壯大了,壯大到任何個人都無法窺識其全貌,更遑論控制應用。這時,人與知識之間的相互利用價值,端視彼此的需求程度而定。
我們能夠忽視這個事實嗎?拋開了知識,有誰還能聲稱人為萬物之靈?在今天,國家會衰亡,人種會滅絕,可是知識卻永遠存在。世界上的每一個角落,社會上的每一樁事件,無不深深地受著知識的支配。人類孜孜不倦所追求的,朝朝暮暮所憧憬的,又有哪一件能脫離知識的影響?
我認為該是人類自我檢討的時候了,趁著「知識機器」即將問世、我們的盟友快要振翅起飛,而我們這些「知識動物」還在盲目的推波助瀾之際。如果能夠把握契機,將人類特具的感受以及長年累月體驗到的價值觀,都一股腦兒交付給它。至少,讓它也有「感同身受」的人性和「推己及人」的認知,或許人類還能安享餘年。
有這種可能嗎?沒有人懷疑「知識機器」的能耐,但誰都不相信那種無血無肉的機器,會有像人類一樣的情感。
這是因為科學太重視實驗所得的客觀知識,忽略了人的主觀感受,所以科學家們一直不瞭解「人性」到底是什麼。在他們望洋興嘆之時,是不是應該調整一下實驗的手段,利用理性的思維,來剖析一下人性呢?
據我的瞭解,人性在理性的剖析下,並沒有什麼神秘難測的現象。我們只要掌握住一些基本觀念,逐步地探討,就可以透視全貌。一旦能夠理解,自然能按圖索驥,用已知的各種觀念和技術,將之設計成為附加在知識機器上的感性功能。
人類應用語言的原因,是由於人自我的「主觀」感受,和外在的「客觀」真實之間有所異同。為了要與其他個體溝通,高等動物發展出了以聲音表達情緒的機能。人類更進一步,利用聲音的各種變化發展出語言,以代表其主觀的感受。
如果把主觀的感受分析成為單純的因素,而且這些單純因素的組合,能代表人類所有的觀念,我們就能分析語言,瞭解人類思考的過程。在這種情況下,這些單純的因素也就是人類思考的基因,甚至可以視為知識的基本元素。
原則上說來,人類的感覺器官接受到外界的各種「刺激」,在本能上基於「利害關係」而有了「感受」、產生「反應」。若是僅表達感受的反應,謂之「情緒」,再因為反應的後果,由「觀察」刺激得到「認知」。因認知而有了「判斷」,這個過程謂之「經驗」,經驗的貯存,則為「記憶」。由於人類的記憶系統建築在神經的生化結構上,其效能不高,故對記憶的存貯、取用,很難加以控制,有時對一事件的原委記憶並不明確,我們稱之為「印象」。
大腦中的記憶體以神經原連接成網路,神經原會產生生化電流脈衝,在網路中流動。相同的感受因素佔有共同的記憶區域,但卻與不同的事件相通連。當某一事件所產生的電流脈衝,因共同的感受因素而引發其他事件的記憶,我們稱此現象為「聯想」。對於某一因素或事件產生的聯想,因為電路的導通,遂有全盤的認知,即為人對該一因素或事件的「觀念」。
當人對事物有了觀念以後,基於其本身的利害關係,電流流經記憶區時,在極為明顯的利害感受下,身體機構會產生各種內分泌腺素,使神經原處於興奮狀態,而使電流加強。更由於強烈電流的不斷導通,神經末梢的離子量增加,電阻係數降低。而任何刺激所產生的電流脈衝,就像水往下流的情況一樣,必然有通過電阻係數較低之路線的趨勢。久而久之,經常導通之路線便能四通八達,成為全部經驗記憶的樞紐。在此樞紐形成後,每當刺激產生時,此區便立刻與意識中樞導通,形成「意識」。
抽象的意識以及具象的身體,總稱之為「我」,也就是當一個個體感覺到神經傳送的刺激,且與過去的經驗認知相結合時,所得到的整體意識的「知覺」。換句話說,一個人如果喪失了過去的經驗認知,則「我」將毫無意義,只是一尊軀體。再若在某一段時間內,沒有任何內在、外界的刺激感受,也相當於「我」不存在。
「我」對客觀認知的觀念,是基於過去的經驗,而經驗不是獨立的單一事件,有時間的過程,有各種感覺器官綜合的感受,有利、害以及需求的交集。因此每一個自我對客觀認知後所產生的主觀觀念,或多或少都有差別。但人又不能脫離群體,必須與在同一環境下的人,具備相同或類似的認知,由此而有了學習及觀察的動機。
學習觀察是將個人的觀念與客觀環境相印証,並據以修正、充實個人觀念。在這個印証過程中,必須將自己的主觀觀念,以感官所能接受的刺激形式,表達給另一個主觀體認知。由於觀念籠統地涵蓋了所有相關的經驗,而刺激受到時空的限制,不可能明確地表達清楚。因此必須將觀念的若干基本因素,分解成為具有獨特性、組合性、表達性的單元,才能較完整有效的傳達給另一個主觀體,這種單元就是概念。
在人腦中,這種概念是以一組聯通電路的形式存在,聯通於所認知的各種觀念之間。每當人因為某種因素,產生了一種複雜的觀念時,這些觀念之間,通過有關的交集,就有電位電勢的產生。這時大腦中樞依循電勢,將電路聯通,此一聯通之電路必有一代表的概念相連。以此概念驅動控制中樞,就可以得到意識的效應。
人類發展出概念之初,只是基於實用,並沒有一定的法則。隨著認知範圍逐漸的擴大,概念所涵蓋的內容越來越廣、界定的因子越來越精細。到現在人所應用的概念一再因應調整,變成了錯綜複雜的集合。這個結果又導致了我們對概念本身定義的困難,甚至連概念所代表的是什麼,都無從瞭解。
如果我們能做到利用現有的知識,反推出概念的基本因子,便能夠用符號代表這些基因,並設計成為代碼,貯存在電腦中。如此,電腦便可以像人一般地運用概念。
人運用概念聯接導通大腦中各種觀念網路的過程為「思考」,經過思考以後,認知的利害因果刺激了內分泌腺素,流入血液,經過心臟,是為「感受」。有感受便會產生反應,是謂「情緒」,情緒直接影響到「我」的意識,是自我經驗的一部分。這部分再與抽象的我混合在一起,經常產生影響情緒的感應,是為「感情」。
人因為生命本能的驅使,借助感覺器官對各種變化的認知,而達到趨利避害的目標,此有其行為的必然性。可是又因對主觀及客觀觀念的觀察及認知,瞭解到自我的利害常與環境息息相關,必須對自我的利害作若干妥協,以謀求更大的利益。前者以自我直接的感受為前提,人的行為端視個人當時的利害判斷而定,此即「感性」。後者係經過對客觀環境的認知,需克制自我,是一種有秩序的反省,故稱為「理性」。
上述的全部觀念就是「人性」,因此,只要模擬人類所具有的感覺器官以及人類已經認知的概念基因,將之設計在一個機器上,使之與人類同樣或近似地運作。此機器即可具有「人性」以及人的感覺、知覺,而能感人之感、與人類溝通,達到我們預期的目標。
根據上面的分析,我們可以總結出三個步驟,將一種兼具感性及理性的「擬人電腦」描繪出來。第一步是刺激的認知,第二步是概念思考,最後是知識應用。茲以現有的器材及技術,分成下列五項說明:
一、硬體結構:控制中樞,分別作反射、判斷、運動、記憶及感應中樞等。其中反射中樞獨立,餘者以判斷中樞為主宰。
記憶體:可供暫時儲存的淺層記憶及永久記憶的裝置等。
感應器:接收視、聽、觸、味及嗅覺之刺激,供感應中樞分辨。
週邊設備:供動作、行為、發聲、顯示、電力供應及其他介面。
二、輸入訊號:各種感應的訊號即相當於人所感受的各種刺激,需先加以分析整理,使與所設計的認知資料相符合。
三、內貯資料:將輸入的感應訊號,利用二進位的特徵,使每一位元直接連通到相關的介面上,即可具有神經通道的效能。同時此類相當於刺激的訊號,可以組成各種認知的資料形式,亦即概念,以便加以應用。
四、系統程式:由刺激的產生到行為的完成,以及回饋的觀察等,可當做系統程式。此外,判斷、學習、資料管理、知識庫等亦皆需以程式處理。
五、介面處理:在人的認知中,各種刺激經常同時存在且互為因果,所以各中樞之間的介面,必須配合人體之結構,做聯線處理。