必備資料 參數設計 雙向溝通

第三節 資料庫

  多媒體自動化的完成有賴幾個必要的手段,其一就是大量且完整的資料庫。若言多媒體是部機器,則資料庫相當於動力,沒有資料,就沒有動力,多媒體不能工作。
  資料庫種類很多,以下為本多媒體系統所必需者:

  甲、常識庫
    人類在日常生活中所能理解之事物,稱為常識,將之整理為資料庫,即為常識庫。
   想利用電腦程式理解文字、語言,首先必須把常識整理出來。
    西方對常識的定義極為分歧,我國對常識有詳盡的認識,即概念所涉及的「體、用、
   因、果」。是以,以體用因果界定的概念,即本書所謂的常識庫。

  乙、知識庫
    專家所用的常識庫即為知識庫。唯知識浩瀚無窮,全部整理成體用因果的形式,當
   前難以實現(未來可由電腦整理歸納)。所幸在理解系統下,知識可用陳述的形式,
   分門別類,置之系統中即可。

  丙、概念庫
    漢字概念分類(詳見拙著《漢字基因工程》)是根據《易經》的分類法則,計有
   256大類。在各大類中,再行定義認知的性、量等。如有必要,可設計成為理解的
   微指令,則效率更高。

  丁、素材庫
    是各種故事的基幹,也是構成獨立單元之資料,這些資料散見於過去各種人文記事
   當中,應採用劇本規劃的格式,設計成為各種素材模組,再統一貯存在素材庫中,以
   供劇作者使用。
    素材設計時,舉凡人事時地物皆編以代號,內容則為分類形式。使用時先找到內容
   分類,再查人事時地物即可。

  戊、圖形庫
    所有物體的三維造形,規格統一,分類定義。
    人物庫:僅需面部造型,各定藝名,以備定妝用。
    化妝庫:各朝各代的時尚衣服、化妝特色等,供定妝用。
    器物庫:各種道具及風俗用物。
    風景庫:各種地貌場景等。

  己、動作庫
    動態的動作行為,設計成為與概念結合的模組。

  庚、主控庫
    所有的模組皆以概念為索引,由主控程式控制。


第四節 參數設計

  資料庫中經常調用的資料,應以參數形式設計,以便於程式調用、修改。各參數之形式則視背景條件而異。

  甲、環境背景

    時間:由資料庫可查明,此一時間內所有相關的參數。
    地域:由資料庫可查明,此一地域內所有相關的參數。

  乙、個人背景(皆以索引形式建檔)

    固定資料:舉凡個人的定義及特徵,固定或不需改變者:
      姓名,性別,籍別,生日,父母,子女,學歷,經歷等。
    可變資料:舉凡個人定義及特徵,可以改變者:
      身高,體重,宗教,信仰,習慣,職業,住址等。
    常變資料:隨時改變,供認知及交談之資料:
      嗜好,交遊,工作,心境,情緒,需求,目標等。

  丙、控制參數

    機體運動的關節、肌肉、器官、肢體及其他機器的機構等,應設為位置參數。此參
   數尚應包括習慣特徵修正值,以及相應條件調整值。

  丁、應用參數

    動態,方向,強度,軸心,力向,力道等,均屬應用參數。

  戊、變化參數

    環境,個體,能量,時間,空間,機率等。

  己、調整參數

    最初設定之參數不可能完全正確,有必要隨時實驗、修正。


第四節 雙向溝通

  人在溝通過程中,必須親自介入,才能獲得主動權。由於電腦及網絡的進步,這種參與性的雙向甚至多向同時溝通,已經成為事實。不過目前尚局限在通訊、會議等現場溝通階段。在戲劇上,尚有多項難題有待解決。
  關鍵問題之一,在於不論通訊技術再進步,網絡永遠不敷使用。這個道理正如當今的交通瓶頸一般。只要想想,如果每個人都擁有一部汽車,這個世界會變成什麼樣子?
  每人一部汽車或許並無必要,更不可能眾人同時把車開到公路上。可是,基於人性的需求,任何人在任一時刻、任何地方,都有極高的欲望要與他人溝通。
  在通訊工具尚無法滿足人類所有感官需求之前,人還無法想像出那種遠景。一旦雙向溝通能與虛擬實境結合,也就是說,人可以將其感官無限伸展到任何時空。到那時連外出旅行都可以免了,人安居斗室,只要把感官送出去,就是百億光年的外太空,也都能一一呈現眼前。
  到了那一天,大部分人的生活,必然都擁塞在網絡上,整個宇宙也將聯成一氣。於是麻煩來了,究竟要有多少網絡頻道,才能滿足這無盡的需求?
  不錯,硬體技術不斷進步,但是如果人人上網絡,且先不談雙向溝通,僅僅這傳達神經脈衝的網絡,除非每個人身上綁一根,否則不論怎樣都難以應付。
  再說,當談到網絡時,有一個數據不能不顧,就是網絡上有多少個收發單位?在收發單位之間,又有多少通道?
  目前在有線通訊上,除了電話線外,最進步的應屬光纖,其容載量是電話線的千餘倍,且正隨著技術的改進而增加。此外還有各種無線網絡,有局部性的,地域性的,也有衛星收發的,不一而足。
  在網絡上,又是些什麼呢?最初當然只是類比式的訊號,現在有了二進位的技術,效率提高了,因為二進位訊號可以壓縮,而壓縮的倍數正是效率增進的比值。
  由於訊號的性質不同,沒有人能明確地用數據說明,究竟類比訊號與二進位壓縮訊號的差值有多少。但在實際應用上,大家都承認至少有百倍以上的效益。只是有一個例外,那就是文字!基於這種符號的特性,可以將之設計成簡單的代碼!
  代碼意為效率最高的組合,即令同樣利用二進位壓縮訊息,每一字形在視覺訊息上,如果使用代碼,在可以辨識的範圍內,以英文為例,最少可以節省六倍(中文為十六倍),多則難以估算。再若是語音,僅以每秒四個音節計(英文一個音節平均約五個字符,漢語僅為一個),目前一個音節在中等水準的壓縮信息下,較代碼約大上一千倍。換句話說,如果用代碼代替語音,網絡的功效至少可以增進一千倍。
  真要把代碼用在網絡上,那就不僅僅是符號及語音的問題而已了,圖形所能節省的效率更高,功效也更大。比如說,影像通訊是當前最需要的功能,由於每秒鐘需要傳輸的動態信息太多,工程師們想盡辦法,比如把靜止且重複的影像保留,僅傳送有變化的部分。就這樣,該信息量還是大得驚人,幾十個人同時上線,就會造成交通堵塞!
  能將圖形也編成代碼嗎?這正是當今全世界最高的高科技,且稱為「萬象編碼」。
  顧名思義,萬象編碼是要將人能認知的所有信息,全部編成代碼。有哪些信息呢?

  甲、文字

    本人在二十年前,為中文電腦編了「倉頡碼」。實際上,當時我已有萬象編碼的想
   法,漢字編碼只是起步。一九七九年我曾在三軍大學演講,題目是「無線電話與中文
   通訊」,當時我即認為,有一天所有通訊都會利用編碼方式傳輸。到目前為止,至少,
   文字通訊已經採用代碼了,新的革命尚有待新的努力。

  乙、語音

    把全世界的語音統統加起來,單音不會超過兩千種。問題在語音中所夾帶的情感(
   語調)及音色(腔調),就人的溝通來說,也都屬於信息辨識的一部分。
    因此,在為語音編碼時應詳細考慮清楚,以便未來在通訊時,能藉代碼的傳輸提升
   效率,而以辨識及合成技術自動編碼及還原。
    語音的元素有五:音頻、音量、音形、音色、音速。
    一、音頻:人耳所聞,約在60至3000週/秒之間,一般說來,男音在60至
   300週/秒之間,女音在150至500週/秒之間。此外還有四聲變化(以普通
   話為例),是以其起音到收音之間,第一聲頻率不變,第二聲起音降百分之十,收音
   升,第三聲起音降百分之二十,收音升,第四聲收音下降。
    二、音量:音量主在偵測情緒,音量大時旨在提醒對方注意,音量小則為掩飾自己
   的主旨或避免打擾第三者。重音所在則為個人的性向及目的。
    三、音形:分子音及母音兩類,母音為主,子音為輔。母音長而循環,子音短而止
   於分別處。茲以英文拼音字母為例,一一說明如下:
        a-母音,發“啊”音,口大張,喉管音,四到五組波形。
        b-子音,發“白”音,唇爆音。
        c-子音,發“塞”音,氣摩音。
        d-子音,發“得”音,舌爆音。
        e-母音,發“呃”音,口張舌收,喉管音,三到四組波形加顫波。
        f-子音,發“弗”音,唇摩音,中頻風聲。
        g-子音,發“哥”音,喉爆音。
        h-子音,發“黑”音,喉風聲。
        i-母音,發“衣”音,口收舌收,喉震音,二到三組波形加顫波。
        k-子音,發“克”音,喉爆音加風聲。
        l-子音,發“兒”音,捲舌收無鼻音。
        m-子音,發“姆”音,全鼻音。
        n-子音,發“嗯”音,收鼻音。
        o-母音,發“歐”音,口張,喉管音,三到四組波形。
        p-子音,發“皮”音,唇爆音加風聲。
        r-子音,發“兒”音,捲舌。
        s-子音,發“尸”音,高頻風聲。
        t-子音,發“提”音,舌爆音加風聲。
        u-母音,發“烏”音,口微張,喉管音,二到三組波形。
    四、音色:音沿振盪、音波比例、音形特徵、子音比重等,皆可用來辨識個人之音
   色變化。加以適當的編碼,即可作為個體辨識。
    五、音速:漢語正常發音約每秒鐘四音,舉凡音與音之間的空隙,母音的週期等,
   都是輔助辨識的重要依據。
    語音除了辨識外,尚可合成,其法適為辨識之反向。

  丙、形像

    形像雖然是無窮無盡,但在系統分類下,倒也沒有多少類別。舉凡視線所及,不外
   乎光的明暗(光源編碼),環境範圍(分類編碼),主觀立場(透視編碼),物體邊
   緣(曲線編碼),體用因果(機能編碼)等。此外,再根據應用時的需求,作重點綜
   合處理,就能逐步化繁為簡,最後以簡馭繁了。
    由編碼到合成,是一體的兩面。最理想的編碼方式,則是與漢字基因的理論結合,
   以字義理解作為形像的定義準則(下文解說中,將編碼與合成視為一體,不再分別解
   釋)。
    一、三維影像
      三維影像是根據任意系統之三維座標設計的,計有XYZ之座標值、顏色或材
     質貼圖、結構體之聯接關係、物質物性定義以及燈光環境的參數等。
      根據XYZ座標值,可以畫出物體表面的標準網線,再加上主觀之鏡頭位置,
     即可得一虛擬的透視模型。
      顏色及材質決定於視訊要求,例如模擬真實與卡通兩者效果相去甚遠,卡通只
     是一種簡易的表達方法,資料內容不變,然無法表現材質。
      結構體在作部位運動時,需要根據其聯結關係,設定轉動軸點、方向、角度、
     限性、重心、摩擦等,由程式控制摹擬出接近真實的運動。
      物質物性定義供碰撞、接觸、摩擦以及各種真實環境下的運動如飄動、浮動、
     移動、游動、滾動等計算之用。
      燈光環境參數等提供戲劇效果或傳真效應,如燈光代表了室內或室外的氣氛條
     件,只要確定光源及光效,就可以節省大量的圖形處理手續。

    二、形像編碼
      形像編碼是視覺辨識的基本課題,只要將視覺基因設定為辨識參數,再以層次
     分類為輔,就能得到有效的形像編碼。

  層次分類可參考概念分類(詳見《漢字基因》),茲以「電腦」一詞為例,說明如下:

               概  念  編  碼
         ┌─────────┴─────────┐
         0                    1
        客 觀                  主 觀
    ┌────┴────┐         ┌────┴────┐
    0          1          0         1
   抽 象       具 象        認 識       行 為
  ┌─┴─┐     ┌─┴─┐       ┌─┴─┐    ┌─┴─┐
  0    1     0    1       0   1     0    1
  定義  應用    本存  人造      感知  狀態   本能  社會
 ┌┴┐ ┌┴┐   ┌┴┐ ┌┴┐     ┌┴┐ ┌┴┐  ┌┴┐ ┌┴┐
 00 10 00 10   00 10 00 10   00 10 00 10   00 10 00 10
 符 根 規 資   本 植 食 起   刺 心 化 界   官 技 生 行
 號 源 範 訊   體 物 衣 居   激 緒 態 態   能 能 活 事
 、 、 、 、   、 、 、 、   、 、 、 、   、 、 、 、
 01 11 01 11   01 11 01 11   01 11 01 11   10 01 01 11
 語 現 人 意   人 動 住 工   感 認 動 知   體 智 溝 控
 法 象 際 義   體 物 行 作   覺 知 態 態   能 能 通 制

  上述編碼表僅分至三十二類,其類每類之下尚有八種,如11工作類下有:
    000文具 001樂器 010工具 011農具 100武器 101機器 110材料 111廢料

    電腦(分類碼)═客觀(0)-具象(1)-人造(1)-工作(11)-文具(00)═78H
    故由辨識即可得到分類碼,由分類之形像特性可知:
      電腦為一人造具體物,為一助人工作之文化器具。必須具輸出入特性,機能特
     性,能源特性等,以便編號選擇。
        電腦之輸入設備有:鍵盤,滑鼠,搖桿,觸筆,網絡等。
        電腦之輸出設備有:顯示器,打印機,網絡等。
        電腦之機能特性有:主機體,週邊體,記憶體等。
        電腦之能源特性有:交流電,電池等。
        電腦之型號種類由知識庫內的資料決定,僅列出型號編碼即可。

    物體經辨識後得到編碼,代碼可供貯存及傳輸。應用時再以三維繪圖,根據資料庫
   將編碼還原繪為圖形。這種工作可利用硬體處理,只要速度快,擬真度高,就有實用
   價值。以傳輸語言為例,人講話時,每秒鐘平均發出五個音節,祇需十個字元而已。
   若用音潻傳送,至少需8k字元,再談圖形,其數量更難以估計。

返回 開放文學

訪問統計