第746章 加法減法

正文卷

第746章 加法減法

「在我看來,新的字型檔,需要達到幾個標準。」

「首先就是碼位要寬泛,我的意見是以二十萬為基準;」

「其次是對GB 2312和GB 13000的兼容,需要具備提供完整、清晰、明確的代碼映射表,實現自由轉換。」

「第三是對標準的用戶自定義區和標準保留區的使用做了明確、詳細的規定。既要讓用戶可以在自定義區,利用字型檔提供的十三筆畫和漢字基準部件,造出自己需要的漢字,同時又要對這些新入庫的漢字,制定出嚴格的標準和使用方法,同時還要及時升級,將通過審批的漢字載入進標準保留區。」

「這樣可以群策群力,既減少我們的工作量,又讓廣大用戶有了參與字型檔建設的機會。」

這一條在座的所有人都沒有想到過,現在給周至一提出來,大家都感覺眼前一亮,這小子的腦瓜子可真靈!

「最後一條,當然就是強制標準,我們需要一個具備強約束力的標準規範,提高知名度。」

「強制性標準的知名度最高。中文軟體的最終用戶如果知道了我們制定出了一個最佳的漢字標準,肯定會要求軟體開發商來實現它。」

「而反過來,軟體開發商也不得不重視標準,實現這個標準,來提高自己的競爭力。」

「這個標準,會不會……太高了啊?」麥明川摳了摳腦門:「我估計百分之九十九的用戶都用不到。」

「剛剛說了,用不到全集,可以選用不同層次的子集嘛。」周至說道:「但是這並不能說明大全集就不該有。」

「麥主任,據我所知,電子計算機使用的邏輯演算法,包括設計理念,其實也是幾十年甚至一兩百年前就已經成熟的學科,直到人類在晶體管技術實現突破之後,才將那些成熟學科的數學成果,應用到了集成電路上,形成了如今的信息產業。」

「弗雷格,羅素和布爾,他們也沒有說過他們的數理邏輯研究,在十九世紀的時候標準太高了,得等到二十一世紀信息科技萌芽的時候,再讓後人來研究也不晚啊?」

「哈哈哈哈哈……」麥明川大笑:「周至同學這是以子之矛攻子之盾,學得一手的好邏輯啊,有沒有興趣來我們計算機系學習啊?這可是如今國家最人才稀缺,需求最迫切的好專業喲!」

「別想了。」辜老擺了擺手:「肘子第一志願是我中文系,其次歷史系,其次哲學系,他是文科生。」

「文科生?」這下輪到麥明川驚訝了:「文科生有如此嚴謹的邏輯思維?」

「麥主任這就是瞧不起我們了。」周至笑道:「我們的古文有一套反覆的語法,這本身就說明我們早就具備了一套嚴密的思維邏輯。」

「我們古代的名家學派,法家學派,縱橫家學派,都是運用這套思維的高手,不能因為我們沒有將之單列出來作為一門學問寫出專著,就代表我們沒有這門學問,就沒有人研究過。」

「肘子你扯遠了,」辜老笑道:「不過我覺得思路是不錯的,我們的目標的確可以定得高一點。」

「辜老,您是不知道現在的內外存儲有多貴,」麥明川說道:「字型檔需要調入內存,才能夠快捷方便地使用,現在的計算機系統,內存一般才八兆,載入了操作系統,尤其是現在的可視化系統,會耗用大量的內存,留給應用的,可就已經不多了。」

「隨著技術的進步,這些總是可以解決的嘛。」辜幼文說道:「就如肘子所言,我們可以先有思路,有理論,有儲備,」

說完拍了拍那堆字稿:「有這些東西,先標準後應用,我看是完全可行的嘛!」

「其實這就和標準計量局裡的鉑金度量衡一樣,」旦增笑道:「標準制定的時候我們不妨就高,等到應用的時候,再因地制宜嘛。」

「其實只要有了標準點陣字,將字型檔拓展出來就不難了。」李紅江有些興奮:「因為不管漢字是複雜還是簡單,是繁體還是簡體,其基準筆畫和部首結構都是一樣的。」

「也就是說,我們完全可以使用GB2312和GB13000的筆畫耦合技術,有了點陣字,就可以創造出黑體,宋體,仿宋,楷體四種基準字體。」

「對,這就是我們漢字的優勢。」周至說道:「我們的字稿上,點陣字以外的其餘三種字體,其實是用來給李教授他們做修正用的,如果李教授認為沒有問題的話,今後我就讓我同學專門寫點陣字了。」

「肘子你這同學也是高中生?那他有沒有興趣來我們計算機系啊?」

「呃,我這同學是水電校,職高那種,已經畢業參加工作了,在蠻州電力公司。」周至說道:「對了我還有個要求,李教授,如果用了我們的字稿,研究者當中,我希望把我同學的名字加進去。」

「現在就剩下開發掃描程序和編碼了。」李紅江拿兩根手指敲著下巴,陷入了思索:「還是時間的問題,要是能夠趕在GB13000推出之前最好。我們說服標準委員會的機會更大……」

「其實我還有一個思路,」周至說道。

「你講伱講。」麥明川現在看著小子一百個的順眼,理論上這小子已經將大家的思路給打開了,也將最難的水磨功夫都做了,現在就剩下一個入庫和編碼的問題。

而這兩樣,國家在編寫GB2312和GB13000的時候,已經有了長足的經驗。

「其實我們還可以反向操作。」

「什麼反向操作?」

「開發一個文字識別軟體。」周至說道:「一個能夠識別漢字,將漢字加工成點陣字,再將之按照偏旁部首等一定的規則,給漢字自動賦予編碼,將之放入字型檔碼位的軟體。」

「設計思路有嗎?」李紅江的這下興趣來了,中文識別,好東西呀。

「這個程序的設計思路是這樣的。」周至說道:「因為漢字本身是有一定組織規則的,以方塊字為主,因此我們可以利用這些規則去掃描它,對其進行分析。」

「理論上每個漢字,尤其是印刷體,其重心位置,中宮收放等特徵,在一本典籍當中都是同一的,我們可以通過廣泛採樣,得到均值,再將這些均值作為漢字的字體設計參數,賦給已有的點陣字,產生與典籍一樣的字體。」

「如果反過來思考,我們可以認為,每一個典籍上的文字,都是被字體演算法計算出來的圖形,而這個圖形,本身是全覆蓋其點陣字的所有邊界的。」

「如果我們對其按照之前掃出的參數進行反耦合,也就是做減法,理論上是完全可以將文字圖形,減縮成標準點陣字的。」