“我們所有人里,還真就只有你能干,”周至說道“你知道現在已經可以用電腦打印書籍了吧”
“嗯,知道,局里現在都有電腦打字員了,聽說那機器很貴,領導都不讓一般人碰。”
“那你知道你們局里那機器,現在一共能夠打印多少個字嗎”
“不是所有漢字都能打嗎”
“當然不是,現在大家使用的,還是由中國國家標準總局八零年發布,八一年實施的一套國家標準,標準號是gb23121980。基本集一共收入漢字六千七百六十三個。”
“那我們國家一共有多少漢字啊”
“不算簡化后的簡體漢字,康熙字典里邊收錄的漢字,一共是四萬七千零三十五個。”
“差這么多”馮雪珊感到十分震驚“連零頭都不到”
“是啊。”周至說道“當然這和現在存儲單元昂貴,簡化字推行方便都有關系,但是將來圖書實現電腦排版,要用電腦整理古籍的話,目前所用的字庫是絕對不行的。”
“所以”
“所以我有一個想法,設計一套康熙字庫出來,用于將來的古籍電腦排版工作。”
“不行不行,我不認識那么多的字”馮雪珊一聽就覺得頭大。
“不用你認識它們,會照著描寫就行了。”周至笑了“字庫設計的一個重要工作,首先就是單字和筆畫、部首設計;”
“之后通過掃描設備將設計圖稿轉化為數字化圖像,存儲于計算機中;再通過數字化擬合,得到字形的矢量輪廓。”
“接下來就是擴展設計,以拼合的方式設計其他單字。”
“最后再將所有得到的字賦予編碼,將其轉換成特定數學函數描述字形輪廓的文件格式,再加以指令,控制其字形的顯示效果和排版效果,就形成字庫了。”
“我越聽越聽不懂了”
“聽不懂也沒關系,單字和筆畫、部首我會找齊,然后就要拜托你用仿宋體、宋體、楷體和黑體,在我給你給你的柵格紙上,將它們描繪出來。”
“鑒于我們現在還沒有相關的電腦設備和字體設計軟件,因此之后的擴展設計工作,我們也只能先通過手工來完成。”
“也就要是將所有的字一一地寫出來。”
“你要做的,就是這些,剩下的校對、檢測,我會來完成。”
“最后我會將所有的字稿帶去蜀都,帶去首都,通過最原始的掃描匹配方式,生成我們需要的字庫。”
“咱們這么做的目的,是設計出一個能夠涵蓋所有已知的繁體漢字和簡化漢字的大字庫出來,從而一勞永逸。”
“而今后的事情就簡單了,我們可以做做減法,搞出一些刪減版來,供人自由選擇,以解決字庫過于龐大和電腦存儲資源不足的矛盾。”
“雪珊你說,將電腦字庫從六千多字擴充到四萬七千多字,這是不是關系我們國家國計民生的大事兒”
“只是寫字那我還行。”馮雪珊知道自己要干什么之后,倒是放松了下來“就算五萬個字,我一天寫一百個,用不了兩年也能夠完成。”