方正超大字庫とは
原文:北大方正「蘭亭苑」(2001年1月15日)
和訳:新疆+ラインラボ(2001年3月3日) |
殷商時代に出土した甲骨文字が中国文字の起源とみなされて以来,時すでに数千年という歴史の変遷を経て,漢字はその字形・字体を問わず,量的に膨大な変化を繰り返して来た。今日,我々は一体どれだけの漢字を使用しているのだろうか?
『康煕字典』の収録文字数は47,035字,『漢語大字典』は56,000字余りを収録している。現在国際標準化機構(ISO)は国際規格を制定した時点で,トータル70,000字余りの漢字を収集した。
北大方正は中国で最も早く中国語フォント開発を手掛けた専門メーカーとして,中国語フォント技術の進歩と中国語印刷字体の発展に多大な関心を寄せ,GB2312-80・GBK・GB18030やISO/IEC-10646といった,中国国家規格及び国際標準化機構(ISO)による規格制定にも積極的に参与してきた。
GB2312-80は6763字の漢字コードを,GBKは21,003字の漢字コードを収録してはいるが,それでもなお,銀行・郵便・保険・新聞社・公安他行政機関等では,珍しい人名・地名などの場合,ピンイン(中国音ローマ字表記)で代用したり,手作業で切り貼りしたりせざるを得ない。また,古書籍の整理や辞書類の出版では,コードにない文字が頻出し,膨大な作字作業に追われている。同じく漢字を使用する日本・韓国・ベトナム・シンガポールといった国や地域では,その文化遺産が漢字形式で保存されているものも多く,情報時代の到来に伴い,それらを電子データ化作業の際に必ず直面するのが,コンピューター内の漢字が少な過ぎる問題である。
漢字コードの規格化をさらに進め,国際標準化機構(ISO)での漢字に対する拡充を行ったのが,漢字EXT Bであり,方正公司も積極的に編集研究作業に参加した。2000年8月22日に公表された,SuperCJK V10.2は計70,205字を含むもので,これがまさに最新の方正超大字庫の全容である。また方正超大字庫は基本的に中国・日本・韓国・ベトナム各国の主要漢字を含んいる。
漢字のルーツは複雑なため,国の要求に従い,現行の書き方に改正しなければならない。方正は多くの文字専門家の指導を受け,70,205字に対し新たに筆形化を行い,同時に多くのフォントデザイナーに字体のチェックを依頼した。字体・筆形の規格性及び統一性は,国家語言文字工作委員会の規格にも符合しており,端正で,重心のバランスがよく,文字サイズが小さくても白黒が均一で,大きい文字はラインが滑らかであり,すっきりした版面,美しさ,雰囲気にも一貫性があり,その可読性は優れている。
現在発売された方正超大字庫は,辞書や古書籍の組版には大変適している。字数の面から見ても,目下『漢語大字典』の全56,000字余りを含み,さらに次のバージョンでは70,000字余りに拡張する予定である。印刷工程の上流と下流を一致させ,見たままを出力させることができる。方正書版9.0及び典碼入力法〔訳注1、2〕をセットで使用すると,大量の作字作業から解放され,労働量は軽減し,作業能率もアップすることであろう。
北大方正は「精益求精」(絶えず進歩を求める精神)の伝統を受け継ぎ,中国漢字文化の伝播に尽力します。GB・GBKの両フォントを相次いで開発した後製品化された超大字庫は,まさにあなたが作業中に直面する漢字の難題を,みごとに解決するものです。
〔訳注1〕中国の入力方法は,地域による発音の違いが大きいためピンイン(音)ではなく,字形の書き順によるものがほとんどである。「五筆入力法」はその一つで,文字の書き順が横棒(−),竪(|),はらい(ノ),点(ヽ),その他(乙)の何で始まるかで入力キーの叩き方が違うため,書き順は重要である。
〔訳注2〕「典碼入力法」の詳細は不明だが若干のピンインの知識があればすぐに入力可能と紹介されている。(汕頭大学関連の開発のようである)
Jump to [トップページに戻る]