《第一批異体字整理表》 電子テキスト
2005年9月5日 初稿
2010年4月3日 修正
針谷壮一
ここに提供する2つのファイルは、1955年に中華人民共和国で公布された《第一批異体字整理表》を、電子テキストとして再現したものである。
一つは、1955年に発表された当時のもの。もう一つは、1989年に語文出版社《語言文字規範手冊》増訂本に収録されたものである。
この2つは、文字の配列順(注音符号順かピンイン順か)、個々の漢字の発音(呆、衄、嫩、樽)、挙げてある項目(諂)、挙げてある異体字(阪、挫、粇、兔、佇)が、いくつか異なる。表題や前文の字体や、説明も異なる。
いずれのファイルも、表示される環境によって、フォントの形や、各ページの一行あたりの文字数が変化するので、原典と全く同じに表示されるわけではないことに留意されたい。
また、原典では、文字の一覧を各ページ2段(1989年版では3段)に組んであるが、このファイルでは、電子テキストの性格を踏まえ、原典のレイアウトには拘泥せず、1段にベタで組んであることにも留意されたい。
* * *
この《第一批異体字整理表》には、現在は常用されない文字が多く含まれ、現在のWeb環境では、必ずしも原典に完全に忠実に再現できるわけではない。現在のUnicodeが、どこまで《第一批異体字整理表》の文字を網羅しているのか確認することが、この電子テキストを公開することの目的である。
この《第一批異体字整理表》には全部で1864字の漢字が収められている。(1955年版での異なり字数。うち、親字810字、括弧内の異体字1054字。)それらの文字のUnicodeとの対応は、以下のようになっている。
(1) 1770字: CJK Unified Ideographs (U+4E00~U+9FBF)
(2) 54字: CJK Unified Ideographs Extension A (U+3400~U+4DBF)
(3) 34字: CJK Unified Ideographs Extension B (U+20000~U+2A6DF)
(4) 6字: 別の字に包摂されていて、独立した文字コードを与えられていない。
このうち、(1)の文字はフォント“SimSun”があれば表示できる。現在のWindowsなら、これは問題なく表示できるだろう。親字810字は、すべてこの範囲に含まれる。
一方、(2)の文字はフォント“SimSun-18030”ないしは“Simsun (Founder Extended)”を入手すれば表示できる。
(3)の文字に至っては、これに対応しているブラウザは現在のところ皆無のようであり、またExtension B全ての文字を含んだフォントも存在しない。ただし、このテキストで使われる文字なら“Simsun (Founder Extended)”に全て含まれている。フォントがあれば、Wordに読み込むと表示できる。
このテキストを表示して「・」や空白で表示される文字があれば、それは現在のあなたのコンピュータ環境では表示できない文字だと理解されたい。
また(4)の文字は、テキスト中では全角空白を入れてある。このページの末尾に文字の画像を添付しておいたので参考にされたい。文字コードの包摂の問題はさまざまな議論があり、ここで深入りすることは避けたいが、中国の文字政策を考える上で重要な資料である《第一批異体字整理表》に含まれる文字くらいは、すべてにコードポイントを与えて欲しいものだと思う。
* * *
正確を期したつもりであるが、もし間違いに気がついた方があれば、製作者までご連絡くだされば幸いである。
* * *
追記(2007年4月9日)
CJK Unified Ideographs Extension B の文字については、Windows Vistaであれば表示可能。それ以前のWindows(2000/XP)でも、新しいUSP10.DLL(バージョン1.601以上?)とフォントを入手しインストールすれば表示できる。(場合によってはレジストリの設定が必要となることもある、こちらも参照のこと。)
修正(2008年3月1日)
表中の誤字を訂正した。
(誤) 按 → (正) 桉
(誤) 梗 → (正) 稉
(誤) 恖 → (正) 悤
(誤) 粘 → (正) 䊀
(誤) 踅 → (正) 蹔
修正(2010年4月3日)
1955年版の前文中の誤字を訂正した。
(誤) 中國文字改革委員会會根据全國 → (正) 中國文字改革委員会根据全國
《第一批異体字整理表》に含まれる字のうち、Unicodeでは別の字に包摂されるもの(6字)。
“奔”の括弧内第2字  |
“虜”の括弧内第1字  |
“韌”の括弧内第3字  |
“軔”の括弧内第1字  |
“珊”の括弧内第1字  |
“兔”の括弧内第2字  |
この6字のうち、「奔」は、CJK Compatibility Ideographs (U+F900~U+FAFF) の U+FA7F に、同じ字形の文字が存在する(右図)。この文字は、北朝鮮の文字コードとの互換性のために設けられたもので、《第一批異体字整理表》の「奔」を U+FA7F としてしまってよいかは、疑問が残る。
また、「軔」と「兔」は、CJK Compatibility Ideographs Supplement (U+2F800~U+2FA1F) の U+2F9DE と U+2080F に、それぞれ同じ字形の文字が存在する(右図)。このブロックは、台湾の文字コード規格である CNS 11643-1992 との互換性のために設けられたもので、《第一批異体字整理表》の「軔」と「兔」を U+2F9DE と U+2080F にしてしまってよいかは、「奔」と同様、疑問が残るところだ。
このブロックには「虜」もふくまれるが(U+2F9B4)、フォントを見る限り、「田」の中央横棒が突き出していない(右図)ので、《第一批異体字整理表》の意図した字形とは、明らかに異なる。
これら以外の2字は、この2つのブロックに同形ないしは近似の文字は含まれない。