《第一批異体字整理表》 電子テキスト
2005年9月5日 初稿
2012年12月6日 修正
針谷壮一


 ここに提供する2つのファイルは、1955年に中華人民共和国で公布された《第一批異体字整理表》を、電子テキストとして再現したものである。

 一つは、1955年に発表された当時のもの。もう一つは、1989年に語文出版社《語言文字規範手冊》増訂本に収録されたものである。

1955年版《第一批異体字整理表》へ   1989年版《第一批異体字整理表》へ

 この2つは、文字の配列順(注音符号順かピンイン順か)、個々の漢字の発音(呆、衄、嫩、樽)、挙げてある項目(諂)、挙げてある異体字(阪、挫、粇、兔、佇)が、いくつか異なる。表題や前文の字体や、説明も異なる。

 いずれのファイルも、表示される環境によって、フォントの形や、各ページの一行あたりの文字数が変化するので、原典と全く同じに表示されるわけではないことに留意されたい。 また、原典では、文字の一覧を各ページ2段(1989年版では3段)に組んであるが、このファイルでは、電子テキストの性格を踏まえ、原典のレイアウトには拘泥せず、1段にベタで組んであることにも留意されたい。

* * *

 この《第一批異体字整理表》には、現在は常用されない文字が多く含まれ、現在(2005年初稿時点で)のWeb環境では、必ずしも原典に完全に忠実に再現できるわけではない。現在のUnicodeが、どこまで《第一批異体字整理表》の文字を網羅しているのか確認することが、この電子テキストを公開することの目的である。

 この《第一批異体字整理表》には全部で1862字の漢字が収められている(1955年版での異なり字数、以下同じ)。うち、親字は809字、括弧内の異体字は1053字である。親字「參」および括弧内の異体字「妳」「粇」の3字は、それぞれ重複して2回ずつ現れる。これらの文字のUnicodeとの対応は、以下のようになっている。

  (1)   1766字:    CJK Unified Ideographs (U+4E00~U+9FBF)
  (2)   55字:    CJK Unified Ideographs Extension A (U+3400~U+4DBF)
  (3)   35字:    CJK Unified Ideographs Extension B (U+20000~U+2A6DF)
  (4)   6字:    別の字に包摂されていて、独立した文字コードを与えられていない。

 このうち、(1)の文字はフォント“SimSun”があれば表示できる。現在のWindowsなら、これは問題なく表示できるだろう。親字809字は、すべてこの範囲に含まれる。
 一方、(2)の文字はフォント“SimSun-18030”ないしは“Simsun (Founder Extended)”を入手すれば表示できる。
 (3)の文字に至っては、これに対応しているブラウザは現在のところ皆無であり、またExtension B全ての文字を含んだフォントも存在しない。ただし、このテキストで使われる文字なら“Simsun (Founder Extended)”に全て含まれている。フォントがあれば、Wordに読み込むと表示できる。

 このテキストを表示して「」や空白で表示される文字があれば、それは現在のあなたのコンピュータ環境では表示できない文字だと理解されたい。

 また(4)の文字は、テキスト中では全角空白を入れてある。このページの末尾に文字の画像を添付しておいたので参考にされたい。文字コードの包摂の問題はさまざまな議論があり、ここで深入りすることは避けたいが、中国の文字政策を考える上で重要な資料である《第一批異体字整理表》に含まれる文字くらいは、すべてにコードポイントを与えて欲しいものだと思う。

* * *

 正確を期したつもりであるが、もし間違いに気がついた方があれば、製作者までご連絡くだされば幸いである。

* * *

追記(2007年4月9日)
 CJK Unified Ideographs Extension B の文字については、Windows Vista以降であれば表示可能。それ以前のWindows(2000/XP)でも、新しいUSP10.DLL(バージョン1.601以上?)とフォントを入手しインストールすれば表示できる。(場合によってはレジストリの設定が必要となることもある、こちらも参照のこと。)

修正(2008年3月1日)
 表中の誤字を訂正した。
 (誤) 按 → (正) 桉
 (誤) 梗 → (正) 稉
 (誤) 恖 → (正) 悤
 (誤) 粘 → (正) 䊀
 (誤) 踅 → (正) 蹔

修正(2010年4月3日)
 1955年版の前文中の誤字を訂正した。
 (誤) 中國文字改革委員会根据全國 → (正) 中國文字改革委員会根据全國

修正(2012年12月6日)
 表中の誤字を訂正し、字数を数え直した。
 (誤) ㄇ → (正) ㄈ
 (誤) 畆 → (正) 𤰜
 (誤) 薫 → (正) 薰
 (誤) 嘩 → (正) 曄
 (誤) 缰 → (正) 繮
 (誤) 侶 → (正) 佀
 また、1955年版の標題・前文中の誤字を訂正した。
 (誤) 中國文字改革委会 → (正) 中國文字改革委員会


トップページにもどる





 《第一批異体字整理表》に含まれる字のうち、Unicodeでは別の字に包摂されるもの(6字)。



“奔”の括弧内第2字


“虜”の括弧内第1字


“韌”の括弧内第3字


“軔”の括弧内第1字


“珊”の括弧内第1字


“兔”の括弧内第2字



 この6字のうち、「奔」は、CJK Compatibility Ideographs (U+F900~U+FAFF) の U+FA7F に同じ字形の文字が存在する(右図)。この文字は、北朝鮮の文字コードとの互換性のために設けられたもので、《第一批異体字整理表》の「奔」を U+FA7F としてしまってよいかは、疑問が残る。

 また、「軔」と「兔」は、CJK Compatibility Ideographs Supplement (U+2F800~U+2FA1F) の U+2F9DE と U+2080F に、それぞれ同じ字形の文字が存在する(右図)。このブロックは、台湾の文字コード規格である CNS 11643-1992 との互換性のために設けられたもので、《第一批異体字整理表》の「軔」と「兔」を U+2F9DE と U+2080F にしてしまってよいかは、「奔」と同様、疑問が残るところだ。

 このブロックには「虜」もふくまれるが(U+2F9B4)、フォントを見る限り、「田」の中央横棒が突き出していない(右図)ので、《第一批異体字整理表》の意図した字形とは、明らかに異なる。

 また、「虜」は、 CJK Compatibility Ideographs (U+F900~U+FAFF) の U+F936 に同じ字形が存在するが、これは、日本・韓国・北朝鮮の文字コードとの互換性のために設けられたもので、《第一批異体字整理表》の「虜」を U+F936 としてしまってよいかは、同様に、疑問が残る。  

 これら以外の2字は、この2つのブロックに同形ないしは近似の文字は含まれない。


トップページにもどる