《第一批異体字整理表》 電子テキスト
2005年9月5日 初稿
2019年9月4日 修正
針谷壮一


 ここに提供する2つのファイルは、1955年に中華人民共和国で公布された《第一批異体字整理表》を、電子テキストとして再現したものである。

 一つは、1955年に発表された当時のもの。もう一つは、1989年に語文出版社《語言文字規範手冊》増訂本に収録されたものである。

1955年版《第一批異体字整理表》へ   1989年版《第一批異体字整理表》へ

 この2つは、文字の配列順(注音符号順かピンイン順か)、個々の漢字の発音(呆、衄、嫩、樽)、挙げてある項目(諂)、挙げてある規範字(卮、栀、謚、污)、挙げてある異体字(阪、挫、粇、兔、佇)が、いくつか異なる。表題や前文の字体や、説明も異なる。

 いずれのファイルも、表示される環境によって、フォントの形や、各ページの一行あたりの文字数が変化するので、原典と全く同じに表示されるわけではないことに留意されたい。 また、原典では、文字の一覧を各ページ2段(1989年版では3段)に組んであるが、このファイルでは、電子テキストの性格を踏まえ、原典のレイアウトには拘泥せず、1段にベタで組んであることにも留意されたい。

* * *

 この《第一批異体字整理表》には、現在は常用されない文字が多く含まれ、現在(2005年初稿時点で)のWeb環境では、必ずしも原典に完全に忠実に再現できるわけではない。現在のUnicodeが、どこまで《第一批異体字整理表》の文字を網羅しているのか確認することが、この電子テキストを公開することの目的である。

 この《第一批異体字整理表》には全部で1862字の漢字が収められている(1955年版での異なり字数、以下同じ)。うち、規範字は809字、括弧内の異体字は1053字である。規範字「參」および括弧内の異体字「妳」「粇」の3字は、それぞれ重複して2回ずつ現れる。これらの文字のUnicodeとの対応は、以下のようになっている。

  (1)   1759字:    CJK 統合漢字(U+4E00~U+9FEA)
  (2)   58字:    CJK 統合漢字拡張 A(U+3400~U+4DFF)
  (3)   39字:    CJK 統合漢字拡張 B(U+20000~U+2A6FF)
  (4)   2字:    CJK 互換文字(U+F900~U+FAFF)に同じ形の文字が存在するもの
  (5)   1字:    CJK 互換文字補助(U+2F800~U+2FA1F)に同じ形の文字が存在するもの
  (6)   3字:    別の字に包摂されていて、独立した文字コードを与えられていない。

 このうち(4)(5)の「CJK 互換文字」については、既存の文字コードとの互換性(round-trip compatibility)を保つために設けられた文字コードであって、元の「CJK 統合漢字」と区別して用いられることを想定したものではない(難しい言い方をすれば、元の文字と正規等価 Canonical Equivalent である)。本来なら(6)と同様に「独立した文字コードを与えられていない」と考えるべきものである。
 また(6)の文字は、テキスト中では■を入れてある。
 このページの末尾に文字の画像を添付しておいたので参考にされたい。

* * *

 正確を期したつもりであるが、もし間違いに気がついた方があれば、製作者までご連絡くだされば幸いである。

* * *

「第一批異体字整理表」更新履歴はこちら
トップページにもどる






CJK 互換文字(U+F900~U+FAFF)に同じ形の文字が存在するもの(2字)
CJK 互換文字補助(U+2F800~U+2FA1F)に同じ形の文字が存在するもの(1字)
(上記の通り、いずれも「独立した文字コードを与えられていない」と考えるべきものである。)

“奔”の括弧内第2字
(≈奔, U+FA7F)


“虜”の括弧内第1字
(≈虜, U+F936)


“兔”の括弧内第2字
(≈兔, U+2F80F)




別の字に包摂されていて、独立した文字コードを与えられていないもの(3字)

“韌”の括弧内第3字


“軔”の括弧内第1字


“珊”の括弧内第1字




CJK 統合漢字の字に包摂されると考えられるが、字体の一部が異なるもの(1字)

“操”の括弧内第2字
(=撡, U+64A1)

(右下「小」の部分が異なる)



トップページにもどる