《第一批異体字整理表》 電子テキスト
2005年9月5日 初稿
2019年9月4日 修正
針谷壮一
ここに提供する2つのファイルは、1955年に中華人民共和国で公布された《第一批異体字整理表》を、電子テキストとして再現したものである。
一つは、1955年に発表された当時のもの。もう一つは、1989年に語文出版社《語言文字規範手冊》増訂本に収録されたものである。
1955年版《第一批異体字整理表》へ
1989年版《第一批異体字整理表》へ
この2つは、文字の配列順(注音符号順かピンイン順か)、個々の漢字の発音(呆、衄、嫩、樽)、挙げてある項目(諂)、挙げてある規範字(卮、栀、謚、污)、挙げてある異体字(阪、挫、粇、兔、佇)が、いくつか異なる。表題や前文の字体や、説明も異なる。
いずれのファイルも、表示される環境によって、フォントの形や、各ページの一行あたりの文字数が変化するので、原典と全く同じに表示されるわけではないことに留意されたい。 また、原典では、文字の一覧を各ページ2段(1989年版では3段)に組んであるが、このファイルでは、電子テキストの性格を踏まえ、原典のレイアウトには拘泥せず、1段にベタで組んであることにも留意されたい。
* * *
この《第一批異体字整理表》には、現在は常用されない文字が多く含まれ、現在(2005年初稿時点で)のWeb環境では、必ずしも原典に完全に忠実に再現できるわけではない。現在のUnicodeが、どこまで《第一批異体字整理表》の文字を網羅しているのか確認することが、この電子テキストを公開することの目的である。
この《第一批異体字整理表》には全部で1862字の漢字が収められている(1955年版での異なり字数、以下同じ)。うち、規範字は809字、括弧内の異体字は1053字である。規範字「參」および括弧内の異体字「妳」「粇」の3字は、それぞれ重複して2回ずつ現れる。これらの文字のUnicodeとの対応は、以下のようになっている。
(1) 1759字:
CJK 統合漢字
(U+4E00~U+9FEA)
(2) 58字:
CJK 統合漢字拡張 A
(U+3400~U+4DFF)
(3) 39字:
CJK 統合漢字拡張 B
(U+20000~U+2A6FF)
(4) 2字:
CJK 互換文字
(U+F900~U+FAFF)に同じ形の文字が存在するもの
(5) 1字:
CJK 互換文字補助
(U+2F800~U+2FA1F)に同じ形の文字が存在するもの
(6) 3字: 別の字に包摂されていて、独立した文字コードを与えられていない。
このうち(4)(5)の「CJK 互換文字」については、既存の文字コードとの互換性(round-trip compatibility)を保つために設けられた文字コードであって、元の「CJK 統合漢字」と区別して用いられることを想定したものではない(難しい言い方をすれば、元の文字と正規等価 Canonical Equivalent である)。本来なら(6)と同様に「独立した文字コードを与えられていない」と考えるべきものである。
また(6)の文字は、テキスト中では■を入れてある。
このページの末尾に文字の画像を添付しておいたので参考にされたい。
* * *
正確を期したつもりであるが、もし間違いに気がついた方があれば、製作者までご連絡くだされば幸いである。
* * *
「第一批異体字整理表」更新履歴はこちら
トップページにもどる
CJK 互換文字(U+F900~U+FAFF)に同じ形の文字が存在するもの(2字)
CJK 互換文字補助(U+2F800~U+2FA1F)に同じ形の文字が存在するもの(1字)
(上記の通り、いずれも「独立した文字コードを与えられていない」と考えるべきものである。)
“奔”
の括弧内第2字
(≈奔, U+FA7F)
“虜”
の括弧内第1字
(≈虜, U+F936)
“兔”
の括弧内第2字
(≈兔, U+2F80F)
別の字に包摂されていて、独立した文字コードを与えられていないもの(3字)
“韌”
の括弧内第3字
“軔”
の括弧内第1字
“珊”
の括弧内第1字
CJK 統合漢字の字に包摂されると考えられるが、字体の一部が異なるもの(1字)
“操”
の括弧内第2字
(=撡, U+64A1)
(右下「小」の部分が異なる)
トップページにもどる