牧野富太郎「植物記」に見るJISX0213にない外字


2011年2月28日付け「そらもよう」で外字注記にUnicodeを記入することが告知された。
そのなかで、「JIS X 0208と0213には、細かな字体差をもって違う字とみるか、同じものとみるかの目安となる包摂規準が設けてある。物差しがあるので、この範囲のものについては、入れて良いか否か、判定しやすい。一方、Unicodeでは、判断に迷う場合が、多くなるだろうと考えた。」とある。

入力した牧野富太郎「植物記」には植物の名称等JISX213に見あたらない外字が21個あり、すべてにUCSコードをあてた。参考までに字形比較一覧を作成した。
Unicodeの確認には、外字注記辞書、Unihan-database、ATOK2010文字パレットを使用している。

・UCSにはJISのような包摂規準はないが、CJK統合漢字で中国・日本・韓国の漢字が統合・分離されている。符号表にはCJKの例字体が示されている。
・5番8番ではCJKの字形に相違があるが、統合(同一コードが付与)されている。包摂規準で理解できる。
・MS明朝フォントは基本的にJの例字体を参考にしているようだ。J例字体が無い場合はC例字体を参考にしているようだ。そのためMS明朝体フォントのデザインが不揃いになっている。
・個別にみると、底本字形がJ例字体と一致していないものを検討すると、1番はK例字体と一致、7番はピタリ一致するものがない、8番はC例字体と一致、9番はK例字体と一致、14番はV例字体と一致、21番はC例字体と一致している。

底本:「植物記」ちくま学芸文庫
    2008(昭和60)年12月10日 初版第1刷

ユニコード漢字データベース
UCSコード検索  Unihan Database Lookup
UCS部首検索 Unihan Radical-Stroke Index

http://www.unicode.org/charts/PDF/U4E00.pdf(30M)

http://www.unicode.org/charts/PDF/U20000.pdf(27M)

1.JISX213にない字、字形比較一覧

番号 底本の字形 底本の
頁行
UCS 外字注記辞書 MS明朝
備考
1234567890
1 45-3 U+7D98 糸+峰のつくり Jなし
底本はKと一致
2 52-7 U+8447 くさかんむり/柔 一致
3 72-6 U+917A 酉+甫 一致
4 88-11 U+82B0 くさかんむり/支 一致
5  101-2 U+5E28 巾+兌 字形統合
包摂15
6  101-6 U+756E 辞書になし
(田+誨のつくり)
Jなし
底本はCと一致
7  104-15 U+7BB9 辞書になし
(たけかんむり/約)
Jなし
糸へんの差
勺の差は包摂32
8  108-13 U+7CB0 米+孚 底本はCと一致
包摂21
9  130-5 U+9A08 辞書になし
(馬+
餠のつくり)
Jなし
底本はKと一致
10  130-11 U+74E4 襄+瓜 字形統合
包摂107
11  140-10 U+65B3 槿のつくり+斤 底本はCよと一致
12  145-4 U+76A4 白+番 一致
13  183-1 U+6D61 さんずい+孛 一致
14  186-10 U+6164 殻/心 底本はVと一致
15  191-15 U+84C7 辞書なし
(くさかんむり/骨)
中国と日本では
骨に相違
16  191-15 U+8456 くさかんむり/突」の
「大」に代えて「犬
字形統合
包摂26
17  192-15 U+727B 特のへん+尨 字形統合
18  192-16 U+221C7 辞書になし
(聯のつくり)
フォントなし Jなし
底本はCと一致
19  200-2 U+535D 辞書になし Jなし
底本はCと一致
20  243-13 U+5914 (止+(首/儿)+巳)
/夂
第4水準
2-05-28
20

U+8641 くさかんむり/
(止+頁+巳)/夂
第3水準
1-15-72
21 250-13 U+9EEB 辞書になし Jなし
底本はkと一致

2011年03月11日公開 

トップへ

----------------------------
■■◇ kompass
■■■ kompas@mvb.biglobe.ne.jp
■■■ CYL01146@nifty.ne.jp
----------------------------