中原中也「山羊の歌」外字考察


1.「山羊の歌」中「月」の三つのテキスト比較

中原中也詩集「山羊の歌」に収められた「月」には、JISX213にない外字がある。
三つのテキストの字形からすれば、大漢和辞典2173に該当すると思われる。全集角川書店版の読みからも妥当する。しかし日本詩人全集22版では読みが「くわいしゆ」となっており、字形が誤植で読みが正しければ、それは大漢和2225に該当する。
角川全集版注記にもあるように、「※[#曾+りっとう]手」が読み《そうしゆ》で「傷ついた手」なら2173、読み《くわいしゅ》で「首切り役」なら2225に該当する。

2.大漢和辞典の二つの字3.UCSにおけるU+528AとU+207C2のグリフ

大漢和2225がU+528Aに該当することは字形からあきらかだが、大漢和2173については、U+207C2をあてていいのか。

4.CJK統合漢字と包摂規準

UCSにはJISのような包摂規準がない。CJK統合漢字という符号表で中国・日本・韓国の漢字が統合(同一コードが付与)されている。表1番に統合の例として「曜」をあげる、CJK3つの字形がU+66DCに統合されている。JISX213の包摂でいうと19番に該当するようだ。

分離(別コードを付与)の例をあげると、2番「悦」は常用漢字でJIS第1水準1-17-57、UCSはU+60A6。3番の字はJISでは「悦」に包摂されているがUCSではU+6085が与えられ分離されている。4番「兌」第2水準1-49-28と5番の字はJISでは包摂されているが、UCSではU+514CとU+5151に分離されている。6番「女+兌」の第4水準2-5-59はU+5A27でCJK字形が統合、7番「木+兌」」第3水準1-85-72はJISでは包摂されてるが、UCSでは8に分離。9番の「巾+兌」は面区点はなく包摂規準はないが、UCSではU+5E28に統合。10番「てへん+兌」U+635Dは面区点なし、UCSでは11番と分離。10番11番の分離は台湾の規格で区分しているとの記述がwikipediaにある。

曽と曾はJISで区分された(別コードが付された)のでUCSでは分離されている。14番の「増」は、15番第3水準1-15-61が区分されたので分離。他の常用漢字16番から19番の各字は統合されていたが、第3水準制定によりJISが区分されたのでUCSも分離した。22番から24番は統合されているがJISにあるので包摂規準が適用される。面区点がない25番から26番は統合されている。23番の糸偏は楷書体となっている。

U+207C2の符号表を見ると「曾+りっとう」の字形例はないので統合されていない、しかし22番から26番の統合されているCとJの字形を見るとJは「曾」で一貫性があり、Cの字形も同様である、U+207C2のJは大漢和2173が登録され、統合されるべきものと思う。

対応1:当該字は大漢和2173であり、UCSコードはU+207C2をあてるのが妥当ではないか。注記は※[#「曾+りっとう」、U+207C2、ページ-行]また巻末にコードを付した理由を注記
対応2:当該字は大漢和2173である。UCS符号表U+207C2の字形例に「曾+りっとう」の記載はなく統合されているか分からない。注記は※[#「曾+りっとう」、ページ-行]また巻末にコードU+207C2を付さない理由を注記

5.終わりに

UCSに包摂規準はないが、統合漢字符号表を眺めれば包摂規準で理解できる。UCSの広大な海から漢字を探すのは大変である。UCSのコード検索は、文字パレットでUCSコードを調べ、U4E00PDFファイル等で統合を確認。分離しているかどうかは、UnihanDatabaseで探すしかない。コード検索の前提として、字書で字義、字形を確認する必要もある。今回のU+207C2のような例が稀であってほしいと思う。

比較した三つのテキスト
(岩波文庫版は全集角川書店版と同一)

中原中也全集第1巻 角川書店
1967(昭和42)年10月20日 初版発行
1974(昭和49)年5月30日 9版発行

日本詩人全集22 新潮社
1967(昭和42)年7月10日

山羊の歌 日本図書センター
1999(平成10)年9月25日 初版第1刷

ユニコード漢字データベース
UCSコード検索 Unihan Database Lookup
UCS部首検索 Unihan Radical-Stroke Index


1.「山羊の歌」中「月」の三つのテキストの外字比較


全集角川書店版 日本詩人全集22 山羊の歌 全集注記 岩波文庫
山羊の歌
から「月」
当該字

2.大漢和辞典の二つの字

字形・検字番号 字          義 備考
U+207C2に該当
包摂101?

U+528Aに該当

3.UCSにおけるU+528AとU+207C2のグリフ

CJK統合漢字符号表
http://www.unicode.org/charts/PDF/U4E00.pdf(30M)

http://www.unicode.org/charts/PDF/U20000.pdf(27M)

UCS グリフ CJK Unided Ideographs Extension B 備考
U+528A 大漢和
2225
U+207C2 大漢和
2173?

4.CJK統合漢字と包摂規準


UCS 備 考
U+66DC 常用漢字
第1水準
UCS統合

包摂19?
2 U+5A6C 常用漢字
第1水準
3と分離
3 U+5D9F 2と分離
包摂15
4 U+514C 第2水準
1-49-28
5と分離
5 U+5151 4と分離
6 U+5A27 第4水準
2-5-59
UCS統合
7 U+68B2 第3水準
1-85-72
8と分離
8 U+68C1 7と分離
9 U+5E28 面区点なし
UCS統合
10 U+6329 面区点なし
11と分離
11 U+635D 10と分離
12 U+66FD 人名漢字
第1水準
1-33-30
分離
13 U+66FE 人名漢字
第1水準
1-33-29
分離
14 U+5897 常用漢字
第1水準
1-33-93
分離
15 U+589E 第3水準
1-15-61
分離
16 U+50E7 常用漢字
第1水準
1-33-46
第3水準で
分離
16_1 U+564C 第3水準
1-14-41
17 U+5C64 常用漢字
第1水準
第3水準で
分離
17_1 U+FA3B 第3水準
1-45-65
分離
18 U+618E 常用漢字
第1水準
1-33-94
第3水準で
分離
18_1 U+FA3F 第3水準
1-84-62
分離
19 U+8D08 常用漢字
第1水準
1-34-03
UCS統合
19_1 U+FA65 第3水準
1-92-29
分離
20 U+564C 第1水準
UCS統合
21 U+7511 第1水準
1-25-89
UCS統合
22 U+5D92 第4水準
2-8-63
UCS統合
23 U+7E52 第3水準
1-90-21
UCS統合
24 U+9C5B 第4水準
2-93-83
UCS統合
25 U+6A67 面区点なし
UCS統合
26 U+8B44 面区点なし
UCS統合

2011年3月9日