新常用漢字:文字にコードポイントをあたえることの意味2009-01-18

2009/01/18
當山日出夫

小形さんの「もじのなまえ」に、安岡さんがトラックバックで、いかっている。

もじのなまえ
http://d.hatena.ne.jp/ogwata/20090116

私の意見としては、安岡さんに賛成。

文字の字体にゆれがある(たとえば、1点のしんにゅうか、2点のしんにゅうか)ということ。これについて、分離して、別のコードポイントを付与するのか、同一コードポイントでのバリアントとして包摂するのか、決定的にちがう。このことについて、委員会ではわかっていない(と、議事録や資料からは読める)。

委員会の議論しているレベルは、漢字表として示すとき、
1.どちらかを代表字体とする(他を許容とする)
2.両方を並記して示す
いずれが、漢字表として、内部的な整合性があるか、あるいは、表外字との関係で実用的であるか、この水準の話し。

この視点(コードポイントの違い)をもたないで、情報機器への対応など、あり得ようはずがない。

當山日出夫(とうやまひでお)

新常用漢字:「叱」の区別2009-01-18

2009/01/18 當山日出夫

★タイトルが、ブラウザの設定によっては、文字化けするので、0213の方の、「しかる」の字を、削除しました。

安岡さんの日記から、引用する。

http://slashdot.jp/~yasuoka/journal/464702

>>>>>
「𠮟」(口へんに七、U+20B9F)なんかじゃなく、「叱」(口へんに匕、U+53F1)の方を(新)常用漢字に追加すべきだろう。
<<<<<

確かに、日本のJIS規格においては、この2字は、分離されている。別のコードポイントが与えられている。

この2字は、別の字としてあつかっているのか、同じ字の異体としてあつかっているのか。実は、判然としない。

手元の漢字字典を見ても、同じ文字とするもの(『全訳漢辞海』第二版、三省堂)、別の文字とするもの(『新選漢和辞典』第七版、小学館)、がある(これらの漢字字典は、文字コードが付してある)。

また、『増補改訂 JIS漢字字典』では、第1水準の「叱」(1-28-24)を掲載する。しかし、第3水準の「𠮟」(1-47-52)は、掲載しない。面区点の一覧からも、この箇所は欠番になっている。

まあ、常識的には、「叱=しかる」であろう。とすれば、漢字の頻度調査において、包摂して、その総数を見るべきではないか。そして、そのうえで、どちらを、新常用漢字表で掲載するか(場合によっては、別の字を「許容」とするか、あるいは、並記するか)という、判断になるべきである。

単純に、別のコードポイント=別の字、ではない、とすべきである。そういえば、昨年の5月の新聞報道で出た一覧。「靴」「闇」の問題を思い出す。

さらにいえば、調査をコンピュータのデータに依存している限り、カウントされるのは、コードポイントが違う文字、についてのみである。実際に、それを、どのようなグリフとして見ているのか(ディスプレイであれ、印刷された紙の文字であれ)は、わからない。

まず、基本的な調査の方法からして危ういと、私は思っている。これは、漢字だけの調査から漢字のことは分からない、という問題とは別にである。

新常用漢字、調査の基本からやりなおすべきである。これが私の意見。

當山日出夫(とうやまひでお)

追記 2009/01/18
このメッセージ、アサヒネットのブログタイトル一覧では、
新常用漢字:「?」と「叱」の区別
と、表示される。
さらに追記 2009/01/18
ブラウザによって見える字がちがう。

タヌキの続報2009-01-18

2009/01/18 當山日出夫

さきほど、「叱」についてメッセージを書いていたとき、私の書斎の上(天井裏)を、なにものか、ドタバタ・ガタゴトと音がした。確認のため、二階にあがってみたが、人はいない。二階は、物置になっている。

ネズミやイタチなら、こんなに派手な音はたてない(だろう)。
我が家の良い子達(ネコ、複数形)であれば、もうすこし静かである。
幽霊ならば音がするはずがない(なぜならば、足がないであろうから)。

となれば、妖怪、かもしれないが、こんな妖怪がいたかどうか(後で時間ができたら、水木しげるの本を読みなおそう。)

今日は、雨。おそらくは、タヌキ、と考える。人家の天井裏は、雨風がしのげて、かつ、あたたかい。

キツネつき、ならぬ、タヌキつきの家に果報はもたらされるであろうか。

當山日出夫(とうやまひでお)