じんもんこん2009覚書(7)2010-01-10

2010-01-10 當山日出夫

二日目の朝である。土曜日なので、バスの運行が通常と違うはず。なるべく早い目に家を出る。といっても、子供が学校に行くのと一緒に家をでるから、そう極端にというこでもないが。駅(南草津)で、どのバスに乗れば、どうなるかわからないまま、「立命館大学」と書いてある、手頃なバスに乗車してしまう。まあ、どうにか、遅刻はしないですんだ。

A会場であるので、テキスト・コーパス関係。

非常によくわかる発表と、はっきり言ってよくわからない(悪いという意味ではない)のとが、混じっている。こちらの専門がいくら日本語学であるからといって、最近の、言語処理技術について精通しているというわけではない。いやむしろ逆で、さっぱりわからないといった方が素直だろう。

興味深かったのは、共通教養日本語均衡コーパス(CCCJ)の概念(芝野耕司さん)。日本の学校教科書を使ったコーパスの事例紹介。ちょうど、勉誠出版から『新常用漢字表の文字論』が刊行された直後だったので、発表のなかで、私のことに何度か言及していただいたのは光栄であるが、なんとなく、きはずかしくもある(^^;)

それにしても「均衡コーパス」とは何であるのか、これはこれで非常に興味深い。日本の学校教科書において、「国語」の教科書語彙が、かなり特殊である、これは理解できる。だが、そのことと、他の教科の教科書の語彙が基本語彙であるかどうかとなると、かなり難しいような気がする。(このあたり、私の誤解であるのかとも思うが。)

そもそも均衡コーパスというものは、何なんだろう、と思う。国立国語研究所の「KOTONOHA」も、現代日本語の均衡コーパスと称している。個人的には、いきなり「均衡コーパス」といくよりも、特定の分野でコーパスを作っていって、それが、た~くさん集まってその結果として、均衡コーパスができあがっていく、という方向ではないだろうかと思う。

が、これとは別に、教科書のコーパスは、これはこれとして、非常に興味深いものがある。今後、多方面で利用されることに期待したい。

それから、大蔵経における多言語対訳コーパスの構築(永崎研宣さん)。永崎さんの発表は何度も聴いているので、これまでの「続編」として聴く。この発表でもそうであるが、実際に大蔵経データベースを構築運用しているということの強みがある。単に技術一辺倒ではなく、実際の人文学研究者が何を求めているのかが、反映された発表であったと記憶する。

ともあれ、前日の夜が遅かったので、朝一番からずっと発表をきいているというのも、正直いって、ややつらい。が、ここは、発表を聴きながらいろいろと考えることになる。

當山日出夫(とうやまひでお)

コメント

コメントをどうぞ

※メールアドレスとURLの入力は必須ではありません。 入力されたメールアドレスは記事に反映されず、ブログの管理者のみが参照できます。

※なお、送られたコメントはブログの管理者が確認するまで公開されません。

※投稿には管理者が設定した質問に答える必要があります。

名前:
メールアドレス:
URL:
次の質問に答えてください:
このブログの名称の平仮名4文字を記入してください。

コメント:

トラックバック

このエントリのトラックバックURL: http://yamamomo.asablo.jp/blog/2010/01/10/4805797/tb

※なお、送られたトラックバックはブログの管理者が確認するまで公開されません。