CH87(5)2010-08-07

2010-08-07 當山日出夫

松田訓典さん、彌永信美さん、永崎研宣さん、下田正弘さん
フランス語仏教辞典『法寶義林』目録のデジタル化とその課題-TEIガイドラインの適用を通して-

この発表、二つの観点から見ることができるだろう。

一つは、額面通りに『法寶義林』のデジタル化の課題として見る。もう一つは、TEIの応用事例として見る視点。私の場合、どちらかといえば、後者、つまりTEIの具体的な活用事例の報告としてきいていた。

おもいおこせば、何年前になるか……TEIが、日本にはじめて紹介されようとしたとき、まだ、パソコンの黎明期であるが……すこしだけだが、かかわったことがある。

その時の議論はいろいろあった。たとえば、そもそも、テキストをマークアップするとはという話しもあれば、はたして、(日本語の)テキストをマークアップ可能であるのか、というようなことまで。

研究会の質疑のときにも、やはり、この点について質問があった。なぜ、TEIであるのか。その必然性はどこにあるのか。

この問いかけはそれなりに意味はみとめられる。しかし、今、日本において必要なのは、TEIの普及啓蒙ではないだろうか。これが言い過ぎなら、もう少し、TEIについて知られていてもよい。今、TEIについて、日本語ではほとんど情報がない状態がつづいている。これは、なんとかする必要があるだろう。

とはいえ、実際にTEIが日本でなじみのあるものになるには、かなり厳しいかなと感じないではない。このことを理解したうえで、意欲的な発表であったと思う次第である。

當山日出夫(とうやまひでお)

CH87(4)2010-08-05

2010-08-05 當山日出夫

田島孝治さん、高田智和さん
「景観文字調査」のための調査結果分類方法に関する一考察

この発表は、私もすこし関係がある。景観文字・・・看板や道路標識などで見る文字である。それを言語研究資料として、いかに利用するかという研究。いや、研究というよりも、そのための方法論。というよりも、そのための、道具(ツール)の話し。

最終的には、人間の目による確認が大事かなとは思う。そして、重要なことは、ある箇所に、その文字が無いということも記録しておく必要がある、ということ。これは、今後の景観文字調査の方法の一つとして、重要な点になると思う。あるいは、ある範囲を悉皆的に調査したのなら、その範囲を明示的にはっきりと示す工夫が必要かもしれない。

デジタルカメラにGPS機能がつかえるようになって便利になったものである。とはいえ、今のところ、一般的には、とれるのは、カメラの位置情報である。撮影の方向や、被写体との距離などは、とれない。景観文字調査にとっては、カメラのある場所ではなく、看板のある場所の情報の方が必要である。実際に調査してみると経験するが、道路の反対側からでないと見えない看板というものがある。

まだまだ、工夫改良の余地のある研究課題であるが、なるべく協力していこうと思う。

當山日出夫(とうやまひでお)

CH87(3)2010-08-04

2010-08-04 當山日出夫

CH研究会の感想のつづきである。

竹田陽子さん、丸茂美恵子さん
情報技術支援によるフィードバック・ループの効果

要するに・・・MC(モーションキャプチャ)を使って、日本舞踊の学習にどのような効果があるか、ということの研究と理解した。MCについては、いろいろ研究会で発表をきくのだが、最近の傾向としては、自分の(あるいは他人の)動作をMCでとってみて、その画像を見て、自分自身の、たとえば舞踊などの学習にどのように影響・学習効果があるか、という方向からの研究発表が増えてきているような気がする。

これが以前であれば、ただ、人間の身体動作の測定、ということに主眼があったように思う。それが、MCという技術によって、自分の動作を客観的に計測してみて、そこから何を学びうるのか、何がわかるのか、という方向に変わってきているようである。

こういう話し、たしか、NHKの番組で、京都の職人の技の伝承をテーマに番組があったように記憶する。熟達した師匠と、若い弟子とで、どのように動作が違うか、機械的に測定してみる。そのことによって、技の伝承を、より効果的なものにしようというもの。

これら全体をとおして、やはり、MC技術と人間のかかわりにおいて、ちょうど転換点にきている。あるいは、それだけ、MC技術が進歩したということなのかもしれない。また、人間の側としても、自分自身の身体動作のコンピュータによる計測ということに、違和感を感じなくなっているということもあるだろう。

人間の感性とコンピュータとの関係において、面白い傾向だと思う。

浅水悠子さん、上村龍太郎さん
情報理論を応用したSOMによるメディアミックス作品と原作の作品分析

正直言って前半の理論的部分はよくわからない。(理工系で専門的すぎて)。ただ、後半の実際の作品の分析になると、なかなか面白かった。題材として、『地底探検』がとりあげられていた。その様々な映画化などにおいて、どのように、原作から離れ、あるいは、忠実であるのか、それを可視化して見せる。これは面白い。

ただ、あつかった素材が、『地底探検』であるのが、どうかな・・・という気がしなくもない。もうちょっと、いい題材がなかったか。また、この手法、日本の古典作品、特に、中世の御伽草子などにも応用がききそうである(このあたりのことは、質疑のときにも、フロアから指摘があったが。)

やはりこの種の研究は、基本となるアイデアの良さも必要だが、同時に、具体的にどの作品をあつかってみるか、というところで、非常に大きく説得力の違いが出るように思う。研究のチームが、良いパートナーを見つけられるか、逆に言えば、文学研究のような分野からいかに積極的にかかわっていくか、ということが、これからの課題ではないだろうか。

當山日出夫(とうやまひでお)

CH87(2)2010-08-02

2010-08-02 當山日出夫

先月31に、皇學館大学(伊勢)であった、CH研究会のつづき。

最初は、小沢一雅さん。古事記崩年干支に関する数理的検討。

日本語史で、それも、いわゆる古代語(近代語に比して)の歴史的研究という分野にいながら、あまり古代史にも、また、考古学にも詳しいといえない。しかも、数学は不得手ときているから、さて、どう考えていいものか、わからないのが正直なところ。

ただ、この小沢さんの一連の、天皇の崩御年についての数理的研究には興味をもっている。おそらく、これまでの文献史学や考古学では生まれてこなかった、斬新な発想にもとづくものだと思う。この意味で、古代史や考古学の専門家が、どのように、小沢さんの研究を見ているのか、きいてみたいところである。

が、どうもCH研究会は、こういう斬新な研究が現れる一方で、その肝心の専門家がなかなか参加してくれないという、ある種の問題点をかかえているように思えなくもない。このあたりが、日本の人文情報学(デジタル・ヒューマニティーズ)のかかえている問題点のひとつであるのかと思う。

ついで、黒崎浩行さん、弓山達也さん、渡辺光一さん、らによる、
日米宗教思想の再構築-思想空間法を用いた体系化の一例
思想空間法-構造化手法と調査データを融合した思想・理念の体系化方法-
の発表。

思想(宗教)というものを、このように「機械的」にとりあつかってしまうことに、違和感を感じる人もいるだろうし、あるいは、斬新な興味を感じる人もいるだろう。このような研究の場合、ただ、工学的な手法を、思想研究にもちこんだというだけではなく、やはり、伝統的な旧来の思想史研究者を納得させるだけの力量が必要になると思う。あえて批判的に見ればであるが、この意味では、非常に面白いのだが、さて、では、普通の宗教学者はどのようにこの発表を聞くのかというあたりが気になるところ。

私個人としては、基本的に、このような斬新な発想に対して常に柔軟な姿勢でありたいと思っている。そのうえで、より、説得力のある研究に発展するにはどうあるべきかを考えてみたい。自分の予備知識のなさであまり良く理解できていない面があるかと思うが、非常に興味深い発表であったと思う。是非、この続きの発表を、いつか聞いてみたいものである。

當山日出夫(とうやまひでお)

CH87(1)2010-08-01

2010-08-01 當山日出夫

人文科学とコンピュータ研究会(CH87、皇學館大学)まで行ってきた。その感想を少し。

朝7時ごろに家を出る。自動車である。京滋バイパスから新名神、伊勢道、というルートをナビが出したので、そのまましたがうことにする。途中、京滋バイパスが名神と合流するまでの間、瀬田東の付近、かなり渋滞。しかも、雨。いったい今日の天気はどうなるんだろうと思っていたが、名神から新名神を走るころには、天気は回復。目的地まで、途中に休憩をいれて、3時間弱ほど。ついたら、猛暑という感じ。しかし、場所が、伊勢神宮の近辺だけあって、京都や東京の夏の暑さとは、感覚がちがう。

ついて、まず、駐車場をさがす。なんとか、一台の空きスペースを見つけてとめる。で、目的の建物は……こういう場合、そこいらへんを歩いている学生さんに聞くのがてっとりばやい。たずねてみると、実に丁寧におしえてくれる。それに、すれ違う学生さんが、挨拶してくれる。

皇學館大学は初めてであるが、学生さんが礼儀正しく親切であるのは、やはりこの学校の建学の精神の故、教育方針なのであろう。(ちなみに、京都の、仏教系の某大学、もうすこし、学生の態度ふるまい、どうにかならんかねえ、と思ってしまう。余談。)

会場には、かなり早めについた。ちょうど受付を開始したところ。知った顔のひとがちらほら、という感じ。

キャンパス内も、また、校舎の中も、きれいに整頓されていて、う~ん、やっぱりちがうなあ、と感じるところがあった。今回の研究会、研究会そのものよりも、会場の大学に感心してしまうところの方が大きかったかもしれない。

そして、定刻になり、研究会である。

つづく(つもり)

當山日出夫(とうやまひでお)

CH研究会での内村DVDの発表が終わった2010-05-23

2010-05-23 當山日出夫

CH研究会(情報処理学会、人文科学とコンピュータ研究会)、無事におわった。懇親会のあと、さほど長居はせずにかえったが、それでも、家に着いたら11時にちかかった。そして、今日は、また、別の学会(訓点語学会)で、京都(京都大学)である。

今日は、雨、どんな服装でいこうかまよう。雨だから、身軽な方がいいが、気温はひくそうだし。ぬれてもいい、という格好でいかないと。

ところで、CH研究会の方は、最初の発表であったので、気が楽であった。話しの内容は、以前に、京都大学人文科学研究所でのセミナー「東洋学へのコンピュータ利用」で話したことを基本にして、それを、人文学研究と電子書籍の利用という方向に、もっていったもの。

なにせ、まだ、できたばかりのDVD版であるので、具体的な使用実績のつみかさねがあまりない。具体的にこれをつかって何ができるのか、それは、今後の課題・・・ということにならざるをえない。

しかし、専門家向けの、研究(知的生産)のためのツールである、という方向性ははっきりしてくるのではないだろうか。これから出てくるであろう、一般の電子書籍の類と、また、紙の本と、どのように共存していくか、これも、このDVD版研究のひとつの課題であるか、と思った次第である。

今、古書店で、全集をワンセット買おうとすれば、10万ちかくはする。それを考えれば、DVD版の価格(60000円)は、かなり妥当であるといえるだろう。しかも、コピープロテクトなどはかけていない。また、全集をバラバラにして、個々に電子書籍として販売したとしたら、合計すれば、同じようなものになるにちがいない。

価格、販売方式、これらについてもいろいろ意見はあるだろうが、現時点の判断として、私としては、妥当なものだと思っている。これが、今後の、種々の電子書籍の展開のなかで、どのようになるか、考えていかなければならないと思う。

當山日出夫(とうやまひでお)

日本のCH2010-03-08

2010-03-08 當山日出夫

先日の「文化とコンピューティング」、AMeeTのWEBマガジンに書かなかったことなど、少し。

CH(人文科学とコンピュータ)の研究会での発言。私のノートによれば、後藤さんからの問題提起となっている。(あくまでも、私のノートから)。

日本は、日本独自のCH(Computer and Humanities)があるのではないか。世界でいうDH(Digital Humanities)とは、違う方向をむいているのかもしれない。日本の場合、芸術、人文地理学、文化人類学などの領域が多いのが特徴。画像データや、モーションキャプチャなどもふくんでいる。テキスト処理のテーマに乏しい。

さて、どうかんがえるか。以下、私見。

日本の場合、言語処理が、特別に独立してしまっている。決して研究がないわけではない。非常にさかんであるといっていいだろう。だが、言語処理研究をやっている人たちが、自分たちの研究分野を、CH(または、DH)と、思ってはいないであろう(と推測される)ところに、問題があるのかもしれない。

実際に、あまり、研究会などでの交流は無いと言っていいだろう。

ちょうど、今日、言語処理学会を開催している。これに、CH・DHにかかわると自称するひとたちが、どれほど参加していることか。このことの是非をここで言ってもしかたない。しかし、このような現実である、ということはふまえておく必要があるだろう。

當山日出夫(とうやまひでお)

じんもんこん2009覚書(7)2010-01-10

2010-01-10 當山日出夫

二日目の朝である。土曜日なので、バスの運行が通常と違うはず。なるべく早い目に家を出る。といっても、子供が学校に行くのと一緒に家をでるから、そう極端にというこでもないが。駅(南草津)で、どのバスに乗れば、どうなるかわからないまま、「立命館大学」と書いてある、手頃なバスに乗車してしまう。まあ、どうにか、遅刻はしないですんだ。

A会場であるので、テキスト・コーパス関係。

非常によくわかる発表と、はっきり言ってよくわからない(悪いという意味ではない)のとが、混じっている。こちらの専門がいくら日本語学であるからといって、最近の、言語処理技術について精通しているというわけではない。いやむしろ逆で、さっぱりわからないといった方が素直だろう。

興味深かったのは、共通教養日本語均衡コーパス(CCCJ)の概念(芝野耕司さん)。日本の学校教科書を使ったコーパスの事例紹介。ちょうど、勉誠出版から『新常用漢字表の文字論』が刊行された直後だったので、発表のなかで、私のことに何度か言及していただいたのは光栄であるが、なんとなく、きはずかしくもある(^^;)

それにしても「均衡コーパス」とは何であるのか、これはこれで非常に興味深い。日本の学校教科書において、「国語」の教科書語彙が、かなり特殊である、これは理解できる。だが、そのことと、他の教科の教科書の語彙が基本語彙であるかどうかとなると、かなり難しいような気がする。(このあたり、私の誤解であるのかとも思うが。)

そもそも均衡コーパスというものは、何なんだろう、と思う。国立国語研究所の「KOTONOHA」も、現代日本語の均衡コーパスと称している。個人的には、いきなり「均衡コーパス」といくよりも、特定の分野でコーパスを作っていって、それが、た~くさん集まってその結果として、均衡コーパスができあがっていく、という方向ではないだろうかと思う。

が、これとは別に、教科書のコーパスは、これはこれとして、非常に興味深いものがある。今後、多方面で利用されることに期待したい。

それから、大蔵経における多言語対訳コーパスの構築(永崎研宣さん)。永崎さんの発表は何度も聴いているので、これまでの「続編」として聴く。この発表でもそうであるが、実際に大蔵経データベースを構築運用しているということの強みがある。単に技術一辺倒ではなく、実際の人文学研究者が何を求めているのかが、反映された発表であったと記憶する。

ともあれ、前日の夜が遅かったので、朝一番からずっと発表をきいているというのも、正直いって、ややつらい。が、ここは、発表を聴きながらいろいろと考えることになる。

當山日出夫(とうやまひでお)

じんもんこん2009覚書(6)2010-01-09

2010-01-09 當山日出夫

懇親会は、大学キャンパス内ではなく、市内のホテル。参加者は、バスで移動。これが、また、たいへんだった。

まず、バスがどこで待っていてくれるか、どうやら事前に確認がとれていなかったらしく、少し待つ。これは、まあ、よくあること(だろうと、思っておくことにする。)

その後、バスに乗ってから、ホテルまでの道が大渋滞。どうやら、事故か何かがあったらしい。結局、予定より、一時間以上遅れて、バスはホテルの前を通過。通過、というのは、路上ではとめられないので、通り過ぎて駅の方まで行って、もどってこないと、左折でホテル内の敷地に入れない。

なんだかんだとあったようであるが、ともあれ、予定を大幅におくれて懇親会。で、例によって、いつもとおおむね同じようなメンバーで、ということになる。これはいいことなのかどうなのか。確かに、仲間同士のコミュニケーションは強くなるが、新しい人もどんどんと参加してほしい。とは思うものの、なかなか、うまくいかないように思える。

学会、研究会、といっても、最終的には人間の社会のいとなみである。人と人との関係が常にそこにある。無理に懇親会に出なさいということもないだろう。集まりたい人が集まる、これが積み重なると、どうしても、そこに人と人との関係の積み重なりが生まれてしまう。

だが、まあ、無事に懇親会終了。そして、その後が寒かった。駅まであるいて、京都方面行きの電車を待っている時間、ホームでとっても寒かった。京都駅で、簡単に二次会。どういうわけだか、文字関係の非常に中身の煮詰まった話しをする会になってしまった。

無事に家まで近鉄で帰れたが、京都駅が10時半をすぎると、列車の連絡がわるくなる。結局、我が家に帰ったのは12時近くになってしまていた。これで、翌日は、朝一番から、BKCのキャンパスである。これは、ちょっとつらかった、というのが、いまから思うところである。

というわけで、翌日につづく。

當山日出夫(とうやまひでお)

じんもんこん2009覚書(5)2010-01-08

2010-01-08 當山日出夫

やっぱり、つづけることにする。パソコンがあたらしくなると、インストールしてあるエディタ類の設定が微妙に変わってしまうの、ついつい文章を書くのが億劫になる。ここは、一種のリハビリ的な意味で、つづきを書いていこう。

基本的にA会場の方にいたので、こちらしかわからない。そのなかで、第一日目の午後の発表で、気づいたことをいくつか記す。

Subversionを用いた仏典テキスト校訂支援システムの評価
福岡整さん(ほか)

なかなかいい発表だなとは思った。まず、画像データとテキストデータとの連係。そして、それを、どのように管理するか(本文校訂)の問題。この場合、やはり問題になるのは「校訂」ということの定義だろう。

単純化していえば、
・本文のミスをただす(→正しい本文に書き換える)
・肯定者(研究者)の本文解釈として字句を改める
この二つの方向がある。

そして、ややこしいことは、これが、それほど単純に分けられないことである。特に、専門家が、その専門の目で、文献を読むときには、これらが重なる中間的なグレーゾーンというべき部分がある。極端な場合、本文のミスとわかっていても、あえてそれを残す、原文のかたちを残す、というような、ひねくれたこともあったりする。(正しいと判断すべき本文は注記などで言及することになるが。)

ここまでいかないにしても、この発表の「評価」のところが少し気になったので質問してみた。単純に、多数決で、何人の人の意見が一致した/しない、ではなくて、専門家の目で見てどう判断できるのか、その部分を考慮すべきではないか、と。

この観点では、次の発表

デジタル画像資料を利用した文献研究に必要な環境について
岡本隆明さん

人文学であつかう文献資料について「テキスト的要素」と「イメージ的要素」にわけて考えるという基本の発想。これは、昨年の秋の訓点語学会の発表でも発言のあったこと。この基本的なことが、実は、コンピュータで、文献資料をあつかえるようになって、あらためて自覚すべきことになってきた、といえるのではないか。そして、このことに、いままで、さほど気にせずにきたのではないか、と反省点の指摘になる。

コンピュータで、かなり自由に画像データとテキストデータとあつかえる。そして、テキストデータについては、文字コードとそれで表示される文字の「かたち」が問題になる。テキスト的要素といっても、純粋にそれだけをとりだして考えようとすると、かなり深いところの文字論に踏み込まざるをえない。

この発表はそこまでつっこんだ内容のものではなかったが、基本的問題点の指摘としては、非常に重要な点をあきらかにしていると思う。ここからさきは、テキストとは何であるか、という議論になる。今後の課題とすべきだろう。

その他に、「幕末維新期人口史料」分析プログラムの開発、など興味深い発表もあったが、長くなるので、これぐらいにしておこう。一日目がおわって、懇親会に出発である。

當山日出夫(とうやまひでお)