新年から仕事である2010-01-01

2010-01-01 當山日出夫

今日から、日付をATOKで自動入力するのに、「2010」から入力しないといけなくなった。「00」年代も過去のものになった。この年末年始は、『1968』(小熊英二)を読みつつすごしている。というよりも、壊れたパソコンを新しくして、再設定で、ソフトのインストール、アップデートなどのあいた時間に、本を読んでいるという状態。

思わぬアクシデントで、予定が大幅にくるってしまった。これが、同時並行で、徐々に新しいパソコンに移行していくというのなら、楽なのであるが。なれているということで、買ったのは、あえて古いVista(HomePremium)のマシン。いずれ、Windows7には、変更するつもりでいるが、それは、もう少し時間をみてからにしよう。

一太郎の新しいのが出る。それに、MSオフィスの2010を確認してから。7のプレインストールマシンを、別に一台新しくしてもいいかと思っている。文字のことをやっていると、現時点では、XPとVisitaと7と、それぞれに現役であるので、すべての文字を見比べて見る必要がある。ここしばらくは、古いマシンも必要なのである。私の場合。

さしあたっては、年賀状書きである。

私の場合、かろうじて年末内に出せたが、だいたいそういう人は、そう律儀であるはず(あるいは、時間に余裕がある立場)ではない。きたとしても、明日以降のことになるだろう。が、ともあれ、もらった年賀状のうち、出し忘れていた人の分については、返礼の賀状を出さないといけない。

それから思うこと。パソコンのOUTLOOKのフォルダがふっとんでしまったおかげで、いろいろ考えた。これは、式年遷宮のようなものかな。数年に1回ぐらいで、メールの送受信履歴、連絡先一覧をリセットするのも、必要かもしれない。

何かの都合で、連絡先に登録してしまったひとというのがある。消すには、しのびない。(気がよわいせいか)。

このとき、以外と便利かと思うが、メールアドレスを、テキストにして、テキストファイルで保存しておくこと。分野ごとにわけて、いくつかのテキスト(文書)ファイルにしてしまえば、100名以上でも簡単に管理できる。

とりあえず保存しておきたいメールアドレス、(名刺を探し出すのは面倒、不可能、まちがえたら困る)、常に連絡先一覧に保存しておきたいアドレスと、いろいろとある。これと、Gメールと、うまく組み合わせて使っていくようにしようかと思っている。

ちなみに、WEBブラウザ(Firefox)のブックマークも全部ふっとんでしまった。これも、式年遷宮方式で、心機一転、ゼロから再構築である。記憶をたよりに、リンクをたどるとどうにかなる(だろう)。

當山日出夫(とうやまひでお)

じんもんこん2009覚書(4)2010-01-01

2010-01-01 當山日出夫

いよいよ「00年代」にわかれをつげたのだが、「じんもんこん2009」の整理の方が終わらない。はやく「09」を終わりにしたい。

初日の講演会。

The Sparrow Flitts Through : From Humanities Computing to the Digital Humanities

話しは、Geoffery Martin Rockwell さん(Alberta大学)。

「人文学とコンピュータ」の時代から「デジタル・ヒューマニティーズ」へ、ということにでも、なるだろうか。逐次通訳だったので、私でも、非常によくわかったのだが、これは言語についてのこと。内容になると、いまいち、よくわからない、いや、わかるのだが、今の日本の状況と比較して、ではいったいどうすればいいのかがはっきりと見えてこない、そんな印象だった。

話しの中心は、テキスト処理。大型計算機を使ったコンコーダンス作成の時代から始まって、現在のコーパス言語学への流れと理解すればいいだろうか。それに、WEBの利用が重なる。単に人文学研究にコンピュータをつかって「便利」になったという時代が、かつてあった。その時代から、量が質を変えるようになる……その結果、デジタル環境での人文学研究の確立へ、だいたいこのような流れだと理解した。

これは、日本でも同様といえばいえる。むかしの、(いまでは覚えている人も少ないだろうが)「テキストデータベース研究会」の時代から、現在への流れを見ると、単なるコンピュータを使った人文学研究、というレベルから変わってきたことはわかる。

ただ、日本の場合、欧米とちがうのは、それがいい意味でも、悪い意味でも、テキストを中心としないで、画像処理・GISなどをふくんだ多様な展開をしていることにあるだろう。これを、すばらしいと見るかどうか。

あえて否定的に見解をしめせば、日本の場合、「日本語」の特殊性もあって、日本語の自然言語処理という特殊分野が独立してしまった。そして、通常の人文学研究に、そのテキスト処理の技術が還元され活用されているとはいえない。これをマイナスに評価することもできよう。あくまでも人文学の中軸は、テキストの読解にあるのだ、という考え方がないわけではないのであるから。

しかし、その一方で、モーションキャプチャやGISをふくめて、デジタル・ヒューマニティーズ(強いていえば、「人文情報学」)が、なりたちつつある。テキストの呪縛からの解放と、積極的にプラスに評価することもできるだろう。

どのように評価するとしても、日本の場合、テキスト処理を軸にしての人文学でのコンピュータ利用で、革命的な変革がおこっていない、ということだけは確認してよいかと思う。

ところで、印象的だったことを記しておくと……講演において、グーグルブックサーチのことを、すでに大前提に話しをすすめていたこと、である。この点は、日本には該当しない。これは、やはり、日本の状況においては、不幸というべきではないだろうか。

膨大なテキストデータ(その代表が、グーグル)があることを大前提にしている欧米の「デジタル・ヒューマニティーズ」と、テキスト以外に多様な展開をしめしている日本の「人文情報学」。そして、日本からとおざかってしまったグーグルブックサーチという黒船。このようなことを、漠然と思いながら講演を聴いていた次第である。

當山日出夫(とうやまひでお)

『日本歴史』日本史研究とデータベース2010-01-02

2010-01-02 當山日出夫

すでに、他のブログなどでも言及されている。ARG(ブログ)でも書いてある。雑誌『日本歴史』(吉川弘文館、2010年1月号)の特集が、「日本史研究とデータベース」になっている。

ARG 2009年12月22日
http://d.hatena.ne.jp/arg/20091222/1261477846

が、まあ、ここでも簡単に目次だけでも簡略に紹介しておく。

日本史研究データベースはどこに行こうとしているのか(横山伊徳)
日本古代史研究のためのオンライン・データベース(小口雅史)
中世史研究資源としてのウェブデータベース(田良島哲)
日本近世史研究とデータベース(鵜飼政志)
インターネットで歴史研究(櫻井良樹)
中国・台湾史に関するデータベース(江川式部)
朝鮮前近代史に関するデータベース(長森美信)
朝鮮近現代史に関するデータベース(河かおる)
ぞんざいな検索、丁寧な検索(荒木浩)
日本史研究におけるインターネットの学術利用(岡本真)

そのほか、「提供者の立場から」「利用者の立場から」として、多数の寄稿がある。

そうじて、「網羅的に紹介」という感じがするが、これはこれで、各種のデータベースの紹介として、利用価値のある特集であると思う。そのなかで、やはり読むべきは、岡本真さんの文章だろう。

岡本さんは次のように記す。

>>>>>

「入手」と「共有」、そして「成果」と「過程」という視点からは、日本史研究におけるインターネットの学術利用はどのように評価できるだろうか。
(p.55)

<<<<<

として、ただ、資料(史料)のインターネットでの学術情報の流通・共有だけではなく、研究者自身が、研究のプロセスを見せていくことの価値を強調している。これこそが、真に共有されるべきものかもしれない。

人文学研究におけるインターネット利用について考えるとき、貴重な提言であることは確かである。

當山日出夫(とうやまひでお)

だいたい復旧できたが2010-01-05

2010-01-05
當山日出夫

年末に壊れて買い換えたパソコン、だいたい、インストールのソフトに、メールアドレスなど、ほぼ復旧した。次におおきく変えるタイミングとしては、MSのオフィス2010が出てから、ということになる(だろう、たぶん。)

今の大学生だと、自分で持っている(自宅にある)パソコンが、XP、Vista、それに、次年度の新入生からは、Windows7を買ってもらって、というのが増えるにちがいない。特に、特定のパソコンに依存したということは教えないでいるつもりでも、基本的操作のところでは、どうしても、機種依存、OS依存になってしまう。まあ、実際には、来年度のその次の年度ぐらいからの問題となるだろうから、しばらくは様子を見るしかない。

それにしても、Gメール転送設定にしておいて、助かった。どうしても、外でメールの送受信をする必要があるので、通常のアカウントをGメール転送にしておいたのだが、緊急の場合の、バックアップにつかえる。これで、かなりのメールアドレスを復旧できた。ついでに、ここ1~2年ほどの間に、いろいろともらった名刺も整理できた。

これが、徐々に、Vistaマシンから、並行して使いながら、7に移行なら、問題ない、というよりも、いろいろ楽しめるのであるが、今回ばかりはそうもいっていられない。たとえば、フォルダをワンクリックで開くか、ダブルクリックか、でも、設定が違うと、ものすごくとまどってしまう。

おかげで、『1968』が、正月の間におわらなかった。

當山日出夫(とうやまひでお)

プリンタがつかえなくなったので2010-01-06

2010-01-06 當山日出夫

パソコンが壊れて新しくしたら、旧のプリンタ用がつながらなくなった。そりゃそうだろ、いまどき、プリンタケーブルでつないでいるような人は、昔の生き残りだろう(^^;)

まだまだ十分に現役で使えるプリンタなのである。たった、10年ほど前の機種である。ケーブルはどうにかなるとしても(USBに変換)、ソフト(プリンタドライバ)の方が、提供されなくなってしまっている。Vista以降の機種では。調べてみると、古いXP用のプリンタドライバ(専用)は、いまだにダウンロードできるらしい(キャノン)。

さて、ここで、おおきく書斎の模様替えをして、パソコンとプリンタの配置を変えるか……となると、これまた、一仕事である。(出てくる本もあるにちがないが、逆に、行方不明になる本もあるだろう。)どうしようか。

ついでに、マウスも新しくした。ワイヤレスだと、電池を入れる。マウス全体の重心の位置と、センサーの位置と、微妙に関係して使い勝手がかわる。少し使いやすくなったかな、という感じ。

つかれたのでしばらく休みたいがそうもしていられない。明日から授業開始である。

それにしても、トナーカートリッジを新しくするだけの費用で、新しいプリンタの本体が買えてしまう。時代の流れもここまでくると、気分的に、ついていけなくなりそうである。

當山日出夫(とうやまひでお)

じんもんこん2009覚書(5)2010-01-08

2010-01-08 當山日出夫

やっぱり、つづけることにする。パソコンがあたらしくなると、インストールしてあるエディタ類の設定が微妙に変わってしまうの、ついつい文章を書くのが億劫になる。ここは、一種のリハビリ的な意味で、つづきを書いていこう。

基本的にA会場の方にいたので、こちらしかわからない。そのなかで、第一日目の午後の発表で、気づいたことをいくつか記す。

Subversionを用いた仏典テキスト校訂支援システムの評価
福岡整さん(ほか)

なかなかいい発表だなとは思った。まず、画像データとテキストデータとの連係。そして、それを、どのように管理するか(本文校訂)の問題。この場合、やはり問題になるのは「校訂」ということの定義だろう。

単純化していえば、
・本文のミスをただす(→正しい本文に書き換える)
・肯定者(研究者)の本文解釈として字句を改める
この二つの方向がある。

そして、ややこしいことは、これが、それほど単純に分けられないことである。特に、専門家が、その専門の目で、文献を読むときには、これらが重なる中間的なグレーゾーンというべき部分がある。極端な場合、本文のミスとわかっていても、あえてそれを残す、原文のかたちを残す、というような、ひねくれたこともあったりする。(正しいと判断すべき本文は注記などで言及することになるが。)

ここまでいかないにしても、この発表の「評価」のところが少し気になったので質問してみた。単純に、多数決で、何人の人の意見が一致した/しない、ではなくて、専門家の目で見てどう判断できるのか、その部分を考慮すべきではないか、と。

この観点では、次の発表

デジタル画像資料を利用した文献研究に必要な環境について
岡本隆明さん

人文学であつかう文献資料について「テキスト的要素」と「イメージ的要素」にわけて考えるという基本の発想。これは、昨年の秋の訓点語学会の発表でも発言のあったこと。この基本的なことが、実は、コンピュータで、文献資料をあつかえるようになって、あらためて自覚すべきことになってきた、といえるのではないか。そして、このことに、いままで、さほど気にせずにきたのではないか、と反省点の指摘になる。

コンピュータで、かなり自由に画像データとテキストデータとあつかえる。そして、テキストデータについては、文字コードとそれで表示される文字の「かたち」が問題になる。テキスト的要素といっても、純粋にそれだけをとりだして考えようとすると、かなり深いところの文字論に踏み込まざるをえない。

この発表はそこまでつっこんだ内容のものではなかったが、基本的問題点の指摘としては、非常に重要な点をあきらかにしていると思う。ここからさきは、テキストとは何であるか、という議論になる。今後の課題とすべきだろう。

その他に、「幕末維新期人口史料」分析プログラムの開発、など興味深い発表もあったが、長くなるので、これぐらいにしておこう。一日目がおわって、懇親会に出発である。

當山日出夫(とうやまひでお)

じんもんこん2009覚書(6)2010-01-09

2010-01-09 當山日出夫

懇親会は、大学キャンパス内ではなく、市内のホテル。参加者は、バスで移動。これが、また、たいへんだった。

まず、バスがどこで待っていてくれるか、どうやら事前に確認がとれていなかったらしく、少し待つ。これは、まあ、よくあること(だろうと、思っておくことにする。)

その後、バスに乗ってから、ホテルまでの道が大渋滞。どうやら、事故か何かがあったらしい。結局、予定より、一時間以上遅れて、バスはホテルの前を通過。通過、というのは、路上ではとめられないので、通り過ぎて駅の方まで行って、もどってこないと、左折でホテル内の敷地に入れない。

なんだかんだとあったようであるが、ともあれ、予定を大幅におくれて懇親会。で、例によって、いつもとおおむね同じようなメンバーで、ということになる。これはいいことなのかどうなのか。確かに、仲間同士のコミュニケーションは強くなるが、新しい人もどんどんと参加してほしい。とは思うものの、なかなか、うまくいかないように思える。

学会、研究会、といっても、最終的には人間の社会のいとなみである。人と人との関係が常にそこにある。無理に懇親会に出なさいということもないだろう。集まりたい人が集まる、これが積み重なると、どうしても、そこに人と人との関係の積み重なりが生まれてしまう。

だが、まあ、無事に懇親会終了。そして、その後が寒かった。駅まであるいて、京都方面行きの電車を待っている時間、ホームでとっても寒かった。京都駅で、簡単に二次会。どういうわけだか、文字関係の非常に中身の煮詰まった話しをする会になってしまった。

無事に家まで近鉄で帰れたが、京都駅が10時半をすぎると、列車の連絡がわるくなる。結局、我が家に帰ったのは12時近くになってしまていた。これで、翌日は、朝一番から、BKCのキャンパスである。これは、ちょっとつらかった、というのが、いまから思うところである。

というわけで、翌日につづく。

當山日出夫(とうやまひでお)

じんもんこん2009覚書(7)2010-01-10

2010-01-10 當山日出夫

二日目の朝である。土曜日なので、バスの運行が通常と違うはず。なるべく早い目に家を出る。といっても、子供が学校に行くのと一緒に家をでるから、そう極端にというこでもないが。駅(南草津)で、どのバスに乗れば、どうなるかわからないまま、「立命館大学」と書いてある、手頃なバスに乗車してしまう。まあ、どうにか、遅刻はしないですんだ。

A会場であるので、テキスト・コーパス関係。

非常によくわかる発表と、はっきり言ってよくわからない(悪いという意味ではない)のとが、混じっている。こちらの専門がいくら日本語学であるからといって、最近の、言語処理技術について精通しているというわけではない。いやむしろ逆で、さっぱりわからないといった方が素直だろう。

興味深かったのは、共通教養日本語均衡コーパス(CCCJ)の概念(芝野耕司さん)。日本の学校教科書を使ったコーパスの事例紹介。ちょうど、勉誠出版から『新常用漢字表の文字論』が刊行された直後だったので、発表のなかで、私のことに何度か言及していただいたのは光栄であるが、なんとなく、きはずかしくもある(^^;)

それにしても「均衡コーパス」とは何であるのか、これはこれで非常に興味深い。日本の学校教科書において、「国語」の教科書語彙が、かなり特殊である、これは理解できる。だが、そのことと、他の教科の教科書の語彙が基本語彙であるかどうかとなると、かなり難しいような気がする。(このあたり、私の誤解であるのかとも思うが。)

そもそも均衡コーパスというものは、何なんだろう、と思う。国立国語研究所の「KOTONOHA」も、現代日本語の均衡コーパスと称している。個人的には、いきなり「均衡コーパス」といくよりも、特定の分野でコーパスを作っていって、それが、た~くさん集まってその結果として、均衡コーパスができあがっていく、という方向ではないだろうかと思う。

が、これとは別に、教科書のコーパスは、これはこれとして、非常に興味深いものがある。今後、多方面で利用されることに期待したい。

それから、大蔵経における多言語対訳コーパスの構築(永崎研宣さん)。永崎さんの発表は何度も聴いているので、これまでの「続編」として聴く。この発表でもそうであるが、実際に大蔵経データベースを構築運用しているということの強みがある。単に技術一辺倒ではなく、実際の人文学研究者が何を求めているのかが、反映された発表であったと記憶する。

ともあれ、前日の夜が遅かったので、朝一番からずっと発表をきいているというのも、正直いって、ややつらい。が、ここは、発表を聴きながらいろいろと考えることになる。

當山日出夫(とうやまひでお)

ARG409号の感想2010-01-11

2010-01-11 當山日出夫

ひさしぶりに『ARG』の感想を書く。ずっと読んではいたし、授業でもとりあげてはきたのだが、このブログに書く余裕がなかなか無かった。

今回、紹介されているなかで興味深いものは、まず、国立民族学博物館の近代日本の身装電子年表、であろう。この「年表」で、種々の文化的事象などを整理して見せる方法は、人間文化研究機構などでもこころみがなされている。そのなかにあって、実用的に使える段階のものとして、また、テキスト・画像を組み合わせたものとして、これは、非常に興味深い。

http://htq.minpaku.ac.jp/databases/mcd/nenpyou/

ちなみに、今から100年前のお正月を見てみると、それはそれなりに面白いものがある。不況であり職人の衣服はまずしくなっている、大相撲には東宮殿下がおでましになり、と。

それともうひとつは、アジア歴史資料センターのコンサイス版である。

http://www.jacar.go.jp/concisejacar/index00.html


おおむね、専門的なデータベースは、専門家が知っていればいい、専門家だけがつかえればいと、そっけないものが多い。単に、検索語をいれるだけ、というようなもの。いったいどんなものがあるのか、事前に知っている人間でないと、なにも手がだせない。紙の本をパラパラめくってみて、ざっとこんな本なんだなとわかる、これが電子的な媒体、特に、データベースには欠如している。

いきなり、人名と地名、年代を入力してくださいと、表示されても、とまどうばかりである。

この観点から見て、アジ歴とはこんな史料(資料)を、こんなふうに見せていますよ、そして、より詳しくは、専門の検索画面から……と、手引きになっている。このようなこころみは、他のデータベース公開でも、是非ともマネしてもらいたいものである。

ところで、岡本さんも、キンドルを使ってみているようである。図書館が、紙の本だけのところから、電子的なコンテンツをあつかうようになるとどうなるだろうか。山中湖情報創造館のこころみが紹介されている。これには、非常に興味深いものがある。

2010年1月9日
http://d.hatena.ne.jp/arg/20100109/1263001124

山中湖情報創造館のことは、今後も注目していきたいと思う。

當山日出夫(とうやまひでお)

『ネットがあれば履歴書はいらない』2010-01-22

2010-01-22 當山日出夫

佐々木俊尚.『ネットがあれば履歴書はいらない-ウェブ時代のセルフブランディング術-』(宝島社新書).宝島社.2010

宝島社
http://tkj.jp/book/?cd=01748501

これを読んでいろいろ考えることが多い。特に、学生に教える立場としては、である。

まず、この本は、「エゴサーチ」のことからはじまる。WEBで自分自身を検索してみることである。そして、その結果が、その人間の「価値」を決める要因の一つになる。

たとえば、次のような指摘。

>>>>>

いまのインターネットの流れからすると、プライバシーというのは将来的にはいまよりもずっとゆるやかになり、個人の情報をよりオープンにすることによって、利便性を高めるという方向におそらくは進んでいくということは間違いないだろう。

(中略)

インターネット世界と現実は全然異なるとみている人もいるだろう。インターネット上のことを”あちら側の世界”と例える人もいるが、その操作をしている人は確実に現実に存在している。そもそもインターネットが別世界だと考えるような時代は終わっている。

p.55

<<<<<

また、

>>>>>

情報を発信することでのリターンは他人からは見えず、本人にしか感じることはできない。怖いと感じ何もしない人と、怖さはゼロではないが、そこに面白さ見いだして情報を発信する人との間に気が付けば、天地の差がつく。

p.72

<<<<<

そして、さりげなく書いてあるが、この指摘は重要である。「これは新たな格差社会なのかもしれない(p.116)」。

ま、ここにこのように書いている私個人のことはおいておこう。考えるのは、学生に、授業の実習としてWEB上で何かをやらせること、その問題である。大学の授業の一部として、たとえば、ブログを作る、Twitterで発言する、などやらせるとして、基本的には、名前を出して、ということになるだろう。(私個人は、この主義でいる。その方が、より「安全」であると考えるから。)

学生個人が特定できるような形でなければ、教師の側としては、評価できない。誰が書いたかわからないでは困ってしまう。ここは、どうしても、名前を出して、ということになる。

だが、これは、同時に、学生が自分の履歴書を常に書いていくようなものである。もうすでに行われているだろう……就職などに際して、学生が、WEBでどのような発言をしているかリサーチするということ、が。

この本、前半は、上述のようなWEB上での情報発信と社会とのコミュニケーションの話し。後半は、それをつかいこなすためのツールとしての、Twitterや、その効果的利用法についてのノウハウ。

いますでにわれわれは、WEBとリアルとが融合した社会のなかにいるのだ、このようなことを考えさせる本である。もはや逃避することはできないだろう。それを理解したうえで、どのような距離をおくか、自分で選択する(それができる人とできない人にわかれるのかもしれないが)、になるのかと思う。

當山日出夫(とうやまひでお)