タグ

2013年10月17日のブックマーク (3件)

  • 中国語スペル誤り訂正の新展開 - 武蔵野日記

    朝起きて「ごちそうさん」を見ていたら「あまちゃん」の総集編がやっていたので思わず見てしまった。前半部分をほとんど見ていなかった(東京編が始まる直前、海女カフェができるあたりから見始めた)ので、こういう話だったのか、といまさらながら思ったりする。 今日は IJCNLP 2013 というアジア圏での最大級の自然言語処理の国際会議に参加するため、名古屋国際会議場に来ている。もっとも、会議は火曜日から木曜日で、月曜日の今日はチュートリアルとワークショップがあるのだが、自分は水曜日に講義と研究会、木曜日に勉強会と実習があるので、今日だけの参加である(厳密には火曜日も参加できなくはないのだが、火曜日は水曜日の授業の準備をしないといけないので……)。 ワークショップは SIGHAN という中国語処理に関するワークショップに参加。ワークショップ自体それなりに歴史があるものなのだが、毎年 SIGHAN B

    中国語スペル誤り訂正の新展開 - 武蔵野日記
    mitsuse
    mitsuse 2013/10/17
    "評価は自然言語処理でよく使われる precision, recall, F ではなく、false alarm rate を基本的に使うという話だが、..."
  • ぼくは研究ができない - 武蔵野日記

    24時間ごとに抗生剤を飲まなければならないということで、なんとか這って起きてきてご飯をべ、抗生剤を飲む。どうやらまた乾燥で喉をやられたようで、トローチをなめたり。目の奥が痛いので、風邪なんだろうなぁと思い、家でじっと過ごす。 そうはいっても家の中のことはしないといけないわけで、洗い物をしたり、新書と文庫のスキャンをしたり。ひとまず家にある新書と文庫は全部スキャンできたようだ。2日間で120冊。1時間12冊として10時間。前見積もったときは20時間以上だったので、悪くない。しかし、この自炊 (裁断+スキャン) という行為は質的に不毛で、やっていると徒労感しか感じないので、他の人にお勧めできるようなものではないと思う (が多くてやらざるを得ない人を除く)。 最初に見かけたのはどなた経由か分からないが、最終的には [twitter:@kur] さんがツイートしていたのがきっかけで、僕は自分

    ぼくは研究ができない - 武蔵野日記
    mitsuse
    mitsuse 2013/10/17
    "若いと変なプライドが邪魔することが多々あるのだが、そういうプライドはできるだけ若いうちに捨てておいたほうがいいように思う。"
  • 何を固定して何を変えたらいいか分かればスムーズに研究が進む - 武蔵野日記

    朝、例のごとくを職場まで車で送り、そのまま出勤。メール処理と事務書類。 昼から大学院のプロジェクト実習に関する打ち合わせ。結局KDD Cup 2013 の論文の著者推定タスク を数チームに分かれてやってもらうことになりそう。 自分の研究室の学生なら研究的なテーマをやって論文を書くところまでやってもらうのがいいと思うのだが、所属する研究室のプロジェクト実習は選択できないという制約があるために、研究から論文を書くところを取り除いた実習にしなければならないのである(学期末にはポスター発表をする)。そうすると、勢い実装メインの実習にせざるを得ず、研究につながる部分といえば(system description 程度しか書かないということなので)サーベイをどこまでやれるかという問題に帰着する。そのため、できるだけ実装しやすく、サーベイの負荷も少ないテーマにしようとして、ここに落ち着いたのであった。

    何を固定して何を変えたらいいか分かればスムーズに研究が進む - 武蔵野日記