タグ

ブックマーク / komachi.hatenablog.com (25)

  • 批判的に論文を読む訓練 - 武蔵野日記

    朝5時に起きてお仕事。朝が段々寒くなってきた。末端冷え性なので、冬の早朝はつらい……。 午前中は論文紹介で、今期から論文を紹介する人の他に「クリティーク」という人を指名して、論文を紹介する人と同様に論文を読み込んできて、批判・批評する、という役割を担当してもらうことにした。提案手法のやり方以外にどんな方法が考えられてどういう利点があるかとか、こういう先行研究が抜けているだとか、そういうことを指摘・議論するための人である。論文を題材にディベートする、というような感じだろうか。 どうやらこの「クリティーク」制度、看護学では一般的なゼミの形式として広く行われているものらしいが、他の分野ではあまり導入されていないようである。自分もから「クリティーク」の存在を聞いて、これはおもしろい、一同試してみよう、とずっと思っていて、松研ではついぞ導入する機会がなかったので、今回が初である。 ちなみに普通ク

    批判的に論文を読む訓練 - 武蔵野日記
  • 日本語のストップワードのリストを求めて - 武蔵野日記

    日は大学院入試の2日目で、博士後期課程の試験である。昨日の博士前期課程の入試で疲労困憊し、今日も一日中朝からいろいろあることが分かっていたし、娘は今日が産まれて満3ヶ月で2回目の予防接種に行く日なので、朝の散歩はスキップさせてもらう。(と書くと、スキップで散歩した、というようにも読めるが、当然そんなわけはない) 午前中は10時に研究室に行き、朝のミーティングをする。それぞれ自分で夏休みの過ごし方、研究の方向性などが決まってきて、いい感じ。じっくり考えることも研究には必要なのだが、そもそも最初のうちは「下手の考え休むに似たり」なので、手を動かせば数時間でできるようなことは、深く考えず手を動かした方がよい(繰り返していくうちに手が速くなるし、そもそも繰り返さなくてよいように自動化するプログラムを書いたりするようになる)。 そういうわけでなんだかんだとお仕事をする。口頭試問の10分前になっても

    日本語のストップワードのリストを求めて - 武蔵野日記
  • 深層学習についてこの夏勉強してみたくなった - 武蔵野日記

    午前2時半に起きて授業の資料を作成。育児支援休暇で1回授業を休講にしたので、その補講があるのだった。 今回いちばんホラーな点は、2限(10:30スタート)に授業があるのに当日の午前2時半で資料が1ページもできていないことで、しかも今回全く新規の内容を話す回にしていたことであった。最近あまり夢を見なくなったのだが、数カ月に1回見る悪夢は、翌日にいくつか授業をしないといけないのに、準備が全く終わっておらず、残り時間を考えると絶対全部間に合わない、というものである。それくらい、授業の準備というものにはプレッシャーがある。(90分、全く準備なしに、教えなければならない内容が決まっている授業を教えるのは難しい) とはいうものの、なんとか4時間くらいで40ページ弱のスライドを作成し、一安心。事前に頭の中では考えていたので、全く準備がないわけではなかったのも幸いしたが、こういう綱渡りは何度もやりたくない

    深層学習についてこの夏勉強してみたくなった - 武蔵野日記
  • 自然言語処理の独習に向かない教科書 - 武蔵野日記

    午前中は共同研究のSkypeミーティング、なのだがこちらの音声が送れないという謎の不具合で20分ほどロス。前回までとお互いハードウェアもソフトウェアも変えていないはずなのだが……。こちらを再起動してSkypeを最新版に更新したらつなげるようになった。謎。 昼過ぎに会計処理。使い切らないといけない予算は全部消化したのだが、新年度の学生数が確定したら必要な機材を揃えておかないと。 夕方は研究室で機械翻訳の話をしたり。先日届いた「機械翻訳」を渡したりする。出版直後は品薄だったようだが、今は普通に買える。 機械翻訳 (自然言語処理シリーズ) 作者: 渡辺太郎,今村賢治,賀沢秀人,Graham Neubig,中澤敏明,奥村学出版社/メーカー: コロナ社発売日: 2014/01/21メディア: 単行この商品を含むブログ (7件) を見るまだ詳しく読んでいないが、チラ見した範囲では相当よく書けているの

    自然言語処理の独習に向かない教科書 - 武蔵野日記
    tnal
    tnal 2014/03/26
  • パターン認識の人手最強伝説 - 武蔵野日記

    午前中は機械学習の基礎勉強会の最終回。1冊全部通読できてよかった。 昼から研究室配属の説明会。誰がうちの研究室を希望してくれるかな? 連続して学部3年生のプロジェクト実習の最終発表会。学生たちが各自チームで半年間研究した成果を発表してくれた。トップバッターの女の子4人組チームがとてもプレゼンがうまく、出した数値も段違いによく、他のチームのほぼダブルスコアで、最優秀発表賞を受賞していた。ポスター発表を聞くと、ポスターにはアルゴリズムが前面に書かれていたが、質問してみたところアルゴリズムが問題なのではなく、驚くべき手法によってその精度が達成されていた。 タスクは顔画像認識で、人物の映る画像が与えられたとき、それが誰か当てるという課題。ただ、この実験は設定が特殊で、画像に手を加えてもいいことになっていた。そこで、彼女たちは数千枚の写真画像からなる訓練事例とテスト事例の両方で、まず顔の中心点を決め

    パターン認識の人手最強伝説 - 武蔵野日記
  • 日本語で読める自然言語処理の参考書まとめ - 武蔵野日記

    第5回入力メソッドワークショップのために京都へ。元々はオープンソース界隈の入力メソッド開発者が中心になって年に1回集まる(同窓)会だったのだが、ここ数年は大学で入力メソッドのレイヤーの研究をしている人や実際に MS, Apple, Google 等入力メソッドの開発に関係している人が中心になってきている。入力メソッドを現在開発していなくても、過去に作っていた人もいらっしゃるので、いろいろとおもしろいお話が聞ける。 自分は去年までは奈良・京都からの参加なので近かったが、今年から東京に引っ越したので、朝起きて品川経由で京都まで。7時40分の便だったが、満席でびっくりした。そうか、世の中的には今日が帰省のピークなのか。 米原で雪のため少し遅れたが、10分遅れで京都に着いたら晴れていた。ワークショップ開催まで時間があったので、NAIST の [twitter:@tom_shibata] さんと近鉄

    日本語で読める自然言語処理の参考書まとめ - 武蔵野日記
  • 自然言語処理の入門的な授業の構成 - 武蔵野日記

    来年度、大学院生(とやる気のある学部生)を対象とした自然言語処理の授業をする予定で、シラバスを考えているところである。形態素解析から構文解析、そして意味解析につながるオーソドックスなスタイル(必ずしも機械学習を出さなくてもよい)でやるか、あるいは機械学習を前面に出してやるか(Teaching (intro, grad) NLP 参照)、悩んだのだが、そういえば来年度は人文系の人も含めた交換留学生対象の授業(同一内容だが英語で授業)もやることを思い出し、それなら後者は難しいか……。 自分自身人文系出身なので他人事ではなく、人文系で数学に苦手意識があると、かけ算が2回以上含まれる数式はダメで、かつ割り算が1回でも含まれる数式はダメで、cosやlogが含まれる数式はそもそも意味を理解することができない(そのため、意味を考えず単なる文字列として考えるので、かえって割り算を含む数式よりよいかもしれな

    自然言語処理の入門的な授業の構成 - 武蔵野日記
  • 正規表現を学ぶタイミング - 武蔵野日記

    地元のクリニックに電話して、インフルエンザの予防接種に行ってくる。自分の人生でインフルエンザの予防接種を受けたのは、大学受験で浪人した年だけである。さすがに浪人した年だけは、インフルエンザで1日寝込むだけでそれまでの努力を棒に振りたくはなかったので……。(これまで34年間インフルエンザにかかったこともなかったのだが、今年初めてインフルエンザにかかったようなので、用心するに越したことはない) 注射を打ってから家に帰ってきて安静にする。来年の授業の準備で、オートマトンと形式言語について勉強する。大学にいるとゆっくりを読む時間がないのだが、家だとするするっと読めてよい(その代わり、キーボードを打たないといけないような仕事は、家ではまずできないのであるが……)。 NAIST では「オートマトン 言語理論 計算論 <1>」を使っていたのだが(リンク先は第2版、どうも第2版のほうがかなりよくなってい

    正規表現を学ぶタイミング - 武蔵野日記
  • 何を固定して何を変えたらいいか分かればスムーズに研究が進む - 武蔵野日記

    朝、例のごとくを職場まで車で送り、そのまま出勤。メール処理と事務書類。 昼から大学院のプロジェクト実習に関する打ち合わせ。結局KDD Cup 2013 の論文の著者推定タスク を数チームに分かれてやってもらうことになりそう。 自分の研究室の学生なら研究的なテーマをやって論文を書くところまでやってもらうのがいいと思うのだが、所属する研究室のプロジェクト実習は選択できないという制約があるために、研究から論文を書くところを取り除いた実習にしなければならないのである(学期末にはポスター発表をする)。そうすると、勢い実装メインの実習にせざるを得ず、研究につながる部分といえば(system description 程度しか書かないということなので)サーベイをどこまでやれるかという問題に帰着する。そのため、できるだけ実装しやすく、サーベイの負荷も少ないテーマにしようとして、ここに落ち着いたのであった。

    何を固定して何を変えたらいいか分かればスムーズに研究が進む - 武蔵野日記
  • ACL 2013 2日目: 意味解析と談話解析の融合 - 武蔵野日記

    会議は2日目だが、自分的には最終日。 朝は Industrial Lecture といって何かと思いきや、Facebook のグラフサーチの話である。けっこうおもしろい。個人的に興味深かったのは質疑応答で Ken Church が「どういう情報を集めているのか?どうやってユーザの意図を推測しているのか?」という質問をしていて、それに対して「検索クエリはもちろん、あらゆるログを集めている。ほとんどのクエリは単純なもので、複雑なものはロングテールなのだが、そういったロングテールのクエリログがあるからこそ高度な検索が可能になっているというのがおもしろいところ。あと、ユーザの意図を推定するのは難しくて、たとえばものすごい勢いで画像をスクロールしているのは、結果に満足して全部見たいと思ってスクロールしているのか、それとも満足いかないからスクロールしているのか分からなかったが、その後の行動を分析して

    ACL 2013 2日目: 意味解析と談話解析の融合 - 武蔵野日記
    tnal
    tnal 2013/08/20
  • ACL 2013 1日目: 言語処理も巨大になり研究分野が分化してきた - 武蔵野日記

    ACL会議初日。今回どうせクロージングも聞けないし、ということで基調講演から参加。去年の心理言語学の話はとても刺激的でおもしろかったのだが、今回はいまいち。そういえば9月2日には東大郷キャンパスで開催される ALAGIN・NLP 若手の会合同シンポジウムで、慶応大学の今井むつみ先生に「語彙習得における記号接地問題――子どもとL2学習者はどのように語彙システム を構築するのか」というお題で招待講演をお願いした ([twitter:@caesar_wanya]さん、ありがとう!) ので、興味のある方はお越しいただけるとよいかなと思う。参加費無料、入退場自由なので、言語処理に関係ある方もない方も、若手の方もそうでない方も、大歓迎である :) (写真は今回の会場となった The National Palace of Culture。中はとてつもなく巨大) さて、午前中、あまりセッションを動かな

    ACL 2013 1日目: 言語処理も巨大になり研究分野が分化してきた - 武蔵野日記
    tnal
    tnal 2013/08/20
  • ACL 2013 チュートリアル: 暗号解読と自然言語処理の不思議な関係 - 武蔵野日記

    朝起きて、夜は気温が下がるのかと思ったらそんなに下がらなかったのでがっかり。あまり寝つきがよくない気もするし……。 朝ご飯に行くと、どうやらDeaflympicの人たちと間違えられたらしく、日人チームの席を指定される。[twitter:@keiskS] くんがいたので、そちらには混ざらず2人でべたけど……。Deaflympic は聾者のためのオリンピックで、国際手話を使って会話するらしい。手を使って盛んに会話する人たちの中にいると、それが分からない自分はむしろマイノリティのような感じになるのだが、こういう感じを聾者の人たちがいつも味わっているのかと思うと、こうやって同じ境遇の人たちで集まって大々的なイベントができるというのは有意義なことだと思う。 さて、昨晩無線がつながらなかった件についてレセプションで聞いてみると、有線LANのケーブルをくれた。そういうことではないのだが、Mac 用の

    ACL 2013 チュートリアル: 暗号解読と自然言語処理の不思議な関係 - 武蔵野日記
    tnal
    tnal 2013/08/14
  • 研究のスタートをスムーズにすると後々効果が出てくる - 武蔵野日記

    午前中、2時間くらいひたすらメール処理。メール処理は大学でなくてもできるので、せっかく大学にいる時間を有意義に使いたいという気持ちもあるのだが、家に仕事を持ち帰りたくないので、だいたい毎日午前中にメールの返事を集中して行い、午後は固めて時間をかけないとできないことをしている感じ (必ずしも集中力が必要な仕事というわけではない)。 昼から研究会。今日から学生のひとりひとりの論文紹介と研究テーマの報告 (7月以降やりたいことの表明)。論文紹介では感情極性に関する論文を説明してくれたので、 評価値表現辞書 Semantic Orientation of Words 日語評価極性辞書 Polar Phrase Dictionary Automatically Constructed Polarity-tagged Corpus などを紹介。今年も hirotsugu-e くんが感情推定に関する研

    研究のスタートをスムーズにすると後々効果が出てくる - 武蔵野日記
  • NLP2013 3日目: 実際のアプリケーションを想定して研究する - 武蔵野日記

    朝、地下鉄で[twitter:@cocha123t]さんと合流。今回はご家族でいらしているようで、昨日[twitter:@naoinui]さんともポスターのとき一瞬だけすれ違ったのであるが、@naoinui さんとはメル友ならぬ絵はがき友 (文通というのだろうか……?) なのである。松研どうなるんでしょうかという話が出たが、どうなるのか自分もよく分からない……。いずれにせよ松研は松研としてまだまだ続いていくと思うので、自分も遠くから見守りたいと思う。 9時からは情報抽出のセッションで、[twitter:@wk_kiyoshi] くんのレビュー文書からの省略された評価情報抽出に関する発表。 柏木潔, 小町守, 松裕治. レビュー文書からの省略された属性の推定を含めた意見情報抽出. NLP2013. 1分ほど発表時間がオーバーしてハラハラしたが、かなり質疑応答が活発で、よかった。セッシ

    NLP2013 3日目: 実際のアプリケーションを想定して研究する - 武蔵野日記
  • NLP2013 2日目: 研究者は集めたほうが相乗効果がある - 武蔵野日記

    朝、栄駅で [twitter:@yotarow] くんと遭遇。名古屋は交通案内が極めて不親切に感じる。案内通り進んでいくと最終的には到達できるのだが、目的地の50mくらい近くになると突然案内が消える (案内板はあるが、行きたいところ以外の行き先への案内しか書かれていない) ので、当にそこを直進していいのか確信が持てず、目的地の近くをうろうろしてしまうのである。地下鉄のホームでも、なぜかホームなのにあらゆる案内板が別の路線を示しておらず、違うホームに下りてしまったかと誤解してしまうのだが (よくよく壁を見ると書いてある)、名古屋の人は「いまいるところがどこか」という情報より「これからどこに行くか」という情報のほうが重要なのだろうか? 9時からのセッションは「評判・感情解析」で hirotsugu-e くんが複雑な感情の同時推定に関する発表。昨日みんなあんなにしこたま飲んでいたので人が少ない

    NLP2013 2日目: 研究者は集めたほうが相乗効果がある - 武蔵野日記
  • NLP2013 1日目: 言語処理は学部生の活躍がめざましい - 武蔵野日記

    泊まっているホテル、7Fに部屋があるのだが、目の前がオフィスでけっこう丸見えなので遮光カーテンをしていて、朝起きるのがつらい。遮光カーテンは真っ暗になるのはいいのだが、日光を浴びないと人間覚醒しないのである (あと眠くなってくる)。 お昼は誤り検出・訂正ワークショップのランチミーティング。集合場所がうまく伝わっていなかったようで、受付前で合流できず、現地で全員合流できたのだが、時間を20分近くロスしてしまい、結局今日も不完全燃焼。明日は若手の会のランチミーティングがあるので金曜日に続きをやることになったが、こういうの、なんとかならないものかなぁ。(携帯電話の連絡先を知っていたら電話するとよい、ということが今日分かったので、明日から実践する) 午後は hiroshi-t くんの Twitter における流言・デマの訂正に関する発表。 高橋弘志, 小町守, 松裕治. Twitterからの多様

    NLP2013 1日目: 言語処理は学部生の活躍がめざましい - 武蔵野日記
  • NLP2013 チュートリアル: どのように解くかではなく何を解くかが重要 - 武蔵野日記

    今日から言語処理学会年次大会である。年に1度の全国大会で、日にいる言語処理の関係者 (大学の人、企業の人、学生等々) が一堂に会するイベントである。参加人数もかなり多い (600人以上) ので、お祭り的なイベントなのであるが…… 朝から新幹線で移動なので、車内で朝ご飯をべていたら、口の中に違和感。金属がご飯の中に入っている感じ。機械の部品の破片か弾丸かなにかが入っているのか? と思って恐る恐る口から出してみたら、小さな金属の塊が出てくる。こんなものが入っているなんてけしからん!と一瞬思ったが、形としてもなにかの部品のようにも思えないし、おかしいな、と思ってお茶を飲んだら、歯の詰め物が取れていたのだ、と分かる。こんなときに、なんで〜……。 幸いなことに、朝早く名古屋に着く便に乗っていたので、名古屋大学近くの歯医者さんを検索し、着いたら速攻で行って事情を話し、治療してもらう。詰め物がそのま

    NLP2013 チュートリアル: どのように解くかではなく何を解くかが重要 - 武蔵野日記
  • 松本研の助教という仕事のpros and cons - 武蔵野日記

    ようやく修士論文のチェックに戻ってくる。午前中、午後合わせて2件コメント。合間に hiromi-o さんと今後の予定について話したりする。言語教育グループも、いろいろと変わりそうである。 実は昨日、松先生が自然言語処理のメーリングリストに松研の助教の公募を出していた。2月28日〆切。「デキ公募に見えるようにはしたくない」とおっしゃっていて、要件も割合一般的な感じで書かれている。ちなみに「Webデータマイニング、機械翻訳、言語教育」と3つ分野が上がっているのは、それぞれ今自分が関わっている「ソーシャルメディア解析勉強会、機械翻訳勉強会、言語教育勉強会」にそれぞれ対応していると思われる (機械翻訳勉強会は最近 [twitter:@kevinduh] さんと [twitter:@neubig] さんに任せっきりで、2ヶ月に1回くらいしか顔を出していないが……)。もっとも、これまでの研究グルー

    松本研の助教という仕事のpros and cons - 武蔵野日記
  • COLING 2012 本会議2日目: 連携するには距離感も重要 - 武蔵野日記

    朝、微妙な時間に起きたせいか、朝ご飯のとき誰も知り合いがおらず、不安感が漂う。出かける用意をしてロビーに降りると、知り合いが増えていたが、これから朝ご飯をべるところのようで (つまり招待講演はスルーするということか……)、出かけそうだった黒橋先生たちの autorickshaw に同乗させてもらう。 今回松先生をはじめ、日からはシニアな人がほとんど来ていない、というお話をお伺いし、確かにそうかも、と思ったりする。主力は助教〜ポスドクくらいの人で、あと同じくらい学生、そして准教授と教授クラスの人は合わせても片手〜両手で数えるくらいかもしれず。日以外からは教授クラスの人もたくさんいらしているのだが……。日から国際会議に行くとき、ほとんどの場合面倒くさいビザの申請はしなくてよいのだが、今回はビザの申請からして面倒だったので、そういうのを敬遠して、というのはあるかもしれない。(他の国の人

    COLING 2012 本会議2日目: 連携するには距離感も重要 - 武蔵野日記
  • COLING 2012 本会議1日目: 同じ問題に取り組んでいて話が通じるとうれしい - 武蔵野日記

    長旅の疲れを癒すため (ホテルで無線が有料だったせいでもあるが)、昨日は早く寝たのだが、朝の6時半に外から聞こえる謎の詠唱で起きる。10分くらい続いていたが、なんだったのだろうか……。6時半でもまだ外は真っ暗なのだが、日の出とともにやる儀式でもあるのだろうか。 [twitter:@keiskS]くんと合流して朝ご飯をべる。彼の論文は reserve paper といって、発表できるかどうか直前まで分からず、発表者が来ない no show のときに繰り上げで発表可能になるそうなのだが、可能性としては初日から繰り上げになる可能性があるので、徹夜でスライドを直していたそうだ。自分だったら頼まれるにしても前日までには連絡があるだろうから、とサボりそうだが、すごい……。 ホテルから会場までは直線距離にすると3kmくらいで、湖を横断する道を通ると歩いて行けるように見えるのだが、実際はその道は通行禁止

    COLING 2012 本会議1日目: 同じ問題に取り組んでいて話が通じるとうれしい - 武蔵野日記