タグ

ブックマーク / komachi.hatenablog.com (76)

  • 常に学生の上を行くのは教員の義務 - 武蔵野日記

    久しぶりの前後に出張がない週末なので、家から出ないでゆっくり休む。 先日購入しておいた「スプートニクの落とし子たち」 スプートニクの落とし子たち 作者: 今野浩出版社/メーカー: 毎日新聞社発売日: 2010/06/19メディア: 単行購入: 1人 クリック: 37回この商品を含むブログ (19件) を見るを読み終わる。筆者の東大の理科1類に進学した同期のその後を、高校生時代から定年退職近くまでずっと追った自伝 (他人の話がほとんどなので他伝か?) 的ドキュメンタリー。前半部分は昔話として「そういう時代だったのかぁ」とそれなりに楽しめる。どのようにして助教授・教授になる・なったかとか、筑波や東工大の教員組織のドロドロした話とか。こういうを読むと筑波の教員の方々はつくづく大変なのだろうと思ってしまう。あと、学際領域だと、工学系でも (博士の) 学生に研究を手伝ってもらうことが組織によって

    常に学生の上を行くのは教員の義務 - 武蔵野日記
  • 研究者人生で楽しい時期は一度しか来ない - 武蔵野日記

    住居が決まっているので久しぶりにのんびりした週末。3週間ぶりにコーヒーを入れてみたり。 午前中にアリさんマークの引越社が見積書を持ってきてもらうという話だったので、待つ間荷造り。マンガの多さに心が折れそう。一般書籍も500冊あったが、マンガもそれくらいあると思われる。マンガも裁断・スキャンしたいのだが、これはどう見ても引っ越しまでに終わらないので断念。 結局見積書を最終的に持ってきてくれたのは18時過ぎ。まあ、おかげで荷造りが多少捗ったけど……。なにが問題だったかというと、複写式の見積書なのだが、お客様控えを担当の方が持って帰って行き、自分のところに残っているのが来向こうにないといけなかった書類だったという。自分もこういうミスやりそうだし、担当の方にちょっと同情。 404 Blog Not Found で紹介されていた「ハカセといふ生き物」を買って読んでみる。 研究者マンガ「ハカセといふ

    研究者人生で楽しい時期は一度しか来ない - 武蔵野日記
  • 初心者向けではない入門書にも需要がある - 武蔵野日記

    最近コタツの中で寝てしまうことがよくあり、気がついたら朝の6時だったりして、非常によろしくない。(寝直すけど) コタツで寝ると眠気は取れるが疲れは取れないので、コタツの中で寝たくないのだが……。父がよくコタツで寝ているのを子どものころはうざったく思っていたが、気持ちが分かる年頃になってきてしまったということだろうか。 昼前、一番下の弟に年賀状を書かなかったので、電話でもしてやるか、と思って電話したところ、夫婦で実家に挨拶に来ていたところだそうで、ついでに両親にも挨拶しておく (両親には年賀状を送ったのだけど)。我々夫婦はほとんど両親に会っていない気がするのだが、そもそも単身赴任だと一緒に行動しにくいし、たまに会える時間があったらわざわざ他の人を交えて会いたいとも思わないので、一緒に暮らすことのできる来年度以降かな……。 午後、ブルーバックスで出ていた「物理数学の直観的方法」を読む。 物理数

    初心者向けではない入門書にも需要がある - 武蔵野日記
  • コーパスの前処理ではまるのはみんな一度は通る道 - 武蔵野日記

    朝一で歯医者へ。虫歯かな? と思って予約して行ったのだが、どうやら虫歯ではなく歯が欠けていたらしい。タイでおいしいものをべ過ぎたか……。エビとかカニとか含め、魚介類の料理も有名だったので、カニとかがんばってべたのが悪かったか…… 昼から学生発表の司会。みんなに質問してもらうのは難しいな〜。結局自分が質問することになってしまうのだが、聞いている人が質問したくなるような感じに司会するのはどうすればいいんだろう。(司会の力でどうにかなるものではないのかもしれないが) 午後は機械翻訳勉強会で、takatomo-k くんの論文紹介。 Andrew Finch and Eiichiro Sumita. A Bayesian Model of Bilingual Segmentation for Transliteration. IWSLT 2010. を紹介してくれる。先日のタイで開催された国際会

    コーパスの前処理ではまるのはみんな一度は通る道 - 武蔵野日記
  • 戦うウェブエンジニアの三種の神器 - 武蔵野日記

    午前中ミーティングの予定を入れていたが、今日は [twitter:@mizuno_takaaki] さんに 学内の招待講演をお願いしていて、[twitter:@tettyun] くんとご飯をべるため高の原まで迎えにいくことを忘れていたので、急遽ミーティングを夕方に延期。すまんかった。 ランチは@mizuno_takaakiさんに新卒採用担当の Kさん を交えて DeNA のお話とか、@tettsyun くんを交えてバイドゥのお話とか、いろいろお伺いする。DeNA は新卒今年40人ほど採用なようだが、30人弱がエンジニアで、新卒研修直後に海外 (サンフランシスコ、Twitter オフィス側) 勤務する人もいたり (海外ゲーム会社を買収したりしたので)、海外で働きたい人にとってはチャンスが豊富な職場だということ。最初から海外で働くこと狙いで入社するのも歓迎 (保証はできないが海外で働きたい

    戦うウェブエンジニアの三種の神器 - 武蔵野日記
  • IBM モデル1とその先 - 武蔵野日記

    朝、腰に違和感を感じる。やはりアメリカ出張が……。 午前中、NTT でミーティング。データを見つつ議論。いろいろデータを見ると悩ましいケースがありますな〜。なんとかなるか……? 昼、お2人の方々からそれぞれ独立に「あれ、小町さんだと気がつきませんでした。学生みたいですね」と言われる。7月1日から NAIST も節電で電灯を消して暗くなっているので、自分もクールビズにしようと思い立ち、普段は土日にするような格好をしているのだが、若く見えるほうが嬉しい年頃。20歳のころは複数の先生方から「小町は年齢を偽っている。きみは当は40歳くらいだろう」と言われたりしたものだが、いまは逆転したのだろうか (笑) 午後、機械翻訳勉強会。そろそろ終わりに近づいているが、 Statistical Machine Translation 作者: Philipp Koehn出版社/メーカー: Cambridge

    IBM モデル1とその先 - 武蔵野日記
  • ACL HLT 2011 初日: 人間のクイズ王に勝った IBM Watson を支える技術 - 武蔵野日記

    今日は自然言語処理に関する世界最大の会議、ACL の会議初日。ホテル開催なので朝簡単につまめるものは会場にあるのでは、と思って行ったら案の定ベーグルとかコーヒーとかフルーツがあったので、ベーグルをべる。けっこういける。 オープニングでは今回の会議の統計を話していたが、1,146の投稿(うち646がフルペーパー、残りの512がショートペーパー)、292(うち164がフルペーパー、128がショートペーパー)が採択とのこと。フルペーパー(2段組8ページ+参考文献)とショートペーパー(2段組4ページ+参考文献)ともに採択率は25%。自然言語処理では採択率が40%くらいの国際会議が多いので、25%はやはり難関会議である。 招待講演はアメリカのクイズ番組で人間に勝ったことで有名になったIBM Watson を支える技術について。ネタがあまりよく分からずいまいち楽しめなかったが (細かい

    ACL HLT 2011 初日: 人間のクイズ王に勝った IBM Watson を支える技術 - 武蔵野日記
  • はじめてで迷ったときの論文の読み方 - 武蔵野日記

    昨晩勉強会のあと20分くらい takuo-h くんと話したのだが、授業や勉強会が多過ぎてキャパシティを超えているとのこと、たぶん松研の M1 はみんなそうではないかな。自分も M1 の間は平日は毎日3時間睡眠で予習・復習・勉強会そしてバイトと大変だったし、大体みんな忙しいのである。 NAIST の M1 自体がそもそも授業の負荷が高いのに加え、松研は特に勉強会の数が多いので、全部出ていると相当しんどいはず。とはいえ、出ていると耳学問でいろいろと学ぶこともあるので、可能な限り出るとあとあと「限界に近かったけど出ていてよかった」と思うこともあるだろうし、そのあたりは自分の体力との相談かと…… そういえば以前書いた松研究室の手引きという文書を発掘した。修士の2年間しか書いていないので、博士の3年間も書きたいのだが、結婚して夫婦で1年間奈良で暮らしたりしていて、あまり他の人の参考にならないの

    はじめてで迷ったときの論文の読み方 - 武蔵野日記
  • 自然言語処理における双対分解に関するチュートリアル - 武蔵野日記

    結局飛行機の中で寝すぎてホテルに着いてから朝まで作業していて、翌日眠い。 朝の便でスーツケースが届くので、午前中にはホテルに届けます、という話だったので、ホテルで待機。10時になって、そろそろ店が開くので最悪買いに行くか、と思って荷物をまとめて出かけようとしたら、フロントからスーツケースが届いたとの電話。助かった。 朝ご飯もべず待っていたので、Pioneer Place というポートランド的なショッピングセンターまで歩いて行って、地下のフードコートでべる。ブティックみたいな店にはほとんど人がいなくて、日曜日だから11時開店らしく、休みだからかな? と思ったら、地下の Apple Store にはうじゃうじゃ人がいて(当に異常なくらい、日の通勤電車並み?)、iPhone 4 やら iPad やらをみなさん見ていて、びっくり。 オレゴンはアメリカの州で唯一消費税がない州で、品物が安く買

    自然言語処理における双対分解に関するチュートリアル - 武蔵野日記
  • ACL HLT 2011 最終日: 自然言語理解の研究がおもしろい - 武蔵野日記

    ACL HLT 2011 の3日目の最初は認知言語学に関するHow do the languages we speak shape the ways we think? という基調講演。時間、性(ドイツ語やフランス語で女性名詞や男性名詞がある)、因果関係に関していろんな言語でどのように表現され、それが人間の認識にどのように影響を与えているか、というトーク。おもしろい。 たとえば、時間軸の過去と現在を前後と言う(思う)か上下と言うかは言語によって違い、たとえば日語では「6月下旬」は6月の先の時間(未来)を指すが、英語では上下でなく前後で表現したり(たとえば "back in '90s" のように過去を指す)、アイマラ語は前後でも過去が前で未来が後ろだったりとか。 それで、言語が認識に影響を与えるかの調査の実験として、英語中国語のバイリンガルに対し、「月曜日と火曜日がどのように位置関係にな

    ACL HLT 2011 最終日: 自然言語理解の研究がおもしろい - 武蔵野日記
  • CoNLL-2011 初日: 人間の言語理解に自然言語処理が貢献できること - 生駒日記

    ACL の会議は終了したので会議後のワークショップの日。自分は Conference on Computational Natural Language Learning ( CoNLL-2011 ) という会議に参加。 当は他のワークショップもぶらぶらと出ておもしろそうなのがあったら聞いてみようかと思っていたのだが、どうも今回は会場がどこも狭いようで、登録した人のぶんしか座席がないようなので、大人しく最初から CoNLL に参加。 CoNLL は今回15回目で、それなりに伝統もある会議なのだが、今回は投稿数82件で採択数はそれぞれ口頭が13件、ポスターが14件、合わせると33%で、中堅どころの会議になっている。もう一つ元々は同じくらいの規模だった EMNLP (機械学習や統計を用いた自然言語処理の国際会議) という会議は今回600件以上の投稿数で、今年の採択率は24%だったらしいのだ

    CoNLL-2011 初日: 人間の言語理解に自然言語処理が貢献できること - 生駒日記
  • CoNLL-2011 最終日: ゲームと自然言語処理の意外な関係 - 武蔵野日記

    会議の全日程を通じて今日が最終日。いや〜、もうへとへと…… 午前中は CoNLL の共通タスクの報告会。今年は共参照(coreference)といって、たとえば 東日大震災からの復興策を検討する政府の復興構想会議(議長・五百旗頭真防衛大学校長)は25日、「復興への提言」を決定し、菅直人首相に答申した。津波で被害を受けた地域の復興に向けて土地の利用手続きを一化することや、一定区域に「特区」を設け、規制緩和や税制優遇を盛り込んだ。復興費を賄う財源として、臨時増税の検討を求めた。首相が退陣表明するなど政局は混迷しており、実現は曲折が予想される。 といった文章があったとき、「菅直人首相」と「(...)首相(が退陣表明...)」が同じ実体を指している、ということを解析するタスクであり、日語では NAIST テキストコーパスでも共参照の情報を付与している。 さて、今回の共通タスクは@jhirwi

    CoNLL-2011 最終日: ゲームと自然言語処理の意外な関係 - 武蔵野日記
  • 生涯ホワイトボードを前にして、みんなでわいわい書き込んで議論していたい - 武蔵野日記

    午前中、ミーティングの予定だったがキャンセル。急遽勉強会に参加。聞いたことない話ばかりだったのでおもしろかった。 情報処理学会全国大会の招待状的なものをもらったと思うのだが、どこかに行ってしまった……。ばたばたと探してみたが見つからず、午後@takahi_iさんと京都に移動。ちょっと乗る予定だった新幹線を送らせたので iPhone で変更を試みるが、Opera Mini でもだめ。仕方ないので MacBook Air + Pocket Wifi で変更しようとするも、Pocket Wifi が DHCP を配ってくれないので接続できず。なんで〜 結局 takahi-i さんに e-mobile を借りて接続したのだが「もう変更できる時間を過ぎたので変更できません」と言われてしまう。むむ、無念…… 結局同じ日の新幹線であれば自由席には乗れるようなので(こうなることを見越して IC 早得ではな

    生涯ホワイトボードを前にして、みんなでわいわい書き込んで議論していたい - 武蔵野日記
  • 自然言語処理ツールの開発を成功に導くには - 武蔵野日記

    CICLing 最終日は Chris Manning さんの基調講演でスタート。Manning さんといえば自然言語処理業界のバイブル的教科書である FSNLP Foundations of Statistical Natural Language Processing (The MIT Press) 作者: Christopher Manning,Hinrich Schuetze出版社/メーカー: The MIT Press発売日: 1999/05/28メディア: ハードカバー購入: 3人 クリック: 169回この商品を含むブログ (18件) を見るやIIRことIntroduction to Information Retrieval 作者: Christopher D. Manning,Prabhakar Raghavan,Hinrich Schuetze出版社/メーカー: Cambr

    自然言語処理ツールの開発を成功に導くには - 武蔵野日記
  • ユーザが待っている研究は、ユーザのことがいちばん大事 - 武蔵野日記

    午前中、メールを書いたりなど。申請していた研究費、ひとつ内定(250万)。助教になってから3連敗だったので、採択されて嬉しい。研究スタート支援が通っていたら出さなかっただろうが、落ちたからこそ他のところで拾ってもらえたのだなぁ。これでタグづけの作業者さんに来年度も継続してもらえる目処がついたので、よかったよかった。NAIST男女共同参画室のメンバーお2人も、最先端・次世代研究開発支援プログラムに採択されたそうで、厳しい環境でもくさらず前に進み続ける勇気をみんなからもらっている。こういう場所で研究させてもらえるのは、ありがたいことである。 午後、研究室の修士の人たちの修論発表x3。1コマで3人まで話せるので、同じコマに入っていてくれたら1.5時間で終わるのだが、なぜか今日は3コマに分散していて、結局4時間坐りっぱなしでひどい腰痛に……。 自分の研究室の人の発表が終わったら出て行く人も多く、自

    ユーザが待っている研究は、ユーザのことがいちばん大事 - 武蔵野日記
  • 文学部は永遠に不滅です - 武蔵野日記

    午前中、ACL や ICML の開催地や開催時期を調べたり。今年はアメリカ西海岸だな〜。 Paper bidding というものを初めて体験。自分で「この論文は読みたい」「この論文は利害関係があるので査読できない」とかいうのを申請し、それに基づいて査読が割り当てられる、というもの。文は割当が決まるまで読めないが、投稿された全論文のタイトルとアブストラクトが読める。この中から通る論文と通らない論文が分かれているのだろうが、世の中のトレンドがどういうところにあるのか分かってなるほどな、と思ったり。 しかし Paper bidding では「最低でも50読みたい論文をマークすること」だって。50もないよ〜、と思いながらがんばってマーク。アブストラクトに数百は目を通しただろうか、けっこう時間がかかった……。 昼、修論発表会練習x3。15時から別の研究室の学生たちの修論発表会の司会に当たって

    文学部は永遠に不滅です - 武蔵野日記
  • 研究費の審査側は科学哲学の理論を学んでいる - 武蔵野日記

    昼から機械翻訳勉強会。論文紹介と進捗報告。katsuhiko-h くんが Zhifei Li, Jason Eisner and Sanjeev Khudanpur. Variational Decoding for Statistical Machine Translation. ACL-IJCNLP 2009. を紹介してくれた。ベストペーパーの選考にも残ったペーパーらしい。 アイデアは、同じ出力になるルールをまとめたいが、それは計算量が爆発するのでこれまでもっとも確率の高いルールで近似(Viterbi)されてきたところを、ちゃんと全部のルールを考慮しなおかつ計算量も爆発しない方法を考案した、というもの。計算量の爆発を抑えるため、直接ルールの展開を全部計算するのではなく、求めたい複雑なモデルといま手元にある(計算可能な)モデルの KL divergence を最小化する問題にする、とい

    研究費の審査側は科学哲学の理論を学んでいる - 武蔵野日記
  • 「日本語の研究というのは日本語教育に役立たなければ意味がない」 - 武蔵野日記

    半徹夜で水曜日のスライドを仕上げる。もうちょっと練りたいのだが、キーボードを叩き始めるとあまり推敲できない。やはり口頭発表にせよ論文にせよ、ノート(メモ)を前に手で書いているときがいちばんストーリーを作るのに役立つし、その段階が一番楽しい。(PowerPoint で作り始めたり LaTeX でコンパイルしたりしてしまうとそれっぽく見えてしまうのがよくない) 昼から @tomo_wbくんの中間発表。なにやらトラブルがあったようで予定が大幅に遅れていたが、順番を入れ替えて先に終わっていたりしたのでなくてよかった。 午後は意味談話解析勉強会。今日は teruaki-o くんが Dmitriy Genzel, Jakob Uszkoreit, Franz Och. "Poetic" Statistical Machine Translation: Rhyme and Meter. EMNLP 20

    「日本語の研究というのは日本語教育に役立たなければ意味がない」 - 武蔵野日記
  • いくら相手のためだと思っていても、押し付けてはいけない - 武蔵野日記

    午前中、大阪大学の留学生センターで日語を教えてらっしゃる先生が、研究で使う茶筌のインストールを手伝ってほしい、というので masakazu-i くんとお手伝い。 実はこちらの先生がマシンを買い替える (OS をアップグレードする) 度に「ChaSen が動かなくなりました、助けてください」と連絡があってお手伝いしているのだが、前回も MeCab を入れようとして「MeCab と ChaSen では出力形式が違うので困るのです」と結局 ChaSen を入れることになった、という経緯があったため、今回も ChaSen かなぁ、と腹をくくっていた。 MeCab に詳しい人は「あれ、mecab には出力形式で -Ochasen とすれば chasen 形式にできるんじゃないの?」と思うかもしれないが、先方が使っていた Excel マクロで利用する形式と微妙に出力形式が違うので、mecabrc を

    いくら相手のためだと思っていても、押し付けてはいけない - 武蔵野日記
  • 広島でお好み焼きを食べる1日 - 武蔵野日記

    ひかりレールスターにて新大阪から広島へ。今日は情報処理学会第199回自然言語処理研究会なのである。 ひかりレールスターは指定席が普通のグリーン車用の席と同じなので、腰には楽かと思ったのだが、人が多くて疲れる。新大阪から広島は1時間半だったのが救い。来週月曜日を休みにすると連休になるので人が多いのだろうか? 広島バスセンターでバスを待っている間にお好み焼きべてみる。五エ門 広島バスセンター・アクア店というところ。確かにこれはおいしいかも〜 広島市立大に来たのは初めてだが、キャンパスはきれいだし、山の中腹で風光明媚だし、これはいいところだなぁ。市内にもバスで15分というロケーションもよい。高校生のとき東広島(新幹線で1駅離れている)にある広島大学を受験しに来たが、あそこは NAIST よりも辺鄙な気がする。大学院ならともかく、学部生があの環境に閉じ込められるのはちょっと気の毒かも。 研究会

    広島でお好み焼きを食べる1日 - 武蔵野日記