タグ

ブックマーク / komachi.hatenablog.com (38)

  • 最先端の研究は大学院生とポスドクが担っている - 武蔵野日記

    第6回最先端NLP勉強会のため、東大郷キャンパスに行く。最近あまり論文を読めていないので、こういう機会はありがたい。 最初の担当だったが、なんとか終える。自分が紹介したのは Baroni et al., Don't count, predict! A systematic comparison of context-counting vs. context-predicting semantic vectors, ACL 2014. という論文。スライド(質疑込み)はこちらで公開している。 事の発端はnlp blog の読書会の記録を読み、たとえば word2vec のような深層学習を用いた最近の分散表現の研究は、意味処理のこれまでの蓄積の上に成り立っているように見えない、と疑問に思っていたのは自分だけじゃなかった、と安心したからである。そして、実際これまでの研究と比較しても、分散表現に

    最先端の研究は大学院生とポスドクが担っている - 武蔵野日記
  • 「哲学入門」は哲学の教科書ではない - 武蔵野日記

    朝に起きて SEG 時代から懇意にしている世界史の増谷先生のお宅へ。先日来たとき傘を忘れてしまったのだが、放送大学の授業も終わったそうで6月の上旬から12月までご夫婦で海外に行かれるとのことで、日を発つ前に、というわけで伺ったのである。 傘だけでなく娘に絵までいただき、恐縮する。自分たちも定年後に夫婦で(子どもを置いて)どこかに出かけたりできるかな? 昼から午後にかけては芝刈りをしたり、うつうつらしたりして過ごす。なぜだか金曜日からやたらと眠いのである。週の後半は疲れが溜まるのだろうか。6月は1日も休日がないので、どこかで自主的に半休にする平日を作ったりしないと、体力が持たないかもしれない。 予備校時代から大学院に行くまでは、講義形式で先生の話を聞いたり教科書や入門書を読んだりするのが勉強だと思っていた(そのため授業によっては話を聞くくらいなら自分でを読んだ方が速いと思っていたもの

  • パターン認識の人手最強伝説 - 武蔵野日記

    午前中は機械学習の基礎勉強会の最終回。1冊全部通読できてよかった。 昼から研究室配属の説明会。誰がうちの研究室を希望してくれるかな? 連続して学部3年生のプロジェクト実習の最終発表会。学生たちが各自チームで半年間研究した成果を発表してくれた。トップバッターの女の子4人組チームがとてもプレゼンがうまく、出した数値も段違いによく、他のチームのほぼダブルスコアで、最優秀発表賞を受賞していた。ポスター発表を聞くと、ポスターにはアルゴリズムが前面に書かれていたが、質問してみたところアルゴリズムが問題なのではなく、驚くべき手法によってその精度が達成されていた。 タスクは顔画像認識で、人物の映る画像が与えられたとき、それが誰か当てるという課題。ただ、この実験は設定が特殊で、画像に手を加えてもいいことになっていた。そこで、彼女たちは数千枚の写真画像からなる訓練事例とテスト事例の両方で、まず顔の中心点を決め

    パターン認識の人手最強伝説 - 武蔵野日記
  • 全てプログラミングで解決しなければならないという思い込みを捨てる - 武蔵野日記

    2時間しか眠れなかったが、なんとか起きて出勤。朝はアルゴリズム演習の授業。先日台風で休講になった日の補講なのだが、3限以降は休講にならなかったので、1-2限だけの補講のはずなのに、1限の授業が休講だったので、実質自分の授業のためだけに学校に来ている人がほとんどだったらしい……(出席しなくてよいし、課題を出すだけでもよいと伝えていたところ、1/3の学生が出席。) 今年度の講義はこれで全部終了。来年は今年度やる予定でウォーミングアップに3回かかってしまったためにできなかったデータ構造と、ソートアルゴリズムをカバーしたいところである。 お昼は学内のお仕事に関係する説明会。どういう分担か事前に知らされていなかったのだが、1時間半あった説明のうち、自分に関するところは1分くらいで、残りは全部自分に関係ないところだった。説明会のあと、コース内の先生方に自分がやる予定の仕事がどういうものか教えていただい

    全てプログラミングで解決しなければならないという思い込みを捨てる - 武蔵野日記
  • 10年あとも続く研究テーマを考える - 武蔵野日記

    今日も午前中は IBISML チュートリアル。ちなみに IBISML チュートリアル・IBIS 2013 ワークショップについては [twitter:@shima__shima] さんのIBIS2013メモがとても詳しいので、詳細はそちらを参照されたい。 チュートリアルの2日目は鹿島さんによるクラウドソーシングの話で、他のチュートリアルと違い、教科書に載っていないような内容で、大変楽しめた。ただ、やっぱりモデルをがんばって得られるゲインより、タスクの発注の仕方や implicit な教師情報の獲得方法を工夫した方が効果が高いように見える(これはクラウドソーシングに限らず、どんな手法でも似たようなものだと思うが)。 このあたりは昨年人工知能学会論文賞を受賞した以下の論文が、サーベイ部分も充実していてよいと思う。松先生がしきりに「EMでよくなるのは興味深いが、いったいどれくらいよくなるのか」

    10年あとも続く研究テーマを考える - 武蔵野日記
  • 何を固定して何を変えたらいいか分かればスムーズに研究が進む - 武蔵野日記

    朝、例のごとくを職場まで車で送り、そのまま出勤。メール処理と事務書類。 昼から大学院のプロジェクト実習に関する打ち合わせ。結局KDD Cup 2013 の論文の著者推定タスク を数チームに分かれてやってもらうことになりそう。 自分の研究室の学生なら研究的なテーマをやって論文を書くところまでやってもらうのがいいと思うのだが、所属する研究室のプロジェクト実習は選択できないという制約があるために、研究から論文を書くところを取り除いた実習にしなければならないのである(学期末にはポスター発表をする)。そうすると、勢い実装メインの実習にせざるを得ず、研究につながる部分といえば(system description 程度しか書かないということなので)サーベイをどこまでやれるかという問題に帰着する。そのため、できるだけ実装しやすく、サーベイの負荷も少ないテーマにしようとして、ここに落ち着いたのであった。

    何を固定して何を変えたらいいか分かればスムーズに研究が進む - 武蔵野日記
  • エンジニアかジャーナリストか立場によって受け取り方も違う - 武蔵野日記

    思い立って iPad mini を iOS 7 にしてみる。動作がもっさりしていることを除けば、悪くない。日本語入力がさらによくなったように思う。あと、入力が引っかかってアプリケーションが突然落ちるということがなくなったのは大きい(引っかかっても待っていたら元に戻る)。ただ、iPhone はまだアップデートするのは怖いかも……。 先日屋で購入した「グーグル秘録」を読み終える。(リンク先は、最近出た文庫のほうで、リビューは単行の方を参照のこと) グーグル秘録 (文春文庫) 作者: ケンオーレッタ,Ken Auletta,土方奈美出版社/メーカー: 文藝春秋発売日: 2013/09/03メディア: ペーパーバックこの商品を含むブログ (11件) を見るAmazon のリビューの評価は悪くないが、個人的には読後感がよろしくない。技術的に正確ではないことが書かれている(筆者はジャーナリストな

    エンジニアかジャーナリストか立場によって受け取り方も違う - 武蔵野日記
  • みんなで自然言語処理の最先端を共有する - 武蔵野日記

    最先端NLP勉強会参加のために朝から中央線。今回の会場は九十九里浜で、駅としては茂原という駅なのだが、在来線を乗り継いで行く方法と新宿から特急に乗る方法、そして東京駅から高速バスに乗る方法、という3通りあり、資料が準備できておらず車内で完成させるため、新宿から特急に乗るルートを選択したのである。 車中は快適で、さくっと資料を作成して M 林さんに送付。送ったあともさらに手を加えたけど……。 茂原駅でみんなと合流し、合宿の宿へ。他にも大学生が合宿をしているらしく、賑やかな感じ。 勉強会の概要と感想はdaiti-mさんが書かれていたり、[twitter:@conditional]さんが最先端NLP勉強会に参加してきましたで書いてくださっているので、自分の紹介した論文だけ説明する。自分が紹介したのは Tim Van de Cruys, Thierry Poibeau and Anna Korho

    みんなで自然言語処理の最先端を共有する - 武蔵野日記
  • 公立大学准教授の初年度の年俸 - 武蔵野日記

    雷雨との予報だったのでびびっていたが、結局全然雨は降らなかった。 2人で出かける予定だったのだが、車で目的地に到着すると両親が立っていたり……。休みが取れたから来たそうなのだが、そもそも来る前提じゃなかったから、日程の変更があっても伝える気なかったし、スケジュールが変わっていたらどうするつもりだったのだろう。あと、内容的に母は来ない方がよいと思ってあえて声をかけなかったのだが、母も来ていてなんだかとても申し訳ない感じになる (実際、とても退屈していたそぶりである)。 夕方、印鑑を作るために武蔵境駅前に行く。自分は奈良に行く前に銀行印と実印を作った記憶があるのだが、なんで作ったんだっけな? と思い起こすと、ne.jp のドメインを取得するときに印鑑証明が必要なので実印を作り、そのついでに (セットで頼むと若干安かったので) 銀行印も作った、という流れであったのを思い出した。銀行印自体はすぐは

    公立大学准教授の初年度の年俸 - 武蔵野日記
  • 仕事のボトルネックを発見して解消するとスムーズに流れるようになる - 武蔵野日記

    首都大に来てから3ヶ月が経過。だいたい海外にインターンシップに行くときも、最初の1ヶ月が大変で、次の1ヶ月はハードワークで、最後の1ヶ月は「帰りたくない」と思いながら迎えたりするわけだが、今の自分もちょうど同じで、そろそろ楽しくなってきたところである。 東京に来るということで、もっとも阻害要因だったのは振り返ってみると通勤環境で、車通勤にしてからは通勤も苦ではなくなった。松先生は京都から奈良まで最初車で通勤していて、ぎっくり腰になったので車通勤を止めて奈良に引っ越したそうだが、自分もぎっくり腰になるまでは車通勤かなと思っている。以前ぎっくり腰になってしばらく大変なことになったので、あの思いはもうしたくないし……。(でも車だと18kmしかないので、腰痛になるほどではないような?) 大学に関しては研究費が使えなかった最初の1ヶ月、そして2ヶ月は相当つらかった。学生がいるのに学生に計算機を買う

    仕事のボトルネックを発見して解消するとスムーズに流れるようになる - 武蔵野日記
  • 基礎勉強から研究につなげるためのステップ - 武蔵野日記

    朝、書類の準備。午後紹介する論文を印刷したり。ようやくコピー機の使い方が分かってくる。印刷と同時にホッチキスもしてくれたりして便利。しかし人数に比べてコピー機の台数が少ない気がする。コピー機は事務の人たちと共用だし、リソグラフ (講義資料をコピーできるもの) に至っては学生とも共用だし、教員はそれぞれプリンタや複合機を個人的に購入しているから必要ない、ということなのだろうか。 昼は学部4年生を対象に、大学院の筆記試験免除の説明会。 筆記試験免除制度について説明すると、首都大のシステムデザイン研究科の情報通信システム分野では、一定の基準を満たした学生に対し、英語数学の試験を免除し、面接だけで合否を判定する制度があるのである。英語の筆記試験と言っても、TOEFLあるいはTOEICのスコアを提出するだけなので、スコアがある人にとっては、実質的に数学が免除になるだけであるが……(そして、複数の大

    基礎勉強から研究につなげるためのステップ - 武蔵野日記
  • 分野が変われば常識も変わる - 武蔵野日記

    2月中旬以降毎週末、部屋探し・契約・引っ越しと、京都と東京の往復で全く休みが取れていなかったので、今日もちょっと研究室に行くつもりだったが、疲労が蓄積していてダウン。動けないので1週間さぼっていた日記を更新したりする。 夕方、腰の血行をよくしようと思ってスーパー銭湯に行ったのだが、入れ違いで夜 [twitter:@shirayu] くんたちもスーパー銭湯と夕に誘ってくれた。みんな出張のあとは温泉でゆっくりしようと思うのは同じらしい (笑) 自分はまだ回数券が4枚あるのだが、奈良にいる間毎日行ってようやく使い切る感じか…… (余ったら誰かにあげればいいだけだけど)。 の博士論文がやっと合格したらしい。博士後期課程への進学は自分と同時だったので、かれこれ6年がかりである。長い道のりであった。博士論文に取り組んだ時期と結婚してからの時期が完全に重なっているので、我々の結婚生活も博士論文を抜き

    分野が変われば常識も変わる - 武蔵野日記
  • 失敗こそ成功につながるヒント - 武蔵野日記

    朝、1電車を乗り逃がして20分待つ。そのせいかなにか分からないが、[twitter:@miorisagara] さんとすれ違う。関係者が多い地域だからか、数週間に1回くらいは電車で通勤途中の人に会う気がする。あるいは、電車が混んでいないので見つけやすい、というのもあるように思う。 午前中、共同研究の電話会議。議論が尽きないネタではあるが、そろそろゴールを定めて走り出したほうがいいかもしれない。いろいろできそうなだけに発散しやすいというのは、嬉しい話でもあるのだが……。この研究に限らないが、4月〆切の国際会議に投稿するなら、自分の80%くらいの時間をそれに割くことが可能な状況で、1月中にはサーベイが完了してタスクの設定や手法の方針が立っていてコーパスの前処理等が済んでいて、2月中にはあれこれ実装して結果を見つつ共著者と議論しながら論文に載せるべき実験結果が揃っている、というくらいが標準的な

  • NLP2013 チュートリアル: どのように解くかではなく何を解くかが重要 - 武蔵野日記

    今日から言語処理学会年次大会である。年に1度の全国大会で、日にいる言語処理の関係者 (大学の人、企業の人、学生等々) が一堂に会するイベントである。参加人数もかなり多い (600人以上) ので、お祭り的なイベントなのであるが…… 朝から新幹線で移動なので、車内で朝ご飯をべていたら、口の中に違和感。金属がご飯の中に入っている感じ。機械の部品の破片か弾丸かなにかが入っているのか? と思って恐る恐る口から出してみたら、小さな金属の塊が出てくる。こんなものが入っているなんてけしからん!と一瞬思ったが、形としてもなにかの部品のようにも思えないし、おかしいな、と思ってお茶を飲んだら、歯の詰め物が取れていたのだ、と分かる。こんなときに、なんで〜……。 幸いなことに、朝早く名古屋に着く便に乗っていたので、名古屋大学近くの歯医者さんを検索し、着いたら速攻で行って事情を話し、治療してもらう。詰め物がそのま

    NLP2013 チュートリアル: どのように解くかではなく何を解くかが重要 - 武蔵野日記
  • 10年かけて研究者を育てる - 武蔵野日記

    午前中、Kevin さんが gcc-4.5 を使いたいというので少し深追い。いろいろ調べてみると、Ubuntu の multilib 周りが問題のようである。新しいサーバ群は基的に使いたいツールは自分でコンパイルして入れる、というような運用になるらしいが、逆に言うと開発ライブラリ・ヘッダー系は基的なものが一通り入っていないと、相当面倒な気がする……。(Gentoo だとライブラリはデフォルトで全部入るのだが、Debian や Ubuntu では細かく分かれているので、ライブラリをちゃんと入れないといけない) 昼は日語学習者の支援についてメールでやりとり。Lang-8 の2012年度の最新データも見積もりをお願いする。昨年度のデータも購入しているが、貴重なリソースとして研究で大変お世話になっているので、微力ながら支援できたらな、と……。使ってみると分かるが、Lang-8 データは相当使

    10年かけて研究者を育てる - 武蔵野日記
  • 教育とは学びたいという気持ちを呼び起こすこと - 武蔵野日記

    夜にお風呂を沸かして入ることと、終電まで粘らず終電の1前で帰るようにしたせいか、ドライアイは段々解消しつつある。ちょっと無理すると一気に身体のどこかに症状が出てくるのは、歳なんだろう。 午前中、Skype ミーティング。この1週間進捗がないので申し訳なく、代わりにいろいろ話をする。なんでこんなに時間がないのだろうか。〆切前だからだろうが……。 午後は hayato-n くんの研究のために、Kevin さんと3人でアノテーターさんのところにお伺いする。楽天のレビューのデータにChaKi.NETで係り受けや並列構造にアノテーションをされているらしいので、ウェブテキストにアノテーションする勘所を教わろうと思ったのである。そして分かった驚愕の事実は、実際 hayato-n くんがやろうとしているタグ付けは松先生自ら直々にタグ付けされていたところで、最近はお忙しいらしくちょっと滞っているらしいが

    教育とは学びたいという気持ちを呼び起こすこと - 武蔵野日記
  • 学生のうちにチームワークを身につける - 武蔵野日記

    連日の終電で体力が削られていて、ちょっと寝坊してしまう。添削待ちの原稿が5。 午前中はよく分からないが研究紹介を頼まれたので、2時間身動きが取れなかった。5分でいいと言われていたのだが、この時期に2時間取られるのはしんどい。 昼、共著者と原稿・研究についてディスカッション。結局コミュニケーションをちゃんと取っているか、物理的に会える距離にいるならちゃんと顔を合わせて話しているか、といったことが大事なんだと思う。先日 [twitter:@yuchang] が言っていたようだが、企業の人が学生に求めるのは、チームワークであって、スタンドプレーでもいい学生と違うことであるそうだ。 確かに大事なのはちゃんと話を聞くこと、事前に相談すること、仕事を任したり任されたりできること、できないときはできないと報告すること、どういうスケジュールでどうなっているのか連絡すること、そういう基的なことができるか

    学生のうちにチームワークを身につける - 武蔵野日記
  • 入力メソッドの始まりと終わり - 武蔵野日記

    午前中、久しぶりに暖かくいい天気になったので、急いで洗濯。昨日までは寒かったからなぁ。 お昼、[twitter:@tkng] さんが桃山御陵前まで来てくれたので、一緒に 饂の神 でうどん。最近のお仕事のお話を聞いたりだとか、自分の近況報告をしたりだとか。「おいしかったけど、小町さんがここに住んでいなかったらもう来ないだろうなぁ」とおっしゃっていて、確かにそうかも……と思ったりする。(自分自身、引っ越したらわざわざ桃山御陵前で降りることはほとんどなさそうに思うし) 出町柳で[twitter:@shirayu] くんと合流し、京大へ。ウェブ業界、特にソーシャルゲームってどうなの?というお話をしたりする。奈良にいるとこういう話に疎くなるので、ときどき東京に行ったり話を聞いたりすると勉強になる。 だいたいみなさん時間通り集まったので、第4回関西入力メソッドワークショップを開催。毎年年末に「IM飲み

    入力メソッドの始まりと終わり - 武蔵野日記
  • COLING 2012 本会議3日目: 一つの研究テーマを掘り下げるとおもしろくなる - 武蔵野日記

    とうとう番。[twitter:@tomo_wb]くんのポスター発表である。ポスターなので、口頭発表と違い複数人で説明ができるので、共著者で分担するのである。招待講演の直後だったせいか、ちょうど会議の真ん中の日で一番参加者が多かったせいか、とても人が集まる。 英作文の校正会社の人が強い興味を示してくれたことと、JoelさんとMarkusさんが聞きにきてくれたのが記憶に残る。みんなが注目してくれて、この仕事の次に研究を進めてくれるような、そういう研究をするのは、形容し難い複雑な気持ちになる。一言で言えば嬉しい、という言葉なのだが、一緒に、あるいは交互に先頭を走っているような、信頼感を感じるし、満足感のようにも思えるが、この研究は中間報告で、色んな人に「この次の研究も興味がある、ぜひ続けてほしい」とも言われ、自分たちもそうしたい、とも思うのである。 Joel さんのコメントは、学習者の誤り別に

    COLING 2012 本会議3日目: 一つの研究テーマを掘り下げるとおもしろくなる - 武蔵野日記
  • 情報科学若手の会2012: 若いうちに失敗した方がいいのではなく、若いうちから失敗した方がいいだけだ。 - 武蔵野日記

    朝6時に起きて、浜辺を散歩。情報科学若手の会自体は2泊3日なのだが、自分は今回2日目で帰ってしまうので、今日砂浜のほうまで行っておきたかったのである。 旅館から砂浜までは直線距離にして30mほどで、休み時間に行けるくらいの距離であるが、アルコールを抜こうと思って (最近はビールを500ml以上飲むと翌日に響く) アクエリアスを買ってぶらぶらしていると、同じく散歩に来られていた [twitter:@katchamans] さんとお会いしたので、二三悩み事の相談に乗ってもらう。結局、何が正解なんてものはなくて、いつまでもそのときどきに目の前にあることで悩み続ける、ってことなんだと思う。 朝ご飯をべてから部屋に戻り、[twitter:@nishio] さん、[twitter:@overlast] さん、[twitter:@air] さんたちといろいろ雑談。潜在意識で働きたくないと思っていたら、

    情報科学若手の会2012: 若いうちに失敗した方がいいのではなく、若いうちから失敗した方がいいだけだ。 - 武蔵野日記