タグ

ブックマーク / komachi.hatenablog.com (77)

  • 10年使われるコミュニケーションツールはない - 武蔵野日記

    朝5時から科研費の申請書を書く。今日が学内〆切なので、最後の追い込みである。研究のプログラムや研究費の申請書、原稿などはここ10年以上 Subversion で管理している(NAISTに入ったとき RCS から Subversion に切り替えたので正確には9年)のだが、最後コミットするのを忘れ、出勤したら1時間ほど手戻りがあった。もはや全部 Dropbox 上でやるのが最適な気もする(有料会員なので、1TBまでOKだし、履歴も辿れる)。 印刷して最後確認したら文字化けがあったのだが、時間もないのでそのままチェックに出す。フォントを埋め込んでいなかったようだが、強制的に埋め込む設定に以前していたのが失われているようだ。(去年は「画像として印刷」で場当たり的な対処をした気もするが……) 昼過ぎは SLP(自然言語処理の教科書)の輪読である。週に3回あるとしょっちゅう読んでいる気もするが、これ

    10年使われるコミュニケーションツールはない - 武蔵野日記
    yuiseki
    yuiseki 2014/10/31
  • Unix を使える学生は急速に減っている - 武蔵野日記

    午前3時から NLP(自然言語処理)若手の会シンポジウム・情報処理学会自然言語処理研究会関係の仕事を黙々とする。大学運営関係のお仕事は9月中旬までないので、いまのうちに溜まった仕事を片付け、9月の準備をしておき、10月以降に備えたい(授業が週3コマある)。 (2014-08-21 追記)タイトルだけ見て反応する人が多いので、よくあるコメントについて冒頭で説明しておく。 「最近の若い者はなっとらん」と言っているだけで、教育もしていないなら当然。→8月20日に追記したが、教員なので教育するのが仕事の一部であり、研究室に配属された学生は最初週20時間(1個2時間×10個)の勉強会に出てもらい、それぞれ合計すると演習を解いたりするのに週20時間かかるようなので、合計週40時間基礎勉強に使ってもらっている。(参考: 研究室の勉強会のスケジュール) 必要性がないとやらないのでは?→世の中の99%の人に

    Unix を使える学生は急速に減っている - 武蔵野日記
    yuiseki
    yuiseki 2014/08/21
    最近だれもが使っているリンゴマークのあれもUnixではないのか
  • ビッグデータに踊らされない - 武蔵野日記

    朝大学に来て昼の臨時コース会議の資料を印刷する。大学に滞在できる時間が限られているので、大学でないとできないことはを先に済ませておかないといけないのである。こうして人間は最適化されていくのだろうか…… 午前中は機械翻訳勉強会。言語モデルの章を途中まで読む。言語モデルといえばこれまでは「確率的言語モデル入門」が定番 言語と計算 (4) 確率的言語モデル 作者: 北研二,辻井潤一出版社/メーカー: 東京大学出版会発売日: 1999/11メディア: 単行購入: 10人 クリック: 91回この商品を含むブログ (44件) を見るで、いまもそれは変わっていないと思う。ただ、いろんなところで同じ話が出てくるのは、冗長と思う人もいるかもしれないが、3回くらい同じ内容を聞いてようやく定着する人も多いので、こういうふうにコンパクトにまとまっているのも価値があるだろう。後半に少しだけ進捗報告を聞く。 Mos

    ビッグデータに踊らされない - 武蔵野日記
    yuiseki
    yuiseki 2014/06/08
  • テストファーストの自然言語処理 - 武蔵野日記

    10日ぶりに出勤したので、朝はひたすら事務処理。娘を扶養に入れるため、戸籍謄を提出したりもする。これまで戸籍謄は1枚でよかったのだが、娘が産まれたことにより2枚になってしまったため、ScanSnap でスキャンできなくなってしまった(フラットヘッドのスキャナでスキャン)。 午前中は機械翻訳の勉強会。評価について学ぶ。コロナ社の機械翻訳を使って勉強しているのだが、2章に評価の話が来るのは思い切った配置である。無難には言語モデルや翻訳モデルの話をしてからおもむろに評価の話に行きそう。ただ、このも、最適化は末尾にあるので、そういう意味では最後にあるのかもしれない(評価の話と最適化の話は近くにあった方がいいような?)。 まあ、我々も「言語処理のための機械学習」は第1章を読んだあと、末尾の評価の章に飛んでから第2章に戻ってくるので、一度も評価について聞いたことがない人には、イントロの次に評価

    テストファーストの自然言語処理 - 武蔵野日記
    yuiseki
    yuiseki 2014/06/02
  • 全てプログラミングで解決しなければならないという思い込みを捨てる - 武蔵野日記

    2時間しか眠れなかったが、なんとか起きて出勤。朝はアルゴリズム演習の授業。先日台風で休講になった日の補講なのだが、3限以降は休講にならなかったので、1-2限だけの補講のはずなのに、1限の授業が休講だったので、実質自分の授業のためだけに学校に来ている人がほとんどだったらしい……(出席しなくてよいし、課題を出すだけでもよいと伝えていたところ、1/3の学生が出席。) 今年度の講義はこれで全部終了。来年は今年度やる予定でウォーミングアップに3回かかってしまったためにできなかったデータ構造と、ソートアルゴリズムをカバーしたいところである。 お昼は学内のお仕事に関係する説明会。どういう分担か事前に知らされていなかったのだが、1時間半あった説明のうち、自分に関するところは1分くらいで、残りは全部自分に関係ないところだった。説明会のあと、コース内の先生方に自分がやる予定の仕事がどういうものか教えていただい

    全てプログラミングで解決しなければならないという思い込みを捨てる - 武蔵野日記
  • 研究室公開に見る研究室間の研究テーマの類似性 - 武蔵野日記

    朝、メール処理してから機械学習の基礎勉強会。演習問題が1問残っていたのだが、無事終了。丁寧にやったので小一時間かかったが、これでみんな EM アルゴリズムは記憶に残ることだろう。結局、時間がかかって(少ししか進んでいないように見えて)も、ちゃんと身に付くことが大事なのである。 午後は学生の研究相談。実験もサーベイも中途半端に数ヶ月ごとに研究テーマを変えるのはよくないと思うのだが、研究テーマを選ぶに当たり、新規性がある研究の中で、世の中的に意義があり、あつ自分の能力で実行可能なタスクを選ぶ必要がある。 新規性がない開発案件では研究としては成立しない(注意してもらいたいのは、これがダメというわけではなく、研究にはならないだけで、開発的には非常に意義がある場合は往々にして存在する)し、自分がやりたいと思っても評価も不能・意義も不明であれば趣味でやれば、という話だし、自分の能力で実行不能(研究的に

    研究室公開に見る研究室間の研究テーマの類似性 - 武蔵野日記
    yuiseki
    yuiseki 2013/12/03
  • イラストがあるからといって初心者向けとは限らない - 武蔵野日記

    朝、例によってを車で職場まで送り、出勤。午前中は業務委託の仕事と共同研究の打ち合わせ。共同研究も、研究を分かっている(教員や学生のことを考えてくれる)かどうかで、やりやすさが全然違う。結局情報系の研究というのは、教員(教授、准教授)が手を動かしているわけではなく、学生(ポスドク)が手を動かしているのであって、一番大事なのは学生なのである。つまり、学生がいかに研究しやすい環境にするかが、研究の成否を決定していると言っても過言ではない。 この認識が共有できていない場合(あるいは、末端では共有できていても、上に伝言ゲームしていくうちに共有できなくなる場合)、けっこうしんどい共同研究になりがちなので、最初から引き受けないか、あるいは間に入って調整するのであるが、ケースバイケースなので、神経を使ったりする。そういう意味で、大学に理解がある共同研究先は大変貴重である。 昼過ぎから事務書類作成。コーパ

    イラストがあるからといって初心者向けとは限らない - 武蔵野日記
    yuiseki
    yuiseki 2013/10/03
  • みんなで自然言語処理の最先端を共有する - 武蔵野日記

    最先端NLP勉強会参加のために朝から中央線。今回の会場は九十九里浜で、駅としては茂原という駅なのだが、在来線を乗り継いで行く方法と新宿から特急に乗る方法、そして東京駅から高速バスに乗る方法、という3通りあり、資料が準備できておらず車内で完成させるため、新宿から特急に乗るルートを選択したのである。 車中は快適で、さくっと資料を作成して M 林さんに送付。送ったあともさらに手を加えたけど……。 茂原駅でみんなと合流し、合宿の宿へ。他にも大学生が合宿をしているらしく、賑やかな感じ。 勉強会の概要と感想はdaiti-mさんが書かれていたり、[twitter:@conditional]さんが最先端NLP勉強会に参加してきましたで書いてくださっているので、自分の紹介した論文だけ説明する。自分が紹介したのは Tim Van de Cruys, Thierry Poibeau and Anna Korho

    みんなで自然言語処理の最先端を共有する - 武蔵野日記
  • ACL 2013 1日目: 言語処理も巨大になり研究分野が分化してきた - 武蔵野日記

    ACL会議初日。今回どうせクロージングも聞けないし、ということで基調講演から参加。去年の心理言語学の話はとても刺激的でおもしろかったのだが、今回はいまいち。そういえば9月2日には東大郷キャンパスで開催される ALAGIN・NLP 若手の会合同シンポジウムで、慶応大学の今井むつみ先生に「語彙習得における記号接地問題――子どもとL2学習者はどのように語彙システム を構築するのか」というお題で招待講演をお願いした ([twitter:@caesar_wanya]さん、ありがとう!) ので、興味のある方はお越しいただけるとよいかなと思う。参加費無料、入退場自由なので、言語処理に関係ある方もない方も、若手の方もそうでない方も、大歓迎である :) (写真は今回の会場となった The National Palace of Culture。中はとてつもなく巨大) さて、午前中、あまりセッションを動かな

    ACL 2013 1日目: 言語処理も巨大になり研究分野が分化してきた - 武蔵野日記
  • ACL 2013 2日目: 意味解析と談話解析の融合 - 武蔵野日記

    会議は2日目だが、自分的には最終日。 朝は Industrial Lecture といって何かと思いきや、Facebook のグラフサーチの話である。けっこうおもしろい。個人的に興味深かったのは質疑応答で Ken Church が「どういう情報を集めているのか?どうやってユーザの意図を推測しているのか?」という質問をしていて、それに対して「検索クエリはもちろん、あらゆるログを集めている。ほとんどのクエリは単純なもので、複雑なものはロングテールなのだが、そういったロングテールのクエリログがあるからこそ高度な検索が可能になっているというのがおもしろいところ。あと、ユーザの意図を推定するのは難しくて、たとえばものすごい勢いで画像をスクロールしているのは、結果に満足して全部見たいと思ってスクロールしているのか、それとも満足いかないからスクロールしているのか分からなかったが、その後の行動を分析して

    ACL 2013 2日目: 意味解析と談話解析の融合 - 武蔵野日記
  • 首都大にウェブマイニングの研究グループを作る - 武蔵野日記

    来週いろいろと私用があるので、投票に行ったあと研究室に来て大学の仕事。書類がここにしかないので……(オンラインではできない系の仕事) 結局7時間たっぷりかかる。いろいろ勉強になった。確かにこれは着任してすぐやるとよい仕事なのかもしれない。最初はよく分からず大学運営の諸々の仕事に放り込まれて右往左往していたが、こうやって少しずつ慣れていくものなのかもしれない。 自分の研究室を修士で受験予定の学生 (既卒) から、他の大学院に受かったのでそちらに行きます、という連絡を丁寧にももらう。あまり研究室の人数が一気に増えすぎても大変かもしれないし、自然言語処理が特に研究したいというよりは、公立で学費が安いから首都大を希望した、ということなので快く送り出す。実際研究室に見学に来てくれたときも、正直にそう言ってくれていて、それはそれでかまわないのだが、入学したら外でアルバイトをしたりする余裕はないかもしれ

    首都大にウェブマイニングの研究グループを作る - 武蔵野日記
    yuiseki
    yuiseki 2013/07/27
  • 何がカバーされるかではなく何をディスカバーするか - 武蔵野日記

    日記を書く。車通勤になってから電車の中で書きだめすることができなくなったので、週末に書くくらいしか書く時間がないのである (Facebook や Twitter は細切れの時間でも書けるのだけど)。 先日購入したまま積ん読になっていた「知の逆転」を読み終える。おもしろかった。 知の逆転 (NHK出版新書) 作者: ジャレド・ダイアモンド,ノーム・チョムスキー,オリバー・サックス,マービン・ミンスキー,トム・レイトン,ジェームズ・ワトソン,吉成真由美出版社/メーカー: NHK出版発売日: 2012/12/06メディア: 新書購入: 2人 クリック: 111回この商品を含むブログ (81件) を見る読み始める前は、単なるミーハーなインタビュー集かと思って指が動かなかったのだが、読んでみるとどれもおもしろい。大体知っているような話なのだが、新書1冊でコンパクトに俯瞰できるのはすばらしい。(それ

    何がカバーされるかではなく何をディスカバーするか - 武蔵野日記
    yuiseki
    yuiseki 2013/07/01
  • Wikipedia の編集履歴のログマイニングによる前置詞誤り訂正 - 武蔵野日記

    週明けはやはりメールが溜まっていて返事を書いているだけであっという間に3時間。休みの日や夜にはメールの返事をしないことにしているのだが、やはり家でも仕事ができるようにして早めに帰ってきたほうがいいのだろうか。松先生も午前3時くらいまでメールの返事が届くし……。 お昼に共同研究の申請書の最終ミーティング。ちょっと関わる人が多く、どこを誰が書くのかよく分からないので、とりあえず自分のできることをしよう。 午後は言語教育勉強会。[twitter:@mitsuse_t] くんの進捗報告と lis-k さんの論文紹介。lis-k さんが紹介してくれたのは Aoife Cahill, Natin Madnani, Joel Tetreault and Diane Napolitano. Robust Systems for Preposition Error Correction Using Wik

    Wikipedia の編集履歴のログマイニングによる前置詞誤り訂正 - 武蔵野日記
  • 手ごろな研究アイデアを考える - 武蔵野日記

    朝大学に来て研究テーマの整理。研究室の学生はそれぞれ好きな研究テーマをしてくれればいいと思っているのだが、何をすればいいのか分からない、という声もあったので、NAISTでM1向けに研究テーマを提供していたような感じで用意することにしたのである。 そういえば、松研でも個々のプロジェクトを実施する助教の名前でプロジェクトごとに募集していたときは応募が少なかったが、松研のプロジェクトを全部束ねて松先生の名前で実施することにしたら一気に応募が増えた (研究室の新入生ほぼ全員が応募するようになった) 。助教に指導してもらうつもりで入学したのではなく、教授に指導してもらうつもりで入学する人がほとんどだろうから、そういうものなのだろうけど……。スタッフが複数人いると、実際に研究を密に見るのは教授というよりは助教や准教授、というのがややこしいところで、研究室生活がスタートしないと理解しづらいところな

    手ごろな研究アイデアを考える - 武蔵野日記
    yuiseki
    yuiseki 2013/06/13
  • 自分の不得意な形でも戦えるようにする - 武蔵野日記

    朝から出勤して講義資料を作成する。一応完成したので印刷しようとコピー室に行ったらコピー機がトナー交換で使用不可能。リソグラフを使おうと思って試してみたら紙が途中で切れて印刷できず。前日までに準備が完了していない自分が悪いのだが、泣きっ面に蜂である。 午前中、2回目の授業、1回目より話すのには慣れてきたが、やはり難しい。どうなればいいのかは分かるのだが、どうしたらそうなるのかが分からない。言うは易く行うは難しである。いつかは手応えが出てくるのだろうか……(助教のときも慣れるまで1年以上かかったが)。 午後はテクニカルライティングの演習の3回目。1グループ6人が研究室に来るので、彼ら・彼女らに論文の書き方を演習する、という授業である。ペアになっていた先生が学内の委員会で不在なので、自分だけでやってみる。午前中の40-50人くらいを相手に話さないといけない講義と比べて遥かにやりやすいし楽しい。や

    自分の不得意な形でも戦えるようにする - 武蔵野日記
    yuiseki
    yuiseki 2013/04/22
  • 首都大学東京で自然言語処理の研究室を立ち上げます - 武蔵野日記

    3月31日で NAIST を退職し、4月1日から首都大学東京システムデザイン学部の准教授になりました。今後ともどうぞよろしくお願いします。 というわけで、朝からバス→武蔵境→JR (中央線)→豊田→バス→大学という経路で通勤。中央線激混み。遅延が発生したりもしているようである。都心と逆方向の通勤なので大丈夫かと思っていたが、先が思いやられる感じである。 豊田駅から大学に来るのは初めて (前回来たときは八高線の北八王子駅から来た) で、少々不安であったが、駅を降りたら目の前にバスが着ていたので無事乗り込み成功。なんとなれば GPS があるので、さすがに迷わないだろうけど……。 キャンパスの規模は NAIST と同じくらいなので、親近感がある。配色もなぜか NAIST の情報科学研究科と似ているような気がする……。授業のない期間なので学生はほとんどいないが、付近の中高生の通学路になったりもして

    首都大学東京で自然言語処理の研究室を立ち上げます - 武蔵野日記
    yuiseki
    yuiseki 2013/04/06
  • COLING 2012 ワークショップ: モバイルテキスト入力の最前線 - 武蔵野日記

    会議は終わったが最後のワークショップがあるので、荷物をまとめて会場の IIT (インドで一番有名な国立の工科大学。インド各地にある) に出発。スーツケースを持ち運ぶのも面倒で、ホテルで預かってもらい、ワークショップが終わったら一度ホテルに戻ってきてホテルから空港に行くことも考えたが、渋滞に巻き込まれると危険なので、会場から直接空港に行くことにしたのである。 Tuktuk で会場まで送ってもらったはいいが、昨日までの招待講演があった会場ではなくレジストレーションがある会場のほうだったので、スーツケースを引きずりながら移動。階段があるのでちょっとしんどい。ワークショップだけ参加の人もいるようで、「ワークショップの場所はどこですか?」と聞かれたので一緒に行く。インドの大学でちょうど英語の感情推定の研究を始めたばかりで、大きな国際会議が開かれると聞いたので発表に来てみた、とのこと。せっかく来るな

    COLING 2012 ワークショップ: モバイルテキスト入力の最前線 - 武蔵野日記
    yuiseki
    yuiseki 2012/12/22
  • 予想通りうまく行かなくても前に進めるようにする - 武蔵野日記

    月末は団地で古紙回収の日。第三月曜日と月末の週2回なので、忘れがちなのである。 午前中はCJE++に出てみる。最近はいろいろと立て込んでいて、論文紹介の回は申し訳ないがスキップさせてもらっていて、進捗報告の回だけに参加させてもらっているのである。月1回にまとめてもらっているのでありがたい。実際に手を動かして分かったことが多い進捗だと、聞いていておもしろい。とはいえ、一つ一つの進捗がそれなりのボリュームで、たっぷり2時間。 昼から共同研究の電話会議。事情があって途中で担当者の人が交代になり、引き継ぎと今後の確認。結局担当する人がいる研究テーマは進み、そうでない研究テーマは進まないのだが、こういうのはこちらの興味あるテーマと先方の興味あるテーマが一致するかどうか次第かなぁ。 午後は研究室の全体ゼミ。M2の人が3人、M1の人が1人。修士論文を考えると、M2の人は研究テーマを変えるなら今週〜来週あ

    予想通りうまく行かなくても前に進めるようにする - 武蔵野日記
    yuiseki
    yuiseki 2012/11/02
  • 情報科学若手の会2012: 一年で一番楽しい日 - 武蔵野日記

    午前中、情報科学若手の会参加のために、熱海に移動。品川からスーパービュー踊り子号に乗り、車内で作業しようと思っていたのだが、三連休の初日だったせいか、満席で乗れず……。東海道線で向かうことにしたが、あとで考えると、せめてグリーン車に座って作業時間を確保すればよかったな〜(指定席ではないグリーン車だったので、乗り方が最初分からず結局ずっと普通車にいたが……) なんとか開始時間には間に合い、受付。今回は前回の30人から一気に60人に定員を拡大したせいか、だいぶ渋滞している。幹事の人数は変わらないので、頭が下がる。会場は3人がけの机にびっしり参加者が座り、ほとんど動けないほどだが、壮観である。かなり異様な雰囲気というか、プログラミングが好きな若者ばかり60人集まると、独特の熱気がある。 まずは1人2分の自己紹介セッションなのだが、60人いるとそれだけで2時間 (!) かかる。みなさん時間どおりに

    情報科学若手の会2012: 一年で一番楽しい日 - 武蔵野日記
    yuiseki
    yuiseki 2012/09/19
  • テキストアノテーションの未来について語る会 - 武蔵野日記

    今日と明日はテキストアノテーションワークショップ・コンテスト参加のために東京へ。新幹線の中で今日〆切の原稿を書いたり赤を入れたりする。 このワークショップ、もっとこぢんまりしたものかと思ったら、総勢60名が参加する (企業から9名) ワークショップで、大盛況。NL研より遥かに人が集まっているような……。 発表は全部で18件で、前半の12件がコンテストとなっていて、予稿以外に研究計画書も提出し、優れた計画には最大250万円の予算をつけて、NIIと共同研究をする、というような形だったので、もう既に終わった研究ではなく、これからこういう研究をしたいという話を12件も聞けるというのは珍しいことで、けっこうおもしろかった。 懇親会に行くとなぜか[twitter:@oxy]くんがいたので近況報告 (?) など。今年も入力メソッド飲み会 (毎年年末に関西で開催されている飲み会) やれるかな。第2回入力メ

    テキストアノテーションの未来について語る会 - 武蔵野日記
    yuiseki
    yuiseki 2012/08/11