タグ

ブックマーク / komachi.hatenablog.com (7)

  • 学会も整理整頓してほしい - 武蔵野日記

    朝6時に起きて1時間ほどメール処理。だんだん寒くなってきて、布団を2枚出してきた。 午前中はウェブ参加で学会の編集委員会(分科会)。キャッチフレーズを考える、というタスクがあり、沈黙の中みんなで考えるのだが、一体何なんだろうか、この時間……(結局自分の考えたフレーズが分科会で採用されたが、後日全体のキャッチフレーズがあるということが判明し、お蔵入りになったりしたのは、当に時間を返してもらいたい)。学会は何のためにあるのか? と疑問に思う。(ほとんどの学会は、全国大会の開催と論文誌の発行に特化していいんじゃなかろうか? みんな考えているのかもしれないけど、研究会や学会も、もっと統合していいのではないか?) 午後は原稿の添削や教務の仕事、メール処理など。カリキュラムを考えるの、どのような科目が必要で、どれが用意されていて、どういう順番で履修しないといけないか、というようなことを考慮しないとい

    学会も整理整頓してほしい - 武蔵野日記
  • 行列とニューラルネットが手をつなぐ - 武蔵野日記

    昨晩から体調がまた悪化したが、情報理論の中間試験を準備しないといけないので、午前5時に起床して作業。しかしいろいろあって一時危ういことに。普段出席を必須としていないので、中間試験の日だけ来る学生もいるし、体調が悪いから、と延期できないため、相当焦る(試験問題を作るのも採点するのも大変だということ、理解していただきたい)。1学期に2回もそういう日があるとしんどいので、期末試験一発にしたほうが自分は楽だなぁ。学生はどっちが楽なのか分からないが……。 午前中、なんとか大学に来て無事中間試験を実施する(中間試験とはいえ、前半の45分は普通の授業)。 そういえば、夏のITエンジニアインターンの情報が集まる魔法のスプレッドシートに、インターンシップの内容や期間、報酬がまとまっているので、学部生たちに授業で紹介している。最近はインターンシップのでも待遇がかなりよいので、下手に夏休みを過ごすなら、こういう

    行列とニューラルネットが手をつなぐ - 武蔵野日記
  • 大規模データ処理のための行列の低ランク近似 -- SVD から用例ベースの行列分解まで -- - 武蔵野日記

    id:naoya さんのLatent Semantic Indexing の記事に触発されて、ここ1週間ほどちょくちょく見ている行列の近似計算手法について書いてみる。ここでやりたいのは単語-文書行列(どの単語がどの文書に出てきたかの共起行列)や購入者-アイテム行列(どの人がどのを買ったかとか、推薦エンジンで使う行列)、ページ-リンク行列(どのページからどのページにリンクが出ているか、もしくはリンクをもらっているか。PageRank などページのランキングの計算に使う)、といったような行列を計算するとき、大規模行列だと計算量・記憶スペースともに膨大なので、事前にある程度計算しておけるのであれば、できるだけ小さくしておきたい(そして可能ならば精度も上げたい)、という手法である。 行列の圧縮には元の行列を A (m行n列)とすると A = USV^T というように3つに分解することが多いが、も

    大規模データ処理のための行列の低ランク近似 -- SVD から用例ベースの行列分解まで -- - 武蔵野日記
  • 自然言語処理における類似度学習(機械学習における距離学習)について - 武蔵野日記

    Twitter でグラフ理論に関する話題が上がっていたので、最近調べている距離学習(distance metric learning)について少しまとめてみる。カーネルとか距離(類似度)とかを学習するという話(カーネルというのは2点間の近さを測る関数だと思ってもらえれば)。 この分野では Liu Yang によるA comprehensive survey on distance metric learning (2005) が包括的なサーベイ論文として有名なようだが、それのアップデート(かつ簡略)版として同じ著者によるAn overview of distance metric learning (2007) が出ているので、それをさらに簡略化してお届けする(元論文自体文は3ページしかないし、引用文献のあとに表が2ページあって、それぞれ相違点と共通点がまとまっているので、これを見ると非

    自然言語処理における類似度学習(機械学習における距離学習)について - 武蔵野日記
    harapon1012
    harapon1012 2014/02/14
    距離学習
  • パターン認識の人手最強伝説 - 武蔵野日記

    午前中は機械学習の基礎勉強会の最終回。1冊全部通読できてよかった。 昼から研究室配属の説明会。誰がうちの研究室を希望してくれるかな? 連続して学部3年生のプロジェクト実習の最終発表会。学生たちが各自チームで半年間研究した成果を発表してくれた。トップバッターの女の子4人組チームがとてもプレゼンがうまく、出した数値も段違いによく、他のチームのほぼダブルスコアで、最優秀発表賞を受賞していた。ポスター発表を聞くと、ポスターにはアルゴリズムが前面に書かれていたが、質問してみたところアルゴリズムが問題なのではなく、驚くべき手法によってその精度が達成されていた。 タスクは顔画像認識で、人物の映る画像が与えられたとき、それが誰か当てるという課題。ただ、この実験は設定が特殊で、画像に手を加えてもいいことになっていた。そこで、彼女たちは数千枚の写真画像からなる訓練事例とテスト事例の両方で、まず顔の中心点を決め

    パターン認識の人手最強伝説 - 武蔵野日記
    harapon1012
    harapon1012 2014/01/25
    学生時代にこういう体験をした人は強いと思う
  • ソーシャルメディアを対象にしていても述語項構造解析に戻ってくる - 武蔵野日記

    午前中、午後から研究発表のためにいらしていた[twitter:@hitoshi_ni]さんと、インドの話をする。何が起きるか分からないが、期待値が低いのでそこまで動じないかもしれない。 松先生がやって来て、来年度以降の研究用の計算機システムの話をしたりする。MapReduce できるようにするのだとか。けっこうメンテナンスが面倒くさい気がするのだが、きっとなんとかされるのであろう。そういうののメンテナンスが好きな学生がいればよいが、時間が取られる割には研究成果につながらないので、スタッフが対応することになりそうだが……。とりあえず自分は今年度12月に来るシステムを安定稼働させ、現行のシステムからスムーズに移行させることが目標である。 お昼は@hitoshi_niさんと松先生と3人で学へ。述語項構造解析や意見情報マイニングの話をしたりする。これもなんとかしなければ。デモシステムの世代交

    ソーシャルメディアを対象にしていても述語項構造解析に戻ってくる - 武蔵野日記
    harapon1012
    harapon1012 2012/12/04
    後半部分,大賛成だなぁ.精度がうんぬんの話をみんなしすぎだよなぁ.
  • インターン、行きたいと思ったときが勉強を始める吉日 - 武蔵野日記

    午前中、NTT 研究所までミーティング。年次大会の原稿を元にディスカッションしつつ、次やるべきことについて議論。 帰ってきて @tomo_wb くんが実験しようとしたらしいが、追加実験するために必要なメタデータがダウンロードしたデータについていないことが分かったので、メタデータの取得。今回は1ヶ月ではなく1週間くらいで終わるはず…… (汗) 修士論文のドラフト提出は過ぎたので週末は小康状態になっていたが、週明けになってみると、まだ実験が完了していない人や、発表スライドを作る人たちがいて、また人が増えつつある。片手で数えられるくらいの人数がインターンシップに応募するような感じなのだが、 Programming Interviews Exposed: Secrets to Landing Your Next Job (Programmer to Programmer) 作者: John Mon

    インターン、行きたいと思ったときが勉強を始める吉日 - 武蔵野日記
  • 1