タグ

ブックマーク / caesar-wanya.hatenadiary.org (10)

  • 進学か、就職か - あしたからがんばる ―椀屋本舗

    皆様こんばんは。就活したことない Advent Calendar 2012 - Adventarの第一弾を担当することになりましたcaesar_wanya、通称椀屋です。今回はこの「就活したことないリスト」の名前にもなっているように、進学するか、就職するかということについて書いてみたいと思います。 博士課程に進学するかということは、修士で研究生活がそこそこうまくいっている人は一度は考えることになると思います。将来研究を続けたければいずれPh.D.を取ることになるでしょうし、博士課程3年間で思うように研究をするということは、研究というものが何かわかってきた学生にとっては、非常に魅力的に映るのです。あと、博士って響きがかっこいいじゃないですか。 博士課程に進学するか就職するか、一体どちらが良いのでしょうか? 結論から言えば、答えは当人の価値観による、としか言いようがないと思うのですが。 就活し

    進学か、就職か - あしたからがんばる ―椀屋本舗
    mamoruk
    mamoruk 2012/12/02
    情報系で博士後期課程に進学する人はこれを読んでほしい
  • Juliusで認識文法とN-gramを併用する - あしたからがんばる ―椀屋本舗

    こんばんは、お久しぶりです。 今回は他研究室の卒論生のお手伝いということで、Juliusにおいて認識文法とN-gramによる認識を併用する、という方法を扱うことになったので、ここにまとめておきます。 まず、Juliusとは京大河原研で開発されたフリーウェアの大語彙連続音声認識用デコーダです。音声認識技術は音響モデル、言語モデル、そしてデコーダから構成されるのが一般的ですが、Juliusはデコーダに加えてデフォルトで音響モデルと言語モデルが付属しており、高い汎用性を備えています。 音声認識にはおおまかに分けて、孤立単語認識、認識文法による認識、大語彙連続音声認識の3種類があります。 孤立単語認識とは、個々の単語を対象として認識を行うものです。最近ではGoogle音声認識などが一番イメージに近いと思います。ちなみに、Google音声認識はかなり広範な語彙を扱う上にディクテーションに近いような認

    Juliusで認識文法とN-gramを併用する - あしたからがんばる ―椀屋本舗
    mamoruk
    mamoruk 2011/12/12
    まとめお疲れさまです! こういうドキュメント、ありがたいですね〜
  • 外部大学院入学について - あしたからがんばる ―椀屋本舗

    震災からこっち日記が書きにくくなっていたのですが、いつまでも書かないわけにもいかないので書きます。被災された方にはお見舞いを申し上げると共に、一日も早い復興を願っております(僕も当日は被災したけど) 今のところ関西の影響は水が買えないとか、電車の部品がまわらなくて間引き運転とかそれくらいですが、長引くと影響も大きくなるんだろうな。 - さて、この度私無事修了し、修士号(情報学)を頂けました。で、修了にあたって、学部から修士へ進学する際に研究室(もっと言うと専攻や大学)を移って思ったことをつらつらと書こうと思うわけです。 外部大学院とは B4(M2)時の大学とは違う大学で修士課程(博士課程)に進学すること。僕の場合はB4から博士進学の可能性を考えていたので、ボスの定年までの時間が足りなかった(B4開始時で残り4年)というのが一番のきっかけでした。他にも、 より良い研究環境を求めたい 異なる研

    外部大学院入学について - あしたからがんばる ―椀屋本舗
    mamoruk
    mamoruk 2011/03/25
    NAISTを志望する人みんなに読ませたい
  • ある分野の研究者となるために - あしたからがんばる ―椀屋本舗

    先日のJUMAN/KNPのラッパーの話の続き。 この前書いたjumanknp.rbはLinuxで書いたのだが、あれをWindowsに持って行ったときに思いがけない罠に嵌った。 Threadから立ち上げたjuman -Sと通信をするとなぜか、 金閣寺について。 金閣寺について。 金閣寺について。 未定義語 15 その他 1 * 0 * 0 NIL EOS みたいな感じで返ってくる。ちなみに期待するのはこんな感じ。 金閣寺 きんかくじ 金閣寺 名詞 6 組織名 6 * 0 * 0 "代表表記:金閣寺/きんかくじ" に に に 助詞 9 格助詞 1 * 0 * 0 "連語" ついて ついて つく 動詞 2 * 0 子音動詞カ行 2 タ系連用テ形 14 "連語" 。 。 。 特殊 1 句点 1 * 0 * 0 NIL EOS 試しに別のプロンプトを立ち上げて、juman -C localhost:

    ある分野の研究者となるために - あしたからがんばる ―椀屋本舗
    mamoruk
    mamoruk 2010/12/09
    「僕の研究は対話システムの動的な応答生成と分野適応なのだが、河原先生に、「ある分野の研究者となるためには、その分野の周辺技術は一通り実装までやってみるべき」と言われ、なるほどと思った」なるほど
  • 学部4年の1年間の重要性 - あしたからがんばる ―椀屋本舗

    最近あまり日記を更新していなかったので書く。いや、ネタはあったのだが。Twitterで短文で考えてることを表に出す機会が増えて、どうもきちんとした文章を書いていない気がする。 今日から黒橋研と一緒に機械学習の勉強会を始めた。 機械学習入門勉強会 この他にcacahoさんが主催で機械学習の論文紹介をしているけど、こちらでは論文紹介よりも、機械学習の基的なところを抑えるため、学生さんで集まって教科書を読んで、その内容を実装することを目標にする感じ。僕は自分でも呆れるほど実装力がないので(実装も英語もできない、論文も書くのが下手となってしまうと残るのは熱意だけだが)、こういう機会を設けて色々な実装をやってみたかった。黒橋研・河原研の学生でやっていますが、参加したいとかがあれば所属は問わないので、皆さんどうぞ。教科書は今いろんなとこで話題の「言語処理のための機械学習入門」 言語処理のための機械学

    学部4年の1年間の重要性 - あしたからがんばる ―椀屋本舗
    mamoruk
    mamoruk 2010/08/11
    NAIST からも参加したい>機械学習入門勉強会
  • ■ - あしたからがんばる ―椀屋本舗

    今日の勉強会はAROW(Adaptive Regularization Of Weight Vectors)の話。AROWは要するにオンライン学習の一例で、CW(Confidence Weighted Learning)をノイズに対して頑健になるようモデリングし直したものと思う。使いたい人は、詳しくはAROW は CW より幾分マシか - ny23の日記に書いてある。 オンライン学習自体あまり今まで触れてこなかったので(流行りなのはわかっているが)、オンライン学習は従来のSVMなどと違って、訓練データが1つ入る度にその訓練データに対してパラメータを更新して分類を行う、というもの。従来のSVMなどの機械学習と比較して収束が早いので学習時間がかからないのが売りだったが、反面CWでは誤り例に引っ張られやすく、ノイズが入ってきたときにそこに大きく引っ張られて精度が悪くなってしまう、という問題があっ

    ■ - あしたからがんばる ―椀屋本舗
  • ■ - あしたからがんばる ―椀屋本舗

    毎週火曜に黒橋研でやってる機械学習の勉強会に参加しているのだが、今日もあるつもりで行ったら今日はなかった…なぜなかったのかは忘れたが、僕は朝弱いのでがっくりである。まあ、自分が悪いわけだが… 自分のキャパが少なくて、参加していても半分も理解できているのか怪しいのだが、大学院生になった直後はあえて手加減しないほうがいいでも書かれているように、自分がやっていることに関連がありそうな勉強会などは、行けるのならば、少しくらいわからなくても積極的に参加する方が将来ためになると信じて参加している…ほんとにわからなくなってしまうと、大丈夫?と聞かれても曖昧にしか答えられないので辛いのだがw 参加していると何度も同じ話が出てくるのでそういうものもわかってくるし、ああいう勉強会は業界の動きに敏感な人が数人はいて、そういう人が紹介する論文を見ているうちに今はどんな題材やテクニックが流行りなのかを知ることができ

    ■ - あしたからがんばる ―椀屋本舗
    mamoruk
    mamoruk 2010/05/25
    リソース作りも大事ですね
  • ■ - あしたからがんばる ―椀屋本舗

    無事SIGDIALと学振を提出し終えました。 実際土曜には39度の熱を出してぶっ倒れ、 日曜は点滴を打って修正をしに来たわけですが (先生が月曜から出張なので日曜中にある程度仕上げる必要があった) まあ、よく終わったね。 どっちも通って欲しいです。 とにかくお腹に来る風邪で、今も大変なんですよ、お腹が。 先日mixiやTwitterには書きましたが、 就職活動も無事内定を頂いて終えることができました。 進路をどうするかはこれから決めます。 就活していて思ったことをちらほらと。 理系院生の就職活動で一番大切なこと - 毛のはえたようなもの にも書いてあることだけど、 特に理科系の場合、研究内容がないと就職活動で何もアピールできないので、 12月までには何らかの研究実績を出しておく必要がある。 幸いにしてこの業界では、あちこちの全国大会が 3月に開催され、その発表申込締切が12月にあるので、

    ■ - あしたからがんばる ―椀屋本舗
    mamoruk
    mamoruk 2010/05/20
  • ■ - あしたからがんばる ―椀屋本舗

    今日の勉強会は並列・分散処理について。 EMアルゴリズムとギブスサンプリングの話だったけど、後半のギブスサンプリングの話は途中で脱落した。大雑把に理解したこととしては、トピックモデルをギブスサンプリングなどで実装する場合、各文書を別のノードに投げたとき推定するトピックのIDが異なる可能性があるけど、それをどうすんのよ、という問題の解決で、それを各クラスの類似度を推定しながら合わせていく、という話だったと思う。 EMの方は、普通のmap-reduceで実装するとE-ステップは各ノードがそれぞれ期待値を返してくるからいいんだけど、M-ステップのときにreduceしたノードが更新したパラメータを推定し直して、そこからE-ステップを計算するノードにパラメータを再分配するところで通信のボトルネックが起こるのでどうしよう、という問題。今回の手法では、単純な解決法として全経路を、他にコスト最小全域木を使

    ■ - あしたからがんばる ―椀屋本舗
    mamoruk
    mamoruk 2010/05/20
    分散並列について EM とギブスサンプリングの話
  • SLP, SIG-SLUD(前編) - あしたからがんばる ―椀屋本舗

    IPSJ-SLP, SIG-SLUDにいってきた。 この2つの並列開催は実は歴史的なことだということで、先生が「10年の時を経てついに和解が…」みたいなことを冗談で言っていたが、実際そのへんは笑い話でもないと思う。僕みたいなペーペーにも2つに壁みたいなものがあるのはわかったし、実際並列開催しているのに、一部のお偉い先生がずっと片方にしか顔を出さなかったのは残念だと思う。一部の先生は行ったり来たりしていたが。 双方にはそれぞれいいところ悪いところがあって、お互いが自分のいいところと悪いところを認識できていればいいと思う。相手の悪いところしか見えない、という関係は一番良くない。 実際SLPは手法もすごい発表も多いけど、「この研究にはこういう社会的意義があります」という観念が希薄な気がするし(別にそれはそれで悪いことではないという主張もあるが)何より議論が手法に偏ってしまっていて、「これをどうい

    SLP, SIG-SLUD(前編) - あしたからがんばる ―椀屋本舗
    mamoruk
    mamoruk 2010/02/15
    SLPとSLUDの併催があったそうで。
  • 1