タグ

ブックマーク / komachi.hatenablog.com (7)

  • エンジニアを幸福にしないヤフーというシステム - 武蔵野日記

    @nokunoさんのYahoo! JAPANを退職しましたという記事を読む。いまはタイトルに「翻訳」と書いてあるので紛らわしくないが、最初は「すわ id:nokuno さんがとうとう辞めたか?!」と釣られたものである (笑) 内容を読んでみると「まあ、そうだろう」という感じで、そんなに目新しいことが書いてあるわけではない (が、Yahoo! JAPAN の労働環境について知らない人が読むと「え、Yahoo! ってそんなところだったの??」とびっくりするかも)。著者も断っているが、これはアメリカYahoo! のことではなく、日Yahoo! JAPAN のことであり、Yahoo! JAPAN は外資系の会社ではなくコテコテの日企業である (それが悪いと思うかよいと思うかは人次第)。 (2010-10-31 追記) Yahoo! JAPAN の環境がそんなによくないのは My New

    エンジニアを幸福にしないヤフーというシステム - 武蔵野日記
  • 博士で身につけるべき研究力とは穴埋め問題の作成能力 - 武蔵野日記

    研究室生活 基礎文法最速マスターでも、著名な id:next49 さんの 発声練習 と並んで取り上げられて恐縮しているが、そういうわけで少し研究に関するエントリを書いてみる (笑) 理系のための「即効!」卒業論文術―この通りに書けば卒論ができあがる (ブルーバックス) 作者: 中田亨出版社/メーカー: 講談社発売日: 2010/01/21メディア: 新書購入: 10人 クリック: 78回この商品を含むブログ (12件) を見る を読んでみた。これはやればできる卒業論文の書き方をまとめたものらしいが、ぶっちゃけ web で公開されているもののほうが、卒論の書き方の指南書としてはおもしろい。しかしながら、こちらののほうは、卒論を書くということ以外の話が充実しているので、それはそれで読む価値あると思う(とくに博士に進むか迷っている人とか)。あと、上記のページには「エンジニア・職業研究者をめざす

    博士で身につけるべき研究力とは穴埋め問題の作成能力 - 武蔵野日記
  • 博士の学生のための就職活動日記 - 武蔵野日記

    いろいろあって名大の萩原さんと夕しつつ、就職活動について聞いたり。萩原さんは自分と志向性が似ていることもあり、同じく自然言語処理の博士後期課程の卒業生として、ちょうど1年先に就職活動をしてくれていたので、ちょくちょくお話を聞いていたのであった。 そういう就職活動記が博士のための「けものみち」就職活動。今日見たらすごくブックマーク数が増えていたので、ホットエントリー入りしていたようだ。 個人的におもしろかったのは 「就活で理想なのは、応募した会社全てから同時に内定が出ること」とMSRでインターンしていた時に同僚が言ってた。まず全てのオファーが出そろうまで待って、そこから最適なものを一つ選ぶそうな。新卒採用で無い限り、オファー(内定)の出るタイミングはなかなか予測できないし、内定の長期間のキープもほぼ不可能である。(ただし、面接のスケジュール調整をうまく使って、複数社の応募の進行具合を調整す

    博士の学生のための就職活動日記 - 武蔵野日記
  • 自然言語処理は Python がいちばん - 武蔵野日記

    現在大学1年生の人で3年後には NAIST に (というか松研に) 来たいという人から「どんなプログラミング言語やっておくといいですか」と質問されたりするのだが、なかなか答えるのは難しい。自分は PerlPython がメインでときどき C++/C# を使ったりするのだが、どれが一番いいかはなんとも言えないので、自然言語処理以外に転向する可能性も考えると、C とか C++ とか Java とか(授業でそちらをやるのであれば)を最初の武器に選んだ方がいいのでは、と思ってはいる。 そんなこんなで最近 Hal Daume III (機械学習を用いた自然言語処理では非常に有名な人) のブログで Language of Choice というタイムリーなエントリーが出ていたので、紹介すると、「それなりに大きな自然言語処理のプロジェクトでどのプログラミング言語を使うのか」というアンケート結果が出

    自然言語処理は Python がいちばん - 武蔵野日記
  • 最大マージン kNN と SVM の関係: kNN も最近はがんばっています - 武蔵野日記

    先日書いた機械学習における距離学習の続き。 kNN (k-nearest neighbour: k 近傍法)は Wikipedia のエントリにも書いてある通り、教師あり学習の一つで、あるインスタンスのラベルを周辺 k 個のラベルから推定する手法。memory-based learning と呼ばれることもある。単純に多数決を取る場合もあれば(同点を解決する必要があるが)、近いインスタンスの重みを大きくする場合もあるのだが、いずれにせよかなり実装は単純なので、他の機械学習との比較(ベースライン)として使われることも多い。 簡単なアルゴリズムではあるが、1-NN の場合このアルゴリズムの誤り率はベイズ誤り率(達成可能な最小誤り率)の2倍以下となることが示されたり、理論的にもそれなりにクリアになってきているのではないかと思う。また、多クラス分類がちょっと一手間な SVM (pairwise に

  • ニコニコ動画の大規模なデータに対するタグ付けとリンク解析 - 武蔵野日記

    ニコニコ動画データ分析研究発表会というのが開催されていたようだ。 タイトルや説明文はノイジーなので、動画につけられたタグを使うと割ときれいなデータとして可視化したりできる、という話は、はてなブックマークの関連エントリー機能のときも聞いたような話で、基的にはインターネットユーザに無料でデータのタグ付けをしてもらっている、という話なんだろうな、と思う。以前紹介したRion Snow の論文 (彼は2005年に Microsoft Research でインターンし、2006年に Powerset (現在は Microsoft に買収済み)、2007年には Google でインターンした人物。ACL という自然言語処理のトップカンファレンスで2006年にベストペーパー受賞)で、 今年の Rion Snow のトークは、Amazon Mechanical Turkというシステムを使って、非常に安価

    ニコニコ動画の大規模なデータに対するタグ付けとリンク解析 - 武蔵野日記
  • 日本の大学院で博士に進学するということ - 武蔵野日記

    書き忘れないうちに専門教育に関して悩まれている人へ贈る言葉と裕福じゃないと博士後期課程に行けないとは限らないをメモしておく。 前者は日で大学院に行くのはお金の無駄だからアメリカに行け、という内容。後者は日で大学院に行くのも賢くやれば費用はかからない、という内容。少し詳しく見てみる。 まず前者から。 第二に、もし学位(Ph.D.)をアメリカでとるのであれば、日でやっていたマスターの二年間もそのお金も完全に無駄になる。少なくともアメリカのresearch universityでは、自然科学系の修士課程(マスターをとることを目標としたプログラム)というものは事実上存在していない(要はすべてがPh.D. program)ため、もう一度、アメリカ中の有名大学からピンに近い成績でやってきた新卒たちとゼロからコースワーク(専門の基礎教育)をやり直すことになる。 第三に、マスターを持っていても研究者

    日本の大学院で博士に進学するということ - 武蔵野日記
  • 1