タグ

ブックマーク / komachi.hatenablog.com (6)

  • 『入門ソーシャルデータ』で文書クラスタリングと文書要約を学ぶ - 武蔵野日記

    先日献いただいた「入門ソーシャルデータ データマイニング、分析、可視化のテクニック」 入門 ソーシャルデータ ―データマイニング、分析、可視化のテクニック 作者: Matthew A. Russell,奥野陽(監訳),佐藤敏紀(監訳),瀬戸口光宏(監訳),原川浩一(監訳),水野貴明(監訳),長尾高弘出版社/メーカー: オライリージャパン発売日: 2011/11/26メディア: 大型購入: 18人 クリック: 779回この商品を含むブログ (42件) を見るを読了 (多謝!)。tkng さんも書評を書かれているし echizen_tm さんも書評を書かれているので、いまさら感は否めないが、別の観点から少し寸評。書は、データを抽出してからの可視化の方法が全体の半分以上を占めていて、そういう方法を知らない人には参考になると思う。 研究のための実験をしていても、実は地味に重要なのは機械学習

    『入門ソーシャルデータ』で文書クラスタリングと文書要約を学ぶ - 武蔵野日記
    kshimo69
    kshimo69 2011/12/05
  • 戦うウェブエンジニアの三種の神器 - 武蔵野日記

    午前中ミーティングの予定を入れていたが、今日は [twitter:@mizuno_takaaki] さんに 学内の招待講演をお願いしていて、[twitter:@tettyun] くんとご飯をべるため高の原まで迎えにいくことを忘れていたので、急遽ミーティングを夕方に延期。すまんかった。 ランチは@mizuno_takaakiさんに新卒採用担当の Kさん を交えて DeNA のお話とか、@tettsyun くんを交えてバイドゥのお話とか、いろいろお伺いする。DeNA は新卒今年40人ほど採用なようだが、30人弱がエンジニアで、新卒研修直後に海外 (サンフランシスコ、Twitter オフィス側) 勤務する人もいたり (海外ゲーム会社を買収したりしたので)、海外で働きたい人にとってはチャンスが豊富な職場だということ。最初から海外で働くこと狙いで入社するのも歓迎 (保証はできないが海外で働きたい

    戦うウェブエンジニアの三種の神器 - 武蔵野日記
    kshimo69
    kshimo69 2011/10/29
  • 自然言語処理の定番の教科書まとめ - 武蔵野日記

    自然言語処理や機械学習でいくつか新しい教科書的なものが登場してきたので、まとめてみようと思う。 教科書について。Introduction to Information Retrieval Introduction to Information Retrieval 作者: Christopher D. Manning,Prabhakar Raghavan,Hinrich Schuetze出版社/メーカー: Cambridge University Press発売日: 2008/07/07メディア: ハードカバー購入: 7人 クリック: 115回この商品を含むブログ (37件) を見るの翻訳が進んでいる(あとこれを研究室の輪読に使っていたりする)という話を聞いたりするのだが、やっぱり知識として知っておくべきというのと、そこから超えていくというのは違うものであって、どれだけ研究が進んでも、分

    自然言語処理の定番の教科書まとめ - 武蔵野日記
  • Google Tech Talk in Osaka に出るために梅田まで - 武蔵野日記

    以前書いたように Google Tech Talk in Osaka で @taku910 さんが Google 日本語入力の話をしてくれるというので、@shirayu くんの車に @smly くんと乗せてもらって行ってくる。昼はすし政 中店というところだったらしい。確かに安い。カウンターに座るタイプの寿司をべたのは(アメリカべたのを除いて)久しぶりなのだが、こういうのもいいなと思った。たぶん最後に回らないお寿司屋さんに行ったのは5年前だと思う……。 講演自体についてはこちらにものすごく詳細にまとまっているので、参照されたし。(40分書いた記事があったのだが、はてなの不具合で全部消えてしまったので、リカバーする気にならない……。管理モードで書いているときはバックアップされるのでいいのだが、インライン編集モードで書いていると、投稿時に接続に問題があったとき全部消えるのは、なんとかしてほ

    Google Tech Talk in Osaka に出るために梅田まで - 武蔵野日記
  • Google に行ったからすごいのではない。すごい人が Google に行ったのだ - 武蔵野日記

    初期の無名のGoogleがどうやって世界中の天才を集めたかというエントリを最初に見たとき「これは紹介したい!」と思ったのだが、ようやく紹介する時間が取れる。このエントリだけじゃなく Lilac さんの MIT の MBA スローンスクールの日記、エンジニアとして非常に示唆に富む内容が多い(たとえば「キットカットの有効なマーケティングターゲットはなにか?」という問いに、「若い年代がいい」みたいに答える普通の人がいる中で、「栄養に優れているし携帯性もいいので兵士の糧として優れている」と答える元軍人の人がいるとか)ので、RSS リーダでの購読をオススメする。 さて題。少々長くなるが引用する。 まだ全く無名だったGoogleが世界中からアルゴリズムの天才たちをどうやって集めたか、という話だ。 Woojaeは1999年頃、イギリスのケンブリッジ大学の博士課程に留学しており、研究のため物理の研究室

    Google に行ったからすごいのではない。すごい人が Google に行ったのだ - 武蔵野日記
  • 大学で Hadoop 使う場面ってどんなのだろうか - 武蔵野日記

    今さらだが @kzk_mover くんによるHadoop World NYC 参加記の紹介。Hadoop って考え方は単純なのだけど、ドキュメントがものすごい勢いで陳腐化したり、チューニングしないといけないパラメータがたくさんあったり(デフォルトで適当な値に設定されているのだけど)、コンセプトはいいのだけど使うとなると手を出しづらい技術の筆頭格だと思う。Yahoo! の例だけ引用してみると、 Hadoop Applications at Yahoo! Yahooでの使用事例の話です。Yahooでは現在約25000台程度のノード上でHadoopが走っているようです。そのうちの約20%が番用、約60%がResearch目的という事でした。 ただ、Yahoo.comのトップページに表示されているコンテンツの裏では結構使われているようで、Ad Optimization, Search Index

    大学で Hadoop 使う場面ってどんなのだろうか - 武蔵野日記
  • 1