タグ

ブックマーク / echizen-tm.hatenadiary.org (9)

  • 個人的に参照することの多い機械学習の本 - EchizenBlog-Zwei

    機械学習をおすすめする記事をいろいろ書いてきたけど、純粋に自分が活用しているについて書いたことがなかった気がしたので書いておきます。必ずしもおすすめではないかもしれません。ベイズ1冊、DL1冊、凸2冊の計4冊。 パターン認識と機械学習 なんだかんだで最も参照頻度が高い気がしました。ベイズに寄りすぎている感はありますが、だいたい必要なことはこれに書いてあるので何冊も手元においておかなくていい便利さがあります。 深層学習 (機械学習プロフェッショナルシリーズ) DLまわりだとこれが一番わかりやすい印象です。変な政治パフォーマンスがなくて純粋に機械学習としての差分が書いてあるのでよい感じ。 東京大学工学教程 情報工学 機械学習 大半はPRML読めばいい感じの内容ですが、オンライン機械学習まわりはこっちのほうが良いです。下記の確率的最適化を読む前に読んでおくとだいぶ見通しが良くなる印象。 M

    個人的に参照することの多い機械学習の本 - EchizenBlog-Zwei
  • 5/1は転職記念日なので記事を書く - EchizenBlog-Zwei

    転職して2年が経った。 転職は私の人生における最大の勝利であるので、2周年を記念して記事を書く。 さしあたり、現時点で考えていることを書いておくことで後々の参考にしたい。 転職してよかったか これは「よかった」と断言できる。 2年経ったのでさすがにそろそろ前の環境と比較してもよい頃合い(転職してすぐはバイアスがかかって何でもよく見えるので)なので書いておくが、あらゆる点で今の環境のほうが良い。 私が転職を考えていたころ「辞めて幸せになった」という資料が少なく、周辺の人の「すぐ辞める人は何をやってもダメ」的な論調に随分脅されたものだった。なので「転職して幸せになった」という事は何度でも繰り返し伝えていきたい。 能力の伸びと幸せ 人の能力は伸び続けると思う。成長が頭打ちになることはないという印象がある。 ではだれでも頑張れば幸せになれるのか?というとそうでもないと思う。何故かというと人生は有限

    5/1は転職記念日なので記事を書く - EchizenBlog-Zwei
  • 文法圧縮を使った完備辞書(簡潔ビットベクトル)を作った - EchizenBlog-Zwei

    @marugorithmさんの文法圧縮の解説資料(http://research.preferred.jp/2014/03/nlp2014_grammar/)があまりにも有益すぎて感動したので、文法圧縮を使った完備辞書(簡潔ビットベクトル)を作った。 文法圧縮の部分は実装の簡単さからRe-Pairアルゴリズムを使った。 https://github.com/echizentm/GCFID 作ってみて感じたメリット・デメリットをメモしておく。 簡単に言うと、rank、selectがO(1)でないという欠点があるものの理解のしやすさ、実装のしやすさを考えると利点が大きいように感じた。 文法圧縮を用いて完備辞書を作るメリット ビット列が変換規則(X1 => X2, X3みたいなの)の集合で表現できるのでpopcountとかのややこしいビット演算が不要 ビット演算が不要なのでperl,python

    文法圧縮を使った完備辞書(簡潔ビットベクトル)を作った - EchizenBlog-Zwei
    suginoy
    suginoy 2014/04/02
  • 【転職一周年記念エントリ】エンジニアの転職を支える技術 - EchizenBlog-Zwei

    転職して1年が経ちました。 前職での6年間は私の人生で最も辛い時期でした。転職してようやく来の自分を取り戻せました。自分にあった場所で働くというのはとても大切だと思うので、転職するにあたって私がやったことをメモしておきます。 1.転職の意思を固める 辞めたいと思った時が辞めどきです。他人の意見は気にする必要はないです。よく「n年はうちで頑張れ」と言われたりしますが、実際は転職を決意してから転職完了までに身につけたことで充分なので「n年頑張る」という待ちのフェイズは不要です。決意から完了まで結果的にn年かかるということはあるかもしれないですが、特に意味もなくn年耐えても良いことはないです。 2.興味のある技術を持つ 人が技術を身につけるのは会社の仕事をするためだけではないです。必要な技術は会社によって異なりますし、会社内でも部署や情勢によって変わってきます。それに追随するためだけに技術を学

    【転職一周年記念エントリ】エンジニアの転職を支える技術 - EchizenBlog-Zwei
    suginoy
    suginoy 2013/05/04
    11番大事。
  • 「4人のロシア人の方法」で編集距離を高速化する - EchizenBlog-Zwei

    ちょっと前に「4人のロシア人の方法(Method of Four Russians)」というのを論文で見かけて面白かったので紹介しておく。 簡単に言ってしまうと、ある処理を高速化したい時にデータ全体を小さなブロックに分割してブロック単位での結果を事前に計算したテーブルで持っておくよ、というアルゴリズム。 名前は知らなくてもアルゴリズム自体は知ってる人は多いかもしれない。 Method of Four Russians - Wikipedia, the free encyclopedia アルゴリズム自体は汎用的なものだが編集距離の高速化を例として説明するのが一般的なようなのでそれに倣う。 文章で書くとごちゃごちゃするのでスライドで。もっふる。 http://www.scribd.com/doc/94190119/MoFR ※追記:↑のスライド、正直自分でもわかりやすいとは思えないので余裕が

    「4人のロシア人の方法」で編集距離を高速化する - EchizenBlog-Zwei
  • 渋谷の会社に転職しました - EchizenBlog-Zwei

    というわけで転職しました。 渋谷といってもモゲマスの会社ではなくDSIRNLPのときにお世話になっていた会社です。 待遇や環境、仕事内容などあらゆる面が大幅に改善されモチベーションがうなぎのぼりです。 さらに前職同様、一緒に仕事をする方にも恵まれていて圧倒的な感じがします。 思わず最善を尽くしたいと思える環境でした。がんばります。

    渋谷の会社に転職しました - EchizenBlog-Zwei
  • 転職します - EchizenBlog-Zwei

    個人的な報告で恐縮ですが日を以って今の職場(以下、現職)の最終出社を迎えました。 「ここはルイーダの酒場。旅人たちが仲間をもとめて集まる出会いと別れの酒場よ」 私にとって現職はルイーダの酒場のような場所でした。多くの優れた人々との出会いは私にとって大きな刺激となりました。私が必死で乗り越えた壁を、いとも容易く乗り越えて遥か彼方をスキップしているような凄まじい技術力を持ったエンジニアに囲まれて非常に大きな刺激を受けました。具体的には「ちょっと暇だった」と言って片手間で実用的なダブル配列を実装してしまうような神ばかりでした。 私は学生時代に自分の力の限界を感じてしまい、無意識の内に目標を小さく持ってしまう癖がついていました。しかし就職してからは周りがものすごい力を持った方ばかりでしたので、何もできなければ直ちに死ぬだけでした。最早頭が悪いとか言っている場合ではありませんでした。高い技術力を身

    転職します - EchizenBlog-Zwei
  • 「テキストマイニングを使う技術/作る技術」を読んだ - EchizenBlog-Zwei

    自然言語処理は大学時代からやっていたのだが、恥ずかしながらテキストマイニングについてはよくわかっていなかった。@shima__shima先生から「テキストマイニングを使う技術/作る技術」を紹介していただいたので読んでみた(紹介していただき、ありがとうございました)。 書によるとテキストマイニングは厳密な定義はないものの、テキストデータから抽出されたデータを用いたデータマイニングを指すらしい。 で、従来のデータマイニングであれば数値データからそのままマイニングすればいいけれどテキストデータは自然言語で書かれていてそのままでは使えないので自然言語処理(NLP)を用いてマイニングで使うデータを抽出するよ。ということらしい。なんとなくNLPの中にテキストマイニングがあるのかと思っていたのだが、テキストデータとデータマイニングの橋渡しをする技術としてNLPを使っている、というのが正しいのかも。

    「テキストマイニングを使う技術/作る技術」を読んだ - EchizenBlog-Zwei
  • これ一冊で圧縮データ構造から機械学習までわかる!?「検索エンジンはなぜ見つけるのか」がすごい - EchizenBlog-Zwei

    話題の検索エンジン教科書「検索エンジンはなぜ見つけるのか 知っておきたいウェブ情報検索の基礎知識」を購入した(@hillbigさんが推薦文を書いていると聞いて気になっていた。)。 書は検索エンジンの超初心者向けの教科書。数式はもとよりコンピュータの用語をほとんど使わずに、わかりやすく検索エンジンの要点を説明している。とはいえ決して子供だましではなく情報技術を扱う人なら知っていないといけない(けど知らない人も多い)ことを誤魔化さずにきちんと書いてくれている。 また書では専門用語を意図的に避けていてイメージを掴みやすいような平易な語に置き換えて説明している。これは賛否あると思うけれど、各ページには対応する専門用語も併記されているし、きちんと勉強するときに読むべき論文等もきちんと紹介されている(しかも的確!)。 書で扱うテーマはクローラやインデックス作成、スコアリングなど検索エンジンの基礎

    これ一冊で圧縮データ構造から機械学習までわかる!?「検索エンジンはなぜ見つけるのか」がすごい - EchizenBlog-Zwei
  • 1