タグ

ブックマーク / echizen-tm.hatenadiary.org (7)

  • 文系でも機械学習がわかるようになる教科書 - EchizenBlog-Zwei

    社内の有志で機械学習数学の勉強会をいくつかやっています(私以外の方が主催しているものもある)。とくに理系ではない方も参加されていますが、きちんと頑張ればだんだん機械学習ができるようになるということがわかってきたのでメモしておきます。 なお、機械学習をとりあえず実装するだけだったらもっと簡単に学ぶ方法もいろいろあり、今回はあくまで正攻法で機械学習を勉強する、という観点での書籍の選択となっています。急がば回れという言葉もあるように、焦って成果を求めないのであれば地道に頑張るほうが後々応用が効いて良いということもあります。 高専の数学 おそらく数学ができないという方は高校の数学あたりから理解が怪しいことになっていると思います。「高専の数学」は中学数学までの前提知識で読める教科書で、わかりやすい例題や理解の助けになる練習問題が多数用意されているため、きちんと問題を解いていけば無理なく高専の数学(

    文系でも機械学習がわかるようになる教科書 - EchizenBlog-Zwei
  • まったく最小二乗法は最高だぜ!な「イラストで学ぶ機械学習」を読み終えた。 - EchizenBlog-Zwei

    イラストで学ぶ機械学習」という機械学習を読んだので感想を書いておく。 なお書にはMatlabのコードが書いてある場合があるけど、Matlabに詳しくないので読み飛ばした。 対象となる読者 あくまで私の主観だけど、以下のような人が読むと良さそうな感じ。 ・機械学習の基礎は知っている(パーセプトロンくらいは実装できる) ・機械学習の論文に出てくる用語が理解できる ・確率の基礎は知っている(条件付き確率とか、周辺確率とか) ・最適化の基礎は知っている(ラグランジュの未定乗数法がわかる) ・行列の演算がわかる(これはわからなくても適当に読み飛ばせば大丈夫かも) ・機械学習で知っておいたほうが良いことを手早く把握したい ・まったく識別関数は最高だぜ!と思っている ・損失関数について理解を深めたい ・正則化について理解を深めたい ・次元削減について理解を深めたい ・転移学習について理解を深めた

    まったく最小二乗法は最高だぜ!な「イラストで学ぶ機械学習」を読み終えた。 - EchizenBlog-Zwei
    gogatsu26
    gogatsu26 2013/10/14
  • CRFがよくわからなくてお腹が痛くなってしまう人のための30分でわかるCRFのはなし - EchizenBlog-Zwei

    機械学習の3大有名手法といえばSVM、CRF、LDAではないだろうか(と勝手に思っている)。 SVM(Support Vector Machine)については以前記事を書いたので今回はCRF(Conditional Random Fields)について書いてみたい。 機械学習超入門IV 〜SVM(サポートベクターマシン)だって30分で作れちゃう☆〜 - EchizenBlog-Zwei といっても今回はさくっと読んでもらうのを目的にしているので手法の具体的な解説は行わない。具体的な部分は@uchumik氏の資料がとても詳しい。 uchiumi log: 間違ってるかもしれないCRFの説明 また、実装方法については高村(言語処理のための機械学習入門)がとても詳しい。 さて、具体的な解説をしないなら何をするの?ということだが、今回はそもそもCRFとは何かという話をする。過去の経験上この、そも

    CRFがよくわからなくてお腹が痛くなってしまう人のための30分でわかるCRFのはなし - EchizenBlog-Zwei
  • 自然言語処理の教科書はもう全部FSNLP一冊でいいんじゃないかな - EchizenBlog-Zwei

    自然言語処理の優秀なエンジニア各位にオススメを聞くと大抵FSNLP(Foundations of Statistical Natiral Language Processing)という答えが返ってくる。またブログ等でFSNLPを絶賛している方も多い。 私は自然言語処理は長尾で満足してしまっていたのでFSNLPは読んでいなかったのだけれど、長尾は現在入手困難ということもあって入手しやすい自然言語処理の教科書があるといいなと思っていたのでFSNLPを読んでみた。 その結果。自然言語処理の教科書はもう全部FSNLP一冊でいいんじゃないかな。という結論に至ったので全力でFSNLPを推薦する記事を書くことにした。 参考: [を]FSNLP @ytoさん 自然言語処理の定番の教科書まとめ - 生駒日記 @mamorukさん Perl で自然言語処理 @overlastさん ざっと読んでみてFSN

    自然言語処理の教科書はもう全部FSNLP一冊でいいんじゃないかな - EchizenBlog-Zwei
    gogatsu26
    gogatsu26 2011/11/03
  • 30分でわかる高性能な圧縮符号vertical code - EchizenBlog-Zwei

    検索エンジンの転置インデックスなどデータ列を小さいデータサイズで持たせたい、という状況がある。こういう場合圧縮符号を使うのが一般的でunary符号やgamma符号、delta符号など様々な種類がある。 圧縮符号の中でイチオシなのがvertical code(vcode)。これは岡野原(@hillbig)氏によって提案された圧縮符号で単純な仕組みでdelta符号並の性能を誇っている。 記事ではvcodeのポイントを絞って30分でわかるように解説してみる。 vcodeは棚にを並べる作業を連想すると理解しやすい。棚は予め高さが決まっているので全てのが入るような棚を用意する。つまり というようなものを想像する。 この棚は8冊のが並んでいるが左から5冊目のが他よりも背が高い。このため5冊目のに合わせて背の高い棚が必要になる。だが他のは5冊目のほどに背が高くないので、5冊目が

    30分でわかる高性能な圧縮符号vertical code - EchizenBlog-Zwei
    gogatsu26
    gogatsu26 2011/10/24
  • これ一冊で圧縮データ構造から機械学習までわかる!?「検索エンジンはなぜ見つけるのか」がすごい - EchizenBlog-Zwei

    話題の検索エンジン教科書「検索エンジンはなぜ見つけるのか 知っておきたいウェブ情報検索の基礎知識」を購入した(@hillbigさんが推薦文を書いていると聞いて気になっていた。)。 書は検索エンジンの超初心者向けの教科書。数式はもとよりコンピュータの用語をほとんど使わずに、わかりやすく検索エンジンの要点を説明している。とはいえ決して子供だましではなく情報技術を扱う人なら知っていないといけない(けど知らない人も多い)ことを誤魔化さずにきちんと書いてくれている。 また書では専門用語を意図的に避けていてイメージを掴みやすいような平易な語に置き換えて説明している。これは賛否あると思うけれど、各ページには対応する専門用語も併記されているし、きちんと勉強するときに読むべき論文等もきちんと紹介されている(しかも的確!)。 書で扱うテーマはクローラやインデックス作成、スコアリングなど検索エンジンの基礎

    これ一冊で圧縮データ構造から機械学習までわかる!?「検索エンジンはなぜ見つけるのか」がすごい - EchizenBlog-Zwei
  • アリ充に近づくために「はじめての数論」を読んでる - EchizenBlog-Zwei

    アリこと「プログラミングコンテスト チャレンジブック」の上級編の最初に数論ぽい話が色々書いてあって興味を持ったので「はじめての数論」を読んで勉強中。 このは数論の入門書ということで非常に分かりやすく数論の基礎が書いてある。全48章からなる書は1章あたり10P前後でまとまっていて読みやすい。毎朝30分で1章読む感じで楽しんでいる。練習問題もプログラムを書け、エッセイを書けなどユニークなものが多くて面白い(難しくて解いてない問題も結構ある。まあ考えることに意義があるので!)。 の構成も数学にありがちな天下り的な感じではなく、事例を眺める、法則を予想する、証明するという流れになっているので自然に頭に入ってくる。 それになんといっても著者が数論大好き!というのが文章から伝わってくるのが良い。なんというか素数かわいいよ素数という感じ。数論は整数を扱うものなので数学の事前知識が無くても読め

    アリ充に近づくために「はじめての数論」を読んでる - EchizenBlog-Zwei
  • 1