ブックマーク / akkikiki.hatenadiary.org (3)

  • 【雑記】学び方について - Topics Related to Computers and NLP

    最近時間ができて学びを促進させようと考えているのですが、どのように機械学習、自然言語処理、情報検索に関連する技術や研究動向を学ぶかについて考えていました。結論を先に言ってしまいますと、よく聞く「自分で疑問を持ち、自分で答えられるようにする。また細部を追ってきちんと中身を咀嚼する」になります。結構当たり前なことを書いている、と書いているうちに気がつきましたが、せっかく書いたので公開しておきます。 あるとき、「読む」といったら一字一句──エンジニア・光成 滋生(2)とコストをかけられないなら認めちゃえばいい──エンジニア・光成 滋生(4)を読みまして、「自分の学び方は自分に最適化されているのだろうか?当に学んだことを理解して咀嚼しているのだろうか?」という疑問が湧きました。 自分でざっと思いつくのは以下の通りです: 自分で実装する 勉強会等で発表する 他人のコードを読む 教科書の練習問題を解

    【雑記】学び方について - Topics Related to Computers and NLP
    yag_ays
    yag_ays 2014/12/28
  • Conditional Random Fields(CRF)入門その1 -主な参考資料と目的関数- - Topics Related to Computers and NLP

    Conditional Random Fields(CRF)がわかりません。何それおいしいの?状態ですが、ここから学習をはじめています。前向きアルゴリズム?後ろ向きアルゴリズム?Viterbiアルゴリズム?どこで使うのそれ?状態ですね。その状態を脱出するため日々奮闘中です。なお、この記事では自分の思考に則って書いていますので、綺麗な教科書的ではないこと(構造学習がなんたら等はあまり触れない)を始めに断っておきます。 脱出するために利用している資料は以下の通りです: 1.「日本語入力を支える技術」(以下IME):実装する上では一番初心者にやさしいです。 日本語入力を支える技術 ?変わり続けるコンピュータと言葉の世界 (WEB+DB PRESS plus) 作者: 徳永拓之出版社/メーカー: 技術評論社発売日: 2012/02/08メディア: 単行(ソフトカバー)購入: 14人 クリック

    Conditional Random Fields(CRF)入門その1 -主な参考資料と目的関数- - Topics Related to Computers and NLP
    yag_ays
    yag_ays 2013/11/17
  • 検索インデックス周り(主に接尾辞配列周り)に関する基礎の話 - Topics Related to Computers and NLP

    資料リンク集みたいなものですね。不完全なので、徐々に詳しく書いていきたい記事です。 接尾辞配列がなぜ巷で「痺れる、憧れるぅ!」状態なのかを理解した。 検索速度、スケーラビリティ、網羅性の観点から優れているみたいだ。 Lucene(Solr)を扱う際は、接尾辞配列のインデックスをサポートしていないみたいです。 接尾辞配列配列の生成にO(n^2logn)というのを常識のごとくウィキペディア日語版に書かれていたのだが、よくわからなかった。 O(nlogn)回の比較ソートが必要なのはわかるが、一回の比較にO(n)の時間がかかるとは? ・・・ここを見ている時に「文字列の比較」であることを思い出した。「あれ、nって要素の数じゃない」と一瞬思ったが、接尾辞配列においては「文字列の長さ=接尾辞配列の要素数」であることをまた、思い出して勝手に納得した。 検索クエリの長さをmとすると、二分探索を用いればO(

    検索インデックス周り(主に接尾辞配列周り)に関する基礎の話 - Topics Related to Computers and NLP
    yag_ays
    yag_ays 2013/07/30
  • 1