タグ

ブックマーク / blog.broomie.net (10)

  • BLOG::broomie.net: 無料でよめる機械学習・自然言語処理の教科書

    夏いですね.最近この手の記事ばかりで大変恐縮ですが,機械学習に関するウェブ上で手に入る無料のテキストが紹介されていたので,共有したいと思います.ほとんどは以前に僕が紹介している(時々更新しています)「機械学習・自然言語処理のリソースリンク集」に入っているのですが,改めて紹介いたします.おそらく,他ブログでも紹介しているようにも思えますが,このサイトの紹介がてら引用させていただこうと思います. MetaOptimize / 最近ちょっと話題になっている「MetaOptimize /」という機械学習のサイトのQ&Aで紹介されていました.まじめに見ていなかったのですが,このサイト非常に有用でおもしろいですね. 特に同サイトの「qa」はかなり有用かと思いました. フリーの機械学習テキスト 話を戻しますと,興味深いQuestionsがたくさんあるのですが,今回注目したのは「Good Freely A

    yuiseki
    yuiseki 2012/06/11
  • BLOG::broomie.net: gperfは色んなプログラミング言語の予約語の認識部分で使われている

    超個人的なエントリで恐縮です。 先日完全ハッシュ関数に関して調査していたのですが、 perfect hash function(完全ハッシュ関数)の概要 そこで、GNU gperfというアプリケーションが完全ハッシュ関数の生成器として存在するって話を少ししだけれども、かくいう僕もgperfを使わせていただいておるのですが、実際にどんなアプリケーションやユースケースで使われているのかなあ、と興味を持ったので軽い気持ちで調べてみた。 gperfの家のマニュアルを調べてみると確かに、それらしいことが書いてある。 gperf currently generates the reserved keyword recognizer for lexical analyzers in several production and research compilers and language proce

    yuiseki
    yuiseki 2012/06/11
  • BLOG::broomie.net: エージェントアプローチ人工知能のプログラム

    shunyaでございます。勉強する時間があまりとれていないのでコネタが続いています。というよりも僕のブログのスタンスは基的に有用なものメモするだけ、気軽にやる!って感じなのでこれで良いと思っています。時間ができたときに時々気のエントリー!みたいな。あるのかな、そんなこと。 前置きが長くなりましたが、今日は人工知能の教科書についてです。人工知能の授業でよく使われる教科書で最も有名なものの一つに「エージェントアプローチ人工知能」というものがあります。 エージェントアプローチ人工知能 第2版 17800円とばか高いのですが、すごく網羅的に解説してあって僕は好きです。大学院時代の人工知能の授業はこの教科書でした。 それで、たいしたことではないのですが、上記の教科書で解説しているアルゴリズムをpythonでひたすら実装しているプロジェクトgoogle codeにあったので紹介しておきます。 h

    yuiseki
    yuiseki 2012/06/11
  • BLOG::broomie.net: WEB+DB PRESS Vol.59 大規模データ分析

    [実践]大規模データ分析というテーマで特集を組ませていただき、 1章 データマイニング入門 2章 テキストマイニング 3章 クラスタリング 4章 ログデータマイニング 5章 リンクマイニング という章立てで僕は「テキストマイニング」について書かせていただきました。 テキストマイニングということで、とても幅の広い話なので、どのようにまとめるかに苦難しました。専門家の方には物足りないかもしれませんが、紙面にも限りがあるため、今回はテキストマイニングの概要とhadoopを使った効率的な頻度分析、共起分析についてまとめ、全体的に基的な内容でまとめさせていただく運びとなりました。 キーワードを抽出し、特徴ベクトルさえできてしまえば、応用できる手法を掲載した書籍がたくさんあることもあり、今回はキーワード抽出のところに重きを置かせていただきました。hadoopを使ってmixiの日記から簡単にキーワード

    yuiseki
    yuiseki 2012/06/11
  • BLOG::broomie.net: 機械学習のアルゴリズムを解説したサンプルプログラム集

    すごい、有名なアルゴリズムのサンプルプログラムがたくさんあります! http://www.yom-tov.info/Uploads/ # Parent Directory # Ada_Boost.m # Bottom_Up_Parsing.m # C4_5.m # DHSchapter2_fixed.mat # Grammatical_Inference.m # Marginalization.m # PPT.m # SVM.m # Sequential_Feature_Selection.m # calculate_region.m だけどmatlabわからない。。。 いつか解読してみせる。

  • BLOG::broomie.net: 機械学習・自然言語処理のリソースリンク集

    いつもネット上で機械学習NLPに関する便利そうなツールや,有用なドキュメント,動画,ツールなどをメモしているのですが,今後の調査のためにどこかに一つに集約しておきたいなあ,と思い,この記事に集約しておくことにしました.昨今,自動リンク集や,自動インデックス作成に関して研究が盛んにされていますが,これは人力リンク集です!リンク先はほとんどさらっとしか見ていないので当に有用かどうか保証できませんが,興味を持ったものは掘り下げて別の記事で紹介したいと思います.おもしろいものを見つけしだい,このエントリーは更新していきたいと思います. ※ 有名どころをカバーしているわけではありません,あくまで気まぐれで追加していきます... ※ いくつかカテゴリ間で重複します 解説・読み物系リソース 全般 Statistical Data Mining Tutorials Tutorial Slides by

  • BLOG::broomie.net: Thriftが便利すぎる

    ちょっと前に「thriftって便利らしいよー」って話を聞いていたのだけれども、なかなか手をつけられずにいたらはてなブックーマークで使われているらしいという噂を聞いたり、Thriftを使って俺俺Key-Value Storeを作ったのように、TXを使ったThriftの紹介などが出てきたりしたのでそろそろ自分でも試したいなあと思い、試しました。で、先に結論を言っておくとThrift、とても気に入りました。とても簡単に処理用の専用サーバをたてることができて、かつ簡単にクライアントから処理要求が送れます。ボクは今まではRESTFulな感じでhttpでこのタスクをやっていたのですが、RESTFulな専用サーバをたてるのは結構開発コストがかかるんですよね。その点で、Thriftは開発コストはとても落ちると思うのでとても気に入っています。なんといって言語バインディングを自動で生成してくれるのは当に開発

  • BLOG::broomie.net: 各種分類器の分類精度を示した絵がおもしろい

    今日会社で多次元のデータを2次元にクールでベストプラクティスな感じでプロットするにはどうしたらいいんだろうね、やっぱ多次元尺度構成法じゃない?的な会話をしていたのだけれども、2次元にデータを落とし込むと人間にもわかるデータになって当におもしろいですよね。今日はその一例というか、いくつかの分類器の分類精度を2次元にプロットした結果を示した実験結果を解説したページを紹介します。おおーこうゆうのみたかったんだよなー!と個人的にはかなりエキサイティングな感じでした。 要約というか意訳になってしまうのですが、ページに以下のように説明されています。(細かいところは訳してません) http://home.comcast.net/~tom.fawcett/public_html/ML-gallery/pages/index.html 分類タスクの機械学習の研究では定量的な評価が重要です(精度とかACUと

  • BLOG::broomie.net: 機械学習の勉強を始めるには

    thriftとかhadoopなど,何やらいろいろと手を出してしまい,ここのところブログの更新が滞ってしまっていますが,今日は前から書きたかったトピックについて自分へのメモの意味も含めて記しておきたいと思います. はじめに 最近,といっても結構前からなのですが,海外のブログなどで「機械学習の勉強を始めるガイドライン」についてのエントリーがいくつか見られ,かつ,議論も少し盛り上がっています.僕は機械学習が好きなだけで,専門というにはほど遠いのですが,僕も一利用者としてはこのトピックに関してはとても興味があります. 機械学習というと,色々な数学的な知識が必要であったり,統計学や人工知能の知識も必要になったりしまったりと,専門的に学ぶ機会が無かった人にとっては興味が湧いてもなかなか始めるには尻込みしてしまうことかと思います.今日紹介するエントリーは,そんな方々にヒントになるような内容になっていると

  • BLOG::broomie.net: 機械学習の最新論文が読めるサイト

    ハイクオリティの最新の機械学習の論文って入手するのが大変ですよね。僕はよくACM系のちょっと前の論文をあさったりするのですが、やっぱり最新の機械学習ライフをエンジョイするには最新の論文が読みたいですよね。そんな、サイトがありました!ってこれってもしかして常識? Journal of Machine Learning Research これはすごい。最新の機械学習に関する論文が読めまくります。こんなポータルが欲しかったんです。RSS機能もあるようですし、ちょくちょく目を向けたいと思います。おもしろい論文があったら紹介したいですね。

    yuiseki
    yuiseki 2009/09/27
  • 1