[B! アルゴリズム] yosshi71jpのブックマーク

yosshi71jp id:yosshi71jp

アルゴリズムに関するyosshi71jpのブックマーク (12)

Ｃ言語辞典アルゴリズム
C言語プログラム用の辞典です。ANCI C規格の標準関数/キーワードなどをソースプログラムを添えて解説しています。
yosshi71jp 2013/04/01
アルゴリズム
リンク
データマイニングで使われるトップ10アルゴリズム - データサイエンティスト上がりのDX参謀・起業家
2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します（この論文は@doryokujin君のポストで知りました、ありがとうございます！）。必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C
yosshi71jp 2011/11/24
データマイニング

アルゴリズム

機械学習
リンク
Transformed Weight-normalized Complement Naive Bayes(TWCNB)についての実験と結果 - rubyu's blog
自作ソフトにテキストの多クラス分類機能を組み込みたくて、調べてみたら Complement Naive Bayes（CNB、補集合ナイーブベイズ）というアルゴリズムが最近の流行のようで、これを検証してみることにしました。元論文　を一通り読んでから検証を進めていきました。実装される際は目を通すことをオススメします。使用したコーパスは以下のようなもの想定する用途に合わせて、それなりにクラス間でデータの量にばらつきがあります。クラスファイル数サイズ A 832 121MB B 491 182MB C 449 59MB D 312 111MB E 298 26MB F 245 67MB G 234 73MB H 210 33MB I 123 33MB J 63 3MB K 62 14MB L 47 6MB M 47 5MB ひとまず、シンプルなナイーブベイズを集合知プログラミング　を
yosshi71jp 2011/08/23
アルゴリズム

naive bayes

機械学習

自然言語処理

cicp
リンク
Data Structure Visualization
Currently, we have visualizations for the following data structures and algorithms: Basics Stack: Array Implementation Stack: Linked List Implementation Queues: Array Implementation Queues: Linked List Implementation Lists: Array Implementation (available in java version) Lists: Linked List Implementation (available in java version) Recursion Factorial Reversing a String N-Queens Probl em Indexing
yosshi71jp 2011/05/15
アルゴリズム
リンク
PythonでOpenCV2.1を試した (CodeZine編集部ブログ)
こんにちは。少し前にPythonのことをしらべていましたら、OpenCVが結構簡単に使えることがわかって早速やってみました。普段Perlを使うことが多いのですがこういうC系のモジュールになると、自分の力不足ですが、Win32にうまくインストールできないことがおおいのです。 Pythonだとスゴイ簡単にインストールできました。 OpenCV.jp http://opencv.jp/ にいってWindows版をインストールすると C:\OpenCV2.1\Python2.6\Lib\site-packages というフォルダに cv.lib cv.pyd というのができるので、これをPythonの C:\Python\Lib\site-packages にいれるだけ、っぽいです。このサイトを参考にテストスクリプトを書きました。 http://my.opera.com/tanoue/blog
yosshi71jp 2010/09/10
python

opencv

顔認識

写真

アルゴリズム

プログラミング

画像
リンク
Latent Semantic Indexing - naoyaのはてなダイアリー
情報検索におけるベクトル空間モデルでは、文書をベクトルとみなして線形空間でそれを扱います。この文書ベクトルは、文書に含まれる単語の出現頻度などを成分に取ります。結果、以下のような単語文書行列 (term document matrix) が得られます。 d1 d2 d3 d4 Apple 3 0 0 0 Linux 0 1 0 1 MacOSX 2 0 0 0 Perl 0 1 0 0 Ruby 0 1 0 3 この単語文書行列に対して内積による類似度などの計算を行って、情報要求に適合する文書を探すのがベクトル空間モデルによる検索モデルです。見ての通り、単語文書行列の次元数は索引語の総数です。文書が増えれば増えるほど次元は増加する傾向にあります。例えば索引語が100万語あって検索対象の文書が 1,000万件あると、100万次元 * 1,000万という大きさの行列を扱うことになりますが、単
yosshi71jp 2010/07/09
検索

計算

アルゴリズム
リンク
類似画像検索システムを作ろう - 人工知能に関する断創録
C++版のOpenCVを使ってカラーヒストグラムを用いた類似画像検索を実験してみました。バッチ処理などのスクリプトはPythonを使ってますが、PerlでもRubyでも似たような感じでできます。指定した画像と類似した画像を検索するシステムは類似画像検索システムと言います。GoogleやYahoo!のイメージ検索は、クエリにキーワードを入れてキーワードに関連した画像を検索しますが、類似画像検索ではクエリに画像を与えるのが特徴的です。この分野は、Content-Based Image Retrieval (CBIR)と呼ばれており、最新のサーベイ論文（Datta,2008）を読むと1990年代前半とけっこう昔から研究されてます。最新の手法では、色、形状、テクスチャ、特徴点などさまざまな特徴量を用いて類似度を判定するそうですが、今回は、もっとも簡単な「色」を用いた類似画像検索を実験してみます
yosshi71jp 2009/10/05
アルゴリズム

プログラミング

画像
リンク
クラスタリング (クラスター分析) - Toshihiro Kamishima
クラスタリング (clustering) とは，分類対象の集合を，内的結合 (internal cohesion) と外的分離 (external isolation) が達成されるような部分集合に分割すること [Everitt 93, 大橋 85] です．統計解析や多変量解析の分野ではクラスター分析 (cluster analysis) とも呼ばれ，基本的なデータ解析手法としてデータマイニングでも頻繁に利用されています．分割後の各部分集合はクラスタと呼ばれます．分割の方法にも幾つかの種類があり，全ての分類対象がちょうど一つだけのクラスタの要素となる場合(ハードなもしくは，クリスプなクラスタといいます)や，逆に一つのクラスタが複数のクラスタに同時に部分的に所属する場合(ソフト，または，ファジィなクラスタといいます)があります．ここでは前者のハードな場合のクラスタリングについて述べます．
yosshi71jp 2009/10/01
アルゴリズム

クラスタリング
リンク
SEO対策のディーボ、Yahoo! JAPAN検索アルゴリズムレポート（09/09/11）を開示！
2009年9月4日に行われたYahoo!検索 Index Updateを受け、Yahoo! JAPANの検索アルゴリズムを分析し、検索アルゴリズムと順位変動に関する情報サイト「namaz.jp」（ URL：リンク）にレポートを開示しました。 ■Yahoo! JAPAN検索アルゴリズムレポート（09/09/11）　概要（1）概要 1.今回の Index Update は前回から93日（約3ヶ月）後で、前回の Index Update よりも大きな順位変動を記録 2.今回の Index Update では被リンクのドメイン数が多ければ多いほど、検索順位の決定に影響がある 3.Index Update 後に相関が高まったSEO要因は、「被リンク数（内部）」、「Yahoo!カテゴリ登録」、「ドメイン年齢」 4.キーワードによってSEO要因の検索結果順位に及ぼす影響力が違う ※各内容の詳細につ
yosshi71jp 2009/09/12
アルゴリズム

SEO
リンク
軽量データクラスタリングツールbayon - mixi engineer blog
逆転検事を先日クリアして、久しぶりに逆転裁判1〜3をやり直そうか迷い中のfujisawaです。シンプルなデータクラスタリングツールを作成しましたので、そのご紹介をさせていただきます。クラスタリングとはクラスタリングとは、対象のデータ集合中で似ているもの同士をまとめて、いくつかのグループにデータ集合を分割することです。データマイニングや統計分析などでよく利用され、データ集合の傾向を調べたいときなどに役に立ちます。例えば下図の例ですと、当初はデータがゴチャゴチャと混ざっていてよく分からなかったのですが、クラスタリングすることで、実際は3つのグループのデータのみから構成されていることが分かります。様々なクラスタリング手法がこれまでに提案されていますが、有名なところではK-means法などが挙げられます。ここでは詳細については触れませんが、クラスタリングについてより詳しく知りたい方は以下の
yosshi71jp 2009/09/06
クラスタリング

アルゴリズム

プログラミング

集合知
リンク
オーダーを極める思考法
プログラムの実行に掛かる時間を把握しておくのは、プログラミングを行う上で基本的な注意点です。今回は、計算量のオーダーについて学びながら、TopCoderのMedium問題を考えてみましょう。プログラムの実行時間業務としてプログラミングをされている方には釈迦に説法かもしれませんが、プログラムの実行に掛かる時間を把握しておくのは、プログラミングを行う上で基本的な注意点です。そしてこれは、TopCoderなどのコンテストでプログラムを組む際にもよく当てはまります。通常、こうしたことは感覚的に理解している方がほとんどだと思いますが、具体的にどれくらいのループを回すと何秒掛かる、といった基準を持っている人は少ないのではないでしょうか？　非常に基本的なことですが、プログラムの実行時間に関して再確認しておきたいと思います。 TopCoderの制限に関して TopCoderでは、実行時間およびメモリ使
yosshi71jp 2009/08/30
アルゴリズム

プログラミング

オーダー
リンク
GoogleのMapReduceアルゴリズムをJavaで理解する
GoogleのMapReduceアルゴリズムをJavaで理解する：いま再注目の分散処理技術（前編）（1/2 ページ）最近注目を浴びている分散処理技術「MapReduce」の利点をサンプルからアルゴリズムレベルで理解し、昔からあるJava関連の分散処理技術を見直す特集企画（編集部）いま注目の大規模分散処理アルゴリズム最近、大規模分散処理が注目を浴びています。特に、「MapReduce」というアルゴリズムについて目にすることが多くなりました。Googleの膨大なサーバ処理で使われているということで、ここ数年の分散処理技術の中では特に注目を浴びているようです（参考「見えるグーグル、見えないグーグル」）。MapReduceアルゴリズムを使う利点とは、いったい何なのでしょうか。なぜ、いま注目を浴びているのでしょうか。その詳細は「MapReduce : Simplified Data Proc
yosshi71jp 2009/08/06
[

mapreduce

並列

google

hadoop

プログラミング

アルゴリズム
リンク
1