運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します。個別にライセンスが設定されている記事等はそのライセンスに従います。
![機械学習 はじめよう 記事一覧 | gihyo.jp](https://cdn-ak-scissors.b.st-hatena.com/image/square/7241c583676d54fc052c4388a6edd25e4c7f280b/height=288;version=1;width=512/https%3A%2F%2Fgihyo.jp%2Fassets%2Fimages%2Fgihyojp-ogp.png)
2006年のデータマイニング学会、IEEE ICDMで選ばれた「データマイニングで使われるトップ10アルゴリズム」に沿って機械学習の手法を紹介します(この論文は@doryokujin君のポストで知りました、ありがとうございます!)。 必ずしも論文の内容には沿っておらず個人的な私見も入っていますので、詳細は原論文をご確認下さい。また、データマイニングの全体観をサーベイしたスライド資料がありますので、こちらも併せてご覧下さい。 データマイニングの基礎 View more presentations from Issei Kurahashi 1. C4.5 C4.5はCLSやID3といったアルゴリズムを改良してできたもので、決定木を使って分類器を作ります。決定木といえばCARTが良く使われますが、CARTとの違いは以下のとおりです。 CARTは2分岐しかできないがC4.5は3分岐以上もできる C
今年の東京ゲームショーの入場者数が過去最高だったそうで。東京ゲームショウ2011の入場者数が過去最高の22万2668人を記録【TGS2011】 - ファミ通.com ゲームが盛り上がってきてるかも?ってことで、とても嬉しいニュースです。偶然ですがちょうど先日、以下を書きました。 あなたの「隙間時間」を埋めてくれる無料iPhoneゲーム30選 色々とゲームで遊んでたら、ゲーム開発について色々と調べたくなったので、調べてみたメモを以下にまとめてみました。 ゲームの作り方目次(AppStoreカテゴリ別) 以下、AppStoreのゲームカテゴリ別に整理した目次です。並びはAppStoreでの表示順です(2011/9/20時点) AppStoreカテゴリジャンプ先アーケードシューティングアクションアクション|Unityアドベンチャーアドベンチャーボード、カジノボード、カジノシミュレーションシミュレ
脳と現状のコンピュータは、計算モデル、アーキテクチャ、 アルゴリズムなどいろいろな観点からみて違いがあります。 はたしてコンピュータの上で脳と同じ機能は実現できるのでしょうか。 実現を難しくする要因として何が考えられるでしょうか。 ◆計算モデルの違い 計算する機械を数学的に抽象化したものを計算モデルと呼びます。 チューリングマシンは計算モデルの1つです。 チューリングマシンとは数学的に異なる計算モデルとしては、 例えば非決定性チューリングマシン、 (理想的な)アナログコンピュータ、量子チューリングマシン (量子コンピュータのモデル)があります。 これらはチューリングマシンよりも強力だったり速かったりします。 さて、「脳の計算モデル」はチューリングマシンと等価でしょうか、 それともより強力だったり速かったりするのでしょうか。 非決定性チューリングマシンは並列度が無限の計算機です。 脳は超並列
Googleからのアドバイス「高品質なサイト」とは? チェックリストを公開 検索アルゴリズム的に「高品質なサイト」って何だろう?Googleが、高品質サイトを判断するための参考になる「質問集」を公開。 公開日時:2011年05月07日 09:03 米Googleは2011年5月6日、役に立たない低品質サイトの排除と同時に優れたコンテンツが検索上位に表示されるようにするためのアルゴリズム変更(パンダ・アップデート(Panda Update))に関連して、同社が考える「高品質サイト」について言及している。 検索マーケティング業界で話題になっているパンダ・アップデートとは、いわばアルゴリズムで自動的にサイト品質(site quality)を判断しようとするGoogleの取り組みだ。低品質サイトの検索順位を低下させることにより、検索利用者が優れたコンテンツを探し出せるようにする狙いがある。 「アル
『モバゲーの大規模データマイニング基盤におけるHadoop活用』-Hadoop Conference Japan 2011- #hcj2011 2011/02/22 [登壇後エントリ] :" 「モバゲーの大規模データマイニング基盤におけるHadoop活用」-Hadoop Conference Japan 2011 #hcj2011 で登壇してきました " http://d.hatena.ne.jp/hamadakoichi/20110222/p1Read less
ImgBurn でディレクトリーからDVDイメージをつくるさいに、なんか対象ディレクトリー内の"xxxx.xls"というファイル(詳細なファイル名を書いてもしょうがないので"xxxx.xls"とする。サイズは620MBほどある)を見に行くと、そこで処理が止まる。やたらと時間がかかる。 というか、イメージファイル作成って、仕様はいろいろあって実装の面倒くさい、とても簡単とはいえないプログラムだと思うけど、高速化のためにむちゃくちゃこったアルゴリズムを使わないといけないようなものでもないはずだ。 CPUとHDDが早ければ、そんな時間がかかるものじゃない。 実際、これまで ImgBurn を使ってきて、そんなバカみたいな時間がかかったなんてことはない。 なのに数時間かかる。"xxxx.xls"のところで処理がとまり(いちおうプログラムは応答無しにはなってない)、かなりの時間ほっておいてようやく次
GoogleとBingの両検索エンジンが、ツイッターでつぶやかれたり、フェイスブック「いいね」ボタンを押されたサイトのデーターを、ランキングの計算に利用していることを明らかにしました。 TwitterやFacebookで共有されたリンクが検索順位に直接影響する――グーグルとBingが明言 これまで「SEO(検索エンジン最適化)」と言われていた手法は、今後は通用しなくなる方向に進むでしょう。間違いなく。 ヘドロの海 検索エンジンは大量のスパムに悩まされているそうです。大量に自動生産され続けるスパムページで汚染されたハイパーリンク空間から、本当に価値のあるページだけを、拾い上げなければなりません。 検索エンジンは、ヘドロの海から、ザルで小さな指輪をすくい上げるような、気が遠くなる作業を繰り返しています。このままでは、リソースをいくら追加したところで、イタチごっこは永遠に続くでしょう。 My o
知ってる? クレジットカード番号の意味と暗算認証術2011.01.24 12:0028,376 satomi 暗算で偽造カード見分けられるなんて...知らなかった! 毎日のように使うクレジットカード。丸暗記して時間セーブしてる人も、あの数字16桁の意味までは知らないんじゃ? 16個の数字にはそれぞれ意味があるんですよ。米国で人気のオンライン資産管理サービス「Mint」がズバリ図解してくれました! (図の訳) 1)最初の1桁:主要産業識別子 (MII:Major industry identifier)。カード発行者の業界を表します。 0 予備 1、2 航空 3 旅行・娯楽 4、5 銀行・金融 6 商品輸送・銀行 7 石油 8 通信 9 国ごとの割り当て分 2)MIIを含む最初6桁:発行者識別番号(IIN:Issuer Identifier Number)。カード発行者の身元を表します。 [
分散 Key-Value ストア mio-0.0.1alpha をリリースしました。(mio-0.0.1-alpha.tar.gz) Mio とは何か? 範囲検索(range query) が出来る KVS です。例えば「key が "1000"〜"2000" にあるものを昇順に10件取り出す」という検索が可能です。 Mio は memcached 互換プロトコルを実装しているので、多くのプログラミング言語から簡単にアクセスする事が可能です。(後述のコード例参照) Mio のアーキテクチャ Mio は Skip Graphs(スキップグラフ)というアルゴリズムに基づいて実装されています。詳細はErlang 分散システム勉強会での発表資料 Mio - a distributed Skip Graph based orderd KVSをご参照ください。 インストール 最新の Erlang をイ
一昨日、Facebookが新たな検索アルゴリズムを実験中、とAll Facebook(元記事)が報じた。 具体的にはLikeに基づくページランクによる検索方式で、実際にFacebookの検索窓で試せるようだ。例えばappleと入力すると、最上部には当社岡村直人が最近投稿した「FacebookとApplrに不協和音!?」というブログ記事が表示され、その下に6名がこの記事をシェアしたと表示されている。 ここからも私の友人関係のLikeないしShareが、検索結果に影響を与えているであろうことが推測できる。 記事原文によると、All Facebookはこの検索結果を「友人のLike情報、および全世界のLike情報に基づいたもの」と推測したが、追記内でFacebookから「友人のLike情報を含んだ検索アルゴリズム」であるとの回答を得たようだ。 さらに記事原文では、このアルゴリズムはこの8月31日
数回にわたって動的計画法・メモ化再帰について解説してきましたが、今回は実践編として、ナップサック問題への挑戦を足がかりに、その長所と短所の紹介、理解度チェックシートなどを用意しました。特に、動的計画法について深く掘り下げ、皆さんを動的計画法マスターの道にご案内します。 もしあなたが知ってしまったなら――病みつきになる動的計画法の集中講義 前回の『アルゴリズマーの登竜門、「動的計画法・メモ化再帰」はこんなに簡単だった』で動的計画法とメモ化再帰を説明しましたが、前回の説明ではまだ勘所をつかめていない方がほとんどでしょう。そこで、これらを完全にマスターするため、今回はもう1つ具体例を挙げながら練習したいと思います。 どういった問題を採用するかは悩みましたが、非常に有名な「ナップサック問題」を取り上げて説明します。 ナップサック問題とは以下のような問題です。 幾つかの品物があり、この品物にはそれぞ
動的計画法とメモ化再帰 今回は、非常によく用いられるアルゴリズムである、「動的計画法」「メモ化再帰」について説明します。この2つはセットで覚えて、両方使えるようにしておくと便利です。 なお、メモ化再帰に関しては、第5・6回の連載の知識を踏まえた上で読んでいただけると、理解が深まります。まだお読みになっていない方は、この機会にぜひご覧ください。 中学受験などを経験された方であれば、こういった問題を一度は解いたことがあるのではないでしょうか。小学校の知識までで解こうとすれば、少し時間は掛かるかもしれませんが、それでもこれが解けないという方は少ないだろうと思います。 この問題をプログラムで解こうとすると、さまざまな解法が存在します。解き方によって計算時間や有効範囲が大きく変化しますので、それぞれのパターンについて考えます。 以下の説明では、縦h、横wとして表記し、プログラムの実行時間に関しては、
あなたのスキルで飯は食えるか? 史上最大のコーディングスキル判定:makeplex salon(1/2 ページ) この問題ができたから優秀な人材とは限らないけれど、できない人は“ほぼ確実に”優秀ではない――プログラマーの皆さまの実力を計るコーディングスキル判定問題を用意しました。あなたはこの問題が解けるでしょうか? 新年度が始まり、新たに社会人となった読者の方も多いかと思います。あるいは、転職で心機一転がんばろうという読者もおられるでしょう。 あなたがもしプログラマーやSEといった職種であれば、ぜひ面白い仕事を手がけていただきたいと思いますが、そもそも開発分野で本当に面白い仕事とは何かを考えたことはありますか? その答えを論ずる前に、少し前に話題となったトピックを取り上げたいと思います。それは、岡嶋大介氏の「人材獲得作戦」についてです。ご存じない方のために少し補足しておくと、岡嶋氏は、株価
探索(たんさく、英: search)とは、特定の制約条件を満たす物を見つけ出す行動のこと。 何か問題を解くに当たって、有効な解析的な解法を用いることのできない場合は、試行錯誤によって解を得る場合もある。 一部のアルゴリズムは、元々、機械学習と並んで人工知能の分野のアルゴリズムであるが、現在はその他の分野にも応用されている。類義語として検索(英: search)も参照。 概要[編集] 探索アルゴリズムとは、大まかに言えば、問題を入力として、考えられるいくつもの解を評価した後、解を返すアルゴリズムである。 まず解くべき問題を状態(英: state)と状態変化(行動、英: action)に分ける。 最初に与えられる状態を初期状態(英: initial state)といい、目的とする状態は最終状態(ゴール、英: final state, goal)と呼ばれる。 初期状態から最終状態に至る、状態及び
細かすぎて伝わりにくいTopCoderのコーディングスキル向上マジック:最強最速アルゴリズマー養成講座(1/3 ページ) 競技プログラミングはレベルの高い人たちの集まり――そんな考えを持っている初心者の方、TopCoderはあなたのコーディングスキルを爆発的に高める魔法のような場です。今回は、初心者にこそお勧めしたいTopCoderの魅力について考えます。 教育的な観点から見るTopCoder 今回からTopCoderに関する実践的アルゴリズムを解説していく予定でしたが、序盤のうちに触れておきたいことがありましたので、今回の枕は“教育的視点から見るTopCoder”というテーマで少し書こうかと思います。 まず、最初に宣言しておきたいことは、この連載は初心者向きである、ということです。「どう考えても上級者向けだろう」という意見はたくさんの方から寄せられていますが、筆者は、まだプログラミングレ
全世界で20万人を超える凄腕のコーダーが集うプログラミングコンテスト「TopCoder」。本稿では、アルゴリズム部門のSRMで取り上げられる問題を考えながら、論理的思考力およびコーディングのテクニックを養っていきます。 はじめに はじめまして。高橋直大です。本連載「最強最速アルゴリズマー養成講座」では、全世界で20万人を超える凄腕のコーダーが集うプログラミングコンテスト「TopCoder」について、そこで出題される数学・アルゴリズムのパズルを考えることで、コーディングのテクニックおよび論理的思考力を磨くことを目的に開始するものです。ここで扱う技法は主にアルゴリズムのそれですが、その根底にはロジカルな思考術が存在します。そうした能力を養いたい方にとって少しでも役に立てれば幸いです。 なお、本稿は必要に応じてコーディング例も紹介しますが、TopCoderで出題される問題の中から比較的やさしい問
プログラムの実行に掛かる時間を把握しておくのは、プログラミングを行う上で基本的な注意点です。今回は、計算量のオーダーについて学びながら、TopCoderのMedium問題を考えてみましょう。 プログラムの実行時間 業務としてプログラミングをされている方には釈迦に説法かもしれませんが、プログラムの実行に掛かる時間を把握しておくのは、プログラミングを行う上で基本的な注意点です。そしてこれは、TopCoderなどのコンテストでプログラムを組む際にもよく当てはまります。通常、こうしたことは感覚的に理解している方がほとんどだと思いますが、具体的にどれくらいのループを回すと何秒掛かる、といった基準を持っている人は少ないのではないでしょうか? 非常に基本的なことですが、プログラムの実行時間に関して再確認しておきたいと思います。 TopCoderの制限に関して TopCoderでは、実行時間およびメモリ使
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く