io9:現代生活におけるアルゴリズムの重要性は決して過小評価できません。アルゴリズムは、金融機関からデートサイトまで、至る所で使われています。その中でも、世界を支配しているいつくかのアルゴリズムが存在します。今回紹介する10のアルゴリズムがまさにそれです。まずは予備知識。アルゴリズムとは? 公式な定義はありませんが、コンピューター科学者たちは一連の処理手順を定めたルールセットをアルゴリズムと呼んでいます。コンピューターに問題の解き方や目標の達成方法を指示するものです。アルゴリズムを考えるときには、視覚的なフローチャートがよく使われます。 1. Google検索 かつて、それほど昔ではない時代に、インターネットの覇権を争って検索エンジン同士の戦いがありました。そして、Googleとその革新的なページランクアルゴリズムが勝者となりました。 今では、米国の検索エンジン市場の66.7%をGoogl
弊社(Cambridge Energy Data Lab)ではデータサイエンス系の開発言語をPythonに統一しておりまして、社員達がNumPy、SciPy、pandasなどなどを目下勉強中です。 データサイエンティストも積極採用中なのですが、応募者全員に以下のデータ解析タスクをGitHubから提出するという課題を課しています。 Cambridge Energy Data Lab: EnergyDataSimulationChallenge 既に15フォークされていて、質の良いPull Requestも多く来ていて嬉しい限りです。Cambridge大学の学生もどんどん応募してきてくれています。皆さんもお暇な時に是非 :) これが採用に非常に有効で、まずランダムにCVを送りまくっている応募者や、最低限のスキルの身に付いていない応募者のフィルタリングが非常に効率的に行えます。基本的にはこのプロ
First steps Scrapy at a glance Installation guide Scrapy Tutorial Examples Basic concepts Command line tool Spiders scrapy.Spider Spider arguments Generic Spiders CrawlSpider Crawling rules CrawlSpider example XMLFeedSpider XMLFeedSpider example CSVFeedSpider CSVFeedSpider example SitemapSpider SitemapSpider examples Selectors Items Item Loaders Scrapy shell Item Pipeline Feed exports Requests and
追記 2016年3月に以下の記事によってこの内容はupdateされています。今後はそちらをお読み下さい。 主に自分向けのまとめという意味合いが強いんですが(笑)、僕が実際に2013年6月現在webデータ分析&データサイエンスの実務でツール・ライブラリ・パッケージを利用しているものに限って、統計学・機械学習系の分析手法を10個挙げて紹介してみようと思います。 追記 回帰分析(特に線形重回帰分析) 独立性の検定(カイ二乗検定・フィッシャーの正確確率検定) 主成分分析(PCA) / 因子分析 クラスタリング 決定木 / 回帰木 サポートベクターマシン(SVM) ロジスティック回帰 ランダムフォレスト アソシエーション分析(バスケット分析・相関ルール抽出) 計量時系列分析 おわりに おまけ1:「素性ベクトル+分類ラベル」なるデータ前処理 おまけ2:グラフ理論*10 {igraph}パッケージでグラ
追うべき指標と追うべきでない指標の見分け方 Lean Analyticsには、追うべきでない指標(vanity = 虚栄な)と追うべき指標(actionable = 行動できる)の性質について、以下のように書いています。 追うべきでない(Vanityな)指標は、(数値の大きさから)楽しい気分にさせてくれる。しかし、あなたがどのように行動したらいいのかは教えてくれない。 追うべき(actionableな)指標は、進むべき方向を指し示してくれる。 つまり、「KPIは自分の行動につながるものでなくてはならない。ただ眺めるだけの指標には、何の意味もない」というわけです。 順にその理由を書いていきます。 ヒット数 古くからあるが何の役にも立たない。 PV数 ヒット数よりはましだが、大した意味はない。 訪問者数 数百回訪れている一人のユーザーなのか、一回しか訪れない一人のユーザーなのか分からない。 ユ
フィードバックを送信 Google グラフの使用 コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。 Google グラフを使用すると、ウェブサイト上のデータを可視化できます。 グラフ ギャラリーには、シンプルな折れ線グラフから複雑な階層ツリーマップまで、すぐに使用できる多数のグラフタイプが用意されています。 Google Chart を使用する最も一般的な方法は、ウェブページに埋め込む簡単な JavaScript を使用する方法です。いくつかの Google Chart ライブラリを読み込み、グラフ化するデータをリストして、グラフをカスタマイズするオプションを選択し、最後に選択した id でグラフ オブジェクトを作成します。 次に、そのウェブページの <div> に、この id を指定して Google グラフを表示します。 スタートガイドをご覧ください。
Send feedback Visualization: Motion Chart Stay organized with collections Save and categorize content based on your preferences. Overview A dynamic chart to explore several indicators over time. The chart is rendered within the browser using Flash. Note for Developers: Because of Flash security settings, this (and all Flash-based visualizations) might not work correctly when accessed from a file l
powered by Firebase What is GeoFire? GeoFire is a set of open-source libraries for JavaScript, Objective-C, and Java that allow you to store and query a set of items based on their geographic location. GeoFire uses the Firebase database for data storage, allowing query results to be updated in realtime as they change. GeoFire does more than just measure the distance between locations; it selective
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く