タグ

ブックマーク / gihyo.jp (5)

  • 第14回 ベイズ線形回帰を実装してみよう | gihyo.jp

    前回までに紹介したベイズ線形回帰を実装してみます。 ベイジアンという言葉に難しい印象を持たれている方もいるかもしれませんが、実装が劇的に難しくなったりはしませんから、ご安心ください。 ベイジアンに難しいところがあるとすれば、増えたパラメータをどう決めるかという点と、確率分布として求まる解をどう扱うかという点でしょうか。今回はそのあたりも含めて、見ていくことにしましょう。 環境はこれまでと同じPython&numpy&matplotlibを使用します。インストールなどがまだの方は連載第6回を参照ください。 普通の線形回帰のコードを復習 それでは、ベイズ線形回帰を解くコードを実際に書いていくのですが、第11回で書いた普通の線形回帰のコードに必要な部分を書き足す形で進めましょう。ただし、特徴関数φにはガウス基底を使うことにします。 ガウス基底は、次のような正規分布と同じ釣り鐘型をした関数です。た

    第14回 ベイズ線形回帰を実装してみよう | gihyo.jp
  • 「第33回 HTML5とか勉強会~Webーデバイス連携最新動向!!」活動報告 | gihyo.jp

    11月20日、第33回目の「HTML5とか勉強会」はNTTコミュニケーションズさんのオフィスをお借りして開催しました。 今回は「Webーデバイス連携最新動向!!」をテーマとして、Webとデバイスとの連携を実現するためのAPIなどについてセッションが行われました。 稿では、今回のイベントについてレポートします。 Web Intentsを中核としたクラウド-デバイス連携概要 はじめに、NTTコミュニケーションズのこまつけんさくさんより、Web Intentsによるデバイス間の連携について紹介いただきました。 まず、マルチデバイスでの連携というと今まではWebSocketサーバを介してデバイス間でデータのやり取りを行う形式がありました。しかし手元にあるデバイスを連携させるためにわざわざ別の中継サーバを介するのはもったいなくて面倒です。ローカルサーバが手軽に動かせて、そのサーバのURLが自動で取

    「第33回 HTML5とか勉強会~Webーデバイス連携最新動向!!」活動報告 | gihyo.jp
  • 第9回 MongoDBの地理空間インデックス | gihyo.jp

    経度・緯度は配列またはハッシュとして保存します。今回はlocというフィールドに配列として保存します。yamanotesenというコレクションにinsertするクエリは、以下のようになります。 > db.yamanotesen.insert({ name:"五反田",loc: [ 139.723822, 35.625974 ] }); > db.yamanotesen.insert({ name:"恵比寿",loc: [ 139.710070, 35.646685 ] }); > db.yamanotesen.insert({ name:"新宿",loc: [ 139.700464, 35.689729 ] }); > db.yamanotesen.insert({ name:"新大久保",loc: [ 139.700261, 35.700875 ] }); > db.yamanotesen

    第9回 MongoDBの地理空間インデックス | gihyo.jp
  • 第3回 JSONPでのクロスドメインアクセス | gihyo.jp

    JSONPの動作原理 前回はAjaxに存在するセキュリティモデルであるSame-Originポリシーを紹介し、そのSame-Originポリシーを迂回する方法とセキュリティについて見てきました。また、回避する方法の1つめとしてリバースProxyを用いた方法を紹介しました。リバースProxyを用いた方法ではセキュリティ的な問題点もありましたが、そもそもProxyサーバを用意しなければならないため、この方法は手軽に使うことはできませんでした。 そこで考え出されたのがJSONP(JavaScript Object Notation with Padding)という方法です。 それではまず簡単にJSONPについて説明します。 Ajaxで使われるXMLHttpRequestオブジェクトには前回説明したとおりSame-Originポリシーがありクロスドメインアクセスはできません。一方、SCRIPTタグ

    第3回 JSONPでのクロスドメインアクセス | gihyo.jp
  • 第19回 転置インデックスの実装 | gihyo.jp

    先ほどの表2のデータが文書ID順だったのに対して、表3は見出し語順になっています。文書IDと見出し語のデータの並び順がひっくり返っているために、転置インデックスに「転置」という語が付けられます。転置インデックスの形式であれば見出し語ごとに求めるべきデータが固まっているので、求めるべき文書IDと出現位置の集合が高速に得られます。Googleでは複数台のマシンを使った分散処理で表2の形式から表3の形式にデータを変換しており、この操作をMapReduceと呼ぶしくみを通じて実現しているということです。 FINDSPOTの転置インデックス構造 FINDSPOTの転置インデックスを設計する際には、いくつかの前提条件について吟味する必要がありました。 まずは扱うデータの分量です。FINDSPOTで扱うデータ量は平均500字程度の文書で100万件というのが当初の目標値でした。トータルの文字数は、500字

    第19回 転置インデックスの実装 | gihyo.jp
  • 1