By hirotakaster on September 11, 2010 10:34 AM | No Comments | No TrackBacks Tweet あんまりネットにそれっぽい内容が無さそうな予感がしたから、参考程度に書いときまっす。 谷本係数(tanimoto coefficient)については、こっちとかこっちを参考に。 式は簡単で、 とか A,Bの類似度を図るのに便利。 T(A, B) = 1の場合、A,Bは同じもので、T(A, B)=0は全然異なるもの。 つまり、T(A, B)が1に近いほど、A,Bは似ていると捉えることができる。 ってことで、式だけ与えてどうすれば…と思うことが多いから、例をとって。 ちょっと前のエントリにあったように、アイテム間の類似度をPVベースで判定する場合を例にして。(あくまでもイメージ。キーワードとか単語でもOKだし。) 例
About this site ビジネスデータ分析のハウツーをコンテンツとする個人製作のサイトです。基本的にハウツーの延長線上でHTMLやCSS,あるいはCGを書(描)いてみたいと思った筆者の趣味的サイトでしかありませんが,もしどこかでどなたかのお役に立つことがあれば幸いです。 プライバシーポリシー・権利表記・著作権と禁止行為・免責事項 プライバシーポリシーその他 その他特に記載しておくべき事項 ハウツー上の設定はフィクションです。例示として使用した人物・会社・店舗および出来事は,実在の対象,あるいは実際に起きた事象とは一切関係ありません。 既存のコンテンツについて,内容の充実を図るため適宜修正・補足等の見直しを入れることがあります(この場合当該箇所に修正内容に関する注釈はおかず,文面等を直接書き換えいたします)。 筆者/サイト管理者 hawcas ご返答いたしかねますこと 「操作手順のこ
関連キーワード PaaS | Force.com | Amazon Web Services | Heroku | IaaS クラウドサービスのIaaSレイヤーの競争激化に伴いコモディティ化が進み、クラウドサービスの主戦場がPaaSレイヤーに一部シフトしつつある(関連記事:2011年クラウド業界を振り返る ~IaaSの発展、混沌としたPaaS業界の行方)。PaaSはIaaSレイヤーとの連携や一体化が不可欠であり、PaaSの種類によって提供される機能やサービスモデルは大きく異なる。 本稿では「Open PaaS」「複数のIaaSに対応するPaaS」「Proprietary PaaS」の3カテゴリに分類し、クラウド利用促進機構(CUPA)とNTTコミュニケーションズが共同で開催したオープンクラウドキャンパス テクノロジーミーティングのアンケートでユーザーの関心度が高かったPaaSを中心に、サー
ビッグデータ時代の救世主「Hadoop」とは 「Apache Hadoop」は今、最も注目を集めている技術の1つです。Hadoopとは、大量のデータを手軽に複数のマシンに分散して処理できるオープンソースのプラットフォームです。 Hadoopを活用している企業は年々増え続けていて、不可欠な技術になりつつあるといえるでしょう。 本連載では、Hadoopとは何か、Hadoopがどう活用できるのかということを、「テキストマイニング」に焦点を当てて解説していきたいと思います。 重い処理を複数のマシンに分散させる 複数のマシンに処理を分散させるには、プロセス同士の通信、監視、障害時の対応などを考えなければならず、プログラマにとってハードルが高いものです。しかし、Hadoopはそういった面倒くさい処理を一手に引き受けてくれ、プログラマは、やりたい処理だけに集中できます。 例えば、Hadoopを使うと、1
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く