タグ

2007年2月14日のブックマーク (3件)

  • ユビキタスの街角 データ圧縮手法の応用

    PPM (Prediction by Partial Matching)というデータ圧縮アルゴリズムがある。 一般に、あるデータ列が与えられているとき、次に来るデータを予測することができればデータ圧縮を行なうことができる。 データ列から判断して次に来るデータが「a」だと確実に判断できるときは「a」を記述する必要が無いからである。 PPM法では、既存のデータ列中の文字列出現頻度を計算することによってこのような予測を行なう。 たとえば「abracadab」というデータの次にどの文字が来るか予測する場合、 「a」は4回、「b」は2回出現している 「b」の後に「r」が続いたことがある 「ab」の後に「r」が続いたことがある ... といった情報を累積して確率を推定する。 この場合、 (3)から考えて次の文字は「r」である確率が高いが、 (1)も考慮すると「a」の確率もある、という風に計算を行なう。

    overleo
    overleo 2007/02/14
  • 360億パターンの解析エンジンでブログやSNSを分析する「CGM Watch」

    NTTアドは、ブログやSNSなどから必要な情報を抽出し、マーケティングレポートとして提供するサービス「CGM Watch」の提供2月15日より開始する。 CGM Watchは、NTTアドとNTTデータが共同で開発したマーケティングサービス。NTTデータの、単語同士から360億パターンの文章の意味や感性を解析できる日語意味理解エンジン「なずき」を利用して、ブログやSNSの記事などから特定の単語や必要な情報を検索。抽出し、商品やサービス、キャンペーンなどの評価や風評調査を分析できる。 また、商品名などの単語の出現頻度のほか、記事作成者の商品購入の有無、記事の書き手の感情などを最大81種類に細分化たレポートも可能。自発的に記載された記事を対象として抽出するため、調査する側のバイアスを受けない消費者の音を引き出せるとしている。なお、NTTアドでは、CGM Watchを利用した「新世代ゲーム機に

    overleo
    overleo 2007/02/14
  • NEC、キーワード入力が不要な検索システムを開発

    Windows SQL Server 2005サポート終了の4月12日が迫る、報告済み脆弱性の深刻度も高く、早急な移行を