タグ

形態素解析とwebに関するamayanのブックマーク (2)

  • ふいんきり?だ? Web Service

    だいぶ前に作った「ふいんきり〜だ〜」の機能を Web サービスとして提供することにしました。任意の日語文書の内容を解析して、2ちゃんねるでいうとどこの板のふいんき(←なぜか変換できない)に似ているかを教えてくれるプログラムです。要は、2ch のスレッドタイトルのデータをもとにして、文書のトピックを推定するというということ。開発者さん向け。 Yahoo! の日形態素解析 Web サービスにインスパイヤされて、手持ちのネタをちょっと改造しました。 10月27日、同一URLは1時間キャッシュするように改造しました。取得先への負担軽減と、サービスのスピードアップをはかりました。 できること 投げられてきた文書、もしくは取得した Web ページの内容が2ちゃんねるとまちBBSのどこの板に似ているか、類似度ランキングを作ります。 ……というとなんだかフザケているようですが、「数学」とか「B級グ

    amayan
    amayan 2007/11/05
    テキストを形態素解析して雰囲気の近い板リストを返すAPI。
  • ヤフー、文章を解析できるAPI「日本語形態素解析Webサービス」を公開ニュース - CNET Japan

    ヤフーは6月18日、開発者向けサイト「Yahoo!デベロッパーネットワーク」において、日語の文章を解析できるAPI「日形態素解析Webサービス」を公開した。 日形態素解析Webサービスは、ヤフーの日語処理技術部がYahoo! JAPAN研究所と共同で開発を進めてきた形態素解析エンジン「Web MA」を社外の開発者向けにAPIとして公開するもの。このエンジンは、ヤフーのブログ検索や商品検索などのテキスト処理、ブログ検索の「評判検索機能」、「まとめ検索機能」などのテキストマイニング処理にも利用されている。 このAPIを利用することで、開発者は解析対象となる日語の文章を形態素に分割し、品詞や読み、基形を取得できるほか、対象となる文章に多く含まれている単語、その文章を構成する特徴的な単語などを把握することが可能だ。 また、すでに公開済みのAPIから取得したデータを解析することもでき

    ヤフー、文章を解析できるAPI「日本語形態素解析Webサービス」を公開ニュース - CNET Japan
    amayan
    amayan 2007/06/18
    うおー、これはすごい。MeCabに取って代わるか。
  • 1