【課題】記載内容が複数の文や表に分かれて存在する文書間や表現の異なる文書間の比較を可能とする文書解析技術を提供する。 【解決手段】複数の文書から文及び表を抽出する。抽出された各文について係り受け関係を解析し、その解析結果に基づいて、単語又は文節をノードとし、文節間の修飾関係や被修飾関係の候補をエッジで表すグラフ構造に変換する。抽出された各表を、枠又は文字行をノードとし、枠間や文字行間の隣接関係をエッジで表すグラフ構造に変換する。次に、枠間や文字行間の隣接関係を表すエッジ間の強度を、枠の隣接パターンや文字列共起頻度に基づいて計算する。異なる文書から生成されたグラフの各ノードペアについて、ノード間の文字列の類似性・同義性と、近傍ノード又は論理関係を持つ遠方のノードの類似性とに基づいて、文及び/又は表の構成要素間のアライメントを判定する。 (もっと読む) 【課題】助詞「は」を含む文を検出し、当該
テキストからの評判分析と 機械学習 鍜治伸裕 東京大学 生産技術研究所 講演の前に • 想定している聴衆 – 評判分析について専門的なことを知らない – 機械学習(ML)の素養を持っている • 講演の内容 – 評判分析という分野の解説 – 評判分析における ML の適用事例の紹介 • お断り – 自然言語処理(NLP)の話に特化 – ML を使っている論文を私の好みで選んで紹介 評判分析を概観する 評判分析はこんな技術 • 例: Yahoo!ブログ検索における「VAIO」の検索結果 肯定的評判と否定的評判の 書き込み数を集計して表示 肯定的な書き込みと否定的 な書き込みを分類して提示 背景: CGMの出現 • CGM – Consumer Generated Media のこと – 例えば Amazon に投稿されたレビューやブログなど – 一般人が作成,発信するコンテンツである点がポイン
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く