[B! nlp] N13iのブックマーク

はてなブログ | 無料ブログを作成しよう

賃貸暮らしのわが家の地震対策【揺れから命を守る編】以前のブログでも記載した、防災の優先順位に基づいて対策を進めています。まだ手をつけられていない部分もありますが、ある程度まとまってきたのでざっくりとご紹介していきます。優先順位別に改善していっているため、今回は主に地震の揺れ対策がメインになります。…

N13i 2008/10/28

twitter
nlp

リンク

単語感情極性対応表日本語および英語の単語とその感情極性の対応表を、研究目的の利用に限り公開します。感情極性とは、その語が一般的に良い印象を持つか（positive）悪い印象を持つか（negative）を表した二値属性です。例えば、「良い」、「美しい」などはpositiveな極性、「悪い」、「汚い」などはnegativeな極性を持ちます。感情極性値は、語彙ネットワークを利用して自動的に計算されたものです。もともと二値属性ですが、-1から+1の実数値を割り当てました。 -1に近いほどnegative、+1に近いほどpositiveと考えられます。リソースとして、日本語は「岩波国語辞書（岩波書店）」を、英語はWordNet-1.7.1を使わせていただきました。こちらからダウンロードしてください→[日本語] [英語] フォーマットは、各行が一単語に対応し、見出し語:読み:品

N13i 2008/10/28

nlp

リンク

Google Japan Blog: 大規模日本語 n-gram データの公開

突然ですが、穴埋めクイズです。下線部に入る単語はなんでしょう? グーグルで_____ おそらく、「検索」「調べる」「探す」といった単語を思いつくのではないでしょうか？実際に、Webにあるドキュメントをくまなく調べ、「グーグルで」の後にくる単語を調べると、「検索」が1位であるとがわかります。一般に、直前の(N-1)個の単語を見て、次の単語を予測するモデルをN-gram言語モデルといいます。さきほどは、「グーグル」と「で」の2単語から次を予想しているので、3-gram言語モデルの例となります。現時点の単語が、直前の(N-1)個のみに影響を受けるという仮説は、一見現実離れしているようですが、実際には非常に有効な場合も多く、かな漢字変換、OCRのエラー訂正、機械翻訳、音声認識などに広く用いられています。たとえば、音声認識の場合、ノイズ等で現時点の単語をシステムが聞き取れなくても、言語モデル

N13i 2008/10/20

リンク

ワードサラダ技術について

後半部分が重要で、未来の挙動が現在の値だけで決定され、過去の挙動と無関係である　ということです。さて、実例です。たとえば次の文章を考えてみます。「通信販売大手セシールは９日、生命保険の販売に本格参入する方針を明らかにした。」まず形態素解析するとこんな感じになります。通信名詞,サ変接続,*,*,*,*,通信,ツウシン,ツーシン販売名詞,サ変接続,*,*,*,*,販売,ハンバイ,ハンバイ大手名詞,一般,*,*,*,*,大手,オオテ,オーテセシール名詞,固有名詞,組織,*,*,*,セシール,セシール,セシールは助詞,係助詞,*,*,*,*,は,ハ,ワ９名詞,数,*,*,*,*,９,キュウ,キュー日名詞,接尾,助数詞,*,*,*,日,ニチ,ニチ、記号,読点,*,*,*,*,、,、,、生命名詞,一般,*,*,*,*,生命,セイメイ,セイメイ保険名詞,一般

N13i 2008/10/20

リンク

はてなブックマーク

タグ

関連タグで絞り込む (5)

nlpに関するN13iのブックマーク (5)

お知らせ

今週のはてなブックマーク数ランキング（2024年10月第1週）

月間はてなブックマーク数ランキング（2024年9月）

今週のはてなブックマーク数ランキング（2024年9月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス