タグ

2011年11月21日のブックマーク (2件)

  • ぶる速-VIP のび太「ドラえもんとか、実際無理だろ」

    のび太「ドラえもんとか、実際無理だろ」 1 名前:以下、名無しにかわりましてVIPがお送りします[]投稿日:2009/02/13(金) 15:49:39.43 ID:aWSpUdyv0 学生「どうかしました?野比先生」 のび太「ううん、何でもないよ。それより研磨は終わったかい?」 学生「はい。これでもうバリはないはずです」 のび太「体側のインターロック回路も大丈夫?」 学生「はい、動作確認済みです」 のび太「よし。じゃあモータを駆動してみようか」 青い球体の中にギアボックスを収められるのを、のび太は少し離れて見守っていた。 FC2ランキング 2ちゃんねる [PR] ハッピーメール [PR] ネットキャッシングならキャレントで借りんと! 2 名前:以下、名無しにかわりましてVIPがお送りします[]投稿日:2009/02/13(金) 15:51:49.20 ID:aWSpUdyv0

  • wikipedia dump を使って複合名詞を判定してみる - 開発めも2

    例えば「ウォークマン」を形態素解析器にかけると、mecabやChasenの場合だと、 「ウォーク|マン」と分けてしまう。 多くの場合、連接する名詞をくっつけて複合名詞とすればうまくいくけど、例外もたくさんある。 単純に連接名詞をとるだけだと、「世界最高新記録並の早さ」を「世界最高新記録並|の|早さ」と分けてしまう。 「世界最高新記録並」は確かにひとつの名詞と呼べそうではあるけど、なんか気持ち悪いです。 つまりどこで区切るのが適切かをコンピュータに自動的に判定させるのは難しいわけなんですが、 そこでwikipediaを使います。 wikipediaの各ページは人手で作られているため、その単語(複合名詞)のページが存在すること自体が、ひとつの単語として認めるかどうかを判断する大きな材料になります。 おまけにwikipediaで複合名詞判定(名詞判定でもある)を行っていれば、その後の処理で例えば

    wikipedia dump を使って複合名詞を判定してみる - 開発めも2