タグ

nlpに関するaerealのブックマーク (6)

  • 【淡路島震度6弱】え~っ、「きょう」の言葉なくシステムエラー 大阪府防災情報メールの配信トラブル - MSN産経west

    兵庫県の淡路島で震度6弱を観測した地震に関する大阪府の防災情報メールが府民に配信されなかった問題で、府は14日、メールの元データとなる気象庁提供の地震情報に、日付の前に「きょう」という言葉がなかったため、府の配信システムにエラーが生じていたと発表した。 府災害対策課によると、防災情報メールは気象庁からの地震情報の内容を府のシステムが自動的に読み取り、配信する仕組みになっている。システムは気象庁の情報について、日付の前にある「きょう」「きのう」といった言葉が入っていることを前提にプログラムされているが、今回の情報では地震発生時間の「13日5時33分ころ」の前に「きょう」が入っていなかったため、システムが異常と認識したという。 同課では「表記の変更について、気象庁から連絡はなかった」といい、15日以降、気象庁に確認する。 防災情報メールは府民約10万人が登録している。地震の発生と府内各地の震度

    aereal
    aereal 2013/04/15
  • ネコでもテキスト分類器のRubyライブラリが生成できる便利ツールを作った - デー

    あまり細かいことは気にせずテキスト分類器のRubyライブラリを1コマンドで自動生成する便利ツールを作りました。 いろいろ迷走している間に。 gem install nekoneko_genでインストールできます。 なにをするものなのか、ちょっと分かりにくいので、例で説明します。 2ちゃんねるの投稿からどのスレッドの投稿か判定するライブラリを生成する 例として、2ちゃんねるに投稿されたデータから、投稿(レス)がどのスレッドのレスか判定するライブラリを生成してみます。 準備 まず gem install nekoneko_genでインストールします。 Ruby 1.8.7でも1.9.2でも動きますが1.9.2のほうが5倍くらい速いので1.9.2以降がおすすめです。 環境は、ここではUbuntuを想定しますが、Windowsでも使えます。(WindowsXP, ruby 1.9.3p0で確認)

    ネコでもテキスト分類器のRubyライブラリが生成できる便利ツールを作った - デー
    aereal
    aereal 2012/05/29
  • Rubyによる形態素解析エンジンokura 0.0.1をリリースしました - <s>gnarl,</s>技術メモ”’<marquee><textarea>¥

    12月にさくさくテキストマイニングで発表したpure Rubyによる形態素解析エンジンをgem化しました。 まだ発展途上で機能が少なかったりパフォーマンスが悪かったりしますが、いちおう動くレベル*1になったので公開します。 注意事項 バージョン0.0.xのうちは、インタフェースや辞書フォーマットは頻繁に変更される予定です。 ある程度安定したら0.1.0出します。 今のところ、Ruby1.9系専用です。 取得 gem install okuraでインストールできます。 ソースは https://github.com/todesking/okura 使い方 MeCabフォーマットの辞書データを使用します。 動作確認はMeCab用NAIST辞書で行いました。 最初にokura compileコマンドで辞書をコンパイルします $ okura compile mecab-naist-jdic-0.6

    Rubyによる形態素解析エンジンokura 0.0.1をリリースしました - <s>gnarl,</s>技術メモ”’<marquee><textarea>¥
  • 決定木を用いた敬語の選択ルールの獲得 | CiNii Research

  • テキストジェネレーター

    出力に何か書くと入力をもとに何か出します. 途中で止めたりできます. たとえば,ペンキと書くと何か出ます. 入力は学習用のテキストなので,好きな文章をコピペしてきます. 1文字ずつにすると変な文章が出ます. 入力 一 「おい地獄さぐんだで!」 二人はデッキの手すりに寄りかかって、が背のびをしたように延びて、海をえ込んでいるの街を見ていた。――漁夫は指元まで吸いつくしたをと一緒に捨てた。巻煙草はおどけたように、色々にひっくりかえって、高いをすれずれに落ちて行った。彼は一杯酒臭かった。 赤い太鼓腹を広く浮かばしている汽船や、積荷最中らしく海の中からをグイと引張られてでもいるように、思いッ切り片側に傾いているのや、黄色い、太い煙突、大きな鈴のようなヴイ、のように船と船の間をせわしく縫っているランチ、寒々とざわめいている油煙やパンや腐った果物の浮いている何か特別な織物のような波……。風の工合で煙が

    aereal
    aereal 2011/10/16
  • 日本語係り受け解析器 CaboCha Ruby 拡張の基本的な使い方とちょっとした応用 - デー

    ari3_botの会話エンジンで使っている自然言語の処理の中から他の方にも有益そうなところだけ書いておこうと思います。 このエンジン自体はアドホックにヒーリスティクスな処理を追加しまくっていて、とても説明しにくいのですが、基的な部分だけ抜き出して……まとめて……解説します。全部実装できるほど詳細な解説はできないので、取っ掛かりになる程度です。 ちなみにCaboChaのAPIはきちんとしたドキュメントがない?ようで、僕はソースコードを自分で読んで得た知識から解説を行っています。また日語文法関する知識もari3_botを作るためだけに得たものであり、あやしいので、あまり信じすぎないようにしてください。 もくじです。 ari3_botの会話エンジンとは CaboChaの基的な使い方 CaboChaで主語と述語っぽいところを抜き出す 述語を活用してみる その他のいろいろなヒント まとめ ar

    日本語係り受け解析器 CaboCha Ruby 拡張の基本的な使い方とちょっとした応用 - デー
    aereal
    aereal 2011/10/15
  • 1