タグ

NLPに関するkitoneのブックマーク (15)

  • 看護記録のかな漢字変換 - 武蔵野日記

    ジャーナル書いたりなんだり、あと松研の合宿が今週土曜と日曜なので、その準備とかなんだとかで、今週は京都と奈良を往復している暇はないのだが、せっかく京都だし、やっぱり行くしかない、と思って足を運ぶ。 午前中の若手の会セッションは NAIST 松研の M1 の人たちががんばっていたようだ。@shirayuくんが Google語 N グラムを使った対話システムについて(他のメンバーは重複を除くと @o_bon, @hayatom, @tettsyun の3人(敬称略))、@rytkturくんがペルシャ語の辞書引きシステムについて、そして@smlyくんが Probabilistic HITS を使った文書要約について。みなさん M1 なのにこんなばしばしポスター作って話していてすごいなぁ。 自分的に今日聞きたかったのは 利用過程で得られる言語情報を活用する音声言語処理システム http:

    看護記録のかな漢字変換 - 武蔵野日記
    kitone
    kitone 2009/10/04
    森信介
  • ヤフーが『キーフレーズ抽出Web API』公開、日本語解析し特徴的な表現抽出 | ネット | マイコミジャーナル

    ヤフーは4日、インターネット関連の開発者向けに同社が提供する一部のサービスやデータベースへのアクセスを無料で公開するサービス「Yahoo!デベロッパーネットワーク」において、『キーフレーズ抽出Web API』を公開したと発表した。 ヤフーでは、オープン化戦略の一環として、「Yahoo!デベロッパーネットワーク」において、一部のサービスやプラットフォームのAPI開放を進めているが、この中でも「日語処理技術の公開についても注力している」(ヤフー)。 今回公開された『キーフレーズ抽出Web API』は、日語のテキストを解析して特徴的な表現を抽出する機能を提供。これを利用すると、例えばブログの文章から話題となっているフレーズを抽出したり、キーフレーズの組み合わせで作成した検索式を使って、関連性の高いドキュメントを検索するアプリケーションを開発することができる。 用途としてはほかにも、ニュースな

  • MeCabの辞書にはてなキーワードを追加しよう - 不可視点

    MeCabは形態素解析のためのソフトウェアです。日語を分かち書きするために使われるものとしては最も人気の高いものだと思われますが、チャットや掲示板に書き込まれるような崩した日語や、正しく書かれた日語でも新語を期待した通りに分かち書きしてくれないことがあります。これはMeCabの内部で使われている辞書が一般的な言葉を情報源としているわけではないことに関係があります。MeCabというか、より一般的な話ですが以下のような認識が一般的かと思われます。 というのも、一番広く使われているであろう自然言語処理技術形態素解析(単語分かち書き、と言ったほうがいいのかもしれない)であろうが、これは現在99%くらいの精度になっていて、すでに人間がやるより遙かに高精度で行えるのだが、これだけ高い精度が出せるのは新聞記事を相手にしたときだけであって、それは新聞記事をコーパスとして用いる機械学習により形態素解

    MeCabの辞書にはてなキーワードを追加しよう - 不可視点
    kitone
    kitone 2009/06/01
  • スタンフォード大学の自然言語処理(NLP)の授業公開っぷりがとてつもない件 - Unchained Life

    以前からMITのOCWを中心にアメリカの大学の授業のビデオや資料などが公開されているのは知っていたが、今日知ったスタンフォード大学の授業公開っぷりがものすごい。 http://see.stanford.edu/SEE/lecturelist.aspx?coll=63480b48-8819-4efd-8412-263f1a472f5a 授業のビデオだけではなく、なんと授業のtranscript、つまり授業中に先生がしゃべったことがテキストに書き起こされているのだ。 MITなどでも授業のビデオは公開されていたが、当然授業の内容を理解するには授業資料がある場合にせよ、何をしゃべっているかを自分で聞き取るほか無く、リスニング力が低い僕には結構ネックだった。 それが今回しゃべる内容がテキストになっているということで聞き取れなくてもテキストを見ればよいし、リスニングの勉強にもなる。 しかも公開されてい

    スタンフォード大学の自然言語処理(NLP)の授業公開っぷりがとてつもない件 - Unchained Life
    kitone
    kitone 2009/05/17
  • イベント/第11回ミーティング告知 - Kansai.pm

    Kansai.pm第11回ミーティングを行います Kansai.pm第11回ミーティングを開催します。第11回ミーティングのメイントークでは、大学で情報科学を専攻する学生ら若いメンバーを中心として、幾つかのアルゴリズムやコルーチンの実装など情報科学分野をテーマに発表いたします。 また恒例の10分枠ではテーマを自由に Kansai.pm 有志が、開発の成果やプログラミングテクニックなどについて発表をいたします。 日時 2009年03月22日(日) 13時30分〜17時 開場時間:13時00分 3月22日は日曜日のため正面玄関が開いていません。入館には会場である株式会社はてなのスタッフによる解錠が必要ため、13時00分頃に1F セブンイレブン正面まで集合をお願いします。 会場 株式会社はてな 京都社 https://www.hatena.ne.jp/company/ 定員 30から40名程度

  • 第11回 Kansai.pm / スペルミス修正プログラムを作ろう - naoyaのはてなダイアリー

    昨日は第11回 Kansai.pm でした。 今回は無理を言って自分がホストを担当させていただきましたが、面白い発表が多く開催した自分も非常に満足でした。 PFI の吉田さんによる Cell Challenge での計算機に合わせたアルゴリズムのチューニング手法の発表 (発表資料) は圧巻でした。伊奈さんの文抽出の話 (発表資料)、はこべさんのコルーチンの話 (発表資料)、いずれも難解になりがちなところを凄く分かりやすく解説されていて、さすがだなと思いました。各々ショートトークも、いずれも良かったです。 スペルミス修正プログラムを作ろう 自分も 20 分ほど時間をいただいて、スペルミス修正プログラムの作り方について発表しました。 スペルミス修正プログラムを作ろうView more presentations from Naoya Ito. スペルミス修正プログラムについてはずばり スペル

    第11回 Kansai.pm / スペルミス修正プログラムを作ろう - naoyaのはてなダイアリー
  • 自然言語処理は Python がいちばん - 武蔵野日記

    現在大学1年生の人で3年後には NAIST に (というか松研に) 来たいという人から「どんなプログラミング言語やっておくといいですか」と質問されたりするのだが、なかなか答えるのは難しい。自分は PerlPython がメインでときどき C++/C# を使ったりするのだが、どれが一番いいかはなんとも言えないので、自然言語処理以外に転向する可能性も考えると、C とか C++ とか Java とか(授業でそちらをやるのであれば)を最初の武器に選んだ方がいいのでは、と思ってはいる。 そんなこんなで最近 Hal Daume III (機械学習を用いた自然言語処理では非常に有名な人) のブログで Language of Choice というタイムリーなエントリーが出ていたので、紹介すると、「それなりに大きな自然言語処理のプロジェクトでどのプログラミング言語を使うのか」というアンケート結果が出

    自然言語処理は Python がいちばん - 武蔵野日記
    kitone
    kitone 2009/03/30
    NAIST
  • 自然言語処理関連の学会・研究会 (国内編) - まきもと@ねっとわーく

    ものすごくご無沙汰のエントリになります*1。春ということで、これから自然言語処理を始めようという方もたくさんいると思います。そういった方々がどのような学会や研究会を調べれば良いのか紹介したいと思います。 自然言語処理は機械学習人工知能、データベース、言語学、認知心理学、音声言語処理などの境界分野としての側面もあるので、一概にどこからどこまでが自然言語処理の範疇であると明言はできませんが、取り敢えず、メイントピックとして自然言語処理を掲げていて、NLPの研究者が関わるであろう団体を並べています。 言語処理学会 (NLP)その名の通り、自然言語処理をメイントピックとして扱う学会です。ジャーナル『自然言語処理』の刊行と年に一度の言語処理学会年次大会の開催を行なっています。年次大会には国内 (と一部国外) の自然言語処理研究者が集まる国内最大規模の自然言語処理を中心とした会議です。発表は査読なし

    kitone
    kitone 2009/03/15
  • http://tsubaki-wiki.ixnlp.nii.ac.jp/

  • 情報爆発プロジェクト 検索エンジン基盤 TSUBAKI

    TSUBAKI利用時の良かった点、問題点などご意見を頂けると幸いです。 ご意見は tsubaki あっと nlp.kuee.kyoto-u.ac.jp までお願い致します。

  • SlothLib Wiki

    2016-06-05 Task1/52 2016-04-24 Task1/51 Task1/49 2012-11-12 RecentDeleted Task1/50 2010-11-30 ダウンロード 2010-03-08 Alpha Release Ruby/SlothLib for Ruby 2009-09-16 Task1/20 2008-07-17 Java/ダウンロード 2008-04-24 Task1/48 2008-04-22 ユーザーズマニュアル/Web/ウェブ検索 Java/Visual Editorを持ちいたアプリケーションの作成 Java/Visual Editorを用いたアプリケーションの作成 Java/SlothLib for Java Java/Eclipseプロジェクトの準備 Java/前準備 2008-04-21 Java/WindowsでのEclipseの

    kitone
    kitone 2008/03/03
  • Home

    Welcome to the Business World of Japan

  • Google、日本語2,550億語から作成したNグラムデータを公開

    Googleが、ウェブから抽出した日語約200億文(約2,550億語)から作成したNグラムデータ(1〜7グラム)を、NPO法人言語資源協会を通じ、学術目的限定で有償公開しました。 大規模日語 n-gram データの公開 – Google Japan Blog http://googlejapan.blogspot.com/2007/11/n-gram.html GSK2007-C Web日語Nグラム第1版 – 言語資源協会 http://www.gsk.or.jp/catalog/GSK2007-C/catalog.html グーグルが大規模な日語の解析データを公開、「20%ルール」の成果 – IT Pro http://pc.nikkeibp.co.jp/article/NEWS/20071101/286215/

    Google、日本語2,550億語から作成したNグラムデータを公開
  • Powerset Home

    A better way to search and discover information in Wikipedia articles.Discover Factz For most people, places and things, Powerset shows a summary of Factz from across Wikipedia.

  • 一般的な辞書を必要としない日本語形態素解析製品「マリモ」

    ウェブサイト検索サービスを提供しているムーター社が8月1日、一般的な辞書を必要としない日形態素解析製品「マリモ」の提供を開始しています。@IT誌が、この「マリモ」の特徴、仕組みについて、ムーター社にインタビューした記事を掲載しています。またムーター社のブログでも、解説が掲載されています。 画期的な日形態素解析製品「マリモ(開発コードネーム)」を提供開始 – Mooter http://enterprise.mooter.co.jp/marimo/ 辞書不要の形態素解析エンジン「マリモ」とは – @IT http://www.atmarkit.co.jp/news/200708/15/mooter.html ムーターの日形態素解析の秘密について – Mooter Blog http://techblog.mooter.co.jp/?p=20

    一般的な辞書を必要としない日本語形態素解析製品「マリモ」
  • 1