タグ

自然言語処理に関するNeanのブックマーク (10)

  • Talk to Books

    Talk to Books was a new way to explore ideas and discover books. Select one of the samples to view its archived search results.

  • Google社、自然言語処理研究のデモとして、文章を入力すると書籍内の適切な一節を表示する“Talk to Books”を公開

    Google社、自然言語処理研究のデモとして、文章を入力すると書籍内の適切な一節を表示する“Talk to Books”を公開
    Nean
    Nean 2018/04/20
    う~、日本語版とかで遊びたいぜ。ないけど\(^o^)/
  • 自然言語処理を自習したくなったら参考になりそうなサイトなど - 鴨川にあこがれる日々

    雑にですが,知ってるサイトやチュートリアルをまとめたくなったのでまとめてみました.夏ですし. 適宜更新しています. 最終更新 2018年02月03日 チュートリアル 言語処理100ノック 言語処理100ノック 2015 東工大の岡崎先生が作られたチュートリアルです. 他大学の研究室でも利用されています. 簡単な内容からはじまるので,プログラミングの導入としてもいいと思います. NLPプログラミングチュートリアル Graham Neubig's Teaching Carnegie Mellon UniversityのGraham Neubig先生のチュートリアルです. Githubにサンプルコードが公開されています. 各チュートリアルにはテストがついているので,実装が正しいかを確かめることができます. 扱っているトピックが広いので,かなり勉強になると思います. ソフト 形態素解析器 日

    自然言語処理を自習したくなったら参考になりそうなサイトなど - 鴨川にあこがれる日々
  • 形態素解析エンジンMeCabにて文章中から短歌を抽出 - inaniwa3's blog

    概要 偶然57577になっている文章を短歌としてつぶやく Twitter の bot を作りました。 フクロウが鳴くと明日は晴れるので洗濯物を干せという意味 #tanka ウィキペディア日語版「フクロウ」より http://t.co/Dm1uHcQdzR— 偶然短歌bot (@g57577) 2014, 12月 31 再帰的アルゴリズムが有効な問題として有名であり #tanka ウィキペディア日語版「ハノイの塔」より http://t.co/vm2ZqwImKi— 偶然短歌bot (@g57577) 2014, 12月 31 文章はウィキペディア日語版を対象としました。 作り方 jawiki-latest-pages-articles.xml.bz2 をダウンロード。 WP2TXT で上記を扱いやすい形式に変換。 このスクリプト で57577になっている文を抽出。数時間かけて(遅い)

    形態素解析エンジンMeCabにて文章中から短歌を抽出 - inaniwa3's blog
    Nean
    Nean 2015/01/19
    形態素解析。
  • 業界初!人から学習し自動的に能力が高まる文章校正技術の開発に成功 : 富士通

    PRESS RELEASE (技術) 2012年4月4日 株式会社富士通研究所 業界初!人から学習し自動的に能力が高まる文章校正技術の開発に成功 複数の誤りの同時修正を実現し、外国人の作成する日語文書の誤りを8割削減 株式会社富士通研究所(注1)は、文章の校正作業において、人が校正した文章の履歴を使って、文章校正を自動的に行う技術を、業界で初めて開発しました。これにより、校正履歴が蓄積されるに従って校正能力が自動的に向上する文章校正システムが実現できます。技術により、近年、オフショア開発の拡大に伴い増加する、開発受注先の外国人によるプログラム仕様書など日語文章の執筆作業において、その品質を向上させることが可能になります。今回、中国語ネイティブが作成する日語文章に対して、1万件の校正履歴を用いた自動校正を実行したところ、約80%の誤りを修正できることを確認しました。 オフショア開発の

    業界初!人から学習し自動的に能力が高まる文章校正技術の開発に成功 : 富士通
  • 富士通研究所、自動で文章を校正する技術を開発

    富士通研究所は4月4日、文章の校正を自動的に行ってその能力を高められるという新技術を発表した。中国語ネイティブの人が作成する日語文章に対して1万件の校正履歴を用いながら自動校正を行ったところ、約80%の誤りを修正できたとしている。 新技術は、企業のグローバル化などで増えつつあるオフショア開発での効率化を目的にしたもの。中国などでのオフショア開発で受託した企業では外国人によるプログラム仕様書の日語での執筆機会などが増加しているが、外国人にとって「て」「に」「を」「は」などの助詞や用語の使い方が非常に難しく、文書に誤りが発生する。納品前に日人が校正作業を行うなど、時間やコストが課題になっていた。 従来の文章校正技術は、不適切な単語や表現とその置き換える内容を事前に辞書へ登録しなければならず、原文と辞書の表記が一致している必要があるなど、その利用には負担が伴うものだったという。新技術では人

    富士通研究所、自動で文章を校正する技術を開発
  • asahi.com(朝日新聞社):村の議事録に音声認識 手ごわい「なまり」 岩手 - 社会

    パソコンの音声認識ソフトが読み取った言葉が表示された画面=岩手県滝沢村役場  岩手県滝沢村役場でパソコンの音声認識技術を使って、役所の会議の議事録やミーティングの会議録の作製を軽減する実証実験が行われている。職員がICレコーダーなどの録音をおこす作業時間を軽減させる狙いだ。将来はソフトに盛岡広域圏のなまりや行政用語を覚えさせるという。  話した言葉が1、2秒後に文字になるシステムの環境調査をしており、実験は2月10日から約1カ月間、行われている。6件ほどの会議や部内のミーティングで、なまりや行政用語が認識できたか、会議室の環境、議事録作成の時間などの課題を調査。その上で、新たな音声辞書の作成などに役立てる予定だが、現段階ではなまりの認識は難しいという。  昨年12月、村の産学官連携補助事業に、同村の貸し研究室「滝沢村IPUイノベーションセンター」に入居するソフトウエア会社「岩手インフォメー

  • 自然言語処理

  • 年収1000億円もらえるならおれは研究者をやめるぞ! - 武蔵野日記

    広島の2日目は朝イチのセッションで座長を頼まれていたのでがんばって起きる。朝早起きして観光しようと思っていたのだが、起きたらそんな時間ないし……。仕方ないので歩いて広島バスセンターに行くまでに少し遠回りして原爆ドームだけ見てくる。 「はだしのゲン」を小学生のときに幾度となく読んだのだが、この町はそういうそぶりを全く見せず、ただこの原爆ドームだけが象徴として残っている。記憶し続けることと同様に、忘れることも大事なのかもしれない。早朝の原爆ドームの近くにいた日人は全員通勤途中のビジネスマンか OL で、観光客は団体の中国人だけだったのは印象的である。日人はもう平和には興味がないのかなぁ。空気のように平和だからこそ意識しないのかもしれず、それが理想なのかもしれないが、なにやら世の中がきな臭いことに突入しつつあり、こういう意識でこれからの世の中乗り越えられるかどうか分からないのだけど。 座長は

    年収1000億円もらえるならおれは研究者をやめるぞ! - 武蔵野日記
  • このサイトについて - 文体診断ロゴーン

    一 文体診断ロゴーンについて 文体診断ロゴーンは、あなたの入力した文章を解析して、その文体の特徴を診断します。 診断では、文章の区切りは句読点だけで判断しています。改行などで文章を区切っている場合はご注意ください。また、文章が短かすぎる場合や、極度にくだけている場合は診断の信頼性が低い場合があります。目安として、適切な診断には、文体の一致指数の最大値が50以上であることが必要だと考えています。 まあ、しかし、そんなに難しく考えずとも、適当に文章を貼り付けていただければ、それなりに楽しんでいただけると思います。これをきっかけに名作に触れる機会が増えれば、作者として喜びとするところです。 二 使用したテキストについて テキストは64名の著者から各1作品を選びました。こちらにテキストの一覧をまとめてあります。著者の先生には、テキストを使用させていただいたこと、深く感謝いたします。 また、テキスト

  • 1