タグ

NLPに関するmamorukのブックマーク (337)

  • Google Sites: Sign-in

    Not your computer? Use a private browsing window to sign in. Learn more

    mamoruk
    mamoruk 2015/10/28
    "Nobuhiro Kaji is senior chief researcher at Yahoo! JAPAN research."
  • AMR: Not semantics, but close (? maybe ???)

    mamoruk
    mamoruk 2014/09/29
  • NLP若手の会合宿に行ってきました

    先週末、三浦海岸で開催されたNLP若手の会(YANS)の合宿に参加してきました。 YANSで合宿が行われるのは6年ぶり、というか多分2回目。 前回は参加できなかったので、私も初参加でした。 データベース系など業界によっては毎年泊まり込みの合宿が開かれるらしくて、いいなぁと思っていたので今回はとても良い機会。 委員のメーリングリストに入っていたので裏で大量のメールが飛び交っていたことは知っていて、準備がとても大変そうでした。 NTT宮崎さんはじめ委員の皆様には感謝です。 YANSシンポジウムというイベントには思いいれが深くて、多分東大でやった2回目のシンポジウムが初めてでした。 確かM2のときでした。 発表者はほぼ全員が教員(当時助教だった)、内容は全部初めて聞くようなテーマでした。 普段は指導の立場であるところの先生方が、斬新なアイデアを発表している。 そんな研究していいんだ!と感動した覚

    mamoruk
    mamoruk 2014/09/28
    「とにかく今回はとてもおもしろかった。 個人的に「楽しい」という価値はとても大事に思っています。 楽しいから続けれられる、楽しいからやりたくなる、楽しいから成果が出る。 」
  • Computational Intelligence Lab, Toyota Technological Institute

     Computational Intelligence Lab, Toyota Technological Institute, Japan 新しいサイト<を訪問ください。 Please visit our new site.

    mamoruk
    mamoruk 2014/06/10
    「 2014年4月1日 三輪誠准教授が着任しました。 」
  • 企業で活用される自然言語処理技術_情報処理学会 第76回全国大会

    【セッション概要】電子機器の普及に伴って、多くのテキストが生成されている。社内の業務管理のために社員が書いた文を蓄積する企業もあれば、ネットのユーザーが書いた文をビジネスの対象とする企業もある。いずれの場合にも、機械的な処理に対する強い要求があり、それを実現する自然言語処理技術への期待は大きい。一方で、企業で活用できる程度に信頼性が高い言語処理技術は限られている。 企画では、各業種を代表する企業に、すでに活用している自然言語処理技術や今後の活用を期待している自然言語処理技術について各社での活用や研究開発の事例を紹介して頂き、それに基づいて自然言語処理技術の研究がどうあるべきかをパネル討論にて議論する。

    企業で活用される自然言語処理技術_情報処理学会 第76回全国大会
    mamoruk
    mamoruk 2014/01/14
    パネリスト6人中3人が松本研出身(笑)
  • Google Code Archive - Long-term storage for Google Code Project Hosting.

    mamoruk
    mamoruk 2014/01/12
    トーナメントモデルとshift-reduceの精度差
  • Jess : Automated Japanese Essay Scoring System

    ヘルプ / 新着情報 / サンプルデータ A B C D E F G / 最終改訂$Date: 2007/02/13 06:52:21 $ Jess®: 日語小論文 評価採点システム 投稿した「質問文」および「解答文」は研究のために二次使用することがあります。 質問文(与えられた問題文を入力してください) 解答文(あなたが作成した小論文を入力してください) 配点: 修辞 論理構成 内容 字数制限:(入力は必須ではありません) ヘルプ / Copyright (c) 2002-2003 Tsunenori ISHIOKA (NCUEE) E-mail:

  • はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知

    はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28

    はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知
    mamoruk
    mamoruk 2012/03/21
    率直な感想が参考になります キリッ
  • 極大部分文字列を使った twitter 言語判定(中谷 NLP2012) - 木曜不足

    来たる 3/13〜16 に広島で行われる言語処理学会年次大会(NLP2012)にて発表する「極大部分文字列を使った twitter 言語判定」の論文を公開。 中谷 秀洋, 極大部分文字列を使った twitter 言語判定, 言語処理学会第18年次大会, 2012 http://ivoca.31tools.com/misc/nlp2012_nakatani.pdf 【注】 言語処理学会の公開規定が「大会での発表後」であったため、一旦公開を取り下げていましたが、発表終了したので再公開しました。 http://www.anlp.jp/rules/repository.html 【/注】 第8回 TokyoNLP で発表した「∞-gram を使った短文言語判定」と基線は同じ。ただしその発表の時にお約束していたとおり、17言語の判定精度で 99.1% を達成している。99% 越えは作り始める前から

    極大部分文字列を使った twitter 言語判定(中谷 NLP2012) - 木曜不足
    mamoruk
    mamoruk 2012/02/02
    松本研からも極大部分文字列をウェブテキストに対して使った発表がありますので、タイトル一覧が公開されたときちょっとドキッとしました (笑)
  • IBMモデル1に言語モデルを追加した - 西尾泰和のはてなダイアリー

    先日のIBMモデル1の実装に関して、なんで「house house house」ってなってしまうのかについて考察した。与えられたデータだけからは、dasがhouseなのか、Hausがhouseなのか、istがhouseなのかわからない。だから確率値もイコールになっていて、argmaxした際に最初に見つかったものが選ばれてhouseになっているものと思われる。 前回の実験では言語モデルが入っていないから、「ここにはtheとかhouseとかisとかが入りそうだ」と思っても、それをどう並べればいいかについて情報がない。じゃあ言語モデルを入れたら改善されるんじゃないか? # 前回の結果 das Haus ist klein house house house small das Haus ist schmutzig house house house dirty das Haus ist saub

    IBMモデル1に言語モデルを追加した - 西尾泰和のはてなダイアリー
    mamoruk
    mamoruk 2012/01/05
    実装マラソン、いいですね! 自分もやりたいです!!!
  • Microsoft Research Asia, Outreach Japan - Microsoft Japan

    すべての Microsoft 製品 Global Office Windows Surface Xbox セール サポート ソフトウェア Windows アプリ OneDrive Outlook Skype OneNote PC とデバイス アクセサリ エンタメ Xbox ゲーム (ダウンロード) Windows ゲーム 映画テレビ番組 法人向け Azure Dynamics 365 Microsoft 365 データ プラットフォーム 法人向け Developer & IT .NET Visual Studio Windows Server デベロッパー センター ドキュメント その他 Microsoft Store Microsoft Rewards 無料ダウンロード & セキュリティ プリペイド カード サイトマップの表示 1991 年に創設された MSR は、コンピューターサイエ

    mamoruk
    mamoruk 2011/12/20
    いろいろと見知った名前がありますね……
  • Python で構文木を端末に描画してみる - ny23の日記

    巷にある構文解析器には,解析結果を木構造で端末に表示する機能がある.あった方が良いだろうなと思いつつ,自分で実装するのはいかにも面倒そうだと感じて,今まで後回しにしていた.いい加減そろそろ無いと困ると感じるようになってきたので,先日の通勤電車の中で暇つぶしに書いたら,思いの外あっけなく実装できたので,メモ代わりに残しておく.最初 Ruby でワンライナーで書けないかなと思ったが,流石に難しかったので,練習も兼ねて Python で実装してみた. #!/usr/bin/env python # -*- coding: utf-8 -*- # Usage: lattice_to_tree.py < in.KNP # translate parser output into human-readable dependency tree structure import sys # customi

    Python で構文木を端末に描画してみる - ny23の日記
  • #TokyoNLP で「∞-gram を使った短文言語判定」を発表しました - 木曜不足

    TokyoNLP 第8回に のこのこ参加。主催者の id:nokuno さん、発表者&参加者のみなさん、そして会場を提供してくださった EC ナビさん改め VOYAGE GROUP さん& @ajiyoshi さん、お疲れ様でした&ありがとうございました。 今回は「∞-gram を使った短文言語判定」というネタを発表。「短文言語判定」って、要は「このツイートは何語?」ってこと。 こちらが資料。 ∞-gram を使った短文言語判定 View more presentations from Shuyo Nakatani そして実装したプロトタイプ ldig (Language Detection with Infinity-Gram) とモデル(小)はこちらで公開。 https://github.com/shuyo/ldig 言語判定とは「文章が何語で書かれているか」を当てるタスクで、以前一度

    #TokyoNLP で「∞-gram を使った短文言語判定」を発表しました - 木曜不足
    mamoruk
    mamoruk 2011/11/25
    参考文献がガチ
  • NL203

    mamoruk
    mamoruk 2011/08/16
    16日だけ開催か〜しかし6件とはまたNLP冬の時代。。。
  • N-gram 漢字<=>かな変換 - アスペ日記

    @gologo13さんの言語モデル配布ページのデータを利用して簡単な漢字->かな/かな->漢字変換ができないかなーと思って作ってみた。 言語モデルの作成には SRILMを使用。 配布中のデータを SRILM で扱うには多少加工しないといけないので、その変換スクリプトも作った。 GitHub リポジトリは https://github.com/hiroshi-manabe/ngram-converter 。 [追記]最新のバージョンでは、4-gram のかな漢字変換用辞書をあらかじめリポジトリに入れてある。 marisa-trie モジュールさえ入れてあれば、 ./converter_sample.py --dicname-prefix=dics/bccwj4_rev_dic --order=4 --interactiveですぐにかな漢字変換が実行できる。 まず、@gologo13さんの言語

    N-gram 漢字<=>かな変換 - アスペ日記
    mamoruk
    mamoruk 2011/07/18
    さくっと作られていてすばらしい
  • FuntennA – 公立はこだて未来大学の情報発信アンテナ » Blog Archive » 新任教員インタビュー その3 「大塚 裕子 准教授」

    新任教員インタビューの第3回目です。 今回は、メタ学習センター 大塚裕子准教授にお話を伺ってきました。 公立はこだて未来大学(教員・研究紹介)- 大塚裕子 FuntennA(以下 F): 今日はよろしくおねがいします。 大塚准教授(以下 大): よろしくお願いします。 F: では最初に、先生の専門分野である「応用言語学」「日語学」「自然言語処理」についてお話ししていただけますか。 大: はい。まず、学部の頃、日語学を学んでいたときの恩氏が、岩波国語辞典を執筆・編集されている水谷静夫先生だったんです。 その水谷先生の専門が数理言語学や計算言語学でした。 これらは、コンピュータを用いて日語の語彙、文法、文章の構造を統計的に分析していく学問です。 また、自然言語処理は、コンピュータによる日語の特徴、構造を、情報工学あるいは言語学の視点から理解、解析する研究分野です。私は、言語

    mamoruk
    mamoruk 2011/07/12
    こちらに移られたとは〜
  • 知能情報処理研究室

    知能情報処理研究室(菊井グループ) established in 2011 ホームページはこちらへ移動しました.(5秒後に自動的に移動します)

    mamoruk
    mamoruk 2011/07/11
    岡山県立大学菊井さんの研究室
  • Software Design Laboratory

    このサイトは岡山県立大学情報工学部情報システム工学科のソフトウェアデザイン研究室のホームページです. 当研究室では,質問応答の技術,機械構造・要素の応答解析,ソフトウェア工学における諸問題について取り組んでいます.

    mamoruk
    mamoruk 2011/07/11
    岡山県立大学磯崎さんの研究室
  • 人材募集|株式会社教育測定研究所(JIEM)

    株式会社教育測定研究所では、現在、以下の人材を募集しています。 募集要項下部の「応募フォームへ」ボタンから、ご応募ください。 英語テスト・教材開発者 国語テスト・教材開発者 算数・数学テスト・教材開発者 研究員(テスト理論、心理測定 専門)

    人材募集|株式会社教育測定研究所(JIEM)
    mamoruk
    mamoruk 2011/07/06
    「自然言語処理技術を利用した自社サービスの品質保持や新規開発に関する業務」・大学院(修士レベル以上)卒業・自然言語処理およびその学習への適用に関する研究をされていた方
  • 実数素性テンプレートの使える CRF

    この間記事で書いた実数素性テンプレートを使える CRF を作ってみました。 google code 面倒くさかったのでだいぶコピペの目立つコードになってますが、その辺は勘弁。 テンプレートが文字列を扱うバイナリな値を取る場合(%x マクロを使うもの)ならば、素性関数 f_k(y_{i-1},y_i,X) は 1 or 0 を取る。テンプレートが実数を扱う場合(%r や SUM, MAX, Value, etc. )ならば、素性関数 f_k(y_{i-1},y_i,X) はテンプレートに書かれた演算結果の値 or 0 を取る。と、実数素性を使わない CRF からの変更点はそれだけです。 以下は動作確認のためだけのコード。 # include "rtcrflearn.hpp" # include "rtcrftagger.hpp" using namespace RtCrf; using na

    mamoruk
    mamoruk 2011/06/13
    「Tagger クラスの出力に予測時のスコアを出すようにすれば、1段目の CRF の出力を2段目の CRF の学習素性に使うというようなスタッキングも出来るようになるかなと思う次第。」