[B! NLP] mamorukのブックマーク

Google Sites: Sign-in

Not your computer? Use a private browsing window to sign in. Learn more

mamoruk 2015/10/28

"Nobuhiro Kaji is senior chief researcher at Yahoo! JAPAN research."

NLP

リンク

AMR: Not semantics, but close (? maybe ???)

mamoruk 2014/09/29

nlp

リンク

先週末、三浦海岸で開催されたNLP若手の会（YANS）の合宿に参加してきました。 YANSで合宿が行われるのは6年ぶり、というか多分2回目。前回は参加できなかったので、私も初参加でした。データベース系など業界によっては毎年泊まり込みの合宿が開かれるらしくて、いいなぁと思っていたので今回はとても良い機会。委員のメーリングリストに入っていたので裏で大量のメールが飛び交っていたことは知っていて、準備がとても大変そうでした。 NTT宮崎さんはじめ委員の皆様には感謝です。 YANSシンポジウムというイベントには思いいれが深くて、多分東大でやった2回目のシンポジウムが初めてでした。確かM2のときでした。発表者はほぼ全員が教員（当時助教だった）、内容は全部初めて聞くようなテーマでした。普段は指導の立場であるところの先生方が、斬新なアイデアを発表している。そんな研究していいんだ！と感動した覚

mamoruk 2014/09/28

「とにかく今回はとてもおもしろかった。個人的に「楽しい」という価値はとても大事に思っています。楽しいから続けれられる、楽しいからやりたくなる、楽しいから成果が出る。」

YANS
nlp

リンク

Computational Intelligence Lab, Toyota Technological Institute

Computational Intelligence Lab, Toyota Techno logical Institute, Japan 新しいサイト<を訪問ください。 Please visit our new site.

mamoruk 2014/06/10

「 2014年4月1日三輪誠准教授が着任しました。」

nlp

リンク

企業で活用される自然言語処理技術_情報処理学会第76回全国大会

【セッション概要】電子機器の普及に伴って、多くのテキストが生成されている。社内の業務管理のために社員が書いた文を蓄積する企業もあれば、ネットのユーザーが書いた文をビジネスの対象とする企業もある。いずれの場合にも、機械的な処理に対する強い要求があり、それを実現する自然言語処理技術への期待は大きい。一方で、企業で活用できる程度に信頼性が高い言語処理技術は限られている。本企画では、各業種を代表する企業に、すでに活用している自然言語処理技術や今後の活用を期待している自然言語処理技術について各社での活用や研究開発の事例を紹介して頂き、それに基づいて自然言語処理技術の研究がどうあるべきかをパネル討論にて議論する。

mamoruk 2014/01/14

パネリスト6人中3人が松本研出身（笑）

NAIST
nlp

リンク

Google Code Archive - Long-term storage for Google Code Project Hosting.

mamoruk 2014/01/12

トーナメントモデルとshift-reduceの精度差

nlp

リンク

Jess : Automated Japanese Essay Scoring System

ヘルプ / 新着情報 / サンプルデータ A B C D E F G / 最終改訂$Date: 2007/02/13 06:52:21 $ Jess®: 日本語小論文評価採点システム投稿した「質問文」および「解答文」は研究のために二次使用することがあります。質問文（与えられた問題文を入力してください）解答文（あなたが作成した小論文を入力してください）配点：修辞論理構成内容字数制限：（入力は必須ではありません）ヘルプ / Copyright (c) 2002-2003 Tsunenori ISHIOKA (NCUEE) E-mail:

mamoruk 2012/03/29

nlp
ACL

リンク

はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知

はてなグループの終了日を2020年1月31日(金)に決定しました以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記はてなグループ日記のエクスポートデータは2020年2月28

mamoruk 2012/03/21

率直な感想が参考になりますｷﾘｯ

リンク

極大部分文字列を使った twitter 言語判定(中谷 NLP2012) - 木曜不足

来たる 3/13〜16 に広島で行われる言語処理学会年次大会(NLP2012)にて発表する「極大部分文字列を使った twitter 言語判定」の論文を公開。中谷秀洋, 極大部分文字列を使った twitter 言語判定, 言語処理学会第18年次大会, 2012 http://ivoca.31tools.com/misc/nlp2012_nakatani.pdf 【注】言語処理学会の公開規定が「大会での発表後」であったため、一旦公開を取り下げていましたが、発表終了したので再公開しました。 http://www.anlp.jp/rules/repository.html 【／注】第8回 TokyoNLP で発表した「∞-gram を使った短文言語判定」と基本線は同じ。ただしその発表の時にお約束していたとおり、17言語の判定精度で 99.1% を達成している。99% 越えは作り始める前から

mamoruk 2012/02/02

松本研からも極大部分文字列をウェブテキストに対して使った発表がありますので、タイトル一覧が公開されたときちょっとドキッとしました (笑)

NLP

リンク

IBMモデル1に言語モデルを追加した - 西尾泰和のはてなダイアリー

先日のIBMモデル1の実装に関して、なんで「house house house」ってなってしまうのかについて考察した。与えられたデータだけからは、dasがhouseなのか、Hausがhouseなのか、istがhouseなのかわからない。だから確率値もイコールになっていて、argmaxした際に最初に見つかったものが選ばれてhouseになっているものと思われる。前回の実験では言語モデルが入っていないから、「ここにはtheとかhouseとかisとかが入りそうだ」と思っても、それをどう並べればいいかについて情報がない。じゃあ言語モデルを入れたら改善されるんじゃないか？ # 前回の結果 das Haus ist klein house house house small das Haus ist schmutzig house house house dirty das Haus ist saub

mamoruk 2012/01/05

実装マラソン、いいですね！　自分もやりたいです！！！

NLP
NAIST

リンク

Microsoft Research Asia, Outreach Japan - Microsoft Japan

すべての Microsoft 製品 Global Office Windows Surface Xbox セールサポートソフトウェア Windows アプリ OneDrive Outlook Skype OneNote PC とデバイスアクセサリエンタメ Xbox ゲーム (ダウンロード) Windows ゲーム映画とテレビ番組法人向け Azure Dynamics 365 Microsoft 365 データプラットフォーム法人向け Developer & IT .NET Visual Studio Windows Server デベロッパーセンタードキュメントその他 Microsoft Store Microsoft Rewards 無料ダウンロード & セキュリティプリペイドカードサイトマップの表示 1991 年に創設された MSR は、コンピューターサイエ

mamoruk 2011/12/20

いろいろと見知った名前がありますね……

MS
NLP

リンク

Python で構文木を端末に描画してみる - ny23の日記

巷にある構文解析器には，解析結果を木構造で端末に表示する機能がある．あった方が良いだろうなと思いつつ，自分で実装するのはいかにも面倒そうだと感じて，今まで後回しにしていた．いい加減そろそろ無いと困ると感じるようになってきたので，先日の通勤電車の中で暇つぶしに書いたら，思いの外あっけなく実装できたので，メモ代わりに残しておく．最初 Ruby でワンライナーで書けないかなと思ったが，流石に難しかったので，練習も兼ねて Python で実装してみた． #!/usr/bin/env python # -*- coding: utf-8 -*- # Usage: lattice_to_tree.py < in.KNP # translate parser output into human-readable dependency tree structure import sys # customi

mamoruk 2011/12/11

python
NLP

リンク

#TokyoNLP で「∞-gram を使った短文言語判定」を発表しました - 木曜不足

TokyoNLP 第8回にのこのこ参加。主催者の id:nokuno さん、発表者＆参加者のみなさん、そして会場を提供してくださった EC ナビさん改め VOYAGE GROUP さん＆ @ajiyoshi さん、お疲れ様でした＆ありがとうございました。今回は「∞-gram を使った短文言語判定」というネタを発表。「短文言語判定」って、要は「このツイートは何語？」ってこと。こちらが資料。 ∞-gram を使った短文言語判定 View more presentations from Shuyo Nakatani そして実装したプロトタイプ ldig (Language Detection with Infinity-Gram) とモデル(小)はこちらで公開。 https://github.com/shuyo/ldig 言語判定とは「文章が何語で書かれているか」を当てるタスクで、以前一度

mamoruk 2011/11/25

参考文献がガチ

リンク

NL203

mamoruk 2011/08/16

16日だけ開催か〜しかし6件とはまたNLP冬の時代。。。

リンク

N-gram 漢字<=>かな変換 - アスペ日記

@go logo13さんの言語モデル配布ページのデータを利用して簡単な漢字->かな/かな->漢字変換ができないかなーと思って作ってみた。言語モデルの作成には SRILMを使用。配布中のデータを SRILM で扱うには多少加工しないといけないので、その変換スクリプトも作った。 GitHub リポジトリは https://github.com/hiroshi-manabe/ngram-converter 。［追記］最新のバージョンでは、4-gram のかな漢字変換用辞書をあらかじめリポジトリに入れてある。 marisa-trie モジュールさえ入れてあれば、 ./converter_sample.py --dicname-prefix=dics/bccwj4_rev_dic --order=4 --interactiveですぐにかな漢字変換が実行できる。まず、@go logo13さんの言語

mamoruk 2011/07/18

さくっと作られていてすばらしい

NLP

リンク

FuntennA – 公立はこだて未来大学の情報発信アンテナ » Blog Archive » 新任教員インタビューその３　「大塚裕子准教授」

新任教員インタビューの第３回目です。今回は、メタ学習センター　大塚裕子准教授にお話を伺ってきました。公立はこだて未来大学（教員・研究紹介）－大塚裕子 FuntennA(以下 F)：今日はよろしくおねがいします。大塚准教授(以下大)：よろしくお願いします。 F：では最初に、先生の専門分野である「応用言語学」「日本語学」「自然言語処理」についてお話ししていただけますか。大：はい。まず、学部の頃、日本語学を学んでいたときの恩氏が、岩波国語辞典を執筆・編集されている水谷静夫先生だったんです。その水谷先生の専門が数理言語学や計算言語学でした。これらは、コンピュータを用いて日本語の語彙、文法、文章の構造を統計的に分析していく学問です。また、自然言語処理は、コンピュータによる日本語の特徴、構造を、情報工学あるいは言語学の視点から理解、解析する研究分野です。私は、言語

mamoruk 2011/07/12

こちらに移られたとは〜

nlp

リンク

知能情報処理研究室

知能情報処理研究室（菊井グループ） established in 2011 ホームページはこちらへ移動しました．(5秒後に自動的に移動します)

mamoruk 2011/07/11

岡山県立大学菊井さんの研究室

nlp

リンク

Software Design Laboratory

このサイトは岡山県立大学情報工学部情報システム工学科のソフトウェアデザイン研究室のホームページです．当研究室では，質問応答の技術，機械構造・要素の応答解析，ソフトウェア工学における諸問題について取り組んでいます．

mamoruk 2011/07/11

岡山県立大学磯崎さんの研究室

nlp

リンク

人材募集｜株式会社教育測定研究所（JIEM）

株式会社教育測定研究所では、現在、以下の人材を募集しています。募集要項下部の「応募フォームへ」ボタンから、ご応募ください。英語テスト・教材開発者国語テスト・教材開発者算数・数学テスト・教材開発者研究員（テスト理論、心理測定　専門）

mamoruk 2011/07/06

「自然言語処理技術を利用した自社サービスの品質保持や新規開発に関する業務」・大学院（修士レベル以上）卒業・自然言語処理およびその学習への適用に関する研究をされていた方

研究
NLP

リンク

実数素性テンプレートの使える CRF

この間記事で書いた実数素性テンプレートを使える CRF を作ってみました。 google code 面倒くさかったのでだいぶコピペの目立つコードになってますが、その辺は勘弁。テンプレートが文字列を扱うバイナリな値を取る場合（%x マクロを使うもの）ならば、素性関数 f_k(y_{i-1},y_i,X) は 1 or 0 を取る。テンプレートが実数を扱う場合（%r や SUM, MAX, Value, etc. ）ならば、素性関数 f_k(y_{i-1},y_i,X) はテンプレートに書かれた演算結果の値 or 0 を取る。と、実数素性を使わない CRF からの変更点はそれだけです。以下は動作確認のためだけのコード。 # include "rtcrflearn.hpp" # include "rtcrftagger.hpp" using namespace RtCrf; using na

mamoruk 2011/06/13

「Tagger クラスの出力に予測時のスコアを出すようにすれば、１段目の CRF の出力を２段目の CRF の学習素性に使うというようなスタッキングも出来るようになるかなと思う次第。」

NLP

リンク

はてなブックマーク

タグ

関連タグで絞り込む (55)

NLPに関するmamorukのブックマーク (337)

お知らせ

今週のはてなブックマーク数ランキング（2024年6月第2週）

月間はてなブックマーク数ランキング（2024年5月）

今週のはてなブックマーク数ランキング（2024年6月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス