タグ

researchとNLPに関するoverlastのブックマーク (8)

  • 音声認識研究の閉塞感は他人事ではない - 武蔵野日記

    「何かが欠けている音声認識研究」についての話。を紹介。前も書いたことがあるかもしれないが、id:tihara さんの文章は独特のリズムととぼけた感じがあってとても好きである。 古井先生の話は「音声認識技術の進歩が止まっている」というところから始まった。古井先生は国内外で有名な音声認識工学の研究者である。日音声認識界で知らない人はいないだろうし、先日は海外で基調講演をしてきたばかりである。その先生が、実感として「止まっている」と言っており、各種客観的なデータから「止まっている」ということを読みとっていた。 私も止まっていると感じているし、そう感じている音声認識技術の研究者は多いようである。実際、20年間進歩がないと言っていた研究者もいた。古井先生の主張はどうやら6年間進歩がないということらしかったが、とにかく6年から20年くらいは進歩がないようである。 音声認識は進歩が止まっているという

    音声認識研究の閉塞感は他人事ではない - 武蔵野日記
    overlast
    overlast 2015/06/11
    2010年
  • [O] UniDic に固有表現やUnicode 絵文字などを足す mecab-unidic-NEologd を公開しました

    UniDic に固有表現やUnicode 絵文字などを足す mecab-unidic-NEologd を公開しました Tweet [NLP] 今年3月中旬 [2015-03-13] に mecab-ipadic-NEologd をリリースして以来、mecab-ipadic-NEologd はとても順調に普及しています。 さて、今回は UniDic に新語や固有表現、Unicode 絵文字などを足すことができる mecab-unidic-NEologd を公開しました。 mecab-ipadic-NEologd を生成する手法を使っています。 https://github.com/neologd/mecab-unidic-neologd/blob/master/README.ja.md シードデータの性質上、構築されるシステム辞書には国語研短単位の条件を満たさないエントリも入りますので、あら

    overlast
    overlast 2015/05/29
    よろしければお試しください😄🎉IPA辞書ユーザの方はmecab-ipadic-NEologdで👌です
  • partake.in

    This domain may be for sale!

    partake.in
    overlast
    overlast 2014/10/01
    10/11(土) 12:30〜 渋谷のデンソーアイティラボラトリさんで開催。招待講演は小町守さん(@mamoruk)。
  • 手元に置いておくと安心できる、情報系の人向けな日本語の本のリスト - EchizenBlog-Zwei

    最近、人にを薦める事が多くなった。とりあえずこの辺を読むといいですよ的なリストを作っておくと便利だと思ったので作ることにした。 以下、「事前知識のいらない入門」「事前知識はいらないけど格的な」「事前知識がないと何言ってるかわからないけど有益な情報が満載な」の3つにわけて列挙する。 事前知識のいらない入門 数式少なめ、脳負荷の小さめなをいくつか。何をやるにしてもデータ構造、アルゴリズム、数学はやっておくと幸せになれるよ。 情報検索と言語処理 データマイニングとか自然言語処理とかやりたい人にはとりあえずこれ。さすがに古い話が多くなってきたのでそろそろ新しい入門用情報検索がでないかなあと思っている。 図解・ベイズ統計「超」入門 伝説のベイジアン先生がベイズの基礎を教えてくれる。ベイズやりたい人はこれ。 珠玉のプログラミング データ構造とかアルゴリズムとかの考え方の基礎を教えてく

    手元に置いておくと安心できる、情報系の人向けな日本語の本のリスト - EchizenBlog-Zwei
  • Statistical Semantics入門の発表をしました

    先週のPFIセミナーで、Statistical Semantics入門という発表をしました。 主に分布仮説をベースにした、単語の意味を文脈の分布で表現する研究を纏めました。 LSIから始まって、PLSI、LDAと続く言語モデル系、NMFなどの行列分解系、そしてNNLM、RNNLMと来て昨年流行したニューラルネット系の3つでまとめるという形をとっています。 あまり専門的になりすぎず、過去からの歴史や流れを踏まえ、一方で実用面や研究テーマのココロ、問題意識を重視するような内容になるように心がけたつもりではあります。 当初、他の「いわゆる意味論」との比較みたいなスライドもあったのですが、変なコト言うと刺されると思ったので消しましたw ところで、応用の観点でこれらの話をどう考えているか、というような点について触れるのを忘れたな、と思ったのでこちらに書いてみます。 基的に私見ですが。 私自身は、単

  • 自動要約の研究動向 - 蝉々亭

    あけましておめでとうございます.もう1月も終わりですが,ようやく年を越してしまった課題を終わらせつつあります. 昨年の9月,11月にそれぞれ情報処理学会第213回自然言語処理研究会と人工知能学会第91回人工知能問題研究会にて機会をいただき,自動要約に関する最近の研究動向についてお話してきました.ありがたいことに,資料を公開して欲しい,との声をいくつか頂戴しましたので,内容を整理してここに掲載しておきたいと思います. Automatic summarization from Hitoshi NISHIKAWA 今年の言語処理学会第20回年次大会では,東京工業大学の高村先生が自動要約に関するチュートリアルをしてくださいます.言語処理学会第20回年次大会は絶賛事前参加受付中です.

    自動要約の研究動向 - 蝉々亭
  • 大規模データを基にした自然言語処理 - DO++

    人工知能問題研究会 (SIG-FPAI)でタイトルの題目で一時間ほど話してきました。 発表資料 [pptx] [pdf] 話した内容は - 自然言語処理における特徴ベクトルの作り方と、性質 - オンライン学習, Perceptron, Passive Agressive (PA), Confidence Weighted Learning (CW) 確率的勾配降下法 (SGD) - L1正則化, FOLOS - 索引を用いた効率化, 全ての部分文字列を利用した文書分類 で、スライドで70枚ぐらい。今までの発表とかぶっていないのはPA CW SGD FOLOSあたりでしょうか オンライン学習、L1正則化の話がメインになっていて、その両方の最終形の 確率的勾配降下法 + FOLOSの組み合わせは任意の損失関数に対してL1/L2正則化をかけながらオンライン学習をとても簡単にできるという一昔前

    大規模データを基にした自然言語処理 - DO++
  • 「Introduction to Information Retrieval」の輪講始めます

    「Introduction to Information Retrieval」の輪講始めます 2007-12-03-2 [IIR] 「Introduction to Information Retrieval」というがあります。 まだ出版されていないのですがドラフト PDF が入手できます。 - Introduction to Information Retrieval http://www-csli.stanford.edu/~hinrich/information-retrieval-book.html - 言及記事→[2007-01-23-5] 来年1月から、有志でこのの輪講を行います。 基的に私が全体をフォローしますので、 まあ「たつをゼミ」みたいな感じです(ヲゼミ?)。 大学のゼミみたいのをオープンにやるイメージで。 第一回は、 2008年1月12日(土)の12:00-15

    「Introduction to Information Retrieval」の輪講始めます
  • 1