タグ

自然言語処理に関するLuigitefuのブックマーク (14)

  • 言語処理100本ノック - 東北大学 乾研究室 / Inui Lab, Tohoku University

    FrontPage / 言語処理100ノック 3 秒後に NLP 100 Drill Exercises に移動します。 (移動しない場合は、上のリンクをクリックしてください。) © Inui Laboratory 2010-2018 All rights reserved. 研究室紹介/About Us 過去に在籍したメンバー Members 研究室環境 Lab Facilities ↑研究会/Research Meetings 概要 Overview 総合研究会 Research Seminar 意味研究会 SIG Semantics 談話研究会 SIG Discourse 知識獲得研究会 SIG Knowledge Acquisition Embedding研究会 SIG Embedding KIAI Knowledge-Intensive Artificial Intellige

    Luigitefu
    Luigitefu 2012/04/14
    誰かこれの コンピュータビジョン版はよ
  • 講義名(自然言語処理に関連する講義資料へのリンク)

    自然言語処理に関連する講義資料へのリンク お願い: このリストに追加すべきページをご存知の方は、nlp_portal あっと nlp.kuee.kyoto-u.ac.jpまでご連絡下さい。 講義名: 自然言語処理論 大学: 北陸先端科学技術大学院大学 キーワード: オートマトン,文脈自由文法,形態素解析,構文解析,情報検索,機械翻訳 ファイル形式: pdf URL: http://www.jaist.ac.jp/~kshirai/lec/i223/index.html (スライド) 講義名: 言語情報科学 大学: 東京大学 キーワード: 形態素解析,情報抽出,自動要約,機械翻訳,情報検索 ファイル形式: ppt URL: http://www.r.dl.itc.u-tokyo.ac.jp/~nakagawa/suri-GJK/syllabus.html (スライド)

  • 博物館所蔵の芸術作品の画像:オープンアクセスの経験(4) / クリスティン・ケリー - 翻訳記事 - みんなの翻訳

    2018年05月30日 平素よりみんなの翻訳サイトをご利用いただき誠にありがとうございます。 この度、2018年05月30日 10:00より、サーバ移行に伴いサービスを一時停止させていただきます。 ※作業完了予定は未定となります。 完了時期が分かり次第、サイト上で連絡させていただきます。ご迷惑をお掛けし、申し訳ございませんが、しばらくお待ちください。

  • 自然言語処理

  • 手軽に自然言語処理を学ぶには「入門 自然言語処理」の第12章がお勧め - 武蔵野日記

    午前中、言語教育勉強会。進捗報告と発表練習など。見る度に新しい機能が追加されていたりUIが向上していたりするので、まだまだ先が楽しみである。 午後、CJE 勉強会と研究会。日語の依存構造解析、これ以上向上させていくのは難しいということを知る。いろいろと悩ましい。少なくともこの状況の上に述語項構造解析をやらなければならないわけで…… 松研OBの@takahi_iさんが記事を書いていると小耳に挟んだので、大学の売店で WEB+DB PRESS を購入してみる。ちなみに大学の売店、書籍・雑誌は1割引である。 WEB+DB PRESS Vol.59 作者: 竹内真,猪狩丈治,矢野りん,中島拓,伊藤敬彦,角田直行,はまちや2,柄沢聡太郎,田中正裕,梶原大輔,藤真樹,増井俊之,加藤幹生,藤澤瑞樹,木村俊也,永井幸輔,中尾光輝,平田雄一,渡辺智暁,藤吾郎,原悠,浜階生,八柳幹太郎,uupaa,塙

    手軽に自然言語処理を学ぶには「入門 自然言語処理」の第12章がお勧め - 武蔵野日記
  • Perl で自然言語処理

    これから自然言語処理を業務でやってみようとしている技術者を対象にしています。 前半は自然言語処理や学習方法について述べており、後半はWebサービスに適用しやすい自然言語処理技術について述べています。Read less

    Perl で自然言語処理
  • 言語処理のための機械学習入門を読んだ - 射撃しつつ前転 改

    言語処理のための機械学習入門というが出版される、という話はtwitterで知っていたのだが、8月ぐらいに出るのだろうとばかり思っていたら、なんかもう発売されているらしい。Amazonでは早速売り切れていたので、某大学生協の書籍部まで行って購入してきた。おかげで、この週末は280円で過ごすハメになってしまった。 まだざっと眺めただけだが、 ラベルを人手でつけるのに隠れマルコフモデルと言うのは来はちょっとおかしいんだけどNLPの分野だとそう表現する事が多いよ 対数線形モデルと最大エントロピーモデルは同じものだよ 出力変数の間に依存関係がなければCRFではなく対数線形モデルとか最大エントロピーモデルと表現するべきだよ といった、これまでの教科書にはあまり載っていなかったような事が載っているのはとても良いと感じた。こういった情報は、これまではどこかの大学の研究室で学ぶか、もしくはウェブ上の資料

    言語処理のための機械学習入門を読んだ - 射撃しつつ前転 改
  • Tsujii Lab. Enshu3 -- Latent Semantic Analysis (LSA)

    Latent Semantic Analysis (LSA) 目次 背景 課題の流れ 背景 近年、情報検索が非常に重要となる一方で、その検索手法は未だにキーワード入力によるものが事実上標準となっています。しかし単語には同義語や、多義語が存在するために目的とする結果がなかなか得られない場合があります。例えば、木を用いたデータ構造を検索しようとして、treeと入力しただけでは目的のものが得られず、tree data structureでようやく狙った検索結果が上位に来ます(多義語の例)。 全ての単語に対し、どの単語同士が似た意味を持っているのか、または持っていないのかを調べることで、より柔軟性をもった情報検索ができる可能性があります(例えば、キーワードに「東大」としか入力していないのに検索結果では「東京大学」「最高学府」「University of Tokyo」が含まれる文書も検索できる)。

  • main.dvi

    Luigitefu
    Luigitefu 2009/05/24
    語彙概念構造に基づく言い換え生成 -機能動詞構文の言い換えを例題に
  • 語彙概念構造

    自然言語処理研究室(竹内研) 研究 研究員 研究室紹介 講義 その他 語彙概念構造辞書 新バージョン公開です2008.3.15 著作権および使用条件について データは国立情報学研究所および岡山大学工学部情報工学科で作成した動詞 に関する語い特性を記述したもので、著作権は岡山大学工学部情報工学科竹内 孔一が保持する。データは研究目的利用ならびに商業利用など自由に無料 で使うことができる。使用に当たっては、研究であれば論文に、商業利用であ ればその商品にこの辞書を使用したことを明記していただければ十分である。 また改変した場合のデータ配布などに関しても同様でもとのデータがこれであ ることを明記すれば自由に使うことができる。 尚、データの著作権を有する岡山大学工学部情報工学科竹内孔一はデー タの利用あるいは改変されたデータに関連して生じる一切の損失に対して保障

  • tf-idf - Wikipedia

    情報検索の分野において、tf–idf (または、 TF*IDF、TFIDF、TF–IDF、Tf–idf)は、term frequency–inverse document frequencyの略であり、コーパスや収集された文書群において、ある単語がいかに重要なのかを反映させることを意図した統計量(数値)である[1]。また、tf-idfは情報検索や、テキストマイニング、ユーザーモデリング(英語版)における重み係数(英語版)にもよく用いられる。ある単語のtf-idfの値は文書内におけるその単語の出現回数に比例して増加し、また、その単語を含むコーパス内の文書数によってその増加が相殺される。この性質は、一般にいくつかの単語はより出現しやすいという事実をうまく調整することに役立っている。今日、tf-idfはもっとも有名な語の重みづけ(term-weighting)手法である。2015年に行われた研究

  • ベイズを学びたい人におすすめのサイト - download_takeshi’s diary

    ベイジアンフィルタとかベイズ理論とかを勉強するにあたって、最初はなんだかよくわからないと思うので、 そんな人にお勧めのサイトを書き残しておきます。 @IT スパム対策の基技術解説(前編)綱引きに蛇口当てゲーム?!楽しく学ぶベイズフィルターの仕組み http://www.atmarkit.co.jp/fsecurity/special/107bayes/bayes01.html いくつかの絵でわかりやすく解説してあります。 自分がしるかぎり、最もわかりやすく親切に解説してる記事です。数学とかさっぱりわからない人はまずここから読み始めるといいでしょう。 茨城大学情報工学科の教授のページから http://jubilo.cis.ibaraki.ac.jp/~isemba/KAKURITU/221.pdf PDFですが、これもわかりやすくまとまってます。 初心者でも理解しやすいし例題がいくつかあ

    ベイズを学びたい人におすすめのサイト - download_takeshi’s diary
  • Aho Corasick 法 - naoyaのはてなダイアリー

    適当な単語群を含む辞書があったとします。「京都の高倉二条に美味しいつけ麺のお店がある」*1という文章が入力として与えられたとき、この文章中に含まれる辞書中のキーワードを抽出したい、ということがあります。例えば辞書に「京都」「高倉二条」「つけ麺」「店」という単語が含まれていた場合には、これらの単語(と出現位置)が入力に対しての出力になります。 この類の処理は、任意の開始位置から部分一致する辞書中のキーワードをすべて取り出す処理、ということで「共通接頭辞検索 (Common Prefix Search)」などと呼ばれるそうです。形態素解析Wikipediaはてなキーワードのキーワードリンク処理などが代表的な応用例です。 Aho Corasick 法 任意のテキストから辞書に含まれるキーワードをすべて抽出するという処理の実現方法は色々とあります。Aho Corasick 法はその方法のひと

    Aho Corasick 法 - naoyaのはてなダイアリー
  • 自然言語処理は Python がいちばん - 武蔵野日記

    現在大学1年生の人で3年後には NAIST に (というか松研に) 来たいという人から「どんなプログラミング言語やっておくといいですか」と質問されたりするのだが、なかなか答えるのは難しい。自分は PerlPython がメインでときどき C++/C# を使ったりするのだが、どれが一番いいかはなんとも言えないので、自然言語処理以外に転向する可能性も考えると、C とか C++ とか Java とか(授業でそちらをやるのであれば)を最初の武器に選んだ方がいいのでは、と思ってはいる。 そんなこんなで最近 Hal Daume III (機械学習を用いた自然言語処理では非常に有名な人) のブログで Language of Choice というタイムリーなエントリーが出ていたので、紹介すると、「それなりに大きな自然言語処理のプロジェクトでどのプログラミング言語を使うのか」というアンケート結果が出

    自然言語処理は Python がいちばん - 武蔵野日記
  • 1