タグ

nlpに関するzyusouのブックマーク (7)

  • Universal Dependencies

    Universal Dependencies Universal Dependencies (UD) is a framework for consistent annotation of grammar (parts of speech, morphological features, and syntactic dependencies) across different human languages. UD is an open community effort with over 600 contributors producing over 200 treebanks in over 150 languages (see the bottom of this page for updated numbers from the latest release). If you’re

    zyusou
    zyusou 2016/06/03
    言語タグ付け等ののまとめ.勉強すべし.
  • Loading...

  • What are the most important research papers which all NLP students should definitely read? Why?

    Answer (1 of 22): I honestly think that there is no single research paper that every NLPer should read. NLP is such a broad field that no person can specialize in everything, and research papers are, by nature, rather narrowly focused. However, in certain areas, there are classic papers that sho...

    What are the most important research papers which all NLP students should definitely read? Why?
  • 言語処理学会第22回年次大会(NLP2016)

    招待講演 3/8(火) 9:30-10:30:医療分野におけるビッグデータ活用の実態と課題 講演者:石川ベンジャミン光一 氏(国立がん研究センター) 概要:医療の分野では1980年代以降に病院の業務を総合的にカバーする情報システムの開発が活発になり,その結果として現実世界での事象を電子的データとして写し取って活用することのできる範囲と粒度は大きな進歩を遂げた.また2000年代以降に入ってからは,施設単位で管理されていたデータを交換・蓄積する方法の整備が進み,大規模な医療データベースの構築とその活用に向けた気運が高まってきている.こうしたデータは医療の学問的・技術的側面における発展と同時に,社会サービスとしての医療の効率・効果と持続可能性を考えるためにも利用されている.中でもDPCデータはデータの内容と規模,収集と活用の容易さから大きな注目を集めており,講演ではその活用の事例について紹介す

    zyusou
    zyusou 2015/11/21
    川内で開催とは。
  • 「統計学と機械学習の違い」はどう論じたら良いのか - 渋谷駅前で働くデータサイエンティストのブログ

    何かこんなメディア記事が出ていたようです。 これを読んで色々な人がツッコミを入れまくっている模様ですが、この記事の不思議なところは「完全に間違った説明というわけでもないのに何故か(両分野に詳しい)誰が読んでも猛烈な違和感を覚える」ところなんじゃないかなぁと。 正直、これはライター・インタビュアー・コメンテーター・編集者の誰のせいなのかは全く分からないんですが、ツッコミ入れられまくっている内容について色々あげつらってもあまり建設的でないので、ここでは記事中で題として取り上げられている「統計学と機械学習の違い」についてちょっとコメントしてみようと思います。 あ、もちろん僕がこれから書くコメントも別に正しいとは全く限らないので、おかしいところや間違ってるところがあったらバンバン突っ込んでいただければ幸いです*1。そしてガチ勢向けのコメントでもないので何卒悪しからず。 統計学はデータを「説明」す

    「統計学と機械学習の違い」はどう論じたら良いのか - 渋谷駅前で働くデータサイエンティストのブログ
  • kondou.com - Beautiful Soup 4.2.0 Doc. 日本語訳 (2013-11-19最終更新)

    Beautiful Soup¶ Beautiful Soup はHTMLやXMLファイルからデータを取得するPythonのライブラリです。あなたの好きなパーサー(構文解析器)を使って、パースツリー(構文木)の探索、検索、修正を行います。 これはプログラマーの作業時間を大幅に短縮してくれます。 (訳注)石鹸はべられない¶ この文書は Beautiful Soup 4.2.0 Documentation の日語訳です。”Beautiful Soup”を”ビューティフルソープ”と読んでしまう英語が苦手でちょっぴりHな後輩のために翻訳しました。 2013年10月29日からこの文書の翻訳をはじめました。11月1日現在まだ全てを訳し終えていませんが、スクレイピングに使う主な部分はとりあえず訳したので、一旦これで公開して、あとは年内を目処にまったりと翻訳をすすめ、あわせて質を高めていこうと思っていま

  • Python による日本語自然言語処理

    はじめに この文書は、 Steven Bird, Ewan Klein, Edward Loper 著 萩原 正人、中山 敬広、水野 貴明 訳 『入門 自然言語処理』 O'Reilly Japan, 2010. の第12章「Python による日語自然言語処理」を、原書 Natural Language Processing with Python と同じ Creative Commons Attribution Noncommercial No Derivative Works 3.0 US License の下で公開するものです。 原書では主に英語を対象とした自然言語処理を取り扱っています。内容や考え方の多くは言語に依存しないものではありますが、単語の分かち書きをしない点や統語構造等の違いから、日語を対象とする場合、いくつか気をつけなければいけない点があります。日語を扱う場合にも

  • 1