タグ

2015年12月6日のブックマーク (5件)

  • ChainerとRNNと機械翻訳 - Qiita

    自然言語処理とニューラルネット ここ数年で、自然言語処理の分野でもニューラルネットが非常に頻繁に使われるようになってきました。 自然言語処理で主に解析対象となるのは単語の配列や構文木などで、これらの内包する情報を表現するためにrecurrent neural network1やrecursive neural network1などに基づくモデルが頻繁に使われます。これらの最大の特徴はニューラルネットがある種のデータ構造を持っているという点で、1レイヤあたりのノードはそれほど多くない代わりにネットワークの接続が複雑で、しかも入力されるデータごとにネットワークそのものの形状が変化するという特徴があります。このため、伝統的なfeedforward neural networkを前提としたツールキットでは構築が難しいという問題がありました。 Chainerは、そのような問題を概ね解決してしまう強力

    ChainerとRNNと機械翻訳 - Qiita
  • A7-2.pdf

    言語処理学会 第20回年次大会 発表論文集 (2014年3月) ‡ † † † †∗ † †‡ ∗ simaokasonse@yahoo.co.jp‡ {muraoka, kazeto, yotaro-w, okazaki, inui}@.ecei.tohoku.ac.jp† 1 (Distributional Semantics) Web “good” “tasty” “good” “catch a ball” “catch a disease” “catch” “grab” “catch” “contract” [5, 6, 3] 1 �� ��� ��� � ����� �� ��� 1: 2 2 wh wd D xh xd xh xd P(xh, xd|wh, wd, Θ) Θ Θ xh xd wh wd P(xh, xd, wh, wd|Θ) P(xh, xd|wh, wd, Θ

  • Zzz Eee Lll Ccc Hhh

  • KyTeaを使った単語分割分野適応

    KyTeaを使った単語分割の分野適応 KyTeaホームに戻る はじめに KyTea の最も大きな利点の1つは分野適応が簡単であることです。特に、部分的アノテーション(後述)を使った分野適応は有用です。従来手法では、辞書に単語を追加する以外には、フルアノテーションコーパスを準備する必要がありました。フルアノテーションコーパスは、 この 時期 の 中心 人物 は 、 風穴 延昭 で あ る 。 のように、全ての単語境界に空白を入れ、単語境界のないところに空白を入れないことで、すべての文字間の境界情報をアノテーションします。しかし、この文の中で、「風穴」以外、ほとんどの単語境界は自明であり、アノテーションする必要はないため、時間の無駄が生じます。その代わり、部分的アノテーションでは、以下のように「風穴」のところだけをアノテーションすることができます。 こ の 時 期 の 中 心 人 物 は 、|

  • データセンターで大声を出してはいけません

    とても面白いビデオ「Shouting in the Datacenter」を見つけたので紹介します(公開されたのは2008年12月のようです)。 サン・マイクロシステムズ(当時)のFishworksチームに所属するBrendan Gregg氏。「面白い発見をしたんだ! マネするのはオススメしないけど」。

    データセンターで大声を出してはいけません