lpm11のブックマーク - はてなブックマーク

http://www.phontron.com/nlptools.php

lpm11 2011/11/03

&NaturalLanguageProcessing

リンク

latticelm

English latticelmはノンパラメトリックベイズ法に基づくPitman-Yor言語モデルを用いた単語分割と言語モデルの教師なし学習ツールです。ツールの特徴は、通常のテキストだけではなく、ラティスからも学習できることです。ラティスから言語モデルを学習することによって、連続音声など、入力にノイズが存在する場合でもよりロバストに言語モデルが学習できます。詳しくは以下の論文をご参照ください。 Graham Neubig, Masato Mimura, Shinsuke Mori, Tatsuya Kawahara Learning a Language Model from Continuous Speech In Proceedings of InterSpeech 2010 Graham Neubig, 三村正人, 森信介, 河原達也ベイズ推論を用いた連続音声からの言

lpm11 2011/10/19

&NaturalLanguageProcessing

リンク

KyTea (京都テキスト解析ツールキット)

English 京都テキスト解析ツールキット(KyTea、「キューティー」)は、日本語など、単語(または形態素)分割を必要とする言語のための一般的なテキスト解析器です。特徴ダウンロード・インストールプログラム仕様解析：手法の詳細, 入出力の形式, API 学習：モデル学習, 入手可能なモデル KyTeaを使った分野適応開発情報特徴 KyTeaには以下の機能が揃っています：単語分割：分かち書きされていないテキストを適当な単語または形態素に分割する。読み推定・品詞推定：かな漢字変換や音声認識、音声生成のために単語の発音を推定することができ、品詞を推定することもできます。線形SVMやロジスティック回帰などを用いてそれぞれの分割点や読みを個別に推定するため、部分的にアノテーションされたデータを利用してモデルを学習することも可能です。分類器の学習にはLIBLINEARを使用してい

lpm11 2011/02/18

&NaturalLanguageProcessing

リンク

はてなブックマーク

タグ

ブックマーク / www.phontron.com (3)

お知らせ

今週のはてなブックマーク数ランキング（2024年11月第1週）

月間はてなブックマーク数ランキング（2024年10月）

今週のはてなブックマーク数ランキング（2024年10月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス