sassanoのブックマーク - はてなブックマーク

JUMANの更新履歴

JUMAN++ 1.00 (2016-09-23) コストを機械学習 Recurrent Neural Network Language Model(RNNLM) も使用辞書の語彙も更新 ver 7.0 (2012-01-12) 非反復形オノマトペ，長音記号による非標準表記，長音記号・小書き文字を用いた長音化の自動認識 Wikipediaから抽出した辞書の追加自動辞書(Webテキストから自動獲得した辞書)の改良 UTF-8化 ver 6.0 (2009-09-26) 意味カテゴリの付与ドメインの付与固有名詞辞書の語彙と意味情報の整理・付与語の意味関係の整理と意味情報の付与連濁，反復形オノマトペ，小書き文字による非標準表記の自動認識未知語の自動獲得意味情報の表記法の整理 ver 5.1 (2005-09-07) 従来KNPで付与していた語の意味情報をJUMANで付与することに

sassano 2015/02/04

リンク

技術情報

See detail on the site.

sassano 2012/10/09

リンク

林部祐太

自然言語処理・画像生成・音声合成などIT・AIを専門として研究開発を行っています．詳細は研究発表をご覧ください．データやソフトウェアの公開も行っています．職歴 2012/8/1 〜 2012/10/31 楽天技術研究所(New York) リサーチインターン，メンター：萩原正人博士英作文を支援するIME（入力メソッド）の研究開発を行いました IMEに関する査読有ワークショップWTIM2012と2013年言語処理学会年次大会で成果を発表し，特許も取得しました． 2013/4/1 〜 2014/3/31 国立国会図書館関西館電子図書館課調査員(非常勤) ウェブアーカイブに関する技術調査業務等を行いました文字コードに関する入門講座も行いました 2014/4/1 〜 2016/8/31 京都大学情報学研究科特定研究員（黒橋・河原研究室）言語の意味解析に関する研究（格フレーム構

sassano 2010/12/13

リンク

日本語係り受けコーパス(JDC)

概要日本語ウェブコーパス2010(NWC2010)(約1億ウェブページ)より CaboChaを用いて，助詞を介した語と語の係り受けを抽出したものです. 類似のコーパスとしてALAGINの日本語係り受けデータベースがあります. 本コーパスでは次のような形で収録されています. NCV (名詞) (助詞) (動詞) 338,092,129種類(約3.3億ユニークペア) レビューをお送りする 496 テレクラでいる 6 大気が存続する 1 化量を言う 1 Private と定義する 1 けんぎゅうかが伝来される 2 プロテスタンティズムを生み出す 1 脳内でアップされる 6 NCN (名詞) (助詞) (名詞) 166,724,808種類(約1.6億ユニークペア) 司会が仕事 25 こころというちよ 1 場所から大筒 1 見直しへ訴訟 3 ここ

sassano 2010/12/13

リンク

日本語述語項構造解析器 YuCha 「夕茶」

目的「述語項構造解析」とは文書中の各述語に対して，「項」となる名詞句等を当てることです．私は今日，トマトカレーを(1)食べました．明日は太郎とインドカレーを(2)食べにショッピングセンターに(3)行く予定です．上の例では，私がトマトカレーを食べる私がインドカレーを食べる私がショッピングセンターに行くということを当てるのが目的です．このようなことが分かれば，表面的な記述に惑わされない自動翻訳や，精度の高い情報検索などに役立ちます．開発状況 TODO 述語の格フレーム判定等，まだまだ未実装の機能がたくさんあります． $ ./bin/default/yucha /tmp/ntc 私は今日，トマトカレーを食べました．明日は太郎とインドカレーを食べに，ショッピングセンタへ行く予定です． EOT GA 0 私は食べました． GA 1 私は食べに， GA

sassano 2010/07/25

NAIST

リンク

はてなブックマーク

タグ

ブックマーク / hayashibe.jp (5)

お知らせ

今週のはてなブックマーク数ランキング（2024年10月第2週）

今週のはてなブックマーク数ランキング（2024年10月第1週）

月間はてなブックマーク数ランキング（2024年9月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

タグ

ブックマーク / hayashibe.jp (5)

JUMANの更新履歴

技術情報

林部 祐太

日本語係り受けコーパス(JDC)

日本語述語項構造解析器 YuCha 「夕茶」

お知らせ

今週のはてなブックマーク数ランキング（2024年10月第2週）

今週のはてなブックマーク数ランキング（2024年10月第1週）

月間はてなブックマーク数ランキング（2024年9月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス

林部祐太