タグ

ブックマーク / hayashibe.jp (5)

  • JUMANの更新履歴

    JUMAN++ 1.00 (2016-09-23) コストを機械学習 Recurrent Neural Network Language Model(RNNLM) も使用 辞書の語彙も更新 ver 7.0 (2012-01-12) 非反復形オノマトペ,長音記号による非標準表記,長音記号・小書き文字を用いた長音化の自動認識 Wikipediaから抽出した辞書の追加 自動辞書(Webテキストから自動獲得した辞書)の改良 UTF-8化 ver 6.0 (2009-09-26) 意味カテゴリの付与 ドメインの付与 固有名詞辞書の語彙と意味情報の整理・付与 語の意味関係の整理と意味情報の付与 連濁,反復形オノマトペ,小書き文字による非標準表記の自動認識 未知語の自動獲得 意味情報の表記法の整理 ver 5.1 (2005-09-07) 従来KNPで付与していた語の意味情報をJUMANで付与することに

    sassano
    sassano 2015/02/04
  • 技術情報

    See detail on the site.

    sassano
    sassano 2012/10/09
  • 林部 祐太

    自然言語処理・画像生成音声合成などITAIを専門として研究開発を行っています. 詳細は研究発表をご覧ください. データやソフトウェアの公開も行っています. 職歴 2012/8/1 〜 2012/10/31 楽天技術研究所(New York) リサーチインターン,メンター:萩原正人博士 英作文を支援するIME(入力メソッド)の研究開発を行いました IMEに関する査読有ワークショップWTIM2012と2013年言語処理学会年次大会で成果を発表し,特許も取得しました. 2013/4/1 〜 2014/3/31 国立国会図書館 関西館 電子図書館課 調査員(非常勤) ウェブアーカイブに関する技術調査業務等を行いました 文字コードに関する入門講座も行いました 2014/4/1 〜 2016/8/31 京都大学 情報学研究科 特定研究員(黒橋・河原研究室) 言語の意味解析に関する研究(格フレーム構

    sassano
    sassano 2010/12/13
  • 日本語係り受けコーパス(JDC)

    概要 日語ウェブコーパス2010(NWC2010)(約1億ウェブページ)より CaboChaを用いて, 助詞を介した語と語の係り受けを抽出したものです. 類似のコーパスとしてALAGINの日語係り受けデータベースがあります. コーパスでは次のような形で収録されています. NCV (名詞) (助詞) (動詞) 338,092,129種類(約3.3億ユニークペア) レビュー を お送りする 496 テレクラ で いる 6 大気 が 存続する 1 化量 を 言う 1 Private と 定義する 1 けんぎゅうか が 伝来される 2 プロテスタンティズム を 生み出す 1 脳内 で アップされる 6 NCN (名詞) (助詞) (名詞) 166,724,808種類(約1.6億ユニークペア) 司会 が 仕事 25 こころ という ちよ 1 場所 から 大筒 1 見直し へ 訴訟 3 ここ

    sassano
    sassano 2010/12/13
  • 日本語述語項構造解析器 YuCha 「夕茶」

    目的 「述語項構造解析」とは文書中の各述語に対して,「項」となる名詞句等を当てることです. 私は今日,トマトカレーを(1)べました. 明日は太郎とインドカレーを(2)べにショッピングセンターに(3)行く予定です. 上の例では, 私が トマトカレーべる 私が インドカレーべる 私が ショッピングセンターに 行く ということを当てるのが目的です. このようなことが分かれば,表面的な記述に惑わされない自動翻訳や, 精度の高い情報検索などに役立ちます. 開発状況 TODO 述語の格フレーム判定等,まだまだ未実装の機能がたくさんあります. $ ./bin/default/yucha /tmp/ntc 私は今日,トマトカレーべました. 明日は太郎とインドカレーべに,ショッピングセンタへ行く予定です. EOT GA 0 私は べました. GA 1 私は べに, GA

  • 1