[日本語] / [English] 京都大学 大学院情報学研究科 知能情報学コース 言語メディア分野(工学部電気電子工学科) 研究室へのアクセス JUMAN は有効な WikiName ではありません。 サイトポリシー
[日本語] / [English] 京都大学 大学院情報学研究科 知能情報学コース 言語メディア分野(工学部電気電子工学科) 研究室へのアクセス JUMAN は有効な WikiName ではありません。 サイトポリシー
日本語形態素解析システム Juman++ † Juman++は言語モデルを利用した高性能な形態素解析システムです.言語モデルとして Recurrent Neural Network Language Model (RNNLM) を用いることにより,単語の並びの意味的な自然さを考慮した解析を行います.それにより JUMAN,MeCab に比べ大きく性能が向上しています.文法・辞書・出力フォーマット等は JUMAN から引き継いだものを利用しています.本システムは CREST「知識に基づく構造的言語処理の確立と知識インフラの構築」の支援により開発されました. ↑ 使用方法 † たとえば,次のようなテキストを入力すると, % cat sample.txt 外国人参政権 私もあさって日曜最終日 以下の解析結果が得られます. % cat sample.txt | jumanpp 外国 がいこく 外国
日本語形態素解析システム JUMAN † 本システムは,計算機による日本語の解析の研究を目指す多くの研究者に共通に使える形態素解析ツールを提供するために開発されました.その際, 学校文法が計算機向きではないという問題を考慮し,使用者によって文法の定義,単語間の接続関係の定義などを容易に変更できるように配慮しました. 新バージョン7.0の拡張点は以下の通りです. 非反復形オノマトペ,長音記号による非標準表記,長音記号・小書き文字を用いた長音化の自動認識 Wikipediaから抽出した辞書の追加 自動辞書(Webテキストから自動獲得した辞書)の改良 UTF-8化 たとえば,次のようなテキストを入力すると, % cat sample.txt カサつく ビミョーだ がんがる アジャイルだ 爽健美茶 ThinkPad 上海ガニ ぺっちゃりしてる ありがとー 行きたぁぁぁい 以下の解析結果が得られます
日本語形態素解析システム JUMAN † 本システムは,計算機による日本語の解析の研究を目指す多くの研究者に共通に使える形態素解析ツールを提供するために開発されました.その際, 学校文法が計算機向きではないという問題を考慮し,使用者によって文法の定義,単語間の接続関係の定義などを容易に変更できるように配慮しました. 新バージョン7.0の拡張点は以下の通りです. 非反復形オノマトペ,長音記号による非標準表記,長音記号・小書き文字を用いた長音化の自動認識 Wikipediaから抽出した辞書の追加 自動辞書(Webテキストから自動獲得した辞書)の改良 UTF-8化 たとえば,次のようなテキストを入力すると, % cat sample.txt カサつく ビミョーだ がんがる アジャイルだ 爽健美茶 ThinkPad 上海ガニ ぺっちゃりしてる ありがとー 行きたぁぁぁい 以下の解析結果が得られます
Last Modified: January 4, 2019 放送大学 自然言語処理('19) 放送時間:2021年度 [第1学期](月曜)06:45~07:30 放送大学のページ 印刷教材の訂正 改訂版 自然言語処理 (2019年3月〜) 2.1.4節 p.26,27 'a' -> 'α' (アルファ,3箇所) 4.2.2節 p.53 7行目 それぞ -> それぞれ 5.2.3節 p.67 図5.4 日付表現と左の3単語の間に'}' 人名と左の2単語の間に'}' 6.1.3節 p.75 脚注 2) の最後に '/'追加 9.1.2節 p.108 13行目 acusative -> accusative 9.1.2節 p.109 表9.1 チェールズ -> チャールズ 9章 参考文献 p.117 2行目 チェールズ -> チャールズ 10.3.2節 p.128 7行目 因果 -> 関係可能
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く