タグ

関連タグで絞り込む (3)

タグの絞り込みを解除

nlpとimeに関するmanabouのブックマーク (2)

  • ニューラルかな漢字変換の細かいツッコみどころ - アスペ日記

    ニューラルかな漢字変換という記事へのツッコミです。 いや、ニューラル部分はいいんですよ。 ぼくはやってないから。 ツッコみどころは、ごく細かいところです。 注釈の、「かな漢字変換はN=3以上にしても精度が上がらないことが実験により確かめられています。詳しくは私の論文(リンク)を参照ください。(ドヤァ 」という箇所です。 それ、BCCWJのコアデータだけ使った場合ですよね。 ぼくは以前、N-gram かな漢字変換を作って公開したことがあります。 これは、京都大学で公開している言語モデル配布ページの、BCCWJ全体を使ったものです。 実装はhttps://github.com/hiroshi-manabe/ngram-converter-cppにあります。 http://vocrf.net/test/ime.htmlで、4-gram かな漢字変換をテストできます。 (PCで、PCのIMEを切っ

    ニューラルかな漢字変換の細かいツッコみどころ - アスペ日記
  • 未踏の応募資料を公開します 【統計的かな漢字変換】 - Qiita

    2016年度の未踏事業の応募資料を公開します。 https://drive.google.com/file/d/0B3_gFEFI2149VEdKeWxsWnJsNlU/view?resourcekey=0-tiHOfGdyOg54X3ZUTVLzZA テーマは「単語の共起情報を利用したかな漢字変換システム」です。 (資料内では「このひとことでげんきになった」を変換対象の文字列の例として挙げていますが,「けんきゅうする」の間違いです) なぜ公開するか 一言で言うと、落ちたからです。しかし誰かの趣味や研究テーマになれば、未踏に落ちたとしてもアイデアの有効活用にはなるだろうと考えてます。 なぜ落ちたか 未踏の審査をして下さった方からは次のようなコメントを頂いています。 「提案手法なしとありとで、提示される候補を比較し、改善の程を評価するというのでは、ソフト開発ではなく研究となってしまいます」

    未踏の応募資料を公開します 【統計的かな漢字変換】 - Qiita
  • 1