[B! 言語モデル] yukinoiのブックマーク

yukinoi id:yukinoi

言語モデルに関するyukinoiのブックマーク (2)

言語モデルの性能が、実装により異なる件を解決する
Deliver the ready-to-train data to your NLP model. - chakki-works/chariot 言語モデルの実装パターン「言語モデルの実装」として紹介されることの多い実装は、主に2つあります。1つがバッチ型、もう一つがシーケンシャル型です(このタイプは私が名付けたので、一般的ではありません)。そして、バッチ型の性能は素直に実装するとシーケンシャル型に大きく劣ります。本節ではまず実装の違い、次節で性能差の原因について解説します。バッチ型のモデルは、固定長の系列から予測を行うタイプの実装です。特にKerasによる言語モデルの実装ではこのタイプが使われていることが多いです。一定長の系列を与えて、系列に続く単語(文字)を予測させる形です。図にすると以下のようになります。バッチ型の言語モデル実装コードにすると、概ね以下のような実装になります。b
yukinoi 2018/10/12
NLP

Python

言語モデル
リンク
Kneser-Ney smoothingで遊ぶ - Negative/Positive Thinking
はじめに 100-nlp-papersで紹介されてた一番最初の論文に、クナイザーネイスムージングのスッキリな実装が載っていたので書いてみる。 Joshua Goodman: A bit of progress in language modeling, MSR Technical Report, 2001. Kneser-Ney smoothingとは言語モデルのスムージング(平滑化)手法の一種で、高い言語モデル性能を実現しているニューラル言語モデルでも比較によく使われるアイデアとしては「(n-1)-gramが出現した文脈での異なり数」を使うこと頻度を使うと、高頻度なn-gramではその(n-1)-gramも多くなってしまうため、特定文脈でしかでないような(n-1)-gramに対しても高い確率値ことになっていて、歪んだ結果になってしまう「San Francisco」の頻度が多いと
yukinoi 2017/04/07
NLP

言語モデル
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx