タグ

2018年2月17日のブックマーク (1件)

  • One hot表現を実装してみた - Qiita

    はじめに こんにちは。未熟者です。研究で自然言語を扱う予定なので自分用のメモ的な感じで書いきます。間違ってたら教えていただけるとありがたいです。あとプログラミングもあまり経験がないので汚いコード、変数名にはご注意を。 やりたいこと kerasのembedding層に日語のコーパスを与えたいがそのまま与えてもindex化しろと言われた。初心者なのでどうしたらいいのかわからない。 そこで単純に、単語ごとにindexを与えていけば良いかと考えたが、調べてみると単語をベクトルや確率分布で扱うことでもできるらしい。 今回調べたもの ・One hot表現 ←これ ・Bag of Bigram(文字nグラム)  (次回説明するかも(するとは言ってない)) 間違いの変更(2/22) コメントでHironsan様より、one hotについての間違いを教えていただきました。 当にありがとうございます! こ

    One hot表現を実装してみた - Qiita
    mega-ne0221
    mega-ne0221 2018/02/17
    “one hotは語彙の数だけ次元を用意して、表現したい文に含まれている単語に対応する次元を1に、それ以外を0にする方法です。”