タグ

ブックマーク / catindog.hatenablog.com (3)

  • emotion2vec - にほんごのれんしゅう

    emotion2vec テキスト感情ベクタライザの提案 〜 doc2vec, fasttext, skipthoughtに続く第四のテキストベクタライザ 〜 (ジョーク投稿です。正確なリプレゼンテーションかどうか、十分な検証をする必要があります) 感情は難しい コミュ症の人が何らか相手の感情を察しようとした場合、既存の知識や経験に基づいて相手が何を意図しているのか、把握することが難しいという悲しい事実があります。 ディープラーニングってやつでなんとかして!案件ですね。 ここでは、感情を定量的に解析して確認する手法を提案します。 リプレゼンテーション(表象)の選択 最も端的に感情を示している素性は何でしょうか。映像ではその人の行動であったり、表情であったりします。 テキストの世界では、最近の若い人たちは、絵文字というものを使うことがあります。絵文字はその文脈では伝えきれてない感情を絵文字の表

    emotion2vec - にほんごのれんしゅう
  • 新しく買ったWindows 10でneologd等の自然言語処理環境を構築する (+ XGBoost) - にほんごのれんしゅう

    新しく買ったWindows 10でneologd等の自然言語処理環境を構築する (+ XGBoost) はじめに 自然言語処理と機械学習とSE的なことを仕事としているのですが、現在務めている会社ではWindowsの利用を強く推奨されることがあります。これは、コンプラインスの関係でセキュリティ管理者が複数のOSを管理するコストは高いからWindowsに限定することが多いという理由に起因しています。 この文章を書いている環境はUbuntu LinuxのLibreofficeを用いています。文字コードがUTF-8だと自然言語処理の観点で何かと都合がよく、MeCabなどの形態素解析エンジンもUTF-8ですし、Python3も内部の処理系がUTF-8で、GolangのRuneや、C++も文字処理粒度はUTF-8のものが増えています。 こういう関係もあって、sjisをハックするなど、あまり技術的にこっ

    新しく買ったWindows 10でneologd等の自然言語処理環境を構築する (+ XGBoost) - にほんごのれんしゅう
  • Seq2Seqで小説自動生成の学習を失敗した話 - にほんごのれんしゅう

    Seq2Seqで小説自動生成の学習を失敗した話 失敗した経験をネット上に上げることにいくつか意見があるでしょうが、機械学習を行って、学習が失敗すると、大きな時間的な損失になるよという見地を示す目的があります。 小説の自動生成では、ディープラーニングを実用に移した例では、韓国の会社がRNNモデルを利用して、VOYAGERなる小説(アプリ?)を公開するに至りました。考え方としては、Seq2Seqによる文章作成はこれに該当すると思われます[1]。 Seq2Seqとは 図.1 この図は、inputを文字のシーケンシャルな列としたとき、アプトプットをシーケンシャルな文字の列とすることです。 ユニークなのは、図の”I”という出力を次のインプットとすることで、”am”という最尤度を持つ文字を取り出していることです。さらに次の出力をインプットとすることで文字列を作り出すということを行っています。 基幹

    Seq2Seqで小説自動生成の学習を失敗した話 - にほんごのれんしゅう
  • 1