タグ

文章と学習に関するpoginのブックマーク (3)

  • 安倍晋三会話botを作っています+助言いただきたいです - イカれた男のイカれたブログ

    不謹慎極まりないですが、安倍晋三氏の発言を学習データとして安倍晋三botなるものを製作しております。題材が安倍晋三氏なのは、発言に大きな特徴がある、国会での発言からそこそこの量のデータを容易に用意できる、国会議事録から簡単に対話コーパスを作成できる、というようにキャラクター対話botという題材に非常に適した存在であるからです。作成途中に痛ましい事件が起こりましたが、人間の欲求は止められねえということで、不道徳の誹りを甘んじて受けることとして、作成を続行しています。 以下に作成過程、作成状況を記載しますので、この分野に詳しい人おられましたら是非助言よろしくお願いいたします。ブログのコメント欄、もしくはメールアドレスとTwitterアカウントも掲載しておきますので、どの媒体でも構いませんのでマジでお願いします。ちなみに私は情報系ではないど素人門外漢なので(専攻は材料とかそっち系)、的外れなこと

    安倍晋三会話botを作っています+助言いただきたいです - イカれた男のイカれたブログ
  • はじめての自然言語処理 類似文書検索の手法と精度比較 | オブジェクトの広場

    自然言語処理とは、人間が自然に使っている英語や日語などの言語をコンピュータで処理する技術です。自然言語処理でできることには機械翻訳、要約生成、感情分析などがありますが、今回は比較的シンプルな例として類似文書検索に焦点を当ててみたいと思います。類似文書検索はテーマとしては真新しいものではありませんが、記事では単語の分散表現を用いる手法や Watson Discovery も含めた各種の類似文書検索手法について、日語データに対して精度比較試験をした結果を紹介します。複数の手法を同一の日語データで比較した記事はあまり見ないので面白いのではないでしょうか。 1. 始めに 記事では類似文書検索の各手法について、単語の分散表現を用いる手法や Watson Discovery も含めて精度比較試験をした結果を紹介します。まず各手法の概要を紹介しますが、ここでは数学的な細かい説明などは省くので概

    はじめての自然言語処理 類似文書検索の手法と精度比較 | オブジェクトの広場
  • これは勉強のやり方が分からなくて困っている人のために書いた文章です(増補しました)

    これは勉強のやり方が分からなくて困っている人のために書いた文章です。 勉強にはいろいろなやり方があるけれど、いろんなことをいっぺんに書いてしまうと読むのがたいへんなので、かんたんなものだけを選んで書きました。 ひとつのやり方が分かれば、他のやり方をさがしたり工夫したりできるようになると思います。 時間がない人のためのまとめ 覚えよう 覚えることで注意力を理解することに回せる 覚えなおそう 忘れることに打ち勝つには記憶の定期メンテナンス 声を出して読もう これだけで効率10%アップ 書き写そう 書き写しのスピードは実力のバロメータ 思い出そう 思い出す価値がある情報だと脳に教える 理解することを理解しよう 知ってることの結びつきを図に描く くり返そう 飽きるのは人間の仕様だから、違う刺激を使う 解き直そう 自分がたった今解いたばかりの問題は最高の教材 勉強日誌をつけよう 記録をとり、読み返す

    これは勉強のやり方が分からなくて困っている人のために書いた文章です(増補しました)
  • 1