タグ

ブックマーク / qiita.com/MeguruMokke (2)

  • Amazon Alexa の内部システムの最先端を読む(2018)(2) - Qiita

    Gunrock のアーキテクチャを見てみる さて、Gunrock が一体何をしようとしたのかわかってきたところで、どういう仕組みなのかを見ていきましょう。端的に言うと、以下の論文中の画像一枚で済ます。 とはいえ初見でこれは理解が難しいと思うので(理解できれば後の文章は読み飛ばしてください)ちょいちょいと説明を加えていきます。 まず左上の User に注目してください。これは人間を指しています。つまり今椅子に座っているなりして画面を見ているあなたです。発言は矢印を進んでASRへ進んでいきます。この時点でいう発言は、音声 となっています。イメージとしてはギジャギジャした例の音声波形みたいな感じです。 ASR (automatic speech recognition) では音声を文字に書き起こす機能を提供します。Gunrockではこの部分は Amazon が提供している ASR の機能を用いた

    Amazon Alexa の内部システムの最先端を読む(2018)(2) - Qiita
  • 対話分野の研究をしたいときに気をつけたいこと - Qiita

    対話システムの研究、人気が出てきましたね 身近なものに対話システムを組み込もうとする流れが来ているのか、機械学習の性能向上や、データの充実などの研究地盤が整ってきたのか、対話システムの研究が暖かみを帯びてきました。 私はここ数年対話系の研究面白そうだなぁとなり、昨年度辺りから(突発的に卒業研究をしなければならないという話もあり)論文読みや実験を行っているのですが、この研究・発表など大変苦労したので、同じ轍を踏まないようにここに色々書いておこうと思います。 尚、この分野は皆さんが想像している以上に広いので、どんなに頑張ってもこの手の解説は一説の域を出ることができないことを補足しておきます。(逆に、これが対話分野の研究のすべてだ!と言っているテキストなんかは注意したほうが良いと思います。自分は大分痛い目を見ました。) 補足や追記・追記依頼はご自由にどうぞ 目次 どのような研究分野なのか どのよ

    対話分野の研究をしたいときに気をつけたいこと - Qiita
  • 1