skypenguinsのブックマーク / 2018年3月27日

skypenguins id:skypenguins

2018年3月27日のブックマーク (5件)

自然な音声作る「WaveNet」の衝撃　なぜ機械は人と話せるようになったのか
2017年、米Googleや米Amazonなどの「スマートスピーカー」と呼ばれるデバイスの普及が日本で始まった。例えば、「ねえGoogle、今日の予定は？」と話しかけると、カレンダーアプリに入力していた予定を流ちょうな日本語で読み上げてくれる。中に人がいるわけではない。デバイスが人の声を認識し、応答となる声を合成しているのだ。このデバイスが音声で応答するために使用しているコアの技術は、「音声認識」と「音声合成」という2つの技術だ。音声認識は人の声の波形を機械で処理し、どんな文であったかを推定する技術。音声合成は与えられた文やデータから、人が話す音声を合成する技術だ。ここに、音声認識で推定した文に対して適切な応答文を出力する「対話制御」という技術が加わり、「人の話を聞いて適切な応答を音声で返す」という一連の動作を実現している。音声認識・合成ともに、コンピュータを利用した研究は1950年
skypenguins 2018/03/27
前にサンプル聞いたけどマジで人間と区別つかないくらい自然だったんだよな

google

音声合成

WaveNet

TTS

機械学習

深層学習
リンク
YOLO: Real-Time Object Detection
How It Works Prior detection systems repurpose classifiers or localizers to perform detection. They apply the model to an image at multiple locations and scales. High scoring regions of the image are considered detections. We use a totally different approach. We apply a single neural network to the full image. This network divides the image into regions and predicts bounding boxes and probabilitie
skypenguins 2018/03/27
コンピュータビジョン

機械学習

DeepLearning

深層学習
リンク
第35回　ポプテピピックはお祭りである
皆さん、この1月クールで最も印象に残ったテレビ番組は何です？ ――え？『アンナチュラル』？まぁ、確かに野木亜紀子サンの脚本はアメリカのドラマみたいで、法医学の話でありながら人間ドラマの側面もあったし、人の死を扱いながらコメディの要素もあって見やすかったし、1話完結ながら連ドラ的な面白さもあったし、何より主人公ミコトを演じる石原さとみサンをはじめ、中堂役の井浦新サン、久部役の窪田正孝サン、東海林役の市川実日子サン、そして所長役の松重豊サンら魅力的なキャスト陣だったし――。うん、僕は『アンナチュラル』は1月クールで最高のドラマだったと思う。いや、間違いなく今年の連ドラTOP3に入る傑作だと思う。でも――“テレビ番組”全体にまで広げると、ちょっと様相が変わってくる。 1月クール最高のテレビ番組――僕は、それはアニメの『ポプテピピック』だったと思う。『ポプテピピック』とは何かそう、ポプテ
skypenguins 2018/03/27
アニメ

メディア

ポプテピピック

考察
リンク
https://killedbynlp.github.io/posts/2018/02/pop-team-epic-1
skypenguins 2018/03/27
機械学習

オンライン学習

NLP

自然言語処理
リンク
ラーメン二郎とブランド品で AutoML Vision の認識性能を試す | Google Cloud 公式ブログ
この投稿は米国時間 3 月 26 日に投稿されたもの（投稿はこちら）の抄訳です。 Posted by Google Cloud デベロッパーアドボケイト佐藤一憲この 3 つのラーメンは、41 店舗あるラーメン二郎のうち 3 店舗で作られたものです。それぞれ、どの店舗で出されたものか分かりますか？　データサイエンティストの土井賢治さんが作成した機械学習（ML）によるラーメン識別器を使えば、それぞれの微妙な盛り付けの違いを見分けることで、95% の精度で店舗を特定できます。この写真を見ても分かるとおり、ラーメン二郎の相当コアなファンでもなければ、ラーメン画像から 41 店舗のどこで作られたかを見分けることは簡単ではありません。テーブルやどんぶりの色、形にあまり違いのない場合が多いのです。土井さんは、ディープラーニングを使ってこの問題を解けるか興味を持ち、インターネット上から 48
skypenguins 2018/03/27
そもそも二郎のデータセットを48000枚も準備できる時点で頭おかしい(褒め言葉)

AutoML

機械学習

深層学習

google
リンク
- 2018年3月28日
- 2018年3月27日
- 2018年3月26日