研究の目標・ねらい 人間中心の情報環境とは、あらゆる人間が情報発信源となり、また自然に情報を享受できる環境である。音声が人間にとって最も基本的なコミュニケーションメディアであるということから、高度なネットワーク情報通信機器があらゆる場所に偏在する中で、人々が音声によって自然かつ自在に情報を発信し、またやりとりする環境が広く社会に実現されることは、ひとつの理想である。音声認識、音声合成、音声対話の要素技術に関しては、実用化のための能力的要件を満たす水準に達しつつあるが、その個々の技術水準に比して、そのような情報環境が実社会で普及する兆しがないのが現状である。個別の要因として、音声認識精度の向上を始めとした既知の課題を列挙することができ、これらを解決するため申請者らも相応の努力をしてきたが、このような技術的な積み重ねだけでは解決できない要因があると考えるべきであろう。それは、音声対話システムの
こんにちは。 この連載では、ちょっと変わったRuby入門を書いていきます。 想定読者は、Rubyを学びたいプログラミング初心者です。 Ruby以外の言語でプログラミングしたことがあると理解がはかどると思いますが、 Rubyを知らなくてもわかるように、なるべく丁寧に説明していくつもりです。 Rubyをある程度知っている読者には、最初の数回は退屈かもしれませんが、 回を重ねていくにつれ、より深くRubyを知ることができるはずです。 Rubyとは? Rubyは「プログラミング言語」です。 プログラミング言語とは、コンピュータにやらせたい仕事を書くための言語です。 つまり、Rubyを覚えて、Rubyでコンピュータへの指示を書けば、 コンピュータはその指示を実行してくれます。 この指示書のことを「プログラム」と言い、特にRubyで書かれたプログラムを「Rubyプログラム」と言います。 ところで、Ru
Microsoft researchers have reached a milestone in the quest for computers to understand speech as well as humans. Xuedong Huang, the company’s chief speech scientist, reports that in a recent benchmark evaluation against the industry standard Switchboard speech recognition task, Microsoft researchers achieved a word error rate (WER) of 6.3 percent, the lowest in the industry. In a research paper p
不動産会社や住宅サイトなどで表示される「徒歩●分」。これには「徒歩1分=80m」という基準がありますが、本当に1分間で80m歩けるのでしょうか?試してみました。 あわせて読みたい:不動産広告の駅から徒歩●分はどこからどこまで? 実際に歩いてみた まずは1分間で何メートル歩けるか計測 「不動産屋さんの基準は1分が80mだけど、そんなに速く歩けないよ」という声を聞いたことがあります。駅近にみせるために、ちょっとサバを読んでいる表記もある?という噂もありますね。はたして本当に1分間で80mは歩けないものでしょうか。 まず、筆者が自分の足で、1分間平坦な道を歩き、何メートル歩けたかを測ってみました。 距離の計測は、歩いた直線道路をGoogleマップで表示させ、右下に表示される「●m」のスケールを道の上にコピー&ペーストして測りました。 その結果は、85m。だいたい合っています。筆者は女性ですが、歩
印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 人間のように音声を理解する音声認識製品の開発でAmazon、Apple、Google、IBMなどと競合するMicrosoftが、音声認識の誤り率の低さで世界記録を達成したと発表した。 Microsoftによると、Microsoft Researchの音声科学者は業界標準の評価の下で、単語誤り率(WER)6.3%を記録したという。利用したのは、将来的に「Cortana」を強化する音声認識技術だ。 これまで記録を保持していたのはIBMの「Watson」チームで、WERは6.9%だった。IBMは2015年に達成した8%という記録を更新したばかりだった。 MicrosoftとIBMは、米国時間9月12日までサンフランシスコで開催されたカンファレ
Research WaveNet: A generative model for raw audio Published 8 September 2016 Authors Aäron van den Oord, Sander Dieleman This post presents WaveNet, a deep generative model of raw audio waveforms. We show that WaveNets are able to generate speech which mimics any human voice and which sounds more natural than the best existing Text-to-Speech systems, reducing the gap with human performance by ove
昨年エンジニア界隈で好評を博した伊藤直也氏(現一休CTO @naoya_ito)がホスト役を務める #naoya_sushi にメルカリCTOの柄沢聡太郎(@sotarok)が登場してから約1年。 tenshoku.mynavi.jp 今回はホスト役をsotarokが務める形で #naoya_sushi のオマージュ企画がメルカンで実現。対談から1年経った今、前編ではお互いCTOの立場となった近況を語り合いました。 お互いCTOになって1年ぶりのsushi対談が実現! sotarok 1年ぶりですね。今回は前回と立場を変えて僕がホスト役です。 まず乾杯しましょうか。 naoya うまい! (よろしくお願いします) sotarok 顔が赤くなる前に話しちゃいましょう。 いきなりなんで一休に入ったか、の話になっちゃうけど…2年口説かれてやる気になったんですか? naoya ま、そうですね。 一
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く