タグ

vuiに関するtakamoriiiのブックマーク (99)

  • 中国での音声入力の普及とクオリティの高さについて|中国情報局@北京オフィス

    そして音声入力といえばやっぱり中国です。先日音声AI企業の「科大讯飞」(iFLYTEK)を紹介しましたが、実は日常生活に使えるサービスは他にもあり群雄割拠となってます。 中国生活では音声入力は必須ところでみなさん、日に来ている中国人が携帯に一方的に話しかけていたり、電車の中などで録音された音声を聞いてるシーンを見たことありますよね?あれは日の電車が混みすぎてて頭がおかしくなったのではなくて、Wechatの音声入力でメッセージを送りあっているんです。 ↑こんな感じ。すごい古い動画しかわかりやすいの見つけられなかった、でも逆に言うとその頃から超便利だった。 中国人は面倒くさがりが多いので、文字打つの面倒なんです。また中国語は漢字なので入力するの面倒なんです。 この音声入力、習慣になると便利なんですよ、シェア自転車乗ってるときとか、ちょっと手が離せない、画面に集中する余裕が無いときでも返事が

    中国での音声入力の普及とクオリティの高さについて|中国情報局@北京オフィス
  • 音声メディアビジネスの行く末

    2020年2月13日(金)、ボイスメディア「Voicy(ボイシー)」主催のイベント「#ボイマ !! Vol.1」に参加してきました。 10分間のライトニングトーク(LT)をさせていただいたので、内容をKOMUGIでもアーカイブしたいと思います。テーマはこちら。 コムギらしく、ということで「そもそもボイスって何?」「メディアとしてどんな特性があるの?」ということを求められているのだと勝手に解釈しまして、「耳」と「声」について、ライトニングトークをします。 人間には、耳、つまり聴覚をふくめて「五感」があることはよく知られていることです。目は視覚、耳は聴覚、鼻は嗅覚、口は味覚、手は触覚。ほかに傾きを自覚する平衡感覚、自分のカラダがどこにあるのかを知る体性感覚、熱いか冷たいかをしる温度感覚などがありますが、基的には五感です。 では五感のなかで、「耳」の特徴はなんでしょうか。 たとえば遠くで起こっ

  • AirPodsでヒソヒソ音声入力 口を手で押さえるジェスチャーで 清華大学など発表

    小声入力は、片側から口を手で覆うしぐさで実行する。左右に装着した2つのBluetoothマイク付きイヤフォン(実験ではAirPodsを使用)で、受信する信号に違いがあるかどうかで手で口を押えているかを判断。押えているときだけ音声入力を行う。

    AirPodsでヒソヒソ音声入力 口を手で押さえるジェスチャーで 清華大学など発表
  • アマゾン、アップル、グーグルなどが連携し、スマートホームデバイスの規格統一へ ほか【中島由弘の「いま知っておくべき5つのニュース」2019/12/12~12/31】

    アマゾン、アップル、グーグルなどが連携し、スマートホームデバイスの規格統一へ ほか【中島由弘の「いま知っておくべき5つのニュース」2019/12/12~12/31】
  • 音声対話技術の未来 【前編】 | 天才エンジニア「未踏」の挑戦

    今から15年前の冬、 2002年12月を憶えていますか?あなたのカバンの中には、何が入っていましたか? 僕のダボダボのカバンの中には、大学ノートと、高校時代から同じ筆箱と、中古のWindows ノートPCPC カードスロットにWi-Fi拡張カード)。クシャクシャになったバイト先の給与明細に、教科書やプリントの類。タバコは嫌いだったし、コーヒーもあまり好きじゃなかった。バイト帰り、工事中の小田急線のホームで、ノートPCのバッテリーが放つ微かなぬくもりを、逃さないように抱えていた――― 今、2017年12月、相変わらず工事中の小田急線のホーム、当時と変わらない寒さ、バッテリーのぬくもりを放つのは、手の中にあるスマートフォン(大量のプッシュ通知でロック画面が溢れている)、15年前のノートPCよりもずっと小さくて、ずっと高速で、バッテリー容量だって大きい。薄くなったカバンには契約書類とプレゼン資

    音声対話技術の未来 【前編】 | 天才エンジニア「未踏」の挑戦
  • アメリカのPodcast音声広告事情 #音声業界最新トレンド | Voicy Journal

    2019年は、Spotifyが大手ポッドキャスト制作会社の、米・Gimlet Mediaとポッドキャスト制作・配信アプリを手がける米・Anchorを買収し、音声コンテンツの黄金時代がやって来たと言われるようになりました。 そして、そのコンテンツの盛り上がりと共に目が話せないのが、音声広告です。2018年に4億8000万ドルだったアメリカPodcast音声広告市場。2021年には10億ドルに到達すると言われています。 今回は、海外での音声広告の捉えられ方、Podcast広告の種類やコストについてお伝えしていきます。 * IAB FY 2018 Podcast Ad Revenue Study Podcastの音声広告は、動画広告に比べて受け入れられやすい 更なる市場の拡大が見込まれるPodcastの音声広告市場ですが、広告を聞いているリスナーはどのように感じているのでしょうか。 2017年

    アメリカのPodcast音声広告事情 #音声業界最新トレンド | Voicy Journal
  • 見るだけで押せる「視線スイッチ」 - Qiita

    カメラを見つめるだけでスイッチを押せる「視線スイッチ」の作り方を紹介します。 「使うときにしか見ないモノ」 が 「見るだけで使える」 ようになります。 カメラ付きのパソコンがあれば今すぐ簡単に作れます。(WindowsMacLinuxに対応) トレたま で取り上げて頂きました!(テレビ東京、WBS ワールドビジネスサテライト) (視線スイッチは 私 の個人開発であり、株式会社バッファローとは一切関係ありません。) 視線スイッチは、汎用的なスイッチなので、繋げるモノ次第で色々な使い方ができます。 例えば、物理ボタンを押してくれる小型の指ロボットSwitchBotを繋げば、見るだけで物理ボタンを押せます。 赤外線家電を操作してくれるスマートリモコンを繋げば、見るだけでリモコン操作できます。 このように設置すれば、見るだけでエアコンをON/OFFできます。 また、「OK Google」と喋っ

    見るだけで押せる「視線スイッチ」 - Qiita
  • 【Web Speech API】ブラウザの音声合成(読み上げ)機能を触ってみる - Qiita

    この記事は、CPS Lab Advent Calendar 2018の5日目の記事です。 音声認識編 → https://qiita.com/hmmrjn/items/4b77a86030ed0071f548 はじめに みなさん、ウェブサイトで音声合成(読み上げ)、音声認識を使いたいとなった時、どうしますか? Google Cloud Speech API Microsoft Azure Text to Speech API IBM Watson Text to Speech API AWS Amazon Polly などのがつがつとしたWebサービスが思いつくのではないでしょうか? でも、登録しないといけないし、お金かかりそうですよね... 実はそれ、最近のブラウザであれば、無料でできるんです。 Web Speech API とは 自分の周りでは意外と知っている人が少なかったので紹介しま

    【Web Speech API】ブラウザの音声合成(読み上げ)機能を触ってみる - Qiita
  • Amazon Alexa ~ ボイスファーストによる新しいライフスタイル ~ | AWS Summit Tokyo 2018

  • Voice UIチーム | CYBIRD(サイバード)

  • [日本語Alexa] Alexa-SDK Ver2(その7) ディスプレイ表示 | DevelopersIO

    記事は、Alexa SDK for Node.js Ver2入門と題して、入門用という位置付けで、Alexa SDKの使い方を、順に紹介しているものです。(対象は、Node.js用のみです。Java用には触れておりません) その7では、ディスプレイ表示について見ていきたいと思います。 ディスプレイ表示のためには、レスポンスでDisplayディレクティブを返すことになりますが、Alexa-SDKでは、ResponseBuilderで、これを簡単に設定できるようになっています。 なお、ディスプレイ表示に対応するには、スキルのインターフェースで 画面インターフェース を有効にする必要があります。 2 テンプレートの種類 テンプレートの種類は、画像やテキストの配置で下記の7種類が提供されています。 各テンプレートの詳細については、公式のドキュメントをご参照下さい。 Display Interfa

    [日本語Alexa] Alexa-SDK Ver2(その7) ディスプレイ表示 | DevelopersIO
  • StandardSkillBuilder | ASK SDK for Node.js

  • リクエスト処理 — ASK SDK for Node.js ドキュメント

    標準のリクエスト¶ 作成したスキルサービスとAlexaとの通信は、SSL/TLSを利用してHTTPを使用するリクエスト-応答メカニズムで行います。ユーザーがAlexaスキルと対話するとき、作成したサービスは、JSON文を含むPOSTリクエストを受け取ります。このリクエスト文には、サービスがロジックを実行してJSON形式の応答を生成するために必要なパラメーターが含まれています。Node.jsはネイティブにJSONを処理できるため、ASK SDK v2 for Node.jsではJSONのシリアル化と逆シリアル化が必要ありません。リクエスト文のJSON構造についてのドキュメントは、こちらを参照してください。 ハンドラー入力¶ リクエストハンドラー、リクエストと応答のインターセプター、エラーハンドラーにはすべて、呼び出し時にHandlerInputオブジェクトが渡されます。このオブジェクト

  • 古いiPadを使ってAlexa,Google Assistant連動スマートディスプレイを作る - Qiita

    ご注意 この記事は、あるスマートスピーカー並行動作芸人の平凡なお遊びを淡々と描く物です。過度な期待はしないでください。 スマートディスプレイが欲しい人は、この記事に従ってあれこれするより、お金を出して買った方が100%幸せになれます。これぞと思ったものを買いましょう。 メカニズムと作ってみた事実を紹介する程度のネタなので、最後まで読んでも、この記事だけではスマートディスプレイは多分作れません。 筆者のやる気が出たら、リソースを共有します。 はじめに 昨年末、iPad Pro 2018(11インチ)を買ったんですよ(ドヤ顔)。 これと交代させる形で、普段使いしていたタブレットを引退させたんですが、家の中を見渡すと、使用済みの古いタブレットがたくさんあってですね…。 iPad(初代) iPad2 Nexus 7 Nexus7は別途用途があったのでさておき、iOSの度重なるアップデートで、実用レ

    古いiPadを使ってAlexa,Google Assistant連動スマートディスプレイを作る - Qiita
  • Alexaスキルのインテント履歴を活用して対話モデルを改善する | DevelopersIO

    はじめに Alexaのカスタムスキルを開発していると、データ分析やスキル改善のために、ユーザーがスキル上でどのような発話を行ったのか、を調査したいニーズが出てきます。 しかし、2018年7月7日現在、Alexaでは開発者がユーザーの発話そのものを取得することはできません。 但し、開発者コンソール上の「インテント履歴」機能を使えば、制限付きではありますがユーザーの発話情報を確認することができます。 【公式ドキュメント】カスタムスキルのインテント履歴を確認する 開発者コンソールでのインテント履歴 インテント履歴を利用するには、開発者コンソールのスキル画面で、「インテント履歴」メニューを選択します。 インテント履歴の画面では、ユーザー発話やそれに対してAlexaがどのインテントで解決したか、などの情報が表形式で表示されます。 なお、インテント履歴の画面で表示される情報は以下の通りです。 (カスタ

    Alexaスキルのインテント履歴を活用して対話モデルを改善する | DevelopersIO
  • X.509証明書の検証手順とありがちな脆弱性 - Qiita

    御社におかれてはTLSスタックのテストは十分に実施しておられますか。拙稿改造する人のためのJSSEをお読みになった御社はもちろんばっちりだと思いますが、世の中では相変わらず不十分なテストと脆弱なコードが溢れかえっている今日この頃です。そんなわけで稿のお題は証明書の検証! 基的な仕組みを復習する 証明書の検証というのは具体的に何をするのかを復習します。以下の説明では、TLSサーバ証明書をクライアントで検証するケースで説明します。これ以外のケース(TLSクライアント証明書をサーバ側で検証するとか、コードサイニング証明書を検証するとか)は、適宜読み替えてください。 証明書チェーン(候補)の構築 TLSのServerCertificateメッセージで、サーバ証明書がダウンロードされて来るわけですが、まずは証明書のSubjectフィールドとIssuerフィールドに注目し、下位証明書のIssuer

    X.509証明書の検証手順とありがちな脆弱性 - Qiita
  • 改造する人のためのJSSE - Qiita

    IoTとやらが大ブームですが、その一方で頭を抱えたくなるような脆弱性満載のTLSスタックを搭載した製品が時折みられます。みなさんTLSスタックのテストちゃんとやってますか。 TLSスタックのテストをやるとなると、そこで使うスタブとかモックとかダブルとかドライバとか呼ばれるモロモロのあれやそれやを作っていくわけですが、そのためにTLSスタックを一から書くのはちょっと非現実的なので、何らかのライブラリを入手してそこから手を加えていくことになると思います。しかるにOpenSSLは、高機能ですけど改造母体とするには敷居が高いですよね。しかしOpenJDKのJSSEなら、機能性はともかく、改造母体としての扱いやすさはそれなりに悪くないという印象です。 というわけで、くれぐれも悪用厳禁でレッツゴー! 実行環境と方針 OracleJDK/OpenJDKの標準ライブラリをextendして機能追加できればい

    改造する人のためのJSSE - Qiita
  • pm2でNode.js実行環境を整備する - Qiita

    過去に、とりあえず、pm2でNode.jsの実行環境を作ったのですが、Node.jsにも慣れてきたので、pm2の設定を見直すとともに、備忘録として残しておこうと思います。 また、Webで実行状態を把握できるpm2-guiもインストールします。 pm2は、node.jsアプリの実行状態の永続化やプロセスの状態、ログの管理など、Node.jsアプリの実行管理に有用なアプリです。 pm2インストール NPMを使ってインストールします。 npm install pm2 -g [参考情報] https://pm2.io/doc/en/runtime/overview/ rootアカウントで起動する場合は、rootアカウントでログインした状態で上記を実行します。 実行するNode.jsアプリは、JSON形式の設定ファイルに指定します。 たとえば、以下に置きます。 /etc/pm2/pm2.config

    pm2でNode.js実行環境を整備する - Qiita
  • Displayインターフェースのリファレンス | Custom Skills

    クラウド内のAlexaサービスからリクエストを受け付けて応答を返すウェブサービスを実装することにより、Alexa用のカスタムスキルを開発できます。サービスが以下の要件を満たしていれば、どのプログラミング言語を使用しても、ウェブサービスを開発できます。 これらの要件は、カスタムウェブサービスを使用するスキルにのみ適用されます。また、アマゾンウェブサービスが提供するAWS Lambdaを使用して、AWS Lambda関数としてスキルを実装することもできます。詳細については、カスタムスキルをAWS Lambda関数としてホスティングするを参照してください。 ウェブサービスの要件 SSLのオプションについて Alexaから送信されたリクエストを検証する 関連トピック ウェブサービスの要件 Alexaから送信されたリクエストを処理するには、ウェブサービスで以下の要件を満たす必要があります。 サービス

    Displayインターフェースのリファレンス | Custom Skills
  • Amazon Echo Dot+さくらのクラウドでAlexaになんか喋らせる - Qiita

    あんまり買う気がないのにとりあえず招待メールを要求しておいたら発売日にメールが来たのでEcho Dotを買った。 スキルという形でAlexaにいろんな動作をさせられるらしい。AWS LambdaかHTTPSエンドポイントを与えるとJSONをやりとりして動作を行わせたり喋る内容を返したりする形っぽい。 みんなLambda使ってるけどあんまり使う気にならないので(政治的要因はないです)Pythonで待ち受けてなんかさせてみます。 私は社のタイムカードをSlack経由で打刻できるようにしており、Alexaで打刻できたらなんとなくナウいのでタイムカードスキルを作ってみることにします。 既にタイムカードをよろしくやるBotが稼働しているので、Slack上でBot同士を会話させてタイムカードをよろしくやってもらう方針とします。 Lambdaを使わずにスキルを作るのに必要な物 Amazon.co.jp

    Amazon Echo Dot+さくらのクラウドでAlexaになんか喋らせる - Qiita