Web Speech API Demo This is web speech api demo 聞いてみる 話してみる 話すの中断
Chromeの拡張機能とは? Chromeの拡張機能は実質的にはただの圧縮したフォルダです。そして、そのフォルダの中身もただのHTMLやCSS、JSファイルです。 つまり、拡張機能の作り方はWebページのそれとは大差ないということですね。 拡張機能にしか提供されていない豊富なChromeのネイティブのAPI群(Chrome.* API)を利用できるところが拡張の魅力です! 一般公開目的ではなく、普段の業務効率化目的でも十分な利用価値があると思うので、まだの方はぜひ一度触ってみてください。 拡張機能の種類 拡張機能の種類は大きく分けて3つあります。 Browser actions Page actions Override Pages 1つずつ見ていきましょう。 Browser actions ツールバーの右側に小さなアイコンを表示させるタイプの拡張機能です。一番頻繁に見かけるのがこのタイプ
発声した音声は以下のように、テキストで表示されるので、自分のコマンドがうまく通っているか確認することができます。 使ってみた感想 Hands Free for Chromeを実際に使ってみたところ、かなり面白いですね。思っていた以上に使えます。 今のところ気をつけなければいけないのは、発音だけです。英語圏ユーザーのための拡張なので。 例えば、「keep scrolling down」というコマンドの場合、日本語英語の「キープスクローリングダウン」のような、母音をハッキリ発音するような発音では認識してくれません。ネイティブっぽく「キープスクローリンダーン」みたいな感じで言わなければなりません。 あと日本人的に厳しいのは、 downとdoneが似ているので、下にスクロールしようとして音声操作が終了してしまうなんてこともあります。 発音がわからない場合は、表の「発音」リンクを参考に発声してみてく
はじめに “Web Speech API”をサポートした「Google Chrome 25」のベータ版が公開 - 窓の杜 2013/01/14 公開の Google Chrome v25.0.1364.29 beta-m から Web Speech API が実装されました。これで JavaScript から音声認識が出来ると言うわけで、ユーザビリティ改善やゲームへの応用など夢が広がりますね。 簡単に調べてみましたので備忘録的にメモしました。 作業/動作環境 Chrome Release Channels - The Chromium Projects 上記サイトより beta 版、もしくは dev 版をインストールします。私は以下のものを使用しています。 Chrome 26.0.1386.0 dev デモ 雰囲気を掴んでもらうためにデモを用意しました。ミクさんがディクテーションした結果を
NTT HOME>NTT持株会社ニュースリリース>2014年>世界に先駆けて様々なHTML5ブラウザ上で高精度な音声認識を利用可能とする技術の開発ならびに、クラウド型音声認識サービス“SpeechRec for Browser”の販売開始について 2014年9月11日 日本電信電話株式会社 エヌ・ティ・ティ アイティ株式会社 世界に先駆けて様々なHTML5ブラウザ上で高精度な音声認識を利用可能とする技術の開発 ならびに、クラウド型音声認識サービス“SpeechRec for Browser”の販売開始について ~ソフトウェアのインストールなしで、様々なブラウザ上で音声認識が可能な Webアプリケーションの開発を支援~ 日本電信電話株式会社(以下NTT、本社:東京都千代田区、代表取締役社長:鵜浦 博夫)は、世界に先駆けて様々なHTML5(※注1)ブラウザ上で事前のソフトウェアのインストールが
JXAを知らない方はとりあえず以下の記事をどうぞ。 JavaScript for Automation Release Notes - 公式のドキュメント 鳶嶋工房 / AppleScript / JavaScript for Automation (JXA) dtinth/JXA-Cookbook 知らないうちにMacがシステム標準でJavaScriptで操作できるようになってた (JXA) - Qiita ここではキーボードやマウスの操作をエミュレートする方法を書きます。 各アプリに用意された機能はスクリプトエディタから見られる「用語説明」等に任せます。 ちょっとしたコードを試すにはosascriptコマンドのインタラクティブモードが便利です。
初めまして、ProttのフロントエンドエンジニアのSyoです。よろしくお願いします! 実は皆さんもう既にご存知と思いますが、Mac OS XにはAppleScriptというスクリプト言語があり、システムアプリケーションや一部のサードパーティ製アプリをコントロールすることができます。これより日常中繰り返し同じ操作する所はプログランミングで操作を自動化することができるので大変便利です。ただし、AppleScriptはそれ以外一切使う所がなくて、その為にわざとAppleScriptを勉強するのは非効率ではないでしょうか。 今秋リリースするOS X Yosemiteでは、AppleScriptに加えJavaScriptも利用可能になりました。ということでJavaScriptを少しでもわかる方は、JavaScriptで簡単にMacアプリケーションを操作することが出来るようになりました! Hello
知ってる人には今更と思いますが、今まで知らなかったのでメモメモ。 AppleScriptの代わりにJavaScriptを使えるようになってました。 Yosemiteからの新機能だそうです。 JXAとも呼ばれています。宇宙航空研究開発機構とは無関係です。 (追記:JXAは公式の略称です →Introduction to JavaScript for Automation Release Notes) 詳しくは Appleの公式ドキュメント か、「参考」にあるリンクへどうぞ。 もう一つ記事を書いたのでこちらもよかったらどぞ。 Macのキーボード入力、マウスクリックをJavaScriptで (JXA) Script Editorで使う方法 まずScript Editorを使う方法を説明します。 好きなテキストエディタを使いたい場合は飛ばしてください。 (でも「用語説明」の表示の仕方は覚えておいて
Electron(エレクトロン)とは、ウェブ技術でデスクトップアプリケーションを作成できるテクノロジーです。HTMLとCSS、JavaScriptを使って開発し、WindowsとmacOSの両OSのアプリケーションを1つのコードから作ることができます。近年、注目度が高まっておりマイクロソフトやGitHubなど、有名企業も採用しています。 Electronエレクトロン製のアプリケーションはChromiumクロミウム(Chromeブラウザの元となるもの)とNode.jsノードジェイエスがランタイムとなっています。ウェブコンテンツをそのままアプリケーションとして動かしたり、デスクトップアプリケーションとしてブラウザだけで実現できない機能を組み込めるのが特徴です。 利用用途として、テキストエディターやユーティリティーソフト、デザインツールなどの小規模な使い方から、イントラネット内のクライアントツー
Web Speech APIが面白そうだなーという純粋な興味で試してみた。 仕様書はこれしか見つからないのだけど、この文章はSpeech API Community GroupによるものでW3C Standardじゃないって書いてある。現状はまだブラウザ独自仕様で標準化はされていないっぽい。 Web Speech API Specification ブラウザのサポート状況は以下です。これ書いてる現時点ではChromeとSafariのみでFirefoxとIEは使えない。スマホもAndroidのChromeとiOSのSafariは使えるっぽい。 Can I use... Support tables for HTML5, CSS3, etc 試しに作ってみたデモ↓ http://minamijoyo.github.io/sandbox/webspeech/index.html 初期化の仕方がブ
こんにちは、@yoheiMuneです。 7月になってやっとブログを書く余裕が出てきた(´∀`∩)〜〜。 今日は、Chromeでも最近使えるようになったWeb Speech APIについて入門記事を書きたいと思います。 Special Thanks to https://flic.kr/p/7fADmS 目次 Web Speech APIとは Web Speech APIはW3Cコミュニティグループによって策定されている仕様で、Web Speech API Specificationに仕様が掲載されています。この仕様書はリンク先にも記載の通り「It is not a W3C Standard nor is it on the W3C Standards Track(このドキュメントはW3C標準でもなければW3Cの標準トラックに則ったものでもない)」とW3C標準ではありません。しかしWebki
HTML5 の Web Speech API をご存知でしょうか? ブラウザベースで音声認識とテキストの読み上げを実現する API です。 今回はこの Web Speech API について試したことをまとめてみました。 ちなみに少し前の Chrome では Speech Input API という INPUT 要素に x-webkit-speech という属性を記述するのみで、手軽に音声認識を実現できるという機能がありましたが現バージョンでは廃止されてるようです・・・ Web Speech API の対応ブラウザは Can I Use よりご確認ください。 テキストの読み上げを行う Speech Synthesis API Speech Synthesis API を使用すると、指定したテキストを PC に読み上げさせることできます。 使い方は非常に簡単で、new SpeechSynth
Microphone' by Juan_Alvaro, http://www.flickr.com/photos/31590610@N03/5408706936/ CC by 2.0 最近、にわかに音声認識というものが盛り上がっています。 スマートフォンに搭載されている、AppleのSiri、NTTドコモのしゃべってコンシェル、Googleの音声検索あたりが有名ですが、お掃除ロボやエアコン、カーナビといった家電にも音声認識機能が搭載されるようになってきました。 認識の精度や意識の問題(人前で機械に話しかけるのはちょっと恥ずかしい)などの課題はありますが、音声認識はアプリや家電のUIの一部としてこれから普及していくと思われます。 ですが、一般の開発者にとって音声認識機能を自分のアプリやウェブサイトに組み込むのはまだまだ難しいです。 Juliusのようなオープンソースの音声認識システムもありま
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く