[B! speech_recognition] nilabのブックマーク

nilab id:nilab

speech_recognitionに関するnilabのブックマーク (22)

http://openhri.net/
nilab 2013/01/08
OpenHRI : 「音声認識・音声合成・対話制御など、ロボットのコミュニケーション機能の実現に必要な各要素を実現するコンポーネント群」

speech_recognition

text2speech
リンク
James
tl;dr This article contains stuff related to speech synthesis: What the Amiga 1000 could do. The famous Scotty scene where he talks into a mouse. Speech Synthesis is hard. Have your Mac say something. Better voices for your Mac. James, a non-walking, talking butler, a dialog system, a Mac Ruby gem. Intro As far back as I can rem ember, I always wanted to be a gangster. cough Let’s try that again… Wh
nilab 2012/07/09
James : Max OS X の音声認識・音声合成機能を利用し、人工無能的な対話を記述できる Ruby のライブラリ

ruby

mac_os_x

voice

speech_recognition
リンク
大人のためのドラえもん特集2012 - Yahoo! JAPAN
完全オリジナルストーリー！「映画ドラえもんのび太と奇跡の島〜アニマルアドベンチャー〜」は2012年3月3日（土）公開。絶滅したはずの動物たちが暮らす不思議な島でドラえもんたちの大冒険が始まる。【アプリの説明と注意事項】「カメラで撮影」を選択すると、画面にフレームが表示され、好きなフレームを選択して撮影すると、カタカナを合成する画面が表示されます。（「アルバムから選択」は、端末に保存されている画像を選択してフレームを選択すると、カタカナを合成する画面が表示されます。）カタカナは、「コエで入力」と「キーボードで入力」のいずれかで入力することができます。入力されたカタカナは、撮影した写真に合成され画面に表示されます。合成されたカタカナ画像をタップすると、カラーパレットが表示され、色の変更が可能です。また、つまんで大きくしたり、表示位置の変更や回転することもできます。撮影した画像は
nilab 2012/04/06
中部電力の音カメラと組み合わせたら写真撮影時の声が人の上に出せたりして。「表示させたい文字をコエに出して合成画像が完成！」大人のためのドラえもん特集2012 - Yahoo! JAPAN

android

speech_recognition
リンク
Julius-4.2のMacPortsで日本語音声認識 - 自然言語処理 on Mac
JuliusのバージョンアップにあわせてMacPortsを更新しました。実は前回登録したportでは正しくインストールできなくて、いくつか修正しています。 MacPortsでは最終的なインストールの前に仮のインストール先にファイルをコピーするdestroot処理を行うのですが、Juliusをmake installするときに、destroot先の指定がMacPortsデフォルトの設定では機能しないため、Portfileに次の行を追加しました。 destroot.destdir prefix=${destroot}${prefix} 次に、Snow Leopard 10.6.xではデフォルトのCore Audioがjuliusから利用できないようで、代わりにPortAudioを使う必要があります。しかし、PortAudioの旧バージョンでは64ビット環境で正しく動作しない不具合があるため、ま
nilab 2011/05/14
Julius-4.2のMacPortsで日本語音声認識 - 自然言語処理 on Mac

speech_recognition
リンク
Google、最初の音声認識サービス「GOOG-411」を終了へ
Googleは、多国語対応の次世代音声認識サービス開発に集中するため、音声による地域情報検索サービス「GOOG-411」の提供を終了する。米Googleは10月8日（現地時間）、米国とカナダで提供している音声認識技術を活用した地域情報検索サービス「GOOG-411」を11月14日に終了すると発表した。同サービスは、フリーダイヤル「1-800-GOOG-411」に電話をかけ、レストランやショップなど、目的地の名前を言うと、無料で電話をつないでもらえるサービス。Google初の音声認識技術を使ったサービスとして、2007年にスタートした。 Googleは、同サービスを開発・運営することで、スマートフォン向けの音声検索機能や音声による命令アプリ「Voice Actions for Android」などの音声認識サービス開発の基礎を築くことができたという。Voice Actionsでは、GOO
nilab 2011/02/09
Google、最初の音声認識サービス「GOOG-411」を終了へ - ITmedia エンタープライズ : 「多国語対応の次世代音声認識サービス開発に集中するため、音声による地域情報検索サービス「GOOG-411」の提供を終了」

google

speech_recognition
リンク
音声認識 (VoiceRecognition - MemoWiki v5)
音声認識 -大語彙連続音声認識システムJulius --http://julius.sourceforge.jp/ -連続音声認識ソフトウエア Julius -Open-Source Speech Recognition Software Julius --http://www.ar.media.kyoto-u.ac.jp/lab/bib/review/KAW-JSAI05.pdf -goo、ボイスサーチ「スピーチ・アシステッド・サーチ」の試験を開始 :: SEM R --http://www.sem-r.com/18/20051207171607.html --->「スピーチ・アシステッド・サーチ」実現にあたりNTTサイバースペース研究所が開発した最新の自由発話音声認識技術「VoiceRex2003」、およびコーパスベース音声合成技術「Cralinet2005」を活用している。「Voic
nilab 2010/03/08
音声認識 (VoiceRecognition - MemoWiki)

speech_recognition
リンク
Julius を使った音声認識 - VoIP-Info.jp
Asterisk で音声認識 Asterisk と Julius を連携させて、音声認識を実現する。なお、以下の番号で山手線の駅名を認識するデモを用意してあります。 055-287-7709 更新履歴 Asterisk 1.6.1 系対応。（2009/11/6）材料必ず必要なもの x86 系の Linux 環境 Asterisk 1.4 / 1.6.1 系のソース 2009/11/6 の最新版： http://downloads.asterisk.org/pub/telephony/asterisk/releases/asterisk-1.4.26.3.tar.gz http://downloads.asterisk.org/pub/telephony/asterisk/releases/asterisk-1.6.1.9.tar.gz Julius ソース http://source
nilab 2010/03/08
Julius を使った音声認識 - VOIP-Info.jp Wiki:「Asterisk と Julius を連携させて、音声認識を実現」

speech_recognition
リンク
www.catalog.to
nilab 2009/11/25
株式会社カタログ:「リアルつぶやき！？iPhoneアプリ「しゃべったー」」「声でTwitterに投稿」「Twitterに投稿されている2,000万件以上の「つぶやき」を使って、最適化した独自の単語辞書や言語モデルを構築」

speech_recognition

iPhone

twitter
リンク
Speech recognition - Wikipedia
Speech recognition is an interdisciplinary subfield of computer science and computational linguistics that develops methodologies and techno logies that enable the recognition and translation of spoken language into text by computers. It is also known as automatic speech recognition (ASR), computer speech recognition or speech-to-text (STT). It incorporates knowledge and research in the computer sc
nilab 2009/11/25
Speech recognition - Wikipedia, the free encyclopedia

speech_recognition
リンク
音声認識 - Wikipedia
音声認識（おんせいにんしき、英: speech recognition）は声がもつ情報をコンピュータに認識させるタスクの総称である[1]。ヒトの（天然）音声認識と対比して自動音声認識（英: Automatic Speech Recognition; ASR）とも呼ばれる[2]。例として文字起こしや話者認識が挙げられる。音声認識は「音声に含まれる情報を認識するタスク」の総称であり、具体的に解かれる問題の例として以下が挙げられる： Speech-to-Text (STT): 含まれる言語情報を文字に変換するタスク。いわゆる文字起こしキーワード認識（英語版）(KWS): 事前に設定されたキーワードの出現を認識するタスク。例として「ヘイ、Siri」音声認識をサブタスクとして含むタスクには以下が挙げられる：音声操作: 音声によるアプリの操作。SST/KWSで音声情報を取り出し、これをコンピ
nilab 2009/11/25
音声認識 - Wikipedia

speech_recognition
リンク
Index of /
Index of / NameLast modifiedSizeDescription
nilab 2009/11/25
しゃべったー | 音声認識機能搭載iPhone用Twitterアプリ:「Twitterに最適化された高性能な音声認識エンジン」「録音ボタンを押して、しゃべるだけ。高速な音声認識で、あっというまに声をテキストに。後は投稿ボタンを押す」

twitter

iPhone

speech_recognition
リンク
catalog.to
The domain name 'catalog.to' is parked at Register.TO
nilab 2009/11/25
カタラボ｜音声認識技術デモをご紹介 : 「カタラボは、株式会社カタログで開発を行っている「*SR」と「Web」を組み合わせた実験的なサービスを紹介するページです」「*SR・・・Speech Recognition、音声認識の略」

speech_recognition

lab
リンク
【レポート】「iPhone 3GS」の音声認識機能はなぜ消費電力が低いのか - その謎に迫る (1) 電力消費が大きい音声認識技術 | エンタープライズ | マイコミジャーナル
高い消費電力が必要なはずの"音声認識技術" 新型iPhoneである「iPhone 3GS」が6月26日に日本でも発売となった。オートフォーカスカメラだけではなくビデオも撮れる、操作応答性が2倍速くなった、GPSのデジタルコンパス機能が付く、Web検索も可能、電池が長持ちという機能だけならエレクトロニクス的な観点からの目新しさはさほどない。 6月26日より発売を開始した次世代iPhone「iPhone 3GS」しかし、これまで以上に楽しくなった。スマートフォンにパソコン並みの操作性を持ちこみ、コピー&ペーストもできるようになった。マウス代わりにタッチスクリーンに指で指定すればパソコン同様、カット・コピー・ペーストができる。こういった機能拡張の中でも特筆すべきは"ボイスコントロール機能"だ。これは音声認識技術を使ったものであり、これまでは高性能なコンピュータでなければ認識処理できないため携帯
nilab 2009/10/06
【レポート】「iPhone 3GS」の音声認識機能はなぜ消費電力が低いのか - その謎に迫る (1) 電力消費が大きい音声認識技術:「まだ8名しかいないベンチャー企業「Novauris Technologies」の技術」

speech_recognition

iPhone
リンク
http://www.novauris.com/
nilab 2009/10/06
++ Novauris : Novauris Technology : NovaSearch Technology

speech_recognition

company
リンク
New Version of Google Mobile App for iPhone, now with Voice Search – News announcements – News from Google – Google
New Version of Google Mobile App for iPhone, now with Voice Search Announcement November 17, 2008 Today Google released an update for its iPhone app that allows people to search on Google faster and easier than ever before. This launch builds on our previous version of the Google Mobile App for iPhone to offer two innovative new ways for users to search the web while they’re on the go: by voice an
nilab 2008/11/18
Google Press Center: News Announcement : New Version of Google Mobile App for iPhone, now with Voice Search : iPhone用音声で検索するアプリ

search

iPhone

speech_recognition

google
リンク
Julius users ML
nilab 2008/09/18
Julius users ML:「Julius users ML (julius-users@luky.org)は，Juliusに関して議論するメーリングリストです」

voice

speech_recognition

mailing_list
リンク
Podcastle
Podcastle (ポッドキャッスル) とは Podcastle は、ポッドキャストの音声を日本語で検索できるサービスです。音声認識技術によって音声を文字に変換しています。その認識誤りは、ユーザが自由に訂正できます。詳しくは「Podcastleとは」をご覧下さい。
nilab 2008/06/18
Podcastle : ポッドキャストの音声を日本語で検索できるサービスです。音声認識技術によって音声を文字に変換しています。その認識誤りは、ユーザが自由に訂正できます。

podcast

search

speech_recognition
リンク
このURLのページは表示することが出来ませんでした。 IP分散サーバーならIQサーバー｜クラスCの完全分散が月額139円～
このURLのページは表示することが出来ませんでした。 IQサーバー
nilab 2008/03/05
聞こえメール無料ボイスメール　電話の音声をメールに転送 : 電話で話した内容を音声認識しメールするWEBサービス:IP電話の着信と応答にAsterisk、音声認識にJuliusを利用

mobile

speech_recognition
リンク
携帯電話で身近になる音声認識 : インタビュー : ネット＆デジタル : YOMIURI ONLINE（読売新聞）
１９５２年、愛知県出身。京大工学部大学院修了。東洋エンジニアリング、インテリジェントテクノロジーを経て１９９７年アドバンスト・メディアを設立、社長に就任。創業以来、一貫して音声認識技術に取り組み、２００６年、アントレプレナー・オブ・ザ・イヤー・ジャパン日本代表に選出された。鈴木　携帯電話に音声認識システムが搭載されたというのは、非常に意味があります。機械本位から、人間本位の姿に近づいたからです。パソコンで路線検索をするには、キーボードとマウスの使い方を学習し、習得する必要があります。でも、携帯電話のような小さい端末には、もっと簡単な操作が向いている。音声による自然なコミュニケーションで動作させる技術が必要だと思いました。今回採用された認識システムでなら、電話のマイクに向かって駅名を話すだけで、画面に経路や所要時間などが表示されます。鈴木　実は、音声認識には４０年もの歴史があります。し
nilab 2008/01/28
携帯電話で身近になる音声認識 : インタビュー : ネット＆デジタル : YOMIURI ONLINE（読売新聞） : アドバンスト・メディア社長 : 鈴木　清幸すずききよゆき

speech_recognition
リンク
音声認識テキスト入力Javascriptライブラリ w3voiceIM.js
たった一行追加するだけで、あなたのサイトに音声認識機能を付けられます！ w3voiceIM.jsは、Webページの上のテキスト入力フォームに音声認識機能を追加するJavascriptライブラリです。手軽に音声認識を利用できることが特徴になっています。また、http://w3voice.jp/でサービスする共有型音声認識エンジンを利用するために、利用者やWeb開発者は、音声認識プログラムのインストールや設定作業を必要としません。 JavaおよびJavascriptが動作するPC及びWebブラウザからの利用をサポートしています。現在のバージョン最新のw3voiceIM.jsのバージョンは0.02です。とりあえず動くようになった開発途上バージョンです。使い方音声入力を開始するには、テキストの入力欄をマウスでダブルクリックします。音声入力パネルが出現したら、「Push here」と
nilab 2007/10/22
音声認識テキスト入力Javascriptライブラリ w3voiceIM.js

javascript_lib

speech_recognition
リンク
1 2 次のページ