![[iPhone駆け込み寺] 「iOS 16」でiPhoneで音声入力がより便利に、より実用的になったことを知ってほしい](https://cdn-ak-scissors.b.st-hatena.com/image/square/ab4bf288f02c5dfa3a59a8fed7bc639bdefbee99/height=288;version=1;width=512/https%3A%2F%2Fk-tai.watch.impress.co.jp%2Fimg%2Fktw%2Flist%2F1440%2F302%2Fios3-1.png)
検索やレコメンドに必要な形態素解析 海野裕也氏(以下、海野):自然言語処理の研究とは何かといいますと、私みたいな研究をやっている人間からすると、例えば機械翻訳だったり、質問応答みたいな目標があって、その中の技術として、ここ(スライド)に書いてあるような、漢字で長ったらしい、いろんな技術がある。 含意関係認識や、述語項構造解析、照応解析など、いっぱいあるんですけども。だいたい世間の人から見ると、「あ、自然言語処理って形態素解析のことでしょ?」って言われるわけですね。 形態素解析はもちろん今でも研究はされてはいるんですけども、残念ながら学会の中ではかなりマイノリティです。発表件数が2件とかしかなくて、セッションを組めないぐらい、ほとんどあんまりいない。あ、いないって言うとやってる人に失礼なので、ちょっとあれなんですけど(笑)。1分野なんですね。すごく狭い領域なんです。 現実的には、言語で書かれ
音声認識APIのまとめスマートフォンの音声認識APIをまとめてみました。▼無料 音声認識API◎Dragon Mobile SDK ・Android&iOS 無償・有償 日本語 http://www.nuancemobiledeveloper.com/public/index.php?task=memberServices) ◎Zypr 音声制御WebサービスAPI ・Android&iOS APIは無料だが収益はシェア。日本語。 http://www.zypr.net/ ◎VocalKit ・iOS 無料。日本語。単語数が多いと処理が重い? http://d.hatena.ne.jp/shu223/20110227/1299368179 ◎iSpeech ・Android&iOS 無料、日本語。 http://www.ispeech.org/ ◎Google Mobile App 音声検
Create with Confidence Nuance Developers is not accepting new customers at this time or accepting the purchase of new licenses at this time. If you are a Enterprise or Healthcare customer that wants to try our technology please contact your sales representative for information. If you do not have a sales representative,for Enterprise solutions please contact us here, for healthcare solutions conta
声でスマートフォンを操作できるアプリ「おはなしアシスタント」の提供について ~au初のAndroid™ 搭載スマートフォン向け音声認識サービス~ KDDI、沖縄セルラーは2012年11月1日より、スマートフォンに話しかけることで、天気やニュースなどの情報を表示できるスマートフォン向けアプリ「おはなしアシスタント」の提供を無料で開始します。 「おはなしアシスタント」は、電話発信、メール作成、天気予報など利用頻度の高い機能を音声で簡単に操作することができます。また、お探しのアプリも声で簡単に起動させることが可能です。 さらに、月額105円 (税込) の「有料コース」は、基本機能に加えて音声認識を活用したライフログの保存・閲覧やアシスタントキャラクターの着せ替えなどのカスタマイズも可能となり、「おはなしアシスタント」の機能をさらにお楽しみいただけます。 「おはなしアシスタント」には、株式会社アド
ああ、忙しい忙しい! ……のっけから泣き事で申し訳ないが、師走を前にしてすでに鬼のような忙しい毎日なのだ。フリーランスの身としては仕事で忙しいのは歓迎すべきことなのだが、こうも忙しいとさすがに何か横着したくなる。 そこでふと思いついたのが、iPhoneの「Siri」を活用して原稿が書けないだろうか、ということだ。 Siriとは、iPhoneやiPad、iPod touchにiOS 5から搭載された音声認識アシスタント機能である。たとえばSiriを起動して「今日の天気は?」と話しかければ、現在地点の天気予報を表示してくれるし、「◯◯にメール」と話しかければメールアプリを起動して、さらに宛先やタイトル、本文まで音声で入力できるという優れものなのだ。
本田技研工業(ホンダ)と同社の北米向け高級ブランドAcuraは現地時間2013年1月31日、米Appleの音声アシスタント機能「Siri」を一部2013年モデルに統合する計画を明らかにした。ディーラーオプションとして、ホンダの中型セダン「Accord」と、AcuraブランドのSUV「Acura RDX」および小型セダン「Acura ILX」にSiriの自動車向け音声制御モード「Eyes Free」を搭載する。 Eyes Freeモードでは、ドライバーが運転中にハンドルから手を離さず、視線を前方からそらすことなく、「ハンズフリー」かつ「アイズフリー」でAppleのスマートフォン「iPhone」(iOS 6搭載)を音声だけで操作できる。 対象のAccordとAcuraでは、iPhoneをハンズフリー操作システム「HandsFreeLink」とBluetooth接続し、車載マイクとスピーカーを通
本連載「Apple Geeks」は、Apple製ハードウェア/ソフトウェア、またこれらの中核をなすOS X/iOSに関する解説を、余すことなくお贈りする連載です(連載目次はこちら)。 UNIX使い向けを始め、Apple関連テクノロジー情報を知りつくしたいユーザーに役立つ情報を提供します。 Siriの近縁? 「Nina」の登場 日本時間の8月7日、音声認識技術で知られるNuance Communications(関連記事)が、音声アシスタント機能「Nina」の開発キット(Nina Virtual Assistant SDK)を提供する方針を発表した。対象プラットフォームはiOSとAndroid、当面は英語(英/米/豪)のみサポートするが、今年後半には他の言語も追加されるという。 なぜアップル以外の企業名がこの連載に? といぶかしく思った方は、iPhone 4S/iOS 5で登場した「Siri
iOS 5.1で日本語版が登場した「Siri」の影に隠れる形になってしまったが、docomoの端末向けに3月1日から提供開始された「しゃべってコンシェル」は、なかなか興味深いサービスだ。ある程度使い込んで検証しないことにはわからないが、国産の音声認識エンジン「ATR-Trek」を採用、語彙数は数十万語で認識率は90%以上という発表内容を素直に受け取れば、それなりの認識精度なのだろう。 しかし、Siriに比べてどうにも残念な点が1つある。それは、「しゃべってコンシェル」がサービス/システムエージェントとしてではなく、アプリの形で提供されることだ。 Siriの音声認識機能は、日本語などのインプットメソッドと同様の形式でシステム上に存在する。たとえば、『メモ』や『メール』で日本語ソフトウェアキーボードを表示し、スペースキー左横にあるマイクボタンをタップすれば、Siriの音声認識機能を利用して文字
モバイルアプリで音声入力が普通になる日――ニュアンスコミュニケーションズ:テクノロジー最前線(4)(1/2 ページ) モバイル向け音声認識・音声合成のスピーチソリューションに強みを持つ米ニュアンスコミュニケーションズ。同社がリリースした「Dragon Mobile SDK」は、iOS/Androidアプリケーションにスピーチ機能を簡単に組み込めるとあって、3週間で1200の開発企業、開発者が飛び付いた。モバイルアプリで音声入力が普通になる日も近いか。(編集部) 米国のニュアンスコミュニケーションズ(以下、ニュアンス)は、20年以上にわたって音声認識・音声合成のスピーチ技術を培ってきた専門ベンダである。実際、同社のスピーチ技術は、コンピュータテレフォニー製品で圧倒的なシェアを誇るほか、最近では車載製品や医療機器の組み込み製品にも採用される。車載分野でいえば、フォードモーターがマイクロソフトと
画面に話しかけると3Dの初音ミクがエージェントとなって答えたり踊ったりする――そんな技術が話題を呼んでいる。 画面に話しかけると3Dの初音ミクがエージェントとなって答えたり踊ったりする――そんな技術が話題を呼んでいる。 名古屋工業大学国際音声技術研究所(代表:徳田恵一教授)では、内部で開発してきた音声合成ツール、音声認識エンジンや3D技術を用い、音声による指示にキャラクターがモーションと音声付きで応答する音声インタラクションシステム構築ツールキット「MMDAgent」を「CEATEC Japan 2010」(10月5日から、千葉・幕張メッセ)で展示する。9月21日夕方にニコニコ動画で展示内容ムービーを公開し、一夜で再生数2万を超える人気を得ている。 名古屋工業大学といえば、楽譜を入力するだけで自然な歌声で歌い上げる歌声合成技術「Sinsy」が昨年末にニコニコ動画で発表されて話題となった。M
カリフォルニア州マウンテンビュー発--GoogleのMike Cohen氏は、コンピュータを声で操作しようとする誰もが、ひどい音声翻訳に笑ったり不満のため息をついたりせずに済むようになるまで満足しないだろう。 音声技術分野の第一人者であるCohen氏は、音声技術を可能な限り多くの製品に導入しつつ科学として進歩させるというGoogleの取り組みの責任者を務めている。同氏は米CNETとの先日のインタビューで、音声技術の分野でGoogleが目指すものについて語り、「Googleの使命は世界の情報を整理することであり、世界の情報の多くは話し言葉であることがわかっている」と述べた。 Googleは、コンピューティングの世界はモバイルデバイスやブラウザベースのアプリケーションにシフトしつつあるという同社の展望に沿った形で、音声認識技術を生み出そうとしている。つまり、負荷の高い処理はデータセンターで実行
アドバンスト・メディアは同社の音声認識技術「AmiVoice」を用いて、医療やビジネスソリューション、コールセンター、教育、議事録などさまざまな分野で“音声認識”を浸透させてきた。モバイルでは、同社のらくらくホン向け「音声入力メール」やiPhone向け「音声認識メール」のほか、GoogleもiPhoneやAndroid端末向けに音声検索を提供。音声認識は文字入力に変わる新たなユーザーインタフェースとして身近な存在になりつつある。 音声認識技術は今後どのような進化を遂げ、どのようなビジネスモデルが創出されるのか。同社が1月22日に実施した技術・戦略説明会で、その詳細を明かした。 今後は機械が人間並みのコミュニケーション能力を持つ アドバンスト・メディア 代表取締役会長の鈴木清幸氏は、「これまでの音声認識技術は機械中心だったが、今後は人間中心に回帰する」と話し、現在が転換期であることを示唆した
音声認識技術などの開発を手掛けるカタログ(東京都渋谷区)は2009年11月11日、音声入力による投稿が可能なiPhone用Twitterアプリ「しゃべったー」の無料提供を開始する。既にアップルの「App Store」への登録申請を終えており、11日からApp Storeで入手可能になる予定。音声認識技術を利用したTwitter専用アプリは日本国内では初めてとなるという。 しゃべったーは、アプリを起動して投稿したい内容を録音すると、しゃべったーのセンターで文字に変換し、自分のiPhoneから投稿できる。カタログは音声認識精度を上げるために、Twitterの最新投稿2000万件以上を収集して、単語辞書や認識メカニズムを作成した。そのため「渋谷なう」(今渋谷にいます)のようなTwitter独特の表現や、流行の言葉も認識できるという。 音声認識の精度は一般には7~8割で、静かな環境で話者の滑舌が良
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く