[B! 音声認識] kat0usiのブックマーク

[iPhone駆け込み寺] 「iOS 16」でiPhoneで音声入力がより便利に、より実用的になったことを知ってほしい

kat0usi 2022/09/20

リンク

自然言語処理の歴史とこれから　ビジネスとして成立させるために必要なこと

検索やレコメンドに必要な形態素解析海野裕也氏（以下、海野）：自然言語処理の研究とは何かといいますと、私みたいな研究をやっている人間からすると、例えば機械翻訳だったり、質問応答みたいな目標があって、その中の技術として、ここ（スライド）に書いてあるような、漢字で長ったらしい、いろんな技術がある。含意関係認識や、述語項構造解析、照応解析など、いっぱいあるんですけども。だいたい世間の人から見ると、「あ、自然言語処理って形態素解析のことでしょ？」って言われるわけですね。形態素解析はもちろん今でも研究はされてはいるんですけども、残念ながら学会の中ではかなりマイノリティです。発表件数が2件とかしかなくて、セッションを組めないぐらい、ほとんどあんまりいない。あ、いないって言うとやってる人に失礼なので、ちょっとあれなんですけど（笑）。1分野なんですね。すごく狭い領域なんです。現実的には、言語で書かれ

kat0usi 2018/08/04

“精度って、シチュエーションによっては、そこまで重要じゃない可能性があるということ”

音声認識

リンク

音声認識APIのまとめ | 週刊てるゆき 2.0

音声認識 APIのまとめスマートフォンの音声認識 APIをまとめてみました。▼無料音声認識 API◎Dragon Mobile SDK ・Android＆iOS 無償・有償日本語 http://www.nuancemobiledeveloper.com/public/index.php?task=memberServices) ◎Zypr 音声制御Webサービス API ・Android＆iOS APIは無料だが収益はシェア。日本語。 http://www.zypr.net/ ◎VocalKit ・iOS 無料。日本語。単語数が多いと処理が重い？ http://d.hatena.ne.jp/shu223/20110227/1299368179 ◎iSpeech ・Android＆iOS 無料、日本語。 http://www.ispeech.org/ ◎Google Mobile App 音声検

kat0usi 2013/10/27

リンク

Unavailable

App game 'Bomberman Touch' for iPhone is now available|Do the Hudson!!(β)

kat0usi 2013/10/27

1アクセスあたり、米ドル換算でおよそ1～2セント（1セントは直近の為替相場で約0.8円）

音声認識

リンク

Nuance Developers | Home

Create with Confidence Nuance Developers is not accepting new customers at this time or accepting the purchase of new licenses at this time. If you are a Enterprise or Healthcare customer that wants to try our techno logy please contact your sales representative for information. If you do not have a sales representative,for Enterprise solutions please contact us here, for healthcare solutions conta

kat0usi 2013/10/27

リンク

声でスマートフォンを操作できるアプリ「おはなしアシスタント」の提供について | 2012年 | KDDI株式会社

声でスマートフォンを操作できるアプリ「おはなしアシスタント」の提供について～au初のAndroid™ 搭載スマートフォン向け音声認識サービス～ KDDI、沖縄セルラーは2012年11月1日より、スマートフォンに話しかけることで、天気やニュースなどの情報を表示できるスマートフォン向けアプリ「おはなしアシスタント」の提供を無料で開始します。「おはなしアシスタント」は、電話発信、メール作成、天気予報など利用頻度の高い機能を音声で簡単に操作することができます。また、お探しのアプリも声で簡単に起動させることが可能です。さらに、月額105円 (税込) の「有料コース」は、基本機能に加えて音声認識を活用したライフログの保存・閲覧やアシスタントキャラクターの着せ替えなどのカスタマイズも可能となり、「おはなしアシスタント」の機能をさらにお楽しみいただけます。「おはなしアシスタント」には、株式会社アド

kat0usi 2013/10/21

「おはなしアシスタント」には、株式会社アドバンスト・メディアの高速・高精度な音声認識エンジン「AmiVoice」を搭載

音声認識

リンク

vGate ASR（音声認識） | 音声認識・音声対話のフュートレック

kat0usi 2013/10/21

音声認識

リンク

Siriの音声認識だけでマイナビニュースの原稿を書いてみた、結果は……?

ああ、忙しい忙しい! ……のっけから泣き事で申し訳ないが、師走を前にしてすでに鬼のような忙しい毎日なのだ。フリーランスの身としては仕事で忙しいのは歓迎すべきことなのだが、こうも忙しいとさすがに何か横着したくなる。そこでふと思いついたのが、iPhoneの「Siri」を活用して原稿が書けないだろうか、ということだ。 Siriとは、iPhoneやiPad、iPod touchにiOS 5から搭載された音声認識アシスタント機能である。たとえばSiriを起動して「今日の天気は?」と話しかければ、現在地点の天気予報を表示してくれるし、「◯◯にメール」と話しかければメールアプリを起動して、さらに宛先やタイトル、本文まで音声で入力できるという優れものなのだ。

kat0usi 2013/10/17

音声認識

リンク

声で文字入力するソフト「AmiVoice」の最新版、書き起こしの支援機能を追加　

kat0usi 2013/03/24

「あおい」さんに力入ってるw

音声認識

リンク

ホンダ、Appleの音声アシスタント「Siri」を一部車種に採用

本田技研工業（ホンダ）と同社の北米向け高級ブランドAcuraは現地時間2013年1月31日、米Appleの音声アシスタント機能「Siri」を一部2013年モデルに統合する計画を明らかにした。ディーラーオプションとして、ホンダの中型セダン「Accord」と、AcuraブランドのSUV「Acura RDX」および小型セダン「Acura ILX」にSiriの自動車向け音声制御モード「Eyes Free」を搭載する。 Eyes Freeモードでは、ドライバーが運転中にハンドルから手を離さず、視線を前方からそらすことなく、「ハンズフリー」かつ「アイズフリー」でAppleのスマートフォン「iPhone」（iOS 6搭載）を音声だけで操作できる。対象のAccordとAcuraでは、iPhoneをハンズフリー操作システム「HandsFreeLink」とBluetooth接続し、車載マイクとスピーカーを通

kat0usi 2013/02/03

リンク

次世代音声アシスタントの座に挑む、Nuance「Nina」 (1/2)

本連載「Apple Geeks」は、Apple製ハードウェア／ソフトウェア、またこれらの中核をなすOS X／iOSに関する解説を、余すことなくお贈りする連載です（連載目次はこちら）。 UNIX使い向けを始め、Apple関連テクノロジー情報を知りつくしたいユーザーに役立つ情報を提供します。 Siriの近縁? 「Nina」の登場日本時間の8月7日、音声認識技術で知られるNuance Communications（関連記事）が、音声アシスタント機能「Nina」の開発キット（Nina Virtual Assistant SDK）を提供する方針を発表した。対象プラットフォームはiOSとAndroid、当面は英語（英／米／豪）のみサポートするが、今年後半には他の言語も追加されるという。なぜアップル以外の企業名がこの連載に?　といぶかしく思った方は、iPhone 4S／iOS 5で登場した「Siri

kat0usi 2012/12/01

リンク

Siriと「しゃべってコンシェル」の決定的な違い - ブログ de OS - unakami - builder

iOS 5.1で日本語版が登場した「Siri」の影に隠れる形になってしまったが、docomoの端末向けに3月1日から提供開始された「しゃべってコンシェル」は、なかなか興味深いサービスだ。ある程度使い込んで検証しないことにはわからないが、国産の音声認識エンジン「ATR-Trek」を採用、語彙数は数十万語で認識率は90%以上という発表内容を素直に受け取れば、それなりの認識精度なのだろう。しかし、Siriに比べてどうにも残念な点が1つある。それは、「しゃべってコンシェル」がサービス/システムエージェントとしてではなく、アプリの形で提供されることだ。 Siriの音声認識機能は、日本語などのインプットメソッドと同様の形式でシステム上に存在する。たとえば、『メモ』や『メール』で日本語ソフトウェアキーボードを表示し、スペースキー左横にあるマイクボタンをタップすれば、Siriの音声認識機能を利用して文字

kat0usi 2012/03/13

音声認識

リンク

モバイルアプリで音声入力が普通になる日――ニュアンスコミュニケーションズ

モバイルアプリで音声入力が普通になる日――ニュアンスコミュニケーションズ：テクノロジー最前線（4）（1/2 ページ）モバイル向け音声認識・音声合成のスピーチソリューションに強みを持つ米ニュアンスコミュニケーションズ。同社がリリースした「Dragon Mobile SDK」は、iOS/Androidアプリケーションにスピーチ機能を簡単に組み込めるとあって、3週間で1200の開発企業、開発者が飛び付いた。モバイルアプリで音声入力が普通になる日も近いか。（編集部）米国のニュアンスコミュニケーションズ（以下、ニュアンス）は、20年以上にわたって音声認識・音声合成のスピーチ技術を培ってきた専門ベンダである。実際、同社のスピーチ技術は、コンピュータテレフォニー製品で圧倒的なシェアを誇るほか、最近では車載製品や医療機器の組み込み製品にも採用される。車載分野でいえば、フォードモーターがマイクロソフトと

kat0usi 2011/02/24

swype と同じUIも提供するっぽいけど特許的に大丈夫なのだろうか？ / T9 / Nuance / Decuma / swipe

リンク

初音ミク、エージェントになる？――名工大「MMDAgent」がもたらす未来

画面に話しかけると3Dの初音ミクがエージェントとなって答えたり踊ったりする――そんな技術が話題を呼んでいる。画面に話しかけると3Dの初音ミクがエージェントとなって答えたり踊ったりする――そんな技術が話題を呼んでいる。名古屋工業大学国際音声技術研究所（代表：徳田恵一教授）では、内部で開発してきた音声合成ツール、音声認識エンジンや3D技術を用い、音声による指示にキャラクターがモーションと音声付きで応答する音声インタラクションシステム構築ツールキット「MMDAgent」を「CEATEC Japan 2010」（10月5日から、千葉・幕張メッセ）で展示する。9月21日夕方にニコニコ動画で展示内容ムービーを公開し、一夜で再生数2万を超える人気を得ている。名古屋工業大学といえば、楽譜を入力するだけで自然な歌声で歌い上げる歌声合成技術「Sinsy」が昨年末にニコニコ動画で発表されて話題となった。M

kat0usi 2010/09/23

名工大

音声認識

リンク

グーグルの音声認識技術--進歩の歴史と新たな挑戦

カリフォルニア州マウンテンビュー発--GoogleのMike Cohen氏は、コンピュータを声で操作しようとする誰もが、ひどい音声翻訳に笑ったり不満のため息をついたりせずに済むようになるまで満足しないだろう。音声技術分野の第一人者であるCohen氏は、音声技術を可能な限り多くの製品に導入しつつ科学として進歩させるというGoogleの取り組みの責任者を務めている。同氏は米CNETとの先日のインタビューで、音声技術の分野でGoogleが目指すものについて語り、「Googleの使命は世界の情報を整理することであり、世界の情報の多くは話し言葉であることがわかっている」と述べた。 Googleは、コンピューティングの世界はモバイルデバイスやブラウザベースのアプリケーションにシフトしつつあるという同社の展望に沿った形で、音声認識技術を生み出そうとしている。つまり、負荷の高い処理はデータセンターで実行

kat0usi 2010/09/09

雑音・正しくない文章・プライバシー上の問題からパーソナライズなどが困難だが「人々が声で入力したい気分のときはそうすることができるし、手で入力したいときはそうすることができると思えるようにしたい」

リンク

ウェブアクセシビリティ支援音声読み上げサービスの第一人者　リードスピーカー・ジャパン

DIGITAL VOICE DESIGN あらゆるシーンに人の声を。企業のDXをリードする世界基準AI音声、「リードスピーカー」

kat0usi 2010/09/07

リンク

日本Androidの会：知恵を持った音声認識ソフトは、利用者の“アバター”になれるのか？

kat0usi 2010/03/19

音声認識

リンク

TechCrunch | Startup and Technology News

Miriam Vogel, profiled as part of TechCrunch’s Women in AI series, is the CEO of the nonprofit responsible AI advocacy organization EqualAI.

kat0usi 2010/02/07

音声認識

リンク

音声認識で人間並みのコミュニケーションが可能に――「AmiVoice」の未来 (1/2) - ITmedia Mobile

アドバンスト・メディアは同社の音声認識技術「AmiVoice」を用いて、医療やビジネスソリューション、コールセンター、教育、議事録などさまざまな分野で“音声認識”を浸透させてきた。モバイルでは、同社のらくらくホン向け「音声入力メール」やiPhone向け「音声認識メール」のほか、GoogleもiPhoneやAndroid端末向けに音声検索を提供。音声認識は文字入力に変わる新たなユーザーインタフェースとして身近な存在になりつつある。音声認識技術は今後どのような進化を遂げ、どのようなビジネスモデルが創出されるのか。同社が1月22日に実施した技術・戦略説明会で、その詳細を明かした。今後は機械が人間並みのコミュニケーション能力を持つアドバンスト・メディア代表取締役会長の鈴木清幸氏は、「これまでの音声認識技術は機械中心だったが、今後は人間中心に回帰する」と話し、現在が転換期であることを示唆した

kat0usi 2010/02/01

超音声認識www

音声認識

リンク

声で入力するiPhone用Twitterアプリ、カタログが提供へ

音声認識技術などの開発を手掛けるカタログ（東京都渋谷区）は2009年11月11日、音声入力による投稿が可能なiPhone用Twitterアプリ「しゃべったー」の無料提供を開始する。既にアップルの「App Store」への登録申請を終えており、11日からApp Storeで入手可能になる予定。音声認識技術を利用したTwitter専用アプリは日本国内では初めてとなるという。しゃべったーは、アプリを起動して投稿したい内容を録音すると、しゃべったーのセンターで文字に変換し、自分のiPhoneから投稿できる。カタログは音声認識精度を上げるために、Twitterの最新投稿2000万件以上を収集して、単語辞書や認識メカニズムを作成した。そのため「渋谷なう」（今渋谷にいます）のようなTwitter独特の表現や、流行の言葉も認識できるという。音声認識の精度は一般には7～8割で、静かな環境で話者の滑舌が良

kat0usi 2009/11/21

Twitterの最新投稿2000万件以上を収集して、単語辞書や認識メカニズムを作成した。そのため「渋谷なう」（今渋谷にいます）のようなTwitter独特の表現や、流行の言葉も認識できる

リンク

はてなブックマーク

タグ

関連タグで絞り込む (13)

音声認識に関するkat0usiのブックマーク (30)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第3週）

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス