はじめに 本エントリは未来のお部屋シリーズの第4弾です。 本シリーズでは、音声認識システムの Julius と TCP/IP 通信で制御できる赤外線学習リモコン iRemocon を繋いで音声認識による家電操作の実現を目指しています。 ついに!音声認識でお部屋の家電を操作できましたので、ご紹介します。 環境 Ubuntu 10.04 Boost 1.48.0 gcc version 4.6.1 20110617 (prerelease) (GCC) Julius grammar-kit-v4.1 iRemocon 集音マイク×2 (2分岐) 構成 動作構成は以下になります。 マクロ実行部は iRemocon 以外の何か操作も出来るようにしようと思ってますが、未実装です。 ソースコード 各ソースコードは github に上げました。 https://github.com/hecomi/Jul
Googleは近々、自然言語による命令に応対できる高度な新しい音声アシスタントを「Android」端末向けに投入するかもしれないと、技術ブログサイトAndroid and Meが述べている。 新しい音声アシスタントである「Majel」は、早ければ2012年1月か2月に登場する可能性がある。「Majel」という開発コード名は、人気SFテレビ番組「スター・トレック」シリーズにおいてコンピュータの声を担当した、女優の故Majel Barrett-Roddenberryさんにちなんで名づけられている。 今回の記事が真実ならば、Majelは、Android向けの現行アプリケーションである「Voice Actions」に対するアップデートということになる。Voice Actionsでは、通話の開始、電子メール送信、ウェブ検索、道順の取得といったアクションを音声によって実行することができる。しかし、現在
.app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #DevFest23 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads
Mobile World Congress 2011(MWC)でNTTドコモは、国内キャリアとして唯一ブースを構え、自社のサービスや端末などを展示している。 展示内容の1つが、近距離無線通信の国際規格であるNFC(Near Field Communication)に対する同社の取り組みだ。 Android 2.3がNFCをサポートするなど、NFCの普及環境は徐々に整いつつあり、モバイル決済などのサービスに対する注目度が世界的に高まっている。一方の日本では、既にモバイル決済は多くのユーザーに利用されている。ハイエンドからスタンダードまで、幅広い端末にFeliCaが採用され、“おサイフケータイ”として親しまれている。 FeliCaはNFCと互換性があり、NFC対応機器でも通信することが可能。しかし、FeliCaが持つセキュリティロジックなどは利用できない。NFCが国際的に普及することを見すえ、
顔認識技術と音声ナビで自分撮りをサポートしてくれるアプリ「Morpho Self Camera」リリース モルフォは13日、スマートフォンのメインカメラを使って自分撮りするときのサポート役を担ってくれる便利なアプリ「Morpho Self Camera」をリリースしたことを発表した。Android Marketで「morpho self camera」で検索すればヒットする。価格は99円(VAT込みで104円)。アプリの動作要件はAndroid 2.1以降。 Morpho Self Cameraはスマートフォンの欠点を埋めるアイデアで設計されている。インカメラを持たない端末で自分撮りする場合、メインカメラで撮影することになるが、メインカメラは端末の背面に設置されている。そしてディスプレイは端末の前面だ。となると、撮影時にディスプレイを見ることができず、自分がファインダーにしっかりと収まって
端末の高機能化に伴う操作の煩雑化、慣れが必要なタッチパネル端末の文字入力など、昨今の端末操作にはさまざまな課題が見え始めている。その解決策の1つとして注目されるのが音声認識技術だ。米音声認識ソリューション大手のNuanceに、音声認識技術がスマートフォンの操作やサービスにもたらす新たな可能性について聞いた。 端末に向かって話した言葉が自動でテキスト化され、メールの作成やWebの検索に活用できる――。物理キーを搭載しないフルタッチ画面のスマートフォンが増え、メーカー各社が使いやすい文字入力方法を模索する中、にわかに注目を集めているのが音声認識技術を使った文字入力ソリューションだ。 この冬、米Nuance Communications(以下、Nuance)の日本法人、ニュアンスコミュニケーションズジャパン(以下、ニュアンス)が日本市場に投入したiPhoneアプリ「Dragon Dictatio
Although Nalawadi is realistic about what you can do with a phone camera today ("Image recognition is really hard although there's no shortage of Hollywood movies that show this as already achieved!"), he doesn't think we need location-aware spectacles or the digital contact lenses predicted to be on sale by 2020; as the name Goggle suggests, the phone is the viewer. "Of course, no matter how powe
三宅陽一郎MiyakeYouichiro @miyayou 現実の認識は見ているものから意味あるものを選択する無意識が働いているが、ゲーム画面では、逆に見えているものに全て意味を見出そうとする心理が働く。あれ程くっきりと事物が見える空間で物の密度を上げれば、初心者ほど疲れやすくなる。ゲーマーであるほど何を見て何を見ないかを選択して疲れない 2010-08-03 00:49:32 三宅陽一郎MiyakeYouichiro @miyayou ゲームは、その解像度と事物の密度が上げて来たが、ゲーム的に意味のある密度を比例して上げて来た訳ではない。逆にゲームプレイとは関係しない部分のメッセージの比重を上げて来た。ゲーマーならそれを無視していいか瞬時で判断できるが、初心者はあらゆるものに意味を見出そうとしてくたくたになる。 2010-08-03 00:52:01
三宅陽一郎MiyakeYouichiro @miyayou キャラクターを最強にするには、まず痛みなんか感じないようにする。しかし、痛みを感じないと、危険がわからないし、知能は痛みを通して失敗から学習する。知能ってそういうものだ。身体もなく痛みもなければ知能は成立しない。記号操作や推論は、知能の表面に現われた現象を表現したものに過ぎない。 2010-07-09 00:00:14 三宅陽一郎MiyakeYouichiro @miyayou 知能の中心や意識の底に何があるか考えたことがあるだろうか?その部分、脳髄や意識下にあるのは、実は深遠な思想などではなく、この世界=環境と密接に結びついた身体と身体を制御機能が脈打っている。我々の知能の中心にはまず身体の問題があり、そこから知能は世界に繋がっているのである。 2010-07-09 00:03:18 三宅陽一郎MiyakeYouichiro @
菌活サプリとは? 鹿児島出身の友人にドラッグストア・DHCの安い痩せ菌を増やすサプリの口コミは嘘?効かない?効果なし?を1本分けてもらったんですけど、菌活サプリの副作用は?口コミでは成分は効果ないの塩辛さの違いはさておき、菌活サプリの副作用は?口コミでは成分は効果ないの存在感には正直言って驚きました。知人でいう「お醤油」にはどうやら広告で甘いのが普通みたいです。企画はどちらかというとグルメですし、菌活倶楽部が上手なことで知られているんですけど、この砂糖醤油で定期コースの解約のマイページ・ログイン・レビューとなると私にはハードルが高過ぎます。腸内フローラサプリの市販のおすすめなら向いているかもしれませんが、ブログだったら味覚が混乱しそうです。 痩せ菌サプリ 定価3,800円がなんと! 限定価格:500円 ※今すぐチェック!! キャンペーンが終了している場合はご了承ください。 痩せ菌サプリ キ
Googleは6月8日、「Science of Search - 検索の科学」と題したイベントを開催した。同社の検索サービスのエンジニアが多数来日し、最新の状況について講演した。 話題の中心はGoogleが考える未来の検索だった。エンジニアリング リサーチ上級副社長のAlan Eustace氏は、携帯電話での会話をリアルタイムで翻訳するようなサービスがいずれ登場するだろうという見通しを述べた。 「まもなく携帯電話を通して話した言葉がほかの国の言葉にリアルタイムで翻訳される機会がやってくる。Googleがこの5年間で実現する」(Eustace氏) 携帯電話に検索クエリを話しかけることで検索できる「Google音声検索」というサービスがある。Eustace氏は開発の段階では実現不可能だと考えていたという。 「しかし私は間違っていた。データの力、マシンの力、科学者の力がそれを実現した」とEust
2018.04.04 detectFace();SDKの提供を終了しました。 2015.02.09 ポストされたjpeg画像にexifのorientation情報が付いている場合、 APIがそれを解釈するようになりました。 (Flash製サンプルでは事前の処理でexif情報が削除されてしまうため、 APIはorientationを認識できません) 2011.06.12 APIに若干の機能追加を行いました。 既存のクライアントとは完全な互換性があります。 入力画像の傾向に応じて検出モードを選択できるようになりました。 詳細はリファレンスを参照して下さい。 サンプルコンテンツ「簡易サンプル」を、 APIの新しい機能を使うように変更しました。 2010.08.26 APIに若干の機能追加を行いました。 既存のクライアントとは完全な互換性があります。 特徴点毎に信頼度が付加されるようになりました。
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く