[4ページ] 音声認識の人気記事 2712件

121 - 160 件 / 2712件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

音声認識の検索結果121 - 160 件 / 2712件

津軽弁の会話ＡＩで文字化に成功青森 | NHKニュース
- 263 users
- www3.nhk.or.jp
- 学び
- 2018/02/19
青森県西部の津軽地方で使われている方言「津軽弁」について、弘前大学と東北電力の研究グループが、独特の言い回しなどをＡＩ＝人工知能に繰り返し覚えさせることで、会話のやり取りをほぼ正確に文字で表示することに成功したと発表しました。それによりますと、研究ではまず、東北電力のコールセンターで録音された１０とおりの会話を、鰺ヶ沢町に住む２０代から７０代の男女１２人にそれぞれ津軽弁で読んでもらいました。そして、そのやり取りをすべて録音したうえでＡＩに読み込ませ、文字にしました。当初は変換ミスが多く、正しく文字に変換できたのは７６％程度でしたが、誤った部分を修正し独特の言い回しなどを繰り返し覚えさせるうちに、およそ９４％まで精度が高まったということです。弘前大学と東北電力は引き続き精度を高めていくとともに、標準語への変換にも取り組むことにしています。研究に当たっている弘前大学の柏倉幾郎副学長は「さ
- 人工知能
- 方言
- 言語
- AI
- あとで読む
- 青森
- 言葉
- NHK
- 会話
- 機械学習
WindowsのキーボードにAndroidタブレットを使うのは本気で快適でした。インテリジェントキーボードになります。今年最大のハックかも。 - 勝間和代が徹底的にマニアックな話をアップするブログ
- 262 users
- katsumakazuyo.hatenablog.com
- テクノロジー
- 2018/12/18
一つ前の記事で、Windowsのキーボードを取り外してAndroidタブレットのリモートマウスを使って色々な入力を全て行うということを書きましたが、これ半日ぐらい試してみたんですけれども、かなり本気で快適です。まず最近の音声入力はほとんど誤入力がないため、キーボードで直すことが少ないため、音声入力をしやすい方が、キーボードを打ちやすいよりも大事でした、そしてこのタブレットを机にぺったりとつけて入力ができるというのはタブレットスタンドに中に浮いてるもので入力するよりもずっと早くて安定します。また、修正の時に親指シフトも十分早いと思っていましたが、最近は日常的にフリックを使うことの方が多いので、下手したら私フリック入力の方が、修正のように少ない文字数の場合には多分早いです。さらに、リモートマウスのキーボードを日本語入力の時と英語入力のときと数字入力の時に全て切り替えられるので、画面がとて
- Android
- あとで読む
- windows
- キーボード
- ガジェット
- pc
- 入力
- tablet
- keyboard
- タブレット
AquesTalk - テキスト音声合成ミドルウェア
- 262 users
- www.a-quest.com
- 暮らし
- 2006/08/21
規則音声合成エンジン　AquesTalkシリーズ組み込み用に開発された小型軽量のエンジンで、テキスト情報（音声記号列）をリアルタイムに音声に変換して出力します。これまで数百万台の機器に実装されています。現在、AquesTalk10/AquesTalk pico/AquesTalk2/AquesTalk1の4種類のエンジンがあります。それぞれ音声生成アルゴリズムが違うため、声質が異なります。声質や動作に必要なリソース量を考慮してエンジンを選択します。エンジン種類 AquesTalk pico シリーズ中、最小サイズのエンジンです。RAM500byte、ROM30Kbyte、8bit CPUという比類ない極小リソースでリアルタイムの音声合成ができます。リソース制約の厳しい小型の組み込み機器に適しています。このエンジンを１チップマイコンに組み込んだ音声合成LSI AquesTalk p
- 音声合成
- 音声
- library
- software
- programming
- ライブラリ
- voice
- プログラミング
- AquesTalk
- TTS
Engadget | Technology News & Reviews
- 261 users
- www.engadget.com
- テクノロジー
- 2017/09/07
Research indicates that carbon dioxide removal plans will not be enough to meet Paris treaty goals
ToScribe -音声書き起こしクラウドエディタ-
- 255 users
- toscribe.toshiba.co.jp
- テクノロジー
- 2012/02/01
ToScribeとは『ToScribe』は、会議などを録音した音声データから参加者の発言内容を文字に起こす「音声書き起こし」の作業環境をブラウザベースで提供する「音声データ書き起こし支援サービス」（完全無料）です。インターネットに接続できる環境があれば、どこに居てもサーバに保存されたデータで書き起こし作業を行うことができます。（株）東芝で開発された音声・言語処理技術を利用した以下のような作業支援機能があります。自動頭出し機能テキスト中のカーソル位置から音声再生を開始できます。校正支援機能（整文支援）書き起こした文章の文末・表記のゆれ、誤字・脱字などを検出してお知らせします。話者分類機能音声データに登場する発言者を分類して、各発言の話者を特定します。聞きやすさ向上機能（ノイズ除去・話速変更）エアコン・プロジェクターのファンノイズなどを抑え、音声を聞きやすくします。
- webサービス
- 音声認識
- voice
- 音声
- 東芝
- webservice
- Toshiba
- service
- audio
- web
不要な音は消去して必要な音だけ聞ける“聴力自在化”技術　北大と神大が開発
- 254 users
- www.itmedia.co.jp
- テクノロジー
- 2020/08/05
Innovative Tech：このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。北海道大学と神戸大学による研究チームが発表した「ウェアラブルコンピューティングにおける聴力自在化技術の提案」（PDFへのリンク）は、外界音を変換し、ユーザーが自在に自身の聴力を操作する技術だ。この技術を用いることで、外界音から聞きたい音だけを選択して聞くことができる。人間の耳は、自らの意志では制御することが難しく、聞く音の取捨選択ができない。その上、超音波などの人間には聞こえない音も取得することができない。研究チームは、マイクとスピーカーを搭載したイヤフォン型ウェアラブルデバイス（マイク付きワイヤレスイヤフォン）での利用を想定し、外界音から聞きたい音だけを聞ける技術でこの課題に挑戦する
- 技術
- 研究
- あとで読む
- 科学
- 開発
- テクノロジー
- technology
- 拡張感覚
- 音
- これはすごい
Google、リアルタイム翻訳対応「Pixel USB-C イヤフォン」を3456円で発売
- 253 users
- www.itmedia.co.jp
- テクノロジー
- 2018/10/10
米Googleは10月9日（現地時間）、新オリジナルスマートフォン「Pixel 3／3 XL」には付属するUSB Type-C接続イヤフォンを、「Google Pixel USB-C イヤフォン」として発売した。日本での販売価格は税込み3456円。昨年発表した「Pixel Buds」と同様に、「Googleアシスタント」を起動したり、リアルタイム翻訳をさせたりできる。コードに付いているリモコンの黒いボタンを長押しするとGoogleアシスタントが起動する。リアルタイム翻訳を使うには黒いボタンを長押ししながら「OK Google、○○語に翻訳して」と言う。40カ国語をサポートする。この機能を使うには、接続する端末が「Android 9 Pie」以上を搭載し、Google翻訳アプリをインストールしておく必要がある。リモコン上部の「音量大」ボタンの長押しで、スマートフォンに来たプッシュ通知を
研究者らが無償のオープンソース版Siriを開発 - BRIDGE（ブリッジ）テクノロジー＆スタートアップ情報
- 253 users
- thebridge.jp
- テクノロジー
- 2015/03/23
Image Credit: Bhupinder Nayyar/Flickr AppleやMicrosoftのような大手テクノロジー企業は、モバイル機器に搭載されたパーソナルデジタルアシスタント機能を多くの人に提供してきた。そのおかげでユーザはデバイスに話しかけるだけでアラームをかけたり、質問の回答を得たりすることができるようになった。現在、他の企業も新しいオープンソースのソフトウェアを用いて、それぞれ独自のバージョンのアシスタント機能を作成することが可能になった。そのソフトウェアは、Sirius。もちろん、AppleのSiriをもじったものだ。今日、トルコで開かれている「プログラム言語およびOS向けアーキテクチャサポートに関する国際会議」にて、ミシガン大学の研究者らがSiriusについてのプレゼンテーションを行った（編集部注：原文掲載3月14日）。時を同じくした今朝、SiriusはPro
- Siri
- オープンソース
- 人工知能
- 音声認識
- oss
- AI
- 機械学習
- あとで読む
- システム
- Apple
Engadget | Technology News & Reviews
- 252 users
- www.engadget.com
- テクノロジー
- 2013/05/22
Hands-on with the new iPad Pro M4: Absurdly thin and light, but the screen steals the show
- Xbox
- game
- Microsoft
- Xbox One
- ゲーム
- XboxOne
- hardware
- engadget
- Kinect
- マイクロソフト
もはや視覚のほんやくコンニャク、「Google 翻訳」アプリが「Word Lens」でパワーアップ
- 249 users
- internet.watch.impress.co.jp
- テクノロジー
- 2015/01/15
- 翻訳
- Google
- アプリ
- translation
- Android
- VR
- 言語
- iPhone
- augmentedreality
- あとで読む
サイボウズ　「共に生きる」をテーマに働き方議論　クラウド伸長、機能拡充進める | BCN Bizline
- 248 users
- www.weeklybcn.com
- テクノロジー
- 2007/12/26
＜サイバー攻撃に打ち勝つ最新セキュリティ＞XDR編　フォーティネットジャパン　「セキュリティファブリック」で自動化を実現
- SIer
- あとで読む
- aws
- セキュリティ
- プリンタ
- SAP
- FinTech
- IBM
アイデアが浮かばないという人は試すべき。音声入力での文章作成方法 - Enter101
- 242 users
- enter101.hatenablog.com
- テクノロジー
- 2016/05/14
ブログや、レポートなど、文章を書きたいけれど、何を書けばいいのかアイデアが浮かんでこない方への処方箋。頭の中にモヤモヤと沸いてきた思考を文字起こしする時に、ピッタリの方法があったので紹介したいと思います。参考になれば嬉しいです。書いたことないけど、小説とかでも使えそうな気がします。（誰か試してください）必要なもの携帯端末の音声認識の精度はかなり高い Google音声入力で文字起こしをするメリット考えたことを文字に起こせるアイデアをどこでも記録出来る編集力が上がる準備する必要がなく手軽に試せる音声入力で文章を書いてみたアイデアの生産方法として便利音声入力したテキストの起こし方文章の目的を考える誰に伝えたい文章なのか（Whom）何を伝えたい文章なのか（What）どのように伝えるのか（How）なぜ書くのか（Why）あまり必要ないものだれが（Who）どこで（W
- 文章
- アイデア
- あとで読む
- 文章術
- キーボード
- テキスト
- 言語
- 音声入力
- iOS
- evernote
YouTubeで“聞こえない音”を流し、スマホを遠隔操作する攻撃　音声アシスタント機能を悪用
- 239 users
- www.itmedia.co.jp
- テクノロジー
- 2023/03/29
Innovative Tech：このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: ＠shiropen2 米テキサス大学サンアントニオ校と米コロラド大学コロラドスプリングス校に所属する研究者らが発表した論文「Near-Ultrasound Inaudible Trojan（NUIT）: Exploit Your Speaker to Attack Your Microphone」は、スマートフォンやスマートスピーカーの音声アシスタント（Siri、Google Assistant、Alexa、Cortana）に対する不可聴攻撃を提案した研究報告である。その手口は、インターネット（動画や音楽、Web会議など）を通じて、人間には聞こえない音を流し、リモートでス
TwilioとGoogle Cloud Speech APIで電話の内容を文章に変換する | DevelopersIO
- 238 users
- dev.classmethod.jp
- テクノロジー
- 2017/02/15
Google Cloud Speech API (以下Speech API) を利用すると、人間が発声した音声をAPIを通してテキストに変換することができます。 Speech APIは日本語にも対応しているため、国内でも電話で話した内容を自動的にテキストに変換するといったようなことが出来るようになります。ということで、Twilio, Zappa, Speech APIを組み合わせて、サーバレスに電話の内容を文章化する仕組みをつくってみました。構成以下が今回作成した仕組みの構成図になります。 Twilioを用いて電話から音声を録音する方法については、こちらの記事を参考にしてください。上記の記事に加えて、Twilioから録音された音声ファイルのURLをSNSを通して別のLambda Functionに投げ、そこから音声ファイルの取得とSpeech APIへの問い合わせを行っています。最
- Twilio
- 音声認識
- api
- AWS
- あとで読む
- google
- gcp
- 音声文字変換
- lambda
- stt
「バルス！」と唱えると光る「天空の城ラピュタ」の飛行石を開発、ついに販売 - エキサイトニュース
- 235 users
- www.excite.co.jp
- アニメとゲーム
- 2014/05/01
スタジオジブリの映画「天空の城ラピュタ」のヒロイン、シータが持つ飛行石。この飛行石を模したグッズはペンダントやストラップなどいくつかあるんですが、ついにあの“滅びの呪文”を唱えると光る飛行石が発売します！滅びの呪文とは、シータとパズーがムスカの前で唱える言葉。「バルス！」この言葉を音声認識して光り出すというアクセサリー「天空の城ラピュタ光る飛行石光のちから音声認識バルスモード搭載」は、今回で３度目のバージョンアップ。もちろん、通常時は普通のペンダントとして使えます。
- ジブリ
- アニメ
- ネタ
- バルス
- グッズ
- anime
- goods
- gadget
- 欲しい
- 音声認識
翻訳機ili（イリー）公式 - インターネット不要で世界と繋がる
- 235 users
- iamili.com
- 学び
- 2016/01/06
アレクサを好きな声に変更可能へ、アマゾンが計画発表
- 231 users
- jp.reuters.com
- テクノロジー
- 2022/06/23
米アマゾン・ドット・コムは２２日、音声アシスタント機能「アレクサ」について、人工知能（ＡＩ）の音声を自分の好きな声に変更できるようにする計画を明らかにした。昨年１０月撮影（２０２２年　ロイター/MIKE BLAKE）［ラスベガス　２２日　ロイター］ - 米アマゾン・ドット・コムは２２日、音声アシスタント機能「アレクサ」について、人工知能（ＡＩ）の音声を自分の好きな声に変更できるようにする計画を明らかにした。
- 音声合成
- Alexa
- 技術
- ガジェット
- amazon
- あとで読む
- 家電
テキストマイニングのための機械学習超入門　一夜目 - あんちべ！
- 228 users
- antibayesian.hateblo.jp
- 暮らし
- 2011/11/04
テキストマイニングに必要なパターン認識と機械学習について学びます。非常に初歩的な話から始めます。対象者は「テキストマイニングに興味があり、用いられる手法の中身を知りたい（けれど高度な数学は厳しい…）」というビジネスマンや学生さんです。数式は出来る限り「使います」。使わないと意味するところは理解できません。ただし、愚直に数式の一行一行を手計算で順を追って解いていきますし、必要な数学知識はその都度説明し、前提知識は求めませんので「数式出てくるの？じゃあついていけないのでは…」という心配は不要です。この記事の特徴は「機械学習の手法をやたら冗長な数式と過剰なまでの例を用いて、くどくどと同じ話を何度も説明する」ことです。筆者ことあんちべは純文系出身で、数学や統計学、プログラミングは全然学生時代やってこなかった上、業務でも機械学習を使うことなんて皆無、それどころか機械学習なんて言葉は就職してからよう
Songrium (ソングリウム) - つながりを用いた新しい音楽鑑賞を
- 227 users
- songrium.jp
- テクノロジー
- 2012/08/07
お知らせ 2022年 12月 23日超歴史プレーヤ - ニコニコ動画2022年版を公開しました 2021年 12月 15日超歴史プレーヤ - ニコニコ動画１５周年記念版を公開しました 2021年 12月 15日超歴史プレーヤ - ニコニコ動画2021年版を公開しました 2020年 12月 18日超歴史プレーヤ - ニコニコ動画2020年版を公開しました 2019年 12月 24日超歴史プレーヤ - ニコニコ動画2019年版を公開しました 2018年 12月 26日超歴史プレーヤ - ニコニコ動画2018年版を公開しました 2018年 02月 10日「SNOW MIKU LIVE! 2018」の舞台にSongrium3D の映像が登場しました 2017年 12月 26日超歴史プレーヤ - ニコニコ動画2017年版を公開しました 2017年 12月 26日超歴史プレーヤ
- vocaloid
- webサービス
- ニコニコ動画
- music
- 音楽
- webservice
- web
- chrome
- 産総研
- visualization
Engadget | Technology News & Reviews
- 227 users
- www.engadget.com
- テクノロジー
- 2019/10/16
Parrots in captivity seem to enjoy video-chatting with their friends on Messenger
- Pixel
- google
- あとで読む
- Android
- pixel4
- engadget
- カメラ
- スマートフォン
- Smartphone
文字起こしアプリで伝言ゲーム
- 227 users
- dailyportalz.jp
- おもしろ
- 2024/01/25
1971年東京生まれ。デイリーポータルZウェブマスター。主にインターネットと世田谷区で活動。編著書は「死ぬかと思った」（アスペクト）など。イカの沖漬けが世界一うまい食べものだと思ってる。（動画インタビュー）前の記事：影だけ悪魔の人になりたい＞個人サイト webやぎの目ルール肉声で喋る→アプリで文字起こし→その結果をiPhoneで読み上げ→ 別のアプリで文字起こし → また読みあげ → またまた別のアプリで文字起こし …を繰り返す。そうして文章がずれていくさまを楽しもう。
ChatGPT APIとWhisper APIで議事録文字起こしアプリを作り、Hugging Face Spacesで公開する | gihyo.jp
- 220 users
- gihyo.jp
- テクノロジー
- 2023/04/06
ChatGPT APIの使い方実際にChatGPT APIを使ってみましょう。 openai-pythonのインストール今回はOpenAIのPython用ライブラリであるopenai-pythonを使います。pipを用いて、openai-pythonをインストールしましょう。 pip install openai APIリクエスト ChatCompletion.createで対話を生成できます。たとえば、以下のようなコードになります。 import openai openai.api_key = "sk-..." # APIキー completion = openai.ChatCompletion.create( model="gpt-3.5-turbo", messages=[{"role": "user", "content": "こんにちは！"}] ) print(complet
- ChatGPT
- Whisper
- あとで読む
- AI
- API
- OpenAI
- Python
- アプリ
- プログラミング
- Hugging Face
Hue対抗スマート電球がアイリスオーヤマから。無線LAN搭載で3000円台、スマホ接続にハブも不要 - Engadget 日本版
- 218 users
- www.engadget.com
- テクノロジー
- 2018/11/08
Research indicates that carbon dioxide removal plans will not be enough to meet Paris treaty goals
- 家電
- あとで読む
- IoT
- LAN
- インタレスト
- 日本
- Saved For Later
“スマホのマイクでこっそり盗聴”を妨害する技術　静かな音で会話内容を改ざん
- 217 users
- www.itmedia.co.jp
- テクノロジー
- 2022/05/17
Innovative Tech：このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。米コロンビア大学の研究チームが発表した「Real-Time Neural Voice Camouflage」は、不正なマイクが取得したユーザーの会話の言葉を正しく聞き取れないようにする攻撃を提案した論文だ。無線で妨害音を発し、自動音声認識（ASR）システムをリアルタイムに混乱させ、本来盗聴側が取得したい会話を間違った形で認識させる。80％の確率でユーザーの言葉を誤認識させられたという。この妨害音は、その場にいるユーザーの邪魔にならないような静かな音に最適化されている。妨害を実際に行った3つの例。攻撃していない時の音声信号スペクトログラム（上）、攻撃した際の音声信号スペクトログラム（下）
Google純正の「レコーダー」は録音した音声を文字に自動変換してくれる | juggly.cn
- 215 users
- juggly.cn
- テクノロジー
- 2019/12/26
Pixel 4 シリーズの登場に併せてリリースされた Google 純正の録音アプリ「レコーダー」は音声を文字に起こす素晴らしい機能を搭載しており、今後、人々のライフスタイルを大きく変える可能性を秘めている思いますのでアプリを紹介します。録音アプリやボイスレコーダーアプリは既に様々なものが Google Play ストアで配信されているので「レコーダー」は特段珍しいアプリではありませんが、録音データの活用の幅が広がるという意味において「レコーダー」は注目のアプリだと言えます。注目のアプリと言っても基本的な機能や使い方は他の録音アプリ・ボイスレコーダーアプリと大体同じです。録音開始ボタンを押して録音を開始し、終了ボタンを押して停止します。「保存」を押せばデータとしてスマホに保存されます。アプリの特徴が録音データの再生画面です。再生ボタンの上にあるタブでモードを選択できるようになっており
- google
- あとで読む
- アプリ
- 録音
- 機能
- 音声
OK, GoogleはどこまでOK, Googleか
- 214 users
- anond.hatelabo.jp
- テクノロジー
- 2018/01/26
■概要 Google Homeが我が家に来た。「OK, Google」（もしくは「ねぇ、Google」）と声をかけるとそれがスイッチとなり、それ以降の言葉を指示として認識するようになっている。いろいろ調べてみると「おーけー、ぐるぐる」でも反応するらしい。というわけで、Google Homeにいろいろと声をかけてみた。その記録である。 ■結果1.「グーグル」の部分 OK, グーグル　→　OK, グーグル OK, ぐるぐる　→　OK, グーグル OK, ルーブル　→　OK, グーグル OK, フーフフ　→　OK, グーグル OK, シューシュシュ　→　反応なし OK, ルールル　→　OK, グーグル OK, ポータル　→　反応なし OK, 痛風　→　反応なし OK, るんるるん　→　OK, グーグル OK, グーググーグ　→　OK, グーグル OK, ハンバーグ　→　反応なし OK, つるん
- 増田
- ネタ
- google
- Google Home
- あとで読む
- AnonymousDiary
- neta
ディープラーニングの力で誰でもゆかりさんの声になれる声変換技術を作ってみた
- 214 users
- blog.hiroshiba.jp
- テクノロジー
- 2020/12/28
2年ほど前に、自分の声を結月ゆかりにする声質変換技術を作り、動画を投稿しました。この技術には利用者の音声データが大量に必要であるという欠点があり、ゆかりさんになりたいというみなさんの願いを叶えるのが難しい状態でした。そこで、この技術を利用者の音声データが不要になるように改良し、誰でも簡単に使えるようにしました。ここではその技術について解説します。手法　音声を直接変換しようとすると、利用者の音声データが必要になってしまいます。そこで、音声を直接変換するのをやめて、①音声を構成する要素である音素と音高に分解し、②音素と音高を目標の声（ゆかりさん）に再合成することを考えました。 ①は、音素の抽出に音声認識とOpenJTalkとJuliusを、音高の抽出にWORLDを用いれば簡単に実現できます。そのため、②さえ実現できれば、利用者の声のデータを用意することなく、誰でもゆかりさんの声に変換すること
Engadget | Technology News & Reviews
- 213 users
- www.engadget.com
- テクノロジー
- 2016/01/21
Research indicates that carbon dioxide removal plans will not be enough to meet Paris treaty goals
- アプリ
- iOS
- 音楽
- Apple
- あとで読む
- iPhone
- music
- 録音
- app
WindowsのPythonでデスクトップ通知(トースト)作ってみた【WinRT】 - Qiita
- 210 users
- qiita.com/relu
- テクノロジー
- 2022/08/10
from win11toast import toast toast('Hello Python', 'Click to open url', on_click='https://www.python.org') from win11toast import toast toast('Hello', 'Lorem ipsum dolor sit amet, consectetur adipisicing elit. Earum accusantium porro numquam aspernatur voluptates cum, odio in, animi nihil cupiditate molestias laborum. Consequatur exercitationem modi vitae. In voluptates quia obcaecati!')
- python
- windows
- あとで読む
- プログラミング
- Qiita
- 通知
- techfeed
Alexa居酒屋、実証実験開始　音声で注文受付　「以上で」で確定
- 208 users
- www.itmedia.co.jp
- テクノロジー
- 2018/03/19
飲食店を運営するロイヤルダイニングとアプリ開発を行うヘッドウォータースは3月19日、居酒屋にスマートスピーカー（Amazon Echo Dot）を設置し、音声でメニューの注文を行う実証実験を開始した。場所は東京都渋谷区にある「天空の月　渋谷」。「Alexaオーダー席」を予約すると体験できる。「Alexa、飲み物メニューを開いて」と呼び掛けると、「はい、飲み物の種類と個数を教えてください」とAlexaが反応。Alexa向けのメニューから飲み物を選び、「ロックの1番」と伝えると、「ご注文は、黒七夕芋のロックを1杯です。注文を確定する場合は『以上で』とお伝えください。次のご注文をどうぞ」などと確認をしてくれる。注文内容は厨房スタッフにチャットで通知される。オーダー途中に注文をキャンセルしたり、変更したりすることも可能。「やっぱやめた」「メニューや個数の変更」と言うと、対応してくれる。また、
- Alexa
- amazon
- スマートスピーカー
- smartspeaker
- AI
- ネタ
- ITmedia
- あとで読む
- Amazon.com
- 音声認識
初音ミク、エージェントになる？――名工大「MMDAgent」がもたらす未来
- 208 users
- www.itmedia.co.jp
- 暮らし
- 2010/09/22
画面に話しかけると3Dの初音ミクがエージェントとなって答えたり踊ったりする――そんな技術が話題を呼んでいる。画面に話しかけると3Dの初音ミクがエージェントとなって答えたり踊ったりする――そんな技術が話題を呼んでいる。名古屋工業大学国際音声技術研究所（代表：徳田恵一教授）では、内部で開発してきた音声合成ツール、音声認識エンジンや3D技術を用い、音声による指示にキャラクターがモーションと音声付きで応答する音声インタラクションシステム構築ツールキット「MMDAgent」を「CEATEC Japan 2010」（10月5日から、千葉・幕張メッセ）で展示する。9月21日夕方にニコニコ動画で展示内容ムービーを公開し、一夜で再生数2万を超える人気を得ている。名古屋工業大学といえば、楽譜を入力するだけで自然な歌声で歌い上げる歌声合成技術「Sinsy」が昨年末にニコニコ動画で発表されて話題となった。M
- 初音ミク
- VOCALOID
- MMD
- technology
- 技術
- ニコニコ動画
- これはすごい
- MikuMikuDance
- 3D
- MMDAgent
ドコモ専属からフリーとなった「しゃべってコンシェル」がドコモ裏切る : 市況かぶ全力2階建
- 206 users
- kabumatome.doorblog.jp
- テクノロジー
- 2013/11/09
元自民党衆院議員の河村建夫さん(81)、よりによって社名ロンダリング4回で怪しいIR連発中のクオンタムソリューションズの会長に就任へ自社株を担保に借金しているENECHANGE(エネチェンジ)筆頭株主兼社長の城口洋平さん、粉飾決算疑惑による株価下落で追証を喰らい保有株の一部が強制決済される
- docomo
- ネタ
- iPhone
- アプリ
- ドコモ
- twitter
- mobile
- au
- 興味深い
- service
8時間分のテープ起こしに役立ったツール「transcribe」 – TechDoll.
- 205 users
- www.techdoll.jp
- テクノロジー
- 2016/04/20
少し前に、お仕事で数日間に及ぶカンファレンスに行ってきました。特にキーノートには面白い講演が多くて、インスピレーションになりました。さて、いざ講演が終わると私のお仕事本番です。日本語の講演なら、聞きながら起こしてしまうこともあるけれど、英語だとそうもいかないため、永遠に感じられるテープ起こしが始まりました。これまでは、ICレコーダーでそのまま再生したり、Macに取り込んで再生したりしていたのだけれど、英語を起こすならもっと良いツールがあるはずだと思って探してみたのです。今回、8時間分の講演のテープ起こしに役立ってくれたのが「transcribe」というツール。複数形式に対応した音声をアップロードすると、あとはショートカットを使うだけで再生したり巻き戻したりできる。escで停止、F3は3秒巻き戻しといった具合に。だから、キーボードから手を離すことなくテープ起こしができるの。また、再生
スマートスピーカー所有者の65％「以前の生活には戻れない」米消費者調査 - iPhone Mania
- 204 users
- iphone-mania.jp
- テクノロジー
- 2018/01/17
アメリカの18歳以上の消費者の16％がスマートスピーカーを所有していることがわかりました。所有者の65％は「スマートスピーカーのない生活には戻りたくない」と回答し、生活に密着した用途で活用していることがわかりました。2月中に発売されるとの予測もあるAppleのHomePodが、急成長する市場でどこまで存在感を発揮できるか、注目です。アメリカの公共放送局がスマートスピーカーの消費者調査アメリカの公共放送局、NPRと市場調査会社のEdison Researchは、スマートスピーカーに関する調査結果を発表しました。調査は、2017年12月26日から30日に実施した全米の18歳以上の男女1,010人への電話調査と、事前調査でAmazonかGoogleのスマートスピーカーを所有している18歳以上の806人に11月17日から22日に実施したオンライン調査を合算して集計しています。全米の18歳以
音声文字起こしサービス徹底検証　ベストな選択はこれだ！
- 201 users
- xtrend.nikkei.com
- テクノロジー
- 2021/05/11
話した言葉をテキストデータに変換できる「音声文字起こしサービス」。テレワーク時代の情報共有ツールとして大いに役立つものの、気になるのはその実用性だ。発言の認識精度に加え、大まかな流れや会話の文脈を後から振り返るのに使えるのかどうか。主要な7つのサービスを使用し、比較した。 ※日経トレンディ2021年5月号の記事を再構成ディープラーニングやビッグデータの活用が進み、音声認識の精度が大きく向上。話した言葉をテキストデータに変換できる「音声文字起こしサービス」が相次いで登場している。会議の内容を振り返ったり、他の人にシェアしたりなど、テレワーク時代の情報共有ツールとして注目されているこれらのサービスは、どこまで実用的なのか。主要な7つのサービスを実際に使い、比較してみた。
- 文字起こし
- あとで読む
- webサービス
- サービス
- web
- ICT
- データ
- service
SkyWay ― WebRTCを簡単＆柔軟に使えるプラットフォーム
- 198 users
- nttcom.github.io
- テクノロジー
- 2013/12/05
WebRTCは、ブラウザや専用アプリ同士でリアルタイムに映像、音声、データを送受信できる画期的な新技術です。SkyWayを使えば、サーバを準備することなく簡単に、WebRTCを使ったアプリが開発できます。
- WebRTC
- javascript
- skyway
- HTML5
- api
- ブラウザ
- 開発
- Web制作
- サーバ
- development
wav ファイルフォーマット
- 196 users
- www.kk.iij4u.or.jp/~kondo
- 暮らし
- 2005/04/25
'fmt ' チャンク構造体 #define FormatID 'fmt ' /* chunkID for Format Chunk. NOTE: There is a space at the end of this ID. */ typedef struct { ID chunkID; long chunkSize; short wFormatTag; unsigned short wChannels; unsigned long dwSamplesPerSec; unsigned long dwAvgBytesPerSec; unsigned short wBlockAlign; unsigned short wBitsPerSample; /* Note: there may be additional fields here, depending upon wFormatTa
- wav
- ファイルフォーマット
- format
- プログラミング
- sound
- programming
- audio
- 資料
- 音楽
- wave
Engadget | Technology News & Reviews
- 194 users
- www.engadget.com
- テクノロジー
- 2017/11/08
Parrots in captivity seem to enjoy video-chatting with their friends on Messenger
- amazon
- AmazonEcho
- Alexa
- ガジェット
- gadget
- amazon echo
- AI
- 言語
Alexaの音声を聞いてテキスト化するスタッフ、日本のAmazonも募集中　在宅勤務、時給1300円
- 194 users
- www.itmedia.co.jp
- テクノロジー
- 2019/04/15
Amazon.comのAIアシスタント「Alexa」にユーザーが入力した音声の一部をAmazonのスタッフが聞いている――米Bloombergがこう報道し、「盗聴ではないか」と話題になったが、日本でも、Alexaに入力された音声を聞くスタッフがいるようだ。（追記あり）アマゾンジャパンは複数の求人サイトを通じて、Alexaを通して集められた音声データのテキスト化などを行う在宅勤務の契約社員を募集している。テキスト化した音声データにタグを付けるなどして、Alexaの音声認識技術向上に役立てるという。求人サイトによると仕事内容は、Alexaに入力された音声をヘッドセットで聞いてテキスト化し、タグ付けやデータの意味づけなどを行うというもの。ネイティブに近い日本語能力や国語力が必要だ。在宅勤務で、給与は時給1300円。実働8時間のシフト制になっている（1日8時間・月20日間勤務で月額換算20万8
- amazon
- Alexa
- privacy
- あとで読む
- セキュリティ
- AI
- 仕事
Googleが自社で使っている「クラウド機械学習」を一般に開放、こんなスゴイことが簡単にできる
- 193 users
- gigazine.net
- テクノロジー
- 2016/03/24
GoogleがGCP NEXT 2016で、Googleの使うクラウドベースの機械学習プラットフォーム「Cloud Machine Learning」を公開。アプリ開発者が自社のサービスで強力な機械学習機能を利用できるようにしました。 Google Cloud Platform Blog: Google takes Cloud Machine Learning service mainstream https://cloudplatform.googleblog.com/2016/03/Google-takes-Cloud-Machine-Learning-service-mainstream.html Google Cloud Machine Learning at Scale — Google Cloud Platform https://cloud.google.com/produc