並び順

ブックマーク数

期間指定

  • から
  • まで

81 - 120 件 / 408件

新着順 人気順

音声認識の検索結果81 - 120 件 / 408件

  • Googleの新アプリが凄すぎる。リアルタイム文字変換の精度がエグい

    Search, watch, and cook every single Tasty recipe and video ever - all in one place! News, Politics, Culture, Life, Entertainment, and more. Stories that matter to you. Googleの新アプリが凄すぎる。リアルタイム文字変換の精度がエグいGoogleの音声文字変換のAndroidアプリ「Live Transcribe」がすごいのです。YouTubeなどの音源までをも機械学習で取り込み、字幕の精度をあげている同社。今後の展開は、Gmail、Google Driveなどを運営するG Suiteと一緒にビジネス展開もありえるかも…!?

      Googleの新アプリが凄すぎる。リアルタイム文字変換の精度がエグい
    • もはや人間と区別がつかない次元に。多言語で歌う機能も搭載したSynthesizer Vの破壊力|DTMステーション

      驚異的に進化したSynthesizer V AI まずは、バックグラウンドや機能、性能といったものを紹介する前に、私がSynthesizer V Pro Studioの1.5.0を使って打ち込んだ、弦巻マキの歌声をちょっと聴いてみてください。 いかがですか?従来の歌声合成の概念を覆すレベルに来ていると思いませんか?これは、2年前のコミケでDTMステーションCreativeからリリースしたoyasumiという曲の冒頭部分。そのときは声優の小岩井ことりさんにボーカルをお願いし、囁くように優しく歌ってもらったので、弦巻マキにも、それっぽく歌わせて仕上げてみたのです。本来、弦巻マキは「アニメキャラっぽい雰囲気の元気な女の子」というイメージの歌声ですが、そことはだいぶ違ったニュアンスの歌声になっているのも感じられたと思います。 「自動処理」メニューにある「自動ピッチ調整(カスタマイズ)」を選択する

        もはや人間と区別がつかない次元に。多言語で歌う機能も搭載したSynthesizer Vの破壊力|DTMステーション
      • スマホに屁の音を聴かせて検索結果を報告するスレ : BIPブログ

        1 以下、名無しにかわりましてVIPがお送りします 2011/11/10(木) 11:29:00.19 ID:HNZcV12a0

          スマホに屁の音を聴かせて検索結果を報告するスレ : BIPブログ
        • Microsoft Research、「息を吸いながら喋る」ことで周囲に気づかれずに音声入力を可能にするシステムを発表

          Microsoft Research、「息を吸いながら喋る」ことで周囲に気づかれずに音声入力を可能にするシステムを発表 2018-10-17 Microsoft Researchの研究者は、「息を吸いながら」喋る時に出る非常に小さな音を利用した音声入力インタフェースデバイス「SilentVoice」を発表しました。 論文:SilentVoice: Unnoticeable Voice Input by Ingressive Speech 著者:Masaaki FUKUMOTO 本論文は、ingressive speech(吸気発話)法を用いて、非常に小さい音(漏洩音量39dB未満)での音声入力を可能にするシステムを提案しています。静かな場所だけではなく、80dBの騒音環境下においても周囲に気づかれずに音声入力が行えます。 本提案手法は、我々の通常音声やささやき声のように、息を吐きながら喋る

            Microsoft Research、「息を吸いながら喋る」ことで周囲に気づかれずに音声入力を可能にするシステムを発表
          • IFTTTでSiriを連携させるといろいろ便利:iOS版IFTTTがどんどん便利になってます | ライフハッカー・ジャパン

            自動化ツール「IFTTT」のiOS版アプリがリリースされ、すでに多くの人がiOS用の素晴らしいレシピを考案しています。 「iPhone版IFTTTは本当に最強か:『写真』『連絡先』などiOSアプリを使った自動化レシピを作ってみた」でもその一部を紹介しましたが、ここでもう一度何ができるかをおさらいしてみましょう。iOS版で追加されたのは、iOSの「写真」「連絡先」「リマインダー」の3チャンネル。一見大したことではないと思われるかもしれませんが、これら3チャンネルを使って、とっても便利なことができるのです。 いつでもどこでも写真を自動バックアップ IFTTTアプリのいちばんわかりやすい使い方がこれ。iCloud以外の第2のバックアップを自動で作成してくれます。主要なクラウドストレージサービスに対応していて、設定も驚くほど簡単。次のレシピから、1つを設定してみましょう。 Dropboxにバックア

            • iPhone・Androidで高速に日本語音声入力するためのベストプラクティス

              先日Twitterで「大学生がスマートフォンでレポートを書いている」というツイートが話題になっており、それに対して反応している方達もほぼ全員が「スマートフォンでレポートを書くのは効率が悪い」という前提で話をしていることに大変違和感を覚えました。 なぜなら私はこのブログはもちろん、技術書を執筆するときでさえ主にスマートフォンで下書きをしているからです。 PCを使うのは、ほぼスクリーンショットの撮影と最後の仕上げだけです。 その方が、最初からPCで文字入力するのに比べて圧倒的に効率が良いです。 この記事では、iPhoneとAndroidそれぞれで音声入力を効率よくおこなう方法について解説します。 iPhone・iPadの場合 先に結論から申し上げると、iPhone・iPad・Macの日本語音声入力は、AndroidのGoogle音声入力に比べて認識精度が低く、認識できる単語が少ないです。 仕事

                iPhone・Androidで高速に日本語音声入力するためのベストプラクティス
              • DeNA×AI|技術と、革新と、未来と。

                AIを活用した技術の進歩。革新。 幅広いサービスの利用が、当たり前になった昨今、 これからの私たちが、提供できる価値とはいったい何か。 それは、DeNA × AIだからできる 「人」と「テクノロジー」が、組み合わさった未来です。 DeNA × AIが持つ 「意図や思いを汲み取った、質の高い発想力」、 「多岐にわたる経験を元にした、AI、データサイエンスの実践力」、 「複雑なシステムの開発、安定した稼働ができる技術力」など。 それぞれの強みを組み合わせることで、 まだどこにもない「モノづくり」や「コトがら」を、生み出していきます。 ともに、技術の向上を。 ともに、革新の追求を。 ともに、今よりも豊かな未来を。 さあ、DeNA × AIと 新しいモノづくりを一緒に。

                  DeNA×AI|技術と、革新と、未来と。
                • グーグルのAI研究者による「ディープラーニング」無料教育コースがスタート (ニュースイッチ) - Yahoo!ニュース

                  ディープラーニング(深層学習)が無料で学べます! 米グーグルは、脚光を浴びる深層学習をテーマにした3カ月間の無料オンラインコースを始めた。教育サービスをインターネット経由で提供する大規模公開オンライン講座(MOOC=ムーク)の一つで、グーグルやフェイスブックといったテクノロジー企業と協力して講座を提供し、ネット上の「シリコンバレーの大学」とも言われる米ユダシティー(Udacity)上で提供される。世界中どこからでも英語で受講できる。 すでにグーグルは、深層学習ソフトの「テンソルフロー(TensorFlow)」を2015年11月にオープンソース化し、無償提供に踏み切っている。こうした一連の活動で、深層学習の知識や考え方を広く行き渡らせるのが目的という。 このコースは初心者向けではなく、エンジニアやデータサイエンティストなどの中上級者向け。インストラクターはグーグルの主席科学者で、「グーグ

                    グーグルのAI研究者による「ディープラーニング」無料教育コースがスタート (ニュースイッチ) - Yahoo!ニュース
                  • ディープラーニングの仕組みと応用

                    脳の神経回路の構造を模倣 ディープラーニングは、大量のデータを学習するために、人間の脳の神経回路の構造を模倣(モデル化)した情報処理の仕組みであるニューラルネットワークを用いる。図3のニューラルネットワークは、「入力層」「隠れ層」「出力層」という3層で構成している。また、学習データは入力データとなる手書き文字の画素データと、正解データがセットになっている。 このニューラルネットワークのモデルを学習させるには、まず手書き文字画素データをピクセル単位に分割した上で、各ピクセル値を入力層に入力する。図3のモデルでは縦横28ドットで分割していることから、784個が入力層に並ぶ。 入力データを受け取った入力層は、受け取った値に「重み付け」をした上で、後段にある隠れ層のニューロン(神経細胞。CPUのような役割を担う)に伝達する。 同様に隠れ層の各ニューロンは、入力層から受け取った値をすべて加算し、その

                      ディープラーニングの仕組みと応用
                    • 「Amazon Alexa」対応のスマートスピーカーによる残高照会・入出金明細照会の提供開始について(1/2) : 三井住友銀行

                      三井住友銀行のホームページです。口座開設のご案内や、住宅ローン、外貨預金、投資信託等の各種商品・サービスのご紹介、お申し込み方法等を掲載しています。また、インターネットバンキングでは、残高照会や振込の他、外貨預金や投資信託のお取り引きもご利用いただけます。

                      • AIスピーカーに特殊な音で指示 勝手に操作可能に | NHKニュース

                        声で家電製品などが操作できる「AIスピーカー」に特殊な音で指示を送ると、周囲に気付かれることなく、第三者が勝手に操れるとする実験結果を早稲田大学の研究グループがまとめました。直ちに悪用することは難しいものの、今後、より安全性の高い製品づくりが求められるとしています。 これに対し、早稲田大学の森達哉准教授らの研究グループは、人の声を特定の方向にしか伝わらない特殊な音に変換し、AIスピーカーに指示を出す実験を行いました。 その結果、周囲にいる人には何も聞こえないのに、AIスピーカーがスケジュールを読み上げたり通販サイトで商品を検索したりするなど、指示に従って動いたということです。 こうした動作は複数のメーカーの製品で確認されたほか、AIスピーカーを勝手に操る研究は海外でも進められています。 特殊な音を出す装置を用意する必要があるため、直ちに悪用することは難しいものの、声で操作する技術はお年寄り

                          AIスピーカーに特殊な音で指示 勝手に操作可能に | NHKニュース
                        • 類似楽曲検索システムを作ろう - 人工知能に関する断創録

                          もう1年以上かけて音声信号処理の勉強をしてきました(Pythonで音声信号処理)。ここらで具体的なアプリケーションとして類似楽曲検索の実験をしてみたのでレポートをまとめておきます。言語はPythonです。 前に 類似画像検索システムを作ろう(2009/10/3) Visual Wordsを用いた類似画像検索(2010/2/27) という画像の類似検索に関するエントリを書きましたが、今回は画像ではなく音楽を対象に類似検索をやってみたいと思います! 今回作る類似楽曲検索システムは、従来からよくあるアーティスト名や曲名などテキストで検索するシステムや購買履歴をもとにオススメする協調フィルタリングベースのシステムとは異なります。WAVEファイルやMP3ファイルなどの音楽波形そのものを入力とするのが特徴です。たとえば、「具体的なアーティストや曲名は知らないけれど、この曲とメロディや雰囲気が似た曲がほ

                            類似楽曲検索システムを作ろう - 人工知能に関する断創録
                          • 日本語対応した「Siri」でオトナの限界に挑む! (1/5)

                            Siriが日本語に対応したから早速遊んでみた!! 「新しいiPad」の発表に合わせて、日本語版「Siri」も提供が開始された。iOS 5.1にアップグレードすると、iPhone 4Sでのみ利用可能になる。細かいアップデート情報などは、きっとほかのライターさんがやるので、この記事では音声アシスタント機能「Siri」さんと遊んでみたインプレッションをお届けしよう。 「新しいiPad」でも搭載されるという、だいぶ遊べるというか、ものすごくお利口なSiriさんは、アップルのサイト上のPVもを見てもわかるとおり、メール送信や電話発信といったことは、英語版同様に楽々こなしてくれるのだ。 イントネーションがフリーダムで 認識性能がスゴイ まず驚くのは、日本語認識精度の高さだ。多少イントネーションがおかしくても認識してくれるし、「理解できません」というわりには、ちゃんと話した言葉を表示してくれている。たと

                              日本語対応した「Siri」でオトナの限界に挑む! (1/5)
                            • OpenAIが高性能文字起こしAI「Whisper」を発表、日本語にも対応し早口言葉や歌詞も高精度に文字起こし可能

                              画像生成AI「DALL・E 2」や文章生成AI「GPT-3」といった高性能AIを開発してきたAI開発組織のOpenAIが、新たに音声を超高精度で認識して文章に書き起こせるAI「Whisper」を発表しました。発表と同時に公開されたサンプルでは「早口のセールストーク」や「ハイテンポな曲の歌詞」などの音声でも問題なく文字起こしできる性能の高さが示されています。 Introducing Whisper https://openai.com/blog/whisper/ GitHub - openai/whisper https://github.com/openai/whisper Whisperはインターネット上から収集された合計68万時間におよぶ音声データでトレーニングされた文字起こしAIです。OpenAIのブログ記事には「早口のセールストーク」「K-POPの曲」「フランス語」「独特なアクセン

                                OpenAIが高性能文字起こしAI「Whisper」を発表、日本語にも対応し早口言葉や歌詞も高精度に文字起こし可能
                              • 一般向けのDeep Learning

                                PFI 全体セミナーで発表した、専門家向けではなく一般向けのDeep Learning(深層学習)の解説です。どのような場面で活躍しているのか、今までの学習手法と何が違うのかを解説しています。

                                  一般向けのDeep Learning
                                • [速報]AIが人間と自然な会話をし、電話で美容院やレストランを予約。Googleがデモを公開。Google I/O 2018

                                  [速報]AIが人間と自然な会話をし、電話で美容院やレストランを予約。Googleがデモを公開。Google I/O 2018 Googleは、サンフランシスコで開催中のイベント「Google I/O 2018」において、人間のように自然に会話をするAIによって電話で美容院やレストランを予約するデモを公開しました。 Google I/O初日の基調講演でもっとも会場が盛り上がったのは、Googleが「Google Duplex」と呼ぶAIの技術を用いて、AIが実際に美容院やレストランに電話をかけ、予約を行う音声を公開した場面でした。 シナリオとしては、ユーザーがGoogle Assistantに「来週の火曜日、10時から12時のあいだで美容院を予約して」と依頼。 するとGoogle Assistantは依頼を受けてGoogle Duplexの機能を用い、バックグラウンドで美容院を予約すべく電話

                                    [速報]AIが人間と自然な会話をし、電話で美容院やレストランを予約。Googleがデモを公開。Google I/O 2018
                                  • スマートスピーカーについてそろそろみんな気づいてること

                                    ・声で命令するのは思ったよりめんどくさく融通がきかない ・機械に対して声を出すコストは思った以上にでかい ・スマホで命令出したほうが楽 ・機械と会話しても何も面白くない ・現状のレベルの製品はいらない

                                      スマートスピーカーについてそろそろみんな気づいてること
                                    • HTML5 presentation

                                      This presentation is an HTML5 website Press → key to advance. Zoom in/out: Ctrl or Command + +/- Having issues seeing the presentation? Read the disclaimer HTML5* Web Development to the next level *Including other next generation technologies of the Web Development stack Rough Timeline of Web Technologies 1991 HTML 1994 HTML 2 1996 CSS 1 + JavaScript 1997 HTML 4 1998 CSS 2 2000 XHTML 1 2002 Tablel

                                      • 超高精度な国産音声認識AI「ReazonSpeech」が無償公開されたので文字起こし機能を使ってみた

                                        東京に拠点を置くテクノロジー企業「レアゾン・ホールディングス」が、1万9000時間に及ぶ国内最大級の日本語音声コーパス「ReazonSpeech」を無償公開しました。同時に、OpenAIが開発した超高性能音声認識AI「Whisper」に匹敵する性能をアピールする文字起こしサービスも公開されていたので、実際に使ってみました。 超高精度で商用利用可能な純国産の日本語音声認識モデル「ReazonSpeech」を無償公開 - Reazon Human Interaction Lab https://research.reazon.jp/news/reazonspeech.html ReazonSpeech - Reazon Human Interaction Lab https://research.reazon.jp/projects/ReazonSpeech/ レアゾン・ホールディングスは「R

                                          超高精度な国産音声認識AI「ReazonSpeech」が無償公開されたので文字起こし機能を使ってみた
                                        • これはスゴい、Google Homeの同時通訳モードが提供開始 日本でも使える

                                          GoogleがCES2019で披露していたGoogleアシスタントの同時通訳モードの提供が開始されました。 対応機器はスマートスピーカーのGoogle Homeシリーズやサードパーティ製Googleアシスタント内蔵スピーカーの一部、すべてのスマートディスプレイ。日本語を含む26カ国語に対応しますが、同時通訳モードの使用開始には日本語・英語・フランス語・ドイツ語・イタリア語・スペイン語で話しかける必要があります。 使い方は非常にかんたんです。まずは対応デバイスに「OK Google、英語を通訳して」「OK Google、スペイン語からイタリア語に翻訳して」などと言うと同時通訳モードが起動。あとは翻訳したい言葉を話しかけると、通訳を頼んだ言語でGoogleアシスタントが読み上げてくれます。 同時通訳モード中は「OK Google」といったウェイクワードは不要なので、二カ国語間の会話を連続的に通

                                            これはスゴい、Google Homeの同時通訳モードが提供開始 日本でも使える
                                          • Googleの愚直さが作る未来を見誤るな - FutureInsight.info

                                            ちょっと最近改めてGoogleってすごいなと思ったので、まぁ、もう聞き飽きたネタかと思いますが、たまにはGoogleの話を。 YouTubeの黒字化は達成済み説 第27夜のポッドキャストでも述べたのですが、YouTubeが単年度で黒字化したのはどうも間違いなさそうです。ネタ元は以下などに列挙されています。 http://it.blog-jiji.com/0001/2009/11/youtube-9a82.html 黒字化の理由ですが、YouTubeにがっつり半透明の広告が設置されるようになったなどの広告の強化に加えて、多くの人々が予想していた動画ビジネスはその配信コストをまかなうことが広告収入からは出来ないといった予測に対して、Googleがあっさりとその上を行ったという点が上げられます。というのも、現状Googleが動画配信に必要な配信コストが劇的に下がっているのです。Googleが海底

                                              Googleの愚直さが作る未来を見誤るな - FutureInsight.info
                                            • スマートスピーカーを使って業務システムを作る(考察編) - Qiita

                                              前置き この記事は OPENLOGI Advent Calendar 2017- Qiita の12日目です。 ⬆︎こんな感じのを作ります。 こんにちは。株式会社オープンロジの@guai3 と言います。 皆さん! WMS作ってますか 我々は、 未来のWMS を作っています。WMSを知らない人のために説明すると Warehouse Management system の略で、物流のための在庫管理システムです。 興味のある方は、是非とも弊社に遊びに来て下さいね。 今年になってGoogle アシスタント対応アプリを日本語で作ることができるようになったので、今回は Google Home を使って未来のWMSを作ってみましょう! 業務システムとしてのスマートスピーカー スマートスピーカーは家で使う形で現在は特化していますが、業務用途でもかなり活用できるのではないかと私は考えています。 タブレットや

                                                スマートスピーカーを使って業務システムを作る(考察編) - Qiita
                                              • 「Amazon Echo」と「Google Home」を120日使い比べて分かった優劣

                                                「Amazon Echo」と「Google Home」を120日使い比べて分かった優劣:特集・音声言語インタフェース最前線(1/3 ページ) スマートスピーカーを代表する「Amazon Echo」と「Google Home」は何が違うのか、どちらが優れているのか。4カ月以上これらを使い比べてきた筆者が、七番勝負で判定する。 2017年秋から国内でも次々とリリースされ始めたスマートスピーカー。現在市場に出ている製品のうち人気が高いのが、Amazonの「Amazon Echo」と、Googleの「Google Home」という両陣営だ。Amazon Echoは「Alexa」、Google Homeは「Googleアシスタント」という音声アシスタントに対応しており、音声によってクラウドベースのさまざまな操作が行える。 筆者は上記2陣営のスマートスピーカー5製品を一通り入手し、自宅で使用しているが

                                                  「Amazon Echo」と「Google Home」を120日使い比べて分かった優劣
                                                • リアルタイム声質変換ライブラリ「Realtime Yukarin」を公開しました

                                                  はじめにリアルタイム声質変換アプリケーション、Realtime Yukarinを開発し、 OSS(オープンソースソフトウェア)として公開しました。 ここで言う声質変換とは、「誰でも好きな声になれる」技術のことを指します。 好きな声になれる声質変換は夢があって流行りそうなのですが、まだ全然普及していないと思います。 それは現時点で、声質変換を実際にリアルタイムで使えるフリーな仕組みが無いためだと考えました。 そこで、自由に使えるリアルタイム声質変換アプリケーションを作り、ソースコードと合わせて公開しました。 声質変換とは声を変える方法で有名なのは、声の高さや音色を変える手法、いわゆるボイスチェンジャーです。 既存のボイスチェンジャーは、元の声を起点として、変換パラメータを自分で調整する必要があります。 一方ここでの声質変換は、元の声と好きな声を用いて機械学習し、変換パラメータを自動で調整しま

                                                  • スタパ齋藤さんが新・VIERAで遊び倒す! 後編:声を認識、スマホからネコ写真を送受信、タッチペンでお絵描きも! - はてなニュース

                                                    (これまでのあらすじ)物欲番長ことスタパ齋藤さんと一緒に、新しいVIERAの特別研究所へと遊びにきた編集部。スタパさんのネコ様写真を堪能したり「マイホーム機能」を試したりしていたら、「さらにすごい機能を搭載した、もっと新しいVIERAがあるんですよ!」と衝撃の事実が。記事の終わりにはVIERAが当たるプレゼントのお知らせもあります! (※この記事はパナソニック株式会社によるPR記事です) ▽ 4K液晶・有機ELテレビ ビエラ | Panasonic ―― 引き続き、VIERA特別研究所からお届けします。 スタパ よろしくお願いします! ―― 前回の様子はこちら。 ▽ スタパ齋藤さんが新・VIERAで遊び倒す! 前編:ネコ写真&マイホーム機能でご満悦! - はてなニュース(前編) ―― そして後編です! スタパ齋藤さん、パナソニックの中岡さんと、VIERAで遊びたいと思います。 スタパ 何が

                                                      スタパ齋藤さんが新・VIERAで遊び倒す! 後編:声を認識、スマホからネコ写真を送受信、タッチペンでお絵描きも! - はてなニュース
                                                    • Microsoftの音声アシスタント「Cortana」、2021年にフェードアウト 縮小のロードマップ公開

                                                      米Microsoftの音声アシスタント「Cortana」の消費者向けアプリおよびサービスの多くが2021年に終了する。Microsoftは8月1日(米国時間)、「Upcoming changes to Cortana」と題したサポートページでCortanaフェードアウトのロードマップを提示した。 同社はCortanaをOfficeやクラウドサービスなどを含むサブスクリプションサービス「Microsoft 365」のためのAIベースデジタルアシスタント体験として再定義することを理由に、Cortanaサードパーティースキルのサポートを9月7日で終了。21年初めにはiOSおよびAndroid向けCortanaアプリのサポートを終了する。

                                                        Microsoftの音声アシスタント「Cortana」、2021年にフェードアウト 縮小のロードマップ公開
                                                      • しゃべった内容を文章に変換する無料のiPhoneアプリ『Dragon Dictation』

                                                        海外で先に公開され、その認識率の高さで話題となったiPhoneアプリ『Dragon Dictation 』がついに日本語に対応。App Storeで無料で公開されています。 iPhoneに向かってしゃべった内容をテキストに変換してくれるので、タッチパネルでの文字入力が苦手なひとでも、素早くかつストレス無く大量のメモや長文メールを書くことができます。 アプリの初回起動時に、使用規約への承諾などを求められます。アドレス帳の連絡先をアップロードすると個人名の認識率が高くなるようですが、必須ではありません。 こちらが開発元によるデモ動画。 マイクからの音声入力をサーバーに送信して処理するため、Wi-FIまたは3G回線でネットワークに接続している必要があります。 使用法はいたってシンプルで、録音ボタンを押してマイクに向かってしゃべるだけです。 「完了」ボタンをタップするとデータがサーバーに送信され、

                                                          しゃべった内容を文章に変換する無料のiPhoneアプリ『Dragon Dictation』
                                                        • 音声だけで完全な長文が書ける技術、東大教授が開発 ささやき声で“改行”や“修正”などコマンドを入力

                                                          Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 ソニーコンピュータサイエンス研究所(CSL)フェロー・副所長であり東京大学大学院情報学環の暦本純一教授が開発した「DualVoice: A Speech Interaction Method Using Whisper-Voice as Commands」は、キーボードやマウスなどを使用せず、音声入力だけで長い文章が書ける技術だ。文字入力以外のコマンド入力と音声認識ミスによる修正は、通常の声とは別に「ささやき声」で操作する。通常の声とささやき声を使い分ける方法で、ハンズフリーの完全な音声入力を実現する。 音声による文字入力はタイピングに比べて格段に速いため、アイデアを書き留めたり、原稿を素

                                                            音声だけで完全な長文が書ける技術、東大教授が開発 ささやき声で“改行”や“修正”などコマンドを入力
                                                          • 日本の苗字7000傑

                                                            日本の苗字の検索と出自、由来などのコンテンツ

                                                            • 「テープ起こし」に特化した再生ソフト

                                                              音声ファイルを再生しながら議事録をまとめたり、メモを取ったりするときのために、一般的な音楽プレーヤーよりも使いやすい「テープ起こし用」に特化した再生ソフト「Okoshiyasu2」「KeyPlayer」「Contents Creator」の3つを紹介する。 ミーティングやヒアリングをICレコーダーで録音し、それを再生しながら議事録をまとめたり、メモを取ることがある。このとき、どんな再生ソフトを使うと便利だろうか。パソコンで再生するなら、Windows Media PlayerやiTunesのような一般的な音楽プレーヤーよりは、テープ起こしに特化したものを使うほうが便利だ。 今回紹介する「Okoshiyasu2」「KeyPlayer」「Contents Creator」の共通点は、テープ起こしに便利なキーボードショートカットを搭載していることだ。エディタで議事録を書くなど、ほかのアプリケーシ

                                                                「テープ起こし」に特化した再生ソフト
                                                              • Apple、スマートスピーカー「HomePod」を2月9日米国発売

                                                                  Apple、スマートスピーカー「HomePod」を2月9日米国発売
                                                                • 【iOS14】ドアベルなどの音をiPhoneが聞き取って通知する「サウンド認識」 - iPhone Mania

                                                                  イヤホン・ヘッドホンで音楽を聴いていたら、家のチャイムが鳴っているのに気づかなかった。何かいい解決策はないの? iOS14 / iPadOS14から「サウンド認識」機能が追加されました。元々は「アクセシビリティ」に分類されている、聴覚サポート機能の一つです。しかし、iPhoneが聞き取った音を通知してくれる機能は、日常生活で便利に活用することができます。 例えば、イヤホンやヘッドホンで音楽を聴いていると、外部の音を認識しづらくなります。そのため、ドアのチャイムが聴こえなくて応対できない場合があります。「ドアベル」の音を通知するように設定すれば、チャイムの音が聞こえなくて宅配便の荷物を受け取れなかった、といったことを防ぐことができます。「ドアベル」の他にも「水の出しっ放し」などの認識可能な音があるので、お好みで設定することをおすすめします。

                                                                    【iOS14】ドアベルなどの音をiPhoneが聞き取って通知する「サウンド認識」 - iPhone Mania
                                                                  • The Official Microsoft Japan Blog - Site Home - TechNet Blogs

                                                                    すべての Microsoft 製品 Global Microsoft 365 Teams Copilot Windows Surface Xbox セール 法人向け サポート ソフトウェア Windows アプリ AI OneDrive Outlook Skype OneNote Microsoft Teams PC とデバイス Xbox を購入する アクセサリ VR & 複合現実 エンタメ Xbox Game Pass Ultimate Xbox Live Gold Xbox とゲーム PC ゲーム Windows ゲーム 映画とテレビ番組 法人向け Microsoft Cloud Microsoft Security Azure Dynamics 365 一般法人向け Microsoft 365 Microsoft Industry Microsoft Power Platform W

                                                                      The Official Microsoft Japan Blog - Site Home - TechNet Blogs
                                                                    • PCで再生中の音声をWhisperでリアルタイムに文字起こしする - TadaoYamaokaの開発日記

                                                                      PCで再生中の音声をリアルタイムで文字起こしできると、字幕機能がない動画の再生や、外国とのオンライン会議で便利である。 先日、OpenAIが公開したWhisperは、音声ファイルから文字起こしするするツールが提供されているが、リアルタイムで処理するツールは提供されていない。 そこで、Pythonスクリプトで、リアルタイムで文字起こしするツールを作成した。 ループバック録音 SoundCardを使うと、PCで再生されている音声を録音することができる。 pip install SoundCardでインストールする。 import soundcard as sc with sc.get_microphone(id=str(sc.default_speaker().name), include_loopback=True).recorder(samplerate=SAMPLE_RATE, chan

                                                                        PCで再生中の音声をWhisperでリアルタイムに文字起こしする - TadaoYamaokaの開発日記
                                                                      • Amazonの「Alexa」とMicrosoftの「Cortana」が統合 年内に会話可能に

                                                                        AmazonとMicrosoftが、それぞれのAIアシスタント「Alexa」と「Cortana」を相互に呼び出せるようにする計画を発表した。Echo端末に「Alexa、Cortanaを開いて」と言えばCortanaを、Windows端末やAndroidやiOS端末上のCortanaに「Hey Cortana、Alexaを開いて」と言えばAlexaを使える。 米Amazon.comと米Microsoftは8月30日(現地時間)、両社の音声認識AIアシスタント「Alexa」と「Cortana」を年内に相互接続させる計画を発表した。 Amazon EchoなどのAlexa搭載スピーカーに「Alexa , open Cortana」と呼び掛けてCortanaを呼び出すことと、Windows 10やモバイル端末上のCortanaに「Hey Cortana, open Alexa」と呼び掛けてAlex

                                                                          Amazonの「Alexa」とMicrosoftの「Cortana」が統合 年内に会話可能に
                                                                        • マズローの欲求5段階説にはさらに上があった。人類が目指す自己超越とは TransTech Conferenceから | AI新聞=AI Weekly=

                                                                          Googleに挑む男から見たAIの今と未来 PerplexityのAravind Srinivas氏2024/04/09 (火) 公開

                                                                          • 「無料でも結構スゴい!! 文字起こしAIに録画したWeb会議のテキスト化をさせてみた!」――急遽テレワークを導入した中小企業の顛末記(118)【急遽テレワーク導入!の顛末記】

                                                                              「無料でも結構スゴい!! 文字起こしAIに録画したWeb会議のテキスト化をさせてみた!」――急遽テレワークを導入した中小企業の顛末記(118)【急遽テレワーク導入!の顛末記】
                                                                            • ChatGPTのアプリ版すごくね!?

                                                                              モバイルアプリ版に実装されてる音声入出力機能が無課金ユーザーにも開放されたってニュースを見て貧乏人の俺は早速ダウンロードしたわけね。 英会話の練習に使えるみたいなニュースを見てたから興味津々でトライしたわけよ。 そしたらまあ俺の英語力では話すのも聞き取るのもままならず、到底使いこなせる”域”に達してねえなこりゃ、と早々に自分に失望したよ。 はあ、アンインスコするか・・・と思いながら設定ちょろちょろ弄ってたら「Speach」の欄にMain Languageって項目があって、そこがAuto-Detect(自動検出)になってたんよね。 あっこれのせいか!俺の英語力が悪いからじゃなかったんだと思って、Englishに切り替えてもう一回やってみたわけ。 そしたら案の定結果は変わらずさらに落ち込んだ。 で、もうどうでもいいやと思いながら日本語で適当に話しかけたんだよ。 そしたら! なぜか俺が日本語で話

                                                                                ChatGPTのアプリ版すごくね!?
                                                                              • 「Alexa」と「Amazon Echo」が年内に日本に登場

                                                                                ~ Amazon Echoの頭脳、Alexaに話しかけるだけで、質問への回答を聞け、音楽の再生や、 スポーツ結果のチェックなども可能に ~ 2017/10/02 ~ Alexaをともに作り上げ、進化を支えてくださるお客様を対象にした招待制での購入が可能に ~ Amazon.co.jp(以下、Amazon)は、クラウドベースの音声サービス「Amazon Alexa」と「Amazon Echo」を年内に日本に展開し、事前に購入を希望されたお客様には招待制でEchoを購入できるようにすると発表しました。さらにAmazonは、Alexa Skills Kit(ASK)およびAlexa Voice Service(AVS)を日本市場でも展開し、日本のお客様に向けて世界中の開発者がさまざまなAlexaによる音声体験を構築できるよう支援します。 Amazon.comのAlexa担当 バイス・プレジデント

                                                                                  「Alexa」と「Amazon Echo」が年内に日本に登場
                                                                                • iOS 10の新機能のサンプルコード集「iOS-10-Sampler」を公開しました - その後のその後

                                                                                  iOS 10でも大量のAPIが追加されました。が、新しいAPIはどう使うのか、実際に何がどこまでできるのか、といった具体的なところが、英語のドキュメントやWWDCのセッション動画をながめているだけだと正直あまりピンときません。やはり実際にコードを書いて動かしてみるのが一番わかりやすい・・・ということで今年もつくりました! iOS-10-Sampler 恒例の新機能のサンプルコード寄せ集めアプリです。ソースコードは GitHub に置いてあるので、ご自由にご活用いただけると幸いです。 https://github.com/shu223/iOS-10-Sampler 使い方は Xcode 8 でビルドするだけ なので、デザイナーさんやディレクターさんもぜひお近くのエンジニアにビルドしてもらってください。 iOSももうかなり成熟してしまい、話題になる革新的な新機能とか、どの開発者にとっても嬉しい

                                                                                    iOS 10の新機能のサンプルコード集「iOS-10-Sampler」を公開しました - その後のその後