Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 立命館大学とデジタルスピリッツテック社の五十嵐雄也、双見京介、村尾和哉らが発表した論文「Silent Speech Eyewear Interface: Silent Speech Recognition Method using Eyewear with Infrared Distance Sensors」は、口パク(無声発話)による音声入力が行えるメガネ型デバイスと耳掛け型マイクデバイスを提案した研究報告である。 これまでにも口パクで音声入力できるサイレント・スピーチ・インタラクション(SSI)の研究は多数報告が上がっており、例えば、口パクで音声入力できるマスクやイヤフォン、顎下2カ所
OpenAIが高性能チャットAI「ChatGPT」のiOSアプリを公開しました。アプリではChatGPTとチャットできるほか、文字起こしAI「Whisper」を用いた音声入力にも対応しています。 Introducing the ChatGPT app for iOS https://openai.com/blog/introducing-the-chatgpt-app-for-ios ChatGPTの公式iOSアプリは、以下のリンク先で配布されています。 OpenAI ChatGPT on the App Store https://apps.apple.com/app/openai-chatgpt/id6448311069 ただし、記事作成時点ではアメリカでのみ公開されており、日本からアクセスしても「App入手不可能」と表示されてしまいました。 そこで、居住国をアメリカに設定したAppl
macOS 14 Sonomaでは、音声入力を止めることなく、途中でキーボード入力を行うことが可能になりました。詳細は以下から。 Appleは2020年にApple Siliconを搭載したMacを発表以降、Apple SiliconのNeural Engineを利用した「音声入力(Dictation)」機能を強化し、現在Apple Siliconを搭載したMacでは、多くの言語で音声入力リクエストはオンデバイスで処理されるようになっていますが、 Appleシリコンを搭載したMacでは、一般的なテキストの音声入力リクエスト(例えば、メッセージやメモの作成は含まれますが、検索ボックスへの音声入力は含まれません)は多くの言語についてデバイス上で処理され、インターネット接続は必要ありません。また、音声入力できるテキストの長さに制限はなく、タイムアウトもありません。 Macでメッセージや書類を音声
Notionユースケースをnoteで紹介するなど、 活用術を発信する富浦咲野さん。ニューヨークに本社を置くビジネス・インベンション・ファーム『I&CO』でデザイナーとして働く。Notionを、自分なりのカスタマイズでもっと楽しむ彼女なりの方法とは? 全2本立てでお送りいたします。 【前編】気持ちよく仕事を進められる「ホーム画面」の作り方 【後編】Notionに「音声入力」で読書メモ。I&CO 咲野さんのNotion活用法 【プロフィール】 I&CO デザイナー 富浦 咲野 Kendall College of Art and Design グラフィックデザイン学科を学部首席で卒業。卒業後、チームラボにてUI/UXデザイナーとして多様な業界のアプリやWebの制作・企画に携わる。2020年5月よりI&CO Tokyoにデザイナーとして参画。ユーザーの体験設計や情報設計、それを実現するデザイン
はじめに 最近、下記の記事にある、クラウド型コンタクトセンターサービスであるAmazon Connectと、高度な自然言語モデルを備えたフルマネージド型チャットボットであるAmazon Lexを組み合わせて、コールセンター向けAIチャットボットを構築する機会がありました。 【RAG】Amazon BedrockとConnect、Kendraを利用し、社内情報や社外の最新情報などの取り込んだデータをもとに回答するコールセンター向けAIチャットボットを構築してみた Amazon BedrockのClaudeとAmazon Connectを利用し、電話で色々な質問に答えてくれるコールセンター向けAIチャットボットを構築してみた Connectと組み合わせてLexを採用する際、ユーザーからの音声入力について、以下の3つの仕様が理解できていなかったため、ドキュメントや実際に試しながら確認しましたので
こんにちは、あとかです♪ 私は、いつもパソコンから記事を書いています。 皆さんは、いかがですか? 読ませていただいているブログの多くはパソコンから書かれている様な気がします。 一方、スマホから更新されている方も結構いらっしゃるみたいです。 今回は、スマホから記事を更新する話を、スマホで書いてみます。 私はiPhone使用ですので、iOS版アプリ準拠です。 スマホでブログを書くには【はてなブログ】 はてなブログのアプリでは、記事を更新するためのある程度の機能が備わっています。 「下書き」→右下のペンのマーク 記事タイトル、記事本文を別々に書く事ができます。 文字の装飾 テキスト入力時に、下部に「文字数」が表示されます。 写真貼り付け 左のカメラマークをタップすると、「写真」を添付できます。 その部分をスライドさせると、文字装飾のアイコンが並んでいます。 文字列を選択してから、それぞれのアイコ
先日、オンラインでライティング添削を受ける際に、Wordで提出している話を書きました。www.pandamama-eigoikuji.xyz 音声入力を活用していると書いたのですが、塾パパ(id:jukupapa)さんよりこんなコメントをいただきました。 音声入力をしているんですね!ワードでもできるのは知りませんでした。一度やってみたいと思いました。ありがとうございました。 jukupapa 2021/08/25 12:04 そう、そうなのです。 Wordでも音声入力は出来るのですが、我が家は使っていません…( ̄▽ ̄;) 言葉足らずな説明で申し訳ございませんでした。 我が家で行っている音声入力は、 iPadのメモに音声入力 ↓ 長男のパソコンのメアドに送信 ↓ Wordに貼り付け という手間をかけております。 試した結果、これが一番速くて楽だという結論に至ったからです。 Wordに音声入力
私これまで音声入力のマイクを10回は変えてきています。最近ずっと使っていたのは25000円ぐらいそれワイヤレスのタイプで、受信機と送信機に分かれてるやつです。その方が口元にマイクが近づけて気にならないからです。 ところがスマホその他で、外で使うため、Type Cに直接繋がるピンマイク型の有線マイクを使っていたところ、音声入力がとても調子がよいので、家のパソコンを USB に直接つながる安いやつにしてみました。 ADi USB マイク PS4 ボイスチャット Win・Mac 対応 ピンマイク 【差し込むだけで使えて簡単 】 ANOTHER DIMENSION Amazon そうしたところ、もうびっくりするぐらい音声入力ミスがなくなりました。これまで高いコンデンサーマイクやワイヤレスマイクを使っていたのは何だったんだろうと思うぐらい快適です。 結局私がやりたいことは良い品質の音をとるのではなく
Amazonが世界で2億台以上出荷している、Amazon Echoなどのデバイスに搭載されているスマートアシスタント「Amazon Alexa」にユーザーの個人情報や音声入力履歴が流出する脆弱性があることを、2020年8月13日(木)にセキュリティ企業のCheck Point Researchが報告しています。 Keeping the gate locked on your IoT devices: Vulnerabilities found on Amazon's Alexa - Check Point Research https://research.checkpoint.com/2020/amazons-alexa-hacked/ In one click: Amazon Alexa could be exploited for theft of voice history, PI
これまで散々どうやってAndroidからリモートマウスで上手に音声入力をパソコン側に流すかということを工夫してきましたが、最近ふっと気づいたことがあります。それは、ひょっとしてピンマイクがAndroidの音声入力に有効であれば Windows 11の標準の音声入力をピンマイクで使えば、そのままそれですべてが完結ではないかというアイディアです。 もともとWindowsの標準の音声入力はいちいちオンとオフをするときにピッと鳴るのが鬱陶しかったのと、場所がいつも真ん中の下の方に出てきて画面上邪魔になったので使わなくなっていたのですが、どこで変わったのかは分かりませんが、最近、画面の右側に 1回ずらすと、そのままずらしたまま出てくれるので、鬱陶しくなくなりました。 加えてピッという音については消し方がわからなかったのですが、もうこれは初めからパソコンの音声を消してしまえばピッという音も出なくなりま
昨日は、省エネな記事作成方法とデスクワーク方法を提案しました。 www.kyokocanaryblog.com その中で気になられたのは、多分、音声入力についてでは、ないでしょうか? そこで今回は、iPhoneで効率的に音声入力する方法に関してのまとめ記事を書きたいと思います。 音声入力で「効率的に」「簡単に」「長文作成できる」がポイントです。 私自身は、4年ほど前から音声入力を試してきました。iPhoneをはじめ、Android、パソコンで試してみた結果、一番使いやすい方法に落ち着きました。 「効率的に」「簡単に」「長文作成できる」iPhoneの音声入力方法をまとめます。 まず、iPhoneの音声入力の設定をする iPhoneの音声入力に最適なメモアプリをインストール iPhoneで音声入力をやってみる iPhoneの音声入力で句読点や記号、絵文字を入れる方法 iPhoneの音声入力でメ
僕は、キーボード入力が苦手です。とにかく致命的に遅い。 なので、もう十数年、音声入力ソフトを利用して文字入力をしています。 これまで使ってきた有名どころの音声入力ソフトがこちら。 ViaVoice AmiVoice SP AmiVoice SP2 ドラゴンスピーチ 直近まで僕は、Windows用の音声入力ソフトとして「AmiVoice SP2」を利用してきました。 しかし残念なことに、AmiVoiceは2020年3月末日をもってサポートが終了してしまいました。 加えて、他のWindows用の音声入力ソフトにおいても現在、開発が継続されているものはありません。なので、残念ながら「今後も継続して利用できる保証はない」というのが現状です。 下手したら、音声入力ソフト難民もありえる…。 とそんな中、最近教えてもらった音声入力ソフトSokki Voiceが、非常に有能だったので最近よく利用しています
GoogleのPixelが6から7になってスピードがアップしました。 Pixelの音声入力よりも Windows11 の音声入力の方が微妙に同音異義語に対する正確性が上なので、最近はずっと Windows 11の音声入力を使っていたのですが、さすがにPixel 7の音声入力がここまで速くなると多少間違えたとしても、その修正のスピードを考えたらどうもピクセルの方が良さそうです。 どれぐらい速いかと言うと、 Windows 11の場合は入力してから少し考えて修正しながら入力が始まってピッと出てくるのですが、Pixel7の場合には音声入力ボタンを押し、終わった瞬間にほぼリアルタイムで出ます。 まあ、さすがにこれはサーバー側で処理をしてるのか、それとも手元のスマホのチップ側で処理をしてるかの差なのでハードウェアで組み込まれた方にはかなわないのかな?と言った印象です。 遅いけれどもちょっと待ったない
Google keepが便利でたまらないので さらに音声入力などを行なって 歩きながらでもブログの記事を書けないかと 思ったわけなんですが いまいちうまくいかない 何故か 自分は喋るよりも書く方が筆が進みやすいのだと言うことなんですね。 しゃべったことを書きおしてくれるのはいいんですが、一人で喋るのはなかなか難しい。 youtuberの方はすごいですね、カメラを前に一人語りできるんですから。 自分もやり始めたら上手くなるんでしょうけど 自分は今のところ、書くことと考えることが同時に進行してるんですね。 考えながら書いている、書きながら考えている。 思考が遅いと言われればそれまでなんでしょうけど、ペンで書くことにもメリットがあるようにキーボードで入力するのにもメリットがあるのです。 動画向けじゃないな、自分は。そう思いながら書いています。でもねyoutuberの稼ぎっぷりをみたら自分だってで
スマホでブログを書くようになってから数ヶ月が経ちます。 たまにスマホのテザリング機能でパソコンを使いますが、現在はスマホ9:パソコン1くらいの割合になりました。 最近はスマホの小さい画面を相手に打ち慣れた気がします。 でも、老眼による打ち間違いが少なからずあるので、ある日Googleの音声入力を試してみることにしました。 Googleの音声入力とは、文字を打つときの入力方法の選択肢のひとつで、文字打ちの際に出るマイクのマークをタップすると使えます。 *僕のスマホはAndroidですので、iPhoneにGoogle音声入力があるかは不明です。 Googleの音声入力なら思ったり考えたりしたことを口から発し、すんなりと記入されて上手くいくと思いきや、頭にすらすらと思い浮かばないとすぐにタイムアウト。 僕はハリウッド映画でたまにある長回しのシーンで、セリフを言い続ける俳優にはいつも感心しています
ぷれぜん仙人です、 あなたは音声入力、使っていますか?? まあ、私も偉そうに言えるほど たいして"キャリア"はないのですが。笑 以前こちらの記事でお伝えした通り、 音声入力、かなり、使えます。 www.presen-sen-nin.com もはや、音声入力無しの時代には 戻れません・・・。 私の使い方としては、 Twitterとか短い文章を書くときは 今まで通り手打ちでやっていますが、 ブログなどの長い文章では、 7〜8割は音声入力でやっています。 音声入力を使うと、速度が2〜3倍くらい になりますので、生産性が爆上がりです。 で、今日のブログなのですが、 私が音声入力を活用し始めて、 これは便利!と感じた活用場面を お伝えしてみたいと思います。 何かしらの気づきがあれば幸いです! 読書メモでの活用 本は読んだだけで放置!だとまず忘れます。 私は読書ですごく重要だと思っているのは、 本に書
(※これは管理人イチオシの記事です。) 今回は、Windows の任意アプリ上で Google 音声入力をインラインで使う方法を紹介します。 Windows 上での音声入力と言えば、Microsoft 純正の「Dictate」「ディクテーション」といった機能がありますが、Google 音声入力と比べると認識率がイマイチ。 一方の Google 音声入力は認識率は抜群なのに、Windows 上ではブラウザで動作する Google ドキュメントなどでしか(普通の方法では)利用できないのが欠点でした。 しかし、今回紹介する「Android スマホアプリと Windows をうまく組み合わせる」方法を使えば、Windows 上の任意アプリのインラインで Google 音声入力を使えるようになります。 Bluetooth ヘッドセットとの相性も非常に良く、Windows 上で実用的な音声入力を実現で
音声入力でメモを記録できるウェブアプリケーション「voicod」が登場したので実際に使用してみました。 voicod https://voicod.pages.dev/ まずはvoicodのページを開くのですが、voicodはSpeechRecognitionという音声認識APIを使用しているとのことで、SpeechRecognitionに対応しているブラウザで開く必要があります。該当するのはGoogle ChromeやSafariなどということで、今回はGoogle Chromeでアクセスします。アクセスするとマイクの使用許可が求められるので「許可」をクリックします。 このまま音声入力を行うと、テキストとして記録されます。試しに梶裕貴氏がYouTubeに公開している外郎売の朗読を聞かせてみたところ、以下のように記録されました。 漢字やカナへの変換は自動で行われますが、一部おかしな変換結果
本記事では、Google ドキュメントの音声入力を mp3 などの音声データで行う方法について、解説します。 具体的には、以下となります。 Google ドキュメントの音声入力を音声データで行う方法【Windows】 Google ドキュメントの音声入力を音声データで行う方法【Mac】 音声データに限らず、PC上で再生可能な音源-たとえば Youtube などの動画やインターネットラジオ-についても、本記事の内容で、同様に音声入力可能です。 Google ドキュメントで音声データを元に音声入力を行いたい、という場合は、ぜひ、本記事を参考にされて下さい。 Google ドキュメントの音声入力を音声データで行う方法【Windows】 Windows における Google ドキュメントの音声入力を音声データで行う方法ですが、以下となります。 Google ドキュメントの音声入力を音声データで行
Mac でノイズのない音声入力環境をつくる May 3, 2020 ( Feb 11, 2022 更新 ) オンラインミーティングをすることが多いのですが、よく音質がいいとか、どんな設定をしているのかについて聞かれることがあるので記事にしてみました。 TL; DR マイクを用意する Element をインストール BlackHole をインストール RX7 Elements をインストール ノイズ低減のための Voice De-noise プラグインを使うため 自分はセール中に買ったけど、高いので別のノイズ低減プラグインでもいいかもしれないです Element 上で Voice de Noise をノード追加し、出力を BlackHole にする Web 会議などのマイク設定に BlackHole を指定する マイク入力 マイクの選び方 マイクにもコンデンサーマイク、ダイナミックマイクなど
相変わらず毎日せっせと音声入力をしています。今年は少し昨年よりも多めに本を出そうと思ってるので、原稿の執筆にもいそしんでいます。 音声入力に関しては三つを組み合わせて使っています。 基本的には ・アンドロイドからのリモートマウスをメイン にして、タブレットから入力をしているのですが、リモートマウスの場合には、いちいち、これから入力をするよということと、これからこの文字をWindowsに送るよということでボタンを2回押す必要があるので、長文の時にはリモート回すが便利なんですけれども、ほんの1行2行返信をしたいとかあれはちょっとしたリモートマウスが間違って認識した単語を書き換えたいという時には ・Chromeの拡張機能のVoiceIn(中身はGoogle音声入力)をサブ に使って短い文章を入れています。 また、原稿はほとんどGoogleドキュメントで書いているのですが、リモートマウスで間違って
最近の音声入力ですが、 YouTube の関係で Windows パソコンをメインに戻したので音声入力をリモートマウスで行うことが多くなりました。 そしてリモートマウスで行うときにSimejiと Google ですと大きな違いがあって、Simejiの方が句読点が自動で入るのはすごく嬉しいのですけれども、残念ながらSimejiは音声入力のオンとオフを毎回やらないといけないのです。 一方 Google の音声入力は音声入力のボタンをオンにした後でしばらく話をしてると、自動で話が入っていくのでいちいちオフを押す必要がないし、また一番喋り終わった後で音を押さなくても次の文章を入力し始めることができます。 そして最近致命的だったのが、どうもSimejiのサーバーとの連結の相性が良くなくてよくせっかく喋ったのに入力が途中で切れてしまったりサーバーエラーになってしまうことがあるのですが、 Google
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く