並び順

ブックマーク数

期間指定

  • から
  • まで

81 - 120 件 / 1462件

新着順 人気順

音声入力の検索結果81 - 120 件 / 1462件

  • 「若者のパソコン離れ」について - いつか電池がきれるまで

    ちょっと衝撃的な話を聞いた。マジで? PC持ってない(自宅にwi-fiなし)若年層が急増 ↓ スマホテザリングを使ってSwitchなど据置機を遊ぶ人が想像以上にいる ↓ "ギガが減る"のでゲームはDL版よりソフト版のほうが需要が高まってきた & 月末は通信制限で露骨に接続数が減る— tetsu (@metatetsu) November 17, 2019 このtweetが話題になっていました。 そうか、今はそんなことになっているのか……と半ば驚くのと同時に、先日読んだ池上彰さんと半藤一利さんの対談本のなかに、こんな話があったので、「今はそういう時代なんだろうな」とも思ったのです。 fujipon.hatenadiary.com それは、こういう話でした。 池上:半藤さん、いまパソコンが売れなくなったこと、ご存じですか? 半藤:えっ、売れなくなっているんですか。 池上:はい。みんなパソコンの

      「若者のパソコン離れ」について - いつか電池がきれるまで
    • アマゾンのアレクサに「日本の呪文を英語で」言うと『スーパーアレクサモード』になる - FRONTROW

      アマゾンのアレクサには「スーパーアレクサモード」がある。そのためのコードは、あの日本のやつ!(フロントロウ編集部) 多くの家庭で使われるAmazonのAlexa アマゾンが開発したアレクサが2014年に登場してから6年。音声で検索できたり音楽をかけたりできる便利さからは多くの人があがらえず、現在では世界中の多くの家庭で利用されている。 AI(人工知能)であるアレクサはコミュニケーション能力も持ち合わせており、例えば2019年にはイギリスで、家で誰かと不穏なムードになってしまった時に「アレクサ、話題を変えて」と言うと、「『ダイ・ハード』はクリスマス映画に入ると思いますか?」「パイナップルの乗ったピザは20世紀最高の料理の発明ですね。議論を進めて…」といった、当たり障りなくもおもしろい会話のトピックを提供してくれる機能が話題となった。 そしてアレクサには、ある特別な“モード”もあることをご存知

        アマゾンのアレクサに「日本の呪文を英語で」言うと『スーパーアレクサモード』になる - FRONTROW
      • 最新のmacOSに対応し、SoundFlowerのように仮想オーディオ入出力を作成できるオープンソースのユーティリティ「BlackHole」がリリース。

        最新のmacOSに対応し、SoundFlowerのように仮想オーディオ入出力を作成できるオープンソースのユーティリティ「BlackHole」がリリースされています。詳細は以下から。 SoundFlowerはMacで実況放送や曲のリミックスをするさい、配信したくない/取り込みたくないmacOSのシステム音などを切り離し、特定の音声入力とアプリからの音のみを他のアプリに送るための仮想入出力オーディオデバイスを作成してくれるユーティリティアプリで、2014年までオリジナルの開発元のCycling ’74チームがメンテナンスを行っていましたが、その後、米Rogue Amoeba Softwareに譲渡され、Loopbackに吸収されてしまいました。 SoundFlowerは元々オープンソース(MIT)だったため、多くの方がSoundFlowerのポートを公開していましたが、2019年10月、Exi

          最新のmacOSに対応し、SoundFlowerのように仮想オーディオ入出力を作成できるオープンソースのユーティリティ「BlackHole」がリリース。
        • KIRINJIの25周年ライブをブラックマジックデザインのカメラ18台で収録・配信〜「KIRINJIの配信史上、一番良かった」と言っていただきました。 | VIDEO SALON.web | 映像制作・動画編集のための月刊誌ビデオサロンが運営するWebマガジン

          KIRINJIの25周年ライブをブラックマジックデザインのカメラ18台で収録・配信〜「KIRINJIの配信史上、一番良かった」と言っていただきました。 2024年5月25日、LINE CUBE SHIBUYAで開催された「KIRINJI 25th ANNIVERSARY LIVE」は18台ものブラックマジックデザインのカメラで撮影され、生配信されたという。どういうシステムで生配信と収録を行なったのか、制作に携わった監督の大野要介さんと、技術周りを担当した森田良紀さんにお話を伺った。 編集部:一柳  取材協力:Rock oN Company LUSH HUB 写真左・大野要介(sleepycat.studio代表、映像作家、フォトグラファー、プロデューサー) 写真右・森田良紀(株式会社ニルヴァーナ、映像ディレクター、レコーディングエンジニア) KIRINJIをブラックマジックのシステムで撮り

            KIRINJIの25周年ライブをブラックマジックデザインのカメラ18台で収録・配信〜「KIRINJIの配信史上、一番良かった」と言っていただきました。 | VIDEO SALON.web | 映像制作・動画編集のための月刊誌ビデオサロンが運営するWebマガジン
          • Googleが発音のチェックを行う音声認識サービスを開始

            By Prostock-studio Googleが単語の発音チェックを行う新しいサービスを2019年11月14日(木)から開始しました。音声ファイルをAIが認識して文字起こしをしたり、声を出さずに音声入力をしたりと音声認識の技術は日々進化しています。Googleによる発音チェック機能は機械学習を用いた技術となっており、英語学習を格段に効率的にしてくれます。 How do you pronounce quokka? Practice with Search https://www.blog.google/products/search/how-do-you-pronounce-quokka-practice-search/ Google search will now give you feedback on your pronunciation - The Verge https://w

              Googleが発音のチェックを行う音声認識サービスを開始
            • Windowsのショートカットキー「Win+H」でタイピングを不要にする【今日のワークハック】 | ライフハッカー・ジャパン

              メール、企画書、プレゼン原稿、議事録など、ビジネスパーソンには、書く(入力する)仕事がたくさんありますね。 誰もが、「これをスピード・アップできたら」と思いながら、キーボード・マウスを買い替えたり、タイピングを練習したり、たくさん単語登録をしたりと努力しています。 そこで入力作業の速度を上げるために、何よりも決定打となる方法をお伝えします。 今日のワークハック:音声入力機能「Win+H」で文書作成を高速化するそれは音声入力。Windows OSのデフォルト機能ですぐに使える「Windowsキー+Hキー」です。 かつての音声認識精度の低さや、なんとなくの心理的抵抗感から、存在は知っていても利用していないスルーされがちな、音声入力「Win+H」のメリットを解説していきましょう。 「音声入力」は進化し実用できるレベルになったたしかに数年前までの音声入力の精度は、実用とは程遠くフラストレーションが

                Windowsのショートカットキー「Win+H」でタイピングを不要にする【今日のワークハック】 | ライフハッカー・ジャパン
              • オンラインイベント開催のガイドライン

                新型コロナウイルス感染症への対応として、国内外でイベントの中止が相次いでいます。 残念な状況ですが、このような状況だからこそ新たにチャレンジできることはないかと思い、オンラインイベント開催のためのガイドラインを作成してみました。 弊社はビデオ配信やオンラインイベントのプロではありませんが、これまでに多くの技術系コミュニティイベントをサポートし、またそれらのビデオ配信を行ってきました。 この経験をもとに作成したガイドラインです。 このガイドラインが正解だとは思っていません。もっと良いやり方はあるはずです。 ですが、まずは何らかの指針が必要だろうと思い、作成したてみました。 このガイドラインが何らかの形でオンラインでのイベント開催の参考となれば幸いです。 オンラインイベントの開催概要 YouTube Live を用いてビデオ配信を行います やり方によっては、講師もオンラインで参加してもらうこと

                  オンラインイベント開催のガイドライン
                • 秋月謎SoC基板付きケースの購入~解析とLinux(buildroot,Debian)を動かす - honeylab's blog

                  ある晴れた昼下がり こんなツイートを見かけました 【新商品】部品取りに!無線モジュール付きSoc基板+白色プラスチックケース | 1,000円 #秋月電子 https://t.co/XGfEkWo9Qw pic.twitter.com/DNnpWKqidX — あきそく2.0 (@aki_soku) March 17, 2023 へー。中身… うおおおおおお、通販ぽちーーーーー! こんなんかうやろ なんなら今から取りに行きたいわ(いかないけど) https://t.co/dawFBTXHbf pic.twitter.com/D1lpN9w3dK — ひろみつ (@bakueikozo) March 17, 2023 としてTLを眺めていると… 次々に流れてくる購入報告と開封画像 久しぶりに秋月らしい物が… https://t.co/JB5Yvpu6N2 pic.twitter.com/ty

                    秋月謎SoC基板付きケースの購入~解析とLinux(buildroot,Debian)を動かす - honeylab's blog
                  • ヘッドセットでリマインダー音声入力という言霊2.0 - 本しゃぶり

                    唱えたことが現実になる。 これはオカルトではなくテクノロジーの話だ。 常時装着したヘッドセットが人生を変える。 常時装着の有効活用 左耳の前を触ってみよう。きっとそこには「ボタン」がある。 そこにはブームマイクしかないが、という人は右側を触ろう。 本記事はこのボタンを有効活用する記事である。 何も無いとのたまう旧人類は早くヘッドセット常時装着(アップデート)してほしい。 前回の記事への反応で、「読んでAfterShockzを買った」というコメントをわりと見た。記事を書いた者として、せっかく買って常時装着するのなら有効活用してほしい。そこで前回の記事では触れていなかった活用方法、リマインダーへの音声入力の話をする。これは音声アシスタントへの入力端末を常時装着することの、真の価値を感じられる手法である。 これを前回紹介しなかったのは、俺はApple Watchで音声入力をすることが多いからであ

                      ヘッドセットでリマインダー音声入力という言霊2.0 - 本しゃぶり
                    • ChatGPTで英会話レッスンをする|柴田 和祈

                      ChatGPTを使って英会話の練習ができたら良いなと思って色々と試してみました。 Chrome拡張を用いる英会話に必要なのは音声による入出力です。 「Voice Control for ChatGPT」というChrome拡張を使うことでそれが可能になります。 この拡張をインストールした状態で、ChromeでChatGPTを開くと次のような画面になります。 画面下のマイクボタンを押してからPCに向かって喋ると、音声による入力ができます。 マイクボタンの隣にあるセレクトボックスから入力の言語が指定できるので、英語に設定しましょう。 ChatGPT側からの返信も音声で読み上げられます。 設定画面から読み上げ速度の調整もできます。 これだけで、ChatGPTとの英会話が成立します。 注意点としては、こちらからの音声入力ではピリオド(.)や疑問符(?)を入れられないので、複数センテンスは入れられませ

                        ChatGPTで英会話レッスンをする|柴田 和祈
                      • Meta、音声生成AIモデル「Voicebox」発表 ノイズ除去や言い間違い修正、多言語会話など多機能

                        Meta、音声生成AIモデル「Voicebox」発表 ノイズ除去や言い間違い修正、多言語会話など多機能 米Metaは6月16日(現地時間)、新たな音声生成AIモデル「Voicebox」を開発したと発表した。音声の編集、サンプリング、スタイルの設定などを行える。 音声とテキストを入力することで、以下のような音声を出力できる。 入力した声で入力したテキストを読み上げる音声クリップを作成する 録音した音声から犬の鳴き声やブザー音などのノイズを除去する 録音した音声の言い間違いを修正する 1つの言語のスピーチを同じ声のまま別の言語に変換する(英語の音声を仏語に、など) 1つのテキストを多様な声で読み上げる Metaは、Voiceboxで将来的にはメタバース内のバーチャルアシスタントやNPC(ノンプレイヤーキャラクター)が自然な声で話せるようになるとしている。また、自分の声のまま(本来は話せない)外

                          Meta、音声生成AIモデル「Voicebox」発表 ノイズ除去や言い間違い修正、多言語会話など多機能
                        • hidane | チームでのブレストをもっと楽しくカジュアルに

                          気軽なアイデア入力 チャットを打つように たくさんのアイデアを出そう! チャット感覚でかんたんにアイデア入力!他の人が出したアイデアもリアルタイムに表示されるので、アイデアの連想も活発に!さらに、音声入力にも対応しています。 ステップで進行 ステップに沿った進行だから 誰でもスムーズに取り組める! アイデアを出してまとめるまでを、5つに分かれたステップに沿って順番に進められます!また、各ステップに合わせたガイドと機能によって、ワークの脱線も防げます。

                            hidane | チームでのブレストをもっと楽しくカジュアルに
                          • お子さんを持つエンジニアの方、子育て中の自己学習どうしてますか - 週刊はてなブログ

                            いま悩んでいる人にこそ読んでほしい 毎日さまざまな話題のエントリーが生まれるはてなブログの中から「旬な話題」をピックアップする企画「はてなブログで話題」。今回は『エンジニアの子育てと自己研磨』をテーマに記事を紹介します。 2022年10月。IT系エンジニアを中心に「子育てと自己研磨」に関する、とあるエントリーが話題となりました。 子供が産まれて一年半近く経つが、時間が全然取れない。 (中略) モバイルアプリエンジニアはこの先オワコンになると思っており、上辺だけのエンジニアリングの知識では飯を食っていけなくなりそうな気がする。そのためバックエンドをもっと強くやっていくとか、ウェブフロントエンドなど手を広げたいが全然時間が取れない。 32歳、新しい技術を習得する余裕がなく昔取った杵柄でいつまで食えるか不安です - star__hoshi's diary id:star__hoshi さんが投稿

                              お子さんを持つエンジニアの方、子育て中の自己学習どうしてますか - 週刊はてなブログ
                            • AirPodsの片方を交換し、通訳付き会話を行う方法

                              まずお互いのiPhone/iPad上に翻訳アプリ「Google 翻訳」をインストールする。 次にお互いのAirPodsの左右どちらかを交換して装着。 Google 翻訳アプリで「会話」を選択する。 自分が話した場合、翻訳結果として、自分のAirPodsと相手に装着しているもう一方のAirPodsに翻訳結果が音声で返ってくる。 相手が話した場合、相手と交換して装着しているAirPodsに翻訳結果が音声で返ってくる。 完全ワイヤレスイヤフォンだからこそ可能なテクニックだ。 関連記事 Apple、AirPodsで絵文字刻印を提供開始 十二支と“うんこ”含む三十一文字 干支、うんこを含む31文字から1つ選択して、AirPodsのバッテリーケースに刻印できる。 iPhone 2020の同梱イヤフォンはEarPodsかAirPodsを選択可能? AirPods販売台数は前年の倍増か 有線と無線、どちら

                                AirPodsの片方を交換し、通訳付き会話を行う方法
                              • superwhisperでの音声入力を試す

                                superwhisperという、whisper.cppを使った音声入力ができるmacOSアプリケーションを最近使っています。 基本的にはggerganov/whisper.cppのモデルを使って、音声認識しながら文字入力ができるアプリケーションです。 特徴 Whisperの認識精度が高い かなり早く喋っても認識してくれる 日本語も認識してくれるモデルがある 日本語で喋って英語に翻訳してくれる機能もある オフライン対応 有料: サブスク と 買い切り の2種類のプランがある 無料で15分のトライアル、その後は選べるモデルが制限される 公式サイトのデモをみると、かなり早く喋っても認識してくれるのがわかります。 大抵の人にとっては、多分文字入力するよりしゃべったほうが早いぐらいの入力速度が出ると思います。 superwhisper 長文はそこまで得意じゃないけど、1行とか2行ぐらいの文章はかなり

                                  superwhisperでの音声入力を試す
                                • キーボードの「沼」から、プラットフォームの「速度」を考える | 遅いインターネット

                                  いま、この原稿を20gに換装したgateronクリア軸にしたzincで書いている。 配列は、飛鳥配列を40%用にセルフカスタムしたものを使っている。 ………こう言われても、何のことか理解できる人は中々いないだろう。これはキーボードと、キーボードの配列の話だ。 私はここ半年ほどキーボード配列関連の「沼」(マニアのコミュニティ)にはまっている。ここから、沼関連の鉄板ネタを展開することもできるのだが、今回、書きたいのはこの沼の「居心地の良さ」がどのような仕掛けによって成立しているのかについてである。 キーボード配列についての沼は、おおまかに3つぐらいに分かれている。物理配列沼(自作キーボード沼)、ソフト配列沼、タイパー沼の3つである。どの沼もゲーム、マンガ、アニメなどのオタコミュニティより参入障壁が高い。 とりあえず、そのことだけわかってもらえれば、下記は、いささかオタトーク気味な話になるので、

                                    キーボードの「沼」から、プラットフォームの「速度」を考える | 遅いインターネット
                                  • 予算2000円でPCをハイレゾに対応させる-低価格USB-DAC内蔵ヘッドホンアンプの紹介- - ARTIFACT@はてブロ

                                    ※追記:この記事はハイレゾの勧めというより、PCのヘッドホン出力は音質が悪いから、外部USB-DACを使って音質を良くしよう!というもので、この程度の環境ではハイレゾの恩恵を受けられないのではという指摘はよくわかる。自分も、ヘッドホンではハイレゾと普通の音源はそれほど差を感じず、差を感じるようになったのはスピーカーにしてからだった。よく言われる高音ではなく、ヘッドホンでは感じづらい空間表現で大きな違いを感じた。 据置USB-DAC内蔵ヘッドホンアンプは1万円以上とそこそこの価格 PCに接続するUSB-DACというと、こんな感じで、据置型のUSB-DAC内蔵ヘッドホンアンプを勧めることが多い。今なら、この記事にあるように、最近出た比較的安くてコンパクトなiFi-Audio Unoがお勧めだろう。*1 【2023年5月最新】おすすめの据え置き型ヘッドホンアンプ・USB-DAC 特集 種類や選び

                                      予算2000円でPCをハイレゾに対応させる-低価格USB-DAC内蔵ヘッドホンアンプの紹介- - ARTIFACT@はてブロ
                                    • 『The Elder Scrolls V: Skyrim』NPCとの会話AI生成Modをユーザーが開発。「膝に矢を受けた話」をめちゃくちゃ詳しく聞ける - AUTOMATON

                                      『The Elder Scrolls V: Skyrim』(以下、スカイリム)において「NPCの会話自動生成」を実現したユーザーが現れた。YouTubeに動作デモ動画が公開されている。Inworld AIとよばれるAIが用いられているといい、定型文ではなくユーザーが入力したテキストに対して世界観に沿った返答が音声付きで生成される。NPCとの自然な対話を楽しむことができるようだ。 *公式DLC『The Elder Scrolls V: Dragonborn』 『スカイリム』は、Bethesda Softworksが2011年にリリースしたオープンワールドARPG。自由度の高いシステムが魅力のひとつで、プレイヤーは自分が望むようにゲームを進めることができ、自由に世界中を探索することができる。発売から12年を迎える現在に至っても根強く愛され、ユーザーによるMod制作も盛んな作品である。 また、『

                                        『The Elder Scrolls V: Skyrim』NPCとの会話AI生成Modをユーザーが開発。「膝に矢を受けた話」をめちゃくちゃ詳しく聞ける - AUTOMATON
                                      • Zero-shot Learning網羅的サーベイ:CLIPが切り開いたVision & Languageの新しい世界 - エクサウィザーズ Engineer Blog

                                        こんにちは! 画像システムグループで機械学習エンジニアをやっている小島です。 この記事では、今ホットな「Zero-shot Learning」と「Vision & Language」に関する最新情報を、CLIPという研究を起点として網羅的にサーベイをしていきます。このために論文1000本に目を通し、70本程度を記事にしました。 Zero-shotやVision & Languageは、Stable Diffusionに代表される画像生成AIとも密接に関連している技術です。この記事を通して、Vision & Languageの奥深い世界を体感できるでしょう。 注意事項 この記事は非常に長いため、全部読むのに1時間以上かかる可能性があるので、休憩を取りながら、または必要な部分だけ読んでください。各セクションを個別に読んでも問題ありません。 また、文章中の画像は、特別な記載がない限り、引用元の論

                                          Zero-shot Learning網羅的サーベイ:CLIPが切り開いたVision & Languageの新しい世界 - エクサウィザーズ Engineer Blog
                                        • 机の上でいい音を、デスクトップスピーカーの推薦5機種はこれだ

                                          昨今のコロナ禍の影響で在宅ワークの時間が増えたため、本格的なデスクワーク環境を整えた人も多いと思う。そのため、2020年はウェブカメラやPCモニター、さらにはPCそのものも需要が高まり、売れ行きを伸ばした。それらと同様に人気が高まった製品が、PCスピーカーだ。 イヤホンやヘッドホンである程度の代用は可能なものの、長時間に渡って使用するとなると、やはりちゃんとしたスピーカーが欲しくなってくる。ノートパソコン内蔵スピーカーはもとより、コスト優先のPCスピーカーでも音楽を聴き続けるは厳しい。そんな状況を解決すべく、多くの人が良質なPCスピーカーを求めるようになったのだろう。 しかしながら、デスクの上はパソコンやモニター、周辺機器など設置する必要のあるアイテムが多々あり、スペース的にはそれほど余裕があるわけではない。そこで人気を集めたのが、小型で高音質なパワードスピーカーだ。これらの製品は、もとも

                                            机の上でいい音を、デスクトップスピーカーの推薦5機種はこれだ
                                          • GPTのFunction callingを使って自然言語が新たなインターフェースになるかを試してみる | DevelopersIO

                                            GPTのAPIに新機能「Function calling」が追加され、ユーザーの自然言語入力に応じて特定の機能を呼び出し様々なツールとの連携が可能になりました。この記事ではFunction callingを利用して、自然言語がインターフェースになるかの可能性を探ります。 はじめに Function callingという機能がGPTのAPIに新たに追加されました。 Function callingはざっくりいうとユーザーが入力した文字列に応じて特定の関数を呼び出すことができる機能です。 例えば、ユーザーの入力が「Tannerに来週の金曜空いてるか日程調整のメールおくっといて!」だった場合、勝手にGmailを開いてメールを送信する関数を呼び出して処理を実施してくれたり、「5/20のタクシー代600円で経費登録しておいて」と記載すると勝手に経費登録を行う関数が処理を行ってくれるようなイメージです

                                              GPTのFunction callingを使って自然言語が新たなインターフェースになるかを試してみる | DevelopersIO
                                            • リモートワークにおけるビデオ会議にまつわる諸問題について - Kentaro Kuribayashi's blog

                                              新型コロナウィルスへの感染拡大を抑制するための社会的な取り組みとして、リモートワークへの取り組みが急速に進展していきている。リモートワークによる協働を効果的に実行するために、ZoomやGoogle Meetなどのビデオ会議用ツールの利用が進んでいる。 それらのツールなしではもはやリモートワークを有効に実施することは不可能ですらある一方で、まったく課題がないわけではない。というよりもむしろ、課題が山積みである。本エントリでは、リモートワークにおけるビデオ会議に関する課題について素描してみる。 本エントリでは、ひたすらあれやこれやを問題として挙げているので、一見するとリモートワークやビデオ会議に対して全体としてネガティヴな印象を述べているように見えるかもしれないが、まったくそうではない。逆に、これだけ問題があってすらなお、ビデオ会議は便利。ただ、いまよりももっともっとよくできるだろうということ

                                                リモートワークにおけるビデオ会議にまつわる諸問題について - Kentaro Kuribayashi's blog
                                              • 音声認識AIのWhisperをUnreal Engineでリアルタイムに動かすためにやったこと

                                                「Unreal Engine (UE) Advent Calendar 2022 その3」23日目の記事です。 はじめに OpenAIの音声認識AI「Whisper」がすごいらしい。これをUnreal Engineでリアルタイムに動かせるようにしたら応用範囲が広がっておもしろいんじゃないかと思いました。 (「異議あり!」って実際に声に出させたいよね) (NLPアドベンチャーを音声入力で、みたいな夢も広がる) しかし、いざやってみたらいろいろな課題にぶつかりました。この記事は、それらをどう解決したかの記録です。 目次 目標設定:C++とONNX Runtimeで実装する Whisperの処理の全体感 課題と対応 課題1:マイク入力と前処理をC++で実装する 課題2:Whisperの機械学習モデルをONNXにエクスポートする 課題3:ONNXモデルをtransformer&FP16向けに最適化

                                                  音声認識AIのWhisperをUnreal Engineでリアルタイムに動かすためにやったこと
                                                • 最新のmacOSに対応した仮想オーディオ入出力ユーティリティ「BlackHole」を利用して、Googleドキュメントに議事録などの自動文字起こしをしてもらう方法。

                                                  最新のmacOSに対応した仮想オーディオ入出力ユーティリティ「BlackHole」を利用してGoogleドキュメントに議事録などの自動文字起こしをしてもらう方法です。詳細は以下から。 以前、既に開発が終了したCycling ’74チームのSoundFlowerのように、特定のアプリからの音声を他のアプリに送るれる仮想オーディオデバイスをMac内に作成できる仮想オーディオ入出力ユーティリティ「BlackHole」を紹介したさい、WWDCのセッションや議事録をGoogleドキュメントの音声入力に接続することで簡単に文字起こしができるという事を教えていただいたので試してみてください。(コメントでのご指摘ありがとうございます) 設定 まず、文字起こしを行う音源が入ったMacにBlackHoleをインストールし、macOSのAudio MIDI設定アプリからBlackHoleの仮想オーディオデバイス

                                                    最新のmacOSに対応した仮想オーディオ入出力ユーティリティ「BlackHole」を利用して、Googleドキュメントに議事録などの自動文字起こしをしてもらう方法。
                                                  • 中国の「南」の民が「北」の民に抱く“警戒と反骨”…日本人が知らない「もうひとつの中国」を解明する(安田 峰俊)

                                                    中国の社会も歴史も、「南」から見なければわからない――。 『越境の中国史 南からみた衝突と融合の三〇〇年』(講談社選書メチエ)で、歴史学者の菊池秀明氏は、福建・広東・広西などの華南地方こそが中国世界のフロンティアであり、ここに生きる人々の「越境のエネルギー」こそが中国近代史と経済発展の原動力だった、という。 日本人には見えていない、「もうひとつの中国」とは? 言語・民族から歴史まで、「南の中国」を知るルポライター・安田峰俊氏が、その現状と台湾・香港問題の背景を解説する。 中国の”標準語”を音声入力する難しさ 近年、私と中華圏の友人との連絡はもっぱらメッセンジャーアプリを使っている。中国大陸の人は微信(WeChat)、白紙運動に加わるなどした反体制系の中国人はTelegram、在米華人はWhatsAPP、香港人や台湾人はFacebook MessengerかLINE……と、プラットフォームは

                                                      中国の「南」の民が「北」の民に抱く“警戒と反骨”…日本人が知らない「もうひとつの中国」を解明する(安田 峰俊)
                                                    • Metaが音楽生成AIモデルをオープンソースで公開、テキスト&音声入力で誰でも高品質な音楽を作成できるように

                                                      Metaの研究チームが音楽を生成するAIモデル「MusicGen」を公開しました。オープンソースでの公開となっているため誰でも無料でモデルを利用できるほか、作例やデモが公開されており、その品質を実際に確かめることが可能になっています。 [2306.05284] Simple and Controllable Music Generation https://doi.org/10.48550/arXiv.2306.05284 MusicGen: Simple and Controllable Music Generation https://ai.honu.io/papers/musicgen/ MusicGenはChatGPTなどの大規模言語モデルと同様にTransformerを利用したモデルです。言語モデルは文の次の言葉を予測しますが、MusicGenは音楽の次のセクションを予測する仕組

                                                        Metaが音楽生成AIモデルをオープンソースで公開、テキスト&音声入力で誰でも高品質な音楽を作成できるように
                                                      • Webページを閲覧しながらメモが取れるChrome拡張機能3選【今日のライフハックツール】 | ライフハッカー・ジャパン

                                                        ネットで調べて情報をまとめたり、あるいはそれを元にレポートを作成したりといった機会は、ままあるのではないでしょうか。 そんなとき、ブラウザ上でそのままメモを取ることができれば効率的。 まとめやアイデアをその場で書き出しながら、読み進められますよね。 そこで今回は、Webページを閲覧しながらメモが取れるChrome拡張機能を3つご紹介いたします。 それぞれユニークな機能を備えていますので、使いやすいものをぜひお試しください。 アウトライナーでメモが整理できる『Diigo』Screenshot: 山田洋路 via Diigo『Diigo』について、ブックマークツールやハイライターとして認識している方もいると思いますが、今回おすすめしたいのがアウトライナーとしての機能です。 『Diigo』では、ピックアップしたいセンテンスをハイライトして注釈を付ける機能に加え、アウトライナーをページの脇に表示し

                                                          Webページを閲覧しながらメモが取れるChrome拡張機能3選【今日のライフハックツール】 | ライフハッカー・ジャパン
                                                        • スマホだけで仕事が完結!?Word、Excel、PowerPointを統合した新しいOfficeアプリが有能すぎる!|@DIME アットダイム

                                                          一気に導入が進んだテレワークだが、動き出した「働き方改革」への大きなうねりは、今回の事態が終息しても止まらない。自宅はもちろん、いつでもどこでも、場所を選ばずに働ける。そんな働き方が当たり前になる日は、そう遠くないかもしれない。すでに環境も整いつつある。マイクロソフトは今年2月から、これまでモバイル向けに提供してきた「Word」「Excel」「PowerPoint」の各アプリの機能を統合し、これひとつで様々なOfficeファイルを編集できる「Microsoft Office」アプリを正式にリリースした。従来のように複数のアプリを行き来する手間なく、1つのOfficeアプリ上で効率的に作業ができる。その便利な使い方を日本マイクロソフト Microsoft 365 ビジネス本部 プロダクトマーケティングマネージャーの広瀬友美さんに聞いた。 3つのアプリの機能を1つに。さらにスキャンや文字起こし

                                                            スマホだけで仕事が完結!?Word、Excel、PowerPointを統合した新しいOfficeアプリが有能すぎる!|@DIME アットダイム
                                                          • Google Keep(グーグルキープ)の使い方を徹底解説!便利な機能が盛りだくさん | WEBマーケティングの専門ブログ|MARC BLOG

                                                            みなさんはメモアプリを使用していますか? 「使ってはみたけどなんだか難しい」「結局紙に書いてしまう」という方も多いのではないかと思います。 今回ご紹介するGoogle Keep(グーグルキープ)はシンプルなので、直感的に使用できるのが特徴です。 ちょっとしたメモをするために使用するのも良いですし、便利な機能を使ってプライベートやビジネスに活用してみるのも良いですよ。 1. Google Keep(グーグルキープ)とは Google Keep(グーグルキープ)とは、Googleが提供するメモアプリです。WEBブラウザ上で使用することもできますが、iOS版、Android版のアプリが使用しやすいためおすすめです。 iOS版 Google Keep Android版 Google Keep メモアプリはStockやEvernote、最近話題になっているNotionなどたくさんの種類があります。そ

                                                              Google Keep(グーグルキープ)の使い方を徹底解説!便利な機能が盛りだくさん | WEBマーケティングの専門ブログ|MARC BLOG
                                                            • 9m先のスマートフォンを超音波で“攻撃” 人に聞かれずに音声入力も

                                                              Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 ミシガン州立大学、中国科学院、ネブラスカ大学リンカーン校、セントルイス・ワシントン大学による米中の研究チームが開発した「SurfingAttack」は、机などの固体を介した超音波によって、離れた場所に置かれているスマートフォンなどへ音声入力する伝送法だ。 SurfingAttackは、音声コマンドを人には聞こえない周波数帯域に変調し、超音波トランスデューサー(圧電トランスデューサー)を用い、固体を介した振動で信号を送ることで、机の上に置いてあるスマートフォンなどに音声入力する。 人には聞き取れない周波数を用いるため、スマートフォンの近くにいる人に気が付かれず音声入力できる。そのため、持ち主

                                                                9m先のスマートフォンを超音波で“攻撃” 人に聞かれずに音声入力も
                                                              • GeForce RTX搭載PCで動くローカルAI「ChatRTX」刷新。画像認識や音声入力に対応

                                                                  GeForce RTX搭載PCで動くローカルAI「ChatRTX」刷新。画像認識や音声入力に対応
                                                                • iOS16の新機能「iPhoneをウェブカメラ化」する機能が想像以上にスゴい【ベータ版インプレッション】

                                                                  アップルは毎年秋に各製品用のOSをアップデートする。特に2022年に注目なのは、iPhone向けの「iOS 16」だ。 Macとの連携、「ロック画面」の刷新、AIの活用、そして音声入力の使い勝手改善など、多数の新機能が搭載される。7月12日に配信が始まったパブリックベータ版で、その機能をいち早く体験してみると、思わずうならされる有用なアップデートもあった。 ここでは、イチオシの機能に注目して掘り下げてみよう。 なお、この記事は、先日公開された「パブリックベータ版」をもとにしている。開発途上のものなので、動作検証が必要な人以外のインストールや常用は推奨しない。また、記事作成については、画像・動画については特別な許可を受けて利用している。 (1)iPhoneがMacの「ウェブカメラ」に。机の上も同時表示 ビデオ会議向けの「ウェブカメラの画質」は今や多くの人が気にする機能になった。 iOS16で

                                                                    iOS16の新機能「iPhoneをウェブカメラ化」する機能が想像以上にスゴい【ベータ版インプレッション】
                                                                  • 英語学習のためのデジタル環境整備

                                                                    このブログの主目的は、(1)英語教育について根本的に考え直すこと、(2)英語教育現場の豊かな知恵をできるだけ言語化すること、です。このブログでの見解などは柳瀬個人のものであり、必ずしも柳瀬が所属する組織や団体などのものではありません。ブログ管理での技術的理由から「英語教育の哲学的探究2」よりこのブログに移行しました。 なお私が所属する京都大学・国際高等教育院・附属国際学術言語教育センター・英語教育部門のウェブサイトでは、学生さんの自律的な英語学習・使用を支援するための情報を多く提供しています。https://www.i-arrc.k.kyoto-u.ac.jp/english_jp 以下に紹介するのは、私が英語を学んだり使ったりするために使用しているデジタル環境(ウェブサイトやアプリ)の一部です。デジタル環境がそろうと英語を学び・使うことが楽しくなり、ますます英語に習熟することができます。

                                                                    • 日本では一ヶ月かかる論文を海外は7日で書き終える→まさかの”音声入力”がカギ

                                                                      りっく @marudewakaran40 留学先のボスに『日本の研究者は国際会議の論文1本書くのに1ヶ月かけるって本当かい?ウチのスタッフは3日で書いて3日でリバイスして1日かけて最終確認&投稿する、7日のワークと決めている。報告書は鮮度が命だからね』と言われて、そんなことができるのかと思っていたら、(1/2) りっく @marudewakaran40 ある日ラボのスタッフがなにやらブツブツ言っていて『なにしてるのん?』と聞いたら『論文書いてる。打つの面倒だからディクテーション機能で書いてる。これが早いんだよ』と言っていて当時は目から鱗なのん。 最近の私は、口頭で書き殴ってGPTに文法ミス指摘させてるのん(2/2)

                                                                        日本では一ヶ月かかる論文を海外は7日で書き終える→まさかの”音声入力”がカギ
                                                                      • これでフルキーボード。6つのキーでQWERTYが入力できる

                                                                        これでフルキーボード。6つのキーでQWERTYが入力できる2024.01.10 07:00133,430 岡本玄介 視覚障がい者が6つのキーでQWERTY入力できる。 弱視や全盲など視覚障がいのレベルはさまざまですが、健常者と比べるとタイピングによるテキスト入力にはさまざまな苦労があることと思います。 人によっては音声入力を使うかもしれませんし、点字使用者向けキーボードや、手話をテキストに変換するAIというのも存在します。 ゲームパッドみたいなキーボードONECOM Co., Ltd.が作ったのは、スマホサイズの入力デバイス「FINTIN V1」。 メインのボタン6つを押して打鍵しますが、これらの斜め左上・上・斜め右上・斜め左下・下・斜め右下方向への入力がQWERTY配列に対応しています。 Video: official_onecom/YouTube両肩のボタンと併せて使おうコンピューター

                                                                          これでフルキーボード。6つのキーでQWERTYが入力できる
                                                                        • [ここまで進化したChagGPT!] 今日から何がどう変わるのか [2023年11月最新版] - Qiita

                                                                          皆さん初めましてこんにちはこんばんは。スウェーデン在住のエンジニア、Harry(ハリー: https://twitter.com/harrythecode )と申します。 普段はDevOpsエンジニアとして働く傍ら、生成AIの最前線にも繰り出し、ToBやToC向けのアプリケーション開発などにフルスタックエンジニアとして携わっています。 2023年11月7日 日本時間午前3時より、ChatGPTの生みの親、OpenAI社のサム・オルトマンによる講演が行われました。 この中で、多くの人が待ち望んだ様々な機能の実装や改善が行われています。 読むのが辛いよ、って方は以下の一言まとめをどうぞ。 また今回の発表によって何が新しくなって、今後どう変わっていくのか、を現役エンジニア目線でご紹介します。では見ていきましょう。 何が新しいん? GPT-4 Turboの発表: コンテキスト長の拡張: 128,0

                                                                            [ここまで進化したChagGPT!] 今日から何がどう変わるのか [2023年11月最新版] - Qiita
                                                                          • GitHub Copilot Chat 舐めていた - ちなみに

                                                                            marketplace.visualstudio.com GitHub Copilot と直接会話できる Copilot Chat 、皆さん使ってますか? 私は最近まともに使い始めました。 Copilot と言えば補完だけだと思っている人、以前ちょっとだけ触れて使えないと思った人(僕です)、いまのバージョンをもう一度触ってみてください、めっちゃ便利になっている。 www.youtube.com この動画が出来ることを追いかけるのに良さそうなので見てください。 ベースモデルがGPT-4に変わったりとかいろいろ変化はありますが、便利なのは Participant や Context の概念が入ったことだと思います。 Participantは @workspace みたいなやつで、Chat-GPTにおける GPTs みたいなやつ。例えば @workspace ならいま開いているプロジェクトについ

                                                                              GitHub Copilot Chat 舐めていた - ちなみに
                                                                            • DeNA目線で見る 音声変換の最先端 - Qiita

                                                                              (2021年5月13日追記)七声ニーナをリリースしました。DeNAの音声変換をご体験ください。 DeNAのAIシステム部、音声チームの豆谷と申します。私は2020年10月に新卒入社しましたが、2021年の新卒組として記事を書きます。 私は今まで音声合成や距離学習の研究をしてきて、音声変換(voice conversion;VC)については入社後キャッチアップしています。本記事では、DeNAの音声チームが注目する最先端の音声変換技術を紹介し、ユーザの喜びと驚きを生み出したいDeNA視点を交えながら解説します。 想定する読者は、音声変換に興味を持つ方、音声技術を生かして新たなエンタメ作りに挑戦したい方です。特に、 音声変換に関心がある学生がサクッと論文レベルで最先端の音声変換を把握できるようなお得な記事で 読者の「音声変換による新しいエンタメ作りに向けた研究開発の一歩」になる ように努めます。

                                                                                DeNA目線で見る 音声変換の最先端 - Qiita
                                                                              • 生成AIの活用事例 10選|masa_kazama

                                                                                「テクノロジーで人々を適切な医療に案内する」をミッションに、医療プラットフォームを提供しているUbie株式会社の@masa_kazamaです。 この記事は#Ubieアドベントカレンダー5日目にエントリーしています。 今年は生成AI一色の1年でした。Ubieでは、生成AIをプロダクト活用と社内生産性向上の観点で取り組んでいます。(取り組みの詳細は、こちらの記事で紹介しています。) この記事では、社内生産性向上観点で、社内の業務プロセスに溶け込んでいて、なくてはならない使い方になっている事例を10個ご紹介します。その中のいくつかは、実際に生産性が倍以上になっていたり、外部委託のコストが半分になったりしています。この記事が、生成AIを活用している人や活用していきたい人のご参考になれば幸いです。 プロダクト活用にもいくつか事例が出ており、問診の内容を大規模言語モデル(LLM)を活用して要約する機能

                                                                                  生成AIの活用事例 10選|masa_kazama
                                                                                • (マジの)ご家庭にジャービス。完全 Macのみで日本語音声応答するAIを作った|shi3z

                                                                                  Speech-to-speechは、NVIDIAのGPU搭載マシンがあればローカルで音声認識、応答生成、音声合成ができる画期的なオープンソースツールだった。 しかし一つだけ不満があったのは、これが日本語には対応していないということだ。 ワイはコスモポリタンである。 ・・・そう名乗ってしまったから、「そういえばコスモポリタンってなんだろう」と思ってClaude-3に聞いてみた。 コスモポリタンは以下のような意味や用法があります: 1.飲み物としてのコスモポリタン: ウォッカ、クランベリージュース、ライムジュース、トリプルセックを使ったカクテル 1980年代後半に人気が出て、特に映画やテレビドラマの影響で広く知られるようになりました 2.思想・概念としてのコスモポリタン: 世界市民主義、国際主義を表す言葉 国境や文化の違いを超えて、世界中の人々と交流し、理解し合うという考え方 狭い地域や国家の

                                                                                    (マジの)ご家庭にジャービス。完全 Macのみで日本語音声応答するAIを作った|shi3z