並び順

ブックマーク数

期間指定

  • から
  • まで

241 - 280 件 / 2148件

新着順 人気順

音声認識の検索結果241 - 280 件 / 2148件

  • 11月12日はAI音声活用の日、ベビーカーにやさしいまちづくりの日、洋服記念日、皮膚の日、HipHopの記念日、コラーゲンペプチドの日、いいにらの日、パレットの日、“四季”の日、留学の日、等の日&話題 - 風に吹かれて旅するブログ (話題・記念日&ハッピートーク)

    おこしやす♪~ 11月12日は何の日? その時、そして今日何してた? 2023年(令和5年) 11月12日はAI音声活用の日、ベビーカーにやさしいまちづくりの日、洋服記念日、皮膚の日、HipHopの記念日、コラーゲンペプチドの日、いいにらの日、パレットの日、“四季”の日、留学の日、等の日です。 ●AI音声活用の日 AI時代にますます活用が進む 音声認識超入門!: 私たちの生活を圧倒的に便利にする技術 初心者向け解説書 (超入門! シリーズ) 作者:トレンド解説部 Amazon AI音声技術を活用した事業を展開している株式会社CoeFont(コエフォント)が制定。人工知能(AI)による音声技術の進歩と普及を祝い、AI音声技術の重要性を理解し、その新たな活用の可能性を探求するのが目的。また同社は、AI音声技術の発展に貢献する人々に感謝し、記念日をAI音声技術の未来に向けた共有のビジョンを築く場

      11月12日はAI音声活用の日、ベビーカーにやさしいまちづくりの日、洋服記念日、皮膚の日、HipHopの記念日、コラーゲンペプチドの日、いいにらの日、パレットの日、“四季”の日、留学の日、等の日&話題 - 風に吹かれて旅するブログ (話題・記念日&ハッピートーク)
    • GPT-4o のマルチモーダル機能をさっそく試す - Qiita

      1. この記事の内容 OpanAI から 2024.5.15 に新しい大規模言語モデル「GPT-4o」が出たので、以前書いた「GPT-4V に入門してみる」記事と同様の検証をもう一回 GPT-4o でやってみて比較する記事となります 結論から言うと「GPT-4oが圧倒的に強い」です。(わかり切った話ですみません) 2. GPT-4o とは? すでに大量のニュース記事が出ていますので細かく紹介しませんが、以下の公式サイトを貼っておきます。 2-1. 料金 こちらのページを参照されたし 2-2. どのくらいの時点までの知識があるのか? 勿論上にある通りオフィシャルには2023年10月までなのですが、実際どのくらい最近のことまで答えられるのか聞いてみました。 最近の情報まで含めてめちゃくちゃ正確な回答です。いつの間にかWeb検索した情報を踏まえて回答するようになっていました。ハルシオン防止のため

        GPT-4o のマルチモーダル機能をさっそく試す - Qiita
      • EndouMadoka/AITuberStudio · Hugging Face

        AITuber Studio AITuber Studioは、AIを活用したバーチャルYouTuber(VTuber)の制作と配信を支援するアプリケーションです。 主な機能 リアルタイムの音声認識と応答生成 複数のAIモデル(GPT-3.5、GPT-4、Claude、Llama2など)をサポート Live2Dモデルを使用したキャラクターの表示と制御 テキスト読み上げ(TTS)機能 YouTubeライブチャットとの連携 小説モードとゲームモードの搭載 セットアップ 必要なPythonパッケージをインストールします: pip install -r requirements.txt 必要なモデルファイルをダウンロードし、model_assetsフォルダに配置します。 promptフォルダ内のai.txtとai-first.txtファイルを編集して、AIの性格や初期メッセージをカスタマイズします。

          EndouMadoka/AITuberStudio · Hugging Face
        • 教育現場にAIが与える影響とは?メリット・デメリットや事例を解説

          近年急速な技術進化を遂げているAI(Artificial Intelligence:人工知能)。私たちの生活に少しずつ浸透し始め、教育現場に導入されるケースも出てきました。しかし「生徒が自ら考える機会が奪われる」と子どもに対するネガティブな影響も懸念されています。 今回は、AIの活用が教育現場にもたらすメリット・デメリットや活用事例などを紹介します。 教育分野におけるデジタル化・AI活用の現状 まずは、日本の教育分野でデジタル化やAI活用がどれくらい進んでいるのか解説します。 「ICT教育」が加速 近年の教育現場ではパソコン・タブレットなどのデジタル機器やインターネットを活用した「ICT教育」の普及が加速しています。ICTとは「Information and Communication Technology(情報通信技術)」の略称で、たとえばコロナ禍で全国的に展開されるようになったオンライ

            教育現場にAIが与える影響とは?メリット・デメリットや事例を解説
          • 音声認識モデルが大幅にアップデートされたReazonSpeech v2を使い、音声の文字起こしを試してみた | DevelopersIO

            音声認識モデルが大幅にアップデートされたReazonSpeech v2を使い、音声の文字起こしを試してみた はじめに 2024年2月14日に、ReazonSpeechの最新バージョン v2.0が公開されたため、ReazonSpeech音声認識モデルを利用してみました。 ReazonSpeechは、レアゾン・ヒューマンインタラクション研究所が開発した高精度な音声認識モデルを中心とするプロダクト群で、それぞれ以下のような特徴があります。(引用)いずれも無償で公開されています。 ReazonSpeech音声認識モデル: OpenAI Whisper に匹敵する高精度な日本語音声認識モデル。商用利用可 ReazonSpeechコーパス作成ツール: TV録画データ等から音声コーパスを自動抽出するソフトウェアツール。商用利用可 ReazonSpeech音声コーパス: 高品質な日本語音声認識モデル学習用

              音声認識モデルが大幅にアップデートされたReazonSpeech v2を使い、音声の文字起こしを試してみた | DevelopersIO
            • Microsoft Copilot進化!音声対話とビジョン機能で日常をAIアシスト - イノベトピア

              Last Updated on 2024-10-02 10:00 by admin マイクロソフトは2024年10月1日、AIアシスタント「Microsoft Copilot」、Windows 11、Bing検索エンジンの大規模アップデートを発表した。 主な更新内容は以下の通り: Copilotに音声対話機能「Copilot Voice」を追加。英語圏の国々で提供開始。 Copilot Proユーザー向けに「Copilot Vision」を導入。画像や画面の内容を理解し、意思決定を支援。 Windows 11に「Recall」機能を追加。以前閲覧したコンテンツを即座に取り出せる。 Windows 11の検索機能を改善。自然言語での検索が可能に。 Bingに「Bing Generative Search」を導入。複雑な質問に対して詳細な回答を生成。 これらの更新は、AIを活用してよりパーソナ

                Microsoft Copilot進化!音声対話とビジョン機能で日常をAIアシスト - イノベトピア
              • Generative AI Use Cases JP をカスタマイズする方法 | Amazon Web Services

                Amazon Web Services ブログ Generative AI Use Cases JP をカスタマイズする方法 このブログでは、さまざまな 生成 AI を活用したビジネスユースケースをデモンストレーションしている Generative AI Use Cases JP をカスタマイズする方法についてご紹介します。Amazon Bedrock、Amazon Kendra などを利用して、Generative AI Use Cases JP はさまざまなビジネスユースケースを公開しています。 その Generative AI Use Cases JP の Web UI を利用することで簡単に新しいユースケースを追加することが可能です。 このデモンストレーションでは、SQL を記述する工数を削減したいデータアナリストをターゲットに、Amazon Bedrock の 基盤モデル を用い

                  Generative AI Use Cases JP をカスタマイズする方法 | Amazon Web Services
                • 【作業別】おすすめAIデザインツール21選

                  AI ツールは、今まさに私たちの仕事や生活を変えつつあります。本記事では、AI ツールの基礎知識と、デザイン業務に活用できそうな AI デザインツールを厳選して紹介します。 特に Web デザイナーやグラフィックデザイナーのみなさんに向けて、実用的な AI デザインツールを激選しました。画像生成ツールや Web デザインツールだけでなく、デザイン作業全体の効率を高めるための便利な作業効率化 AI ツールも併せて紹介します。 これからデザインを学ぶ人は、Web デザインの基礎についての記事も参考にしてみてください。 目次 AI ツールの原理 AI デザインツールの 3 つのモデル ジェネレーティブモデル 大規模言語モデル(LLM) コンピュータビジョンモデル デザイン作業フロー別AIデザインツールまとめ リサーチ、アイディエーションに使える AI ツール クライアント理解に使える AI ツー

                    【作業別】おすすめAIデザインツール21選
                  • 冷たい行政と苦情ばかりの親 すり減る学童職員「子の安全守れない」:朝日新聞デジタル

                    ","naka5":"<!-- BFF501 PC記事下(中⑤企画)パーツ=1541 -->","naka6":"<!-- BFF486 PC記事下(中⑥デジ編)パーツ=8826 --><!-- /news/esi/ichikiji/c6/default.htm -->","naka6Sp":"<!-- BFF3053 SP記事下(中⑥デジ編)パーツ=8826 -->","adcreative72":"<!-- BFF920 広告枠)ADCREATIVE-72 こんな特集も -->\n<!-- Ad BGN -->\n<!-- dfptag PC誘導枠5行 ★ここから -->\n<div class=\"p_infeed_list_wrapper\" id=\"p_infeed_list1\">\n <div class=\"p_infeed_list\">\n <div class=\"

                      冷たい行政と苦情ばかりの親 すり減る学童職員「子の安全守れない」:朝日新聞デジタル
                    • rinna、日本語特化の基盤モデルを組み合わせた音声認識モデル「Nue ASR」を公開

                        rinna、日本語特化の基盤モデルを組み合わせた音声認識モデル「Nue ASR」を公開 
                      • Fire TVリモコン故障: 娘の苦悩 #故障 - のんべえの気まぐれ

                        いつも読んで頂きありがとうございます。 最近、長女からFire TVのリモコンが効かなくなったと連絡がきました。 YouTubeだけ反応しない 娘のアパートで確認 最後に YouTubeだけ反応しない 娘からこんな連絡が来ました。 YouTube以外は大丈夫らしく、自分で調べて再起動とかいろいろやったけどダメと言ってきました。最後は何も効かなくなってペアリングも出来ない状態に。 そして、こんな返信が おいおい病んでるのか? 多分リモコンが壊れたと思いますが、とりあえずFire TVのアプリがあるのでそれを入れて動くか確認してみろと言いましたがもう面倒だから良いと。 娘のアパートで確認 先週の金曜日に息子が帰省して日曜日に札幌に送って行くついでに娘のアパートに寄りました。娘は仕事でいませんでしたが鍵は息子が持っているので部屋に入ってリモコンが本当にダメか確認します。 Fire TVの再起動、

                          Fire TVリモコン故障: 娘の苦悩 #故障 - のんべえの気まぐれ
                        • OpenAIとロスアラモス国立研究所が提携 マルチモーダルAIの悪用可能性を評価する

                          米OpenAIと米ロスアラモス国立研究所は7月10日(現地時間)、バイオサイエンスの研究現場におけるAIの安全性と有効性を評価するための提携を発表した。「GPT-4o」などのマルチモーダルAIモデルがラボ環境でどのように活用できるかを評価し、特に安全性と有効性に焦点を当てる。 ロスアラモス国立研究所は発表文で、特に生物学的脅威に関するAIの安全性を評価するとしている。最先端のAIモデルが、悪意ある生物学的用途にどのように利用される可能性があるかを理解することに焦点を当てる。これまでもテキストベースのタスクでの評価を実施してきたが、新たな共同研究では、現実的な実験室環境で、マルチモーダルなAIモデルを評価する。 例えば、GPT-4oの音声認識や画像認識機能を駆使して、専門知識がない人でも基本的なバイオ実験操作を安全に行えるようにするための実験を行う。 ロスアラモス国立研究所は、米エネルギー省

                            OpenAIとロスアラモス国立研究所が提携 マルチモーダルAIの悪用可能性を評価する
                          • VRChatでの国際交流に便利 多言語対応の翻訳システム「VRCT」を試してみた

                            VRChatでの国際交流に便利 多言語対応の翻訳システム「VRCT」を試してみた ソーシャルVR「VRChat」では、日本人だけでなく、多くの海外ユーザーが参加し、お互いに交流を楽しんでいます。しかし、大きな問題となるのが「言葉の壁」です。「VRChat」には標準翻訳機能などは用意されておらず、国際交流の際には、自分で日本語以外の言語を話すか、テキストチャットの使用がほぼ必須となっています。 「VRCT」は、この状況を改善することを目標とした、クリエイター(みしゃさん)によるプロジェクト。アバターのチャット欄に、音声をリアルタイム翻訳したテキストを表示できるソフトウェアです。 「VRCT」は、英語や中国語、フランス語、ドイツ語、オランダ語など多数の言語に対応しています。また多くの言葉の“方言”が実装されているのも特徴。例えば英語の場合「イギリス英語」や「アメリカ英語」といった、複数のアクセ

                              VRChatでの国際交流に便利 多言語対応の翻訳システム「VRCT」を試してみた
                            • 研究者たちが描く「ゲーム×AIの未来像」〜書籍刊行記念・スクウェア・エニックスAI部座談会 セクションリーダー編(1)

                              ※2024年4月の組織変更により、旧AI部を含む部門名・職種等に変更がありました。本記事および書籍「スクウェア・エニックスのAI」では、執筆時点の表記を用いております。 関連記事 ・AI部から生まれる、新しいゲームの可能性〜書籍刊行記念・スクウェア・エニックスAI部座談会 若手メンバー編(1)/若手メンバー編(2) Information 詳細・ご購入はこちらから メタAIで「ゲームの面白さ」を追求し続ける 三宅陽一郎氏(以下、三宅):今回は、各分野の柱とも呼べるみなさんに、ゲームAIでこれからのゲーム体験がどう変わっていくのか、その未来像を聞いていきたいと思います。まずは、里井さんが研究を進める「メタAI」の可能性を伺いましょうか。 三宅陽一郎/Youichiro Miyake スクウェア・エニックス AI部 ジェネラルマネージャー 2022年よりAI部ジェネラル・マネージャー。2011

                                研究者たちが描く「ゲーム×AIの未来像」〜書籍刊行記念・スクウェア・エニックスAI部座談会 セクションリーダー編(1)
                              • 【AI】無料で利用可能な革新的性能のAIモデル「GPT-4o」がリリース | EARLの医学ノート

                                ■2024年5月14日にOpenAI社からGPT-4o(oはomni「全て」の略)がリリースされた.この日はGoogleが大規模アップデートを発表する日でもあったが,GPT-4oのその性能と無料開放されたことから完全に霞んでしまったようである(Googleアップデートもかなりのものなので後日別の記事でまとめる).OpenAIは1ヵ月前にGPT-4-turbo-2024-04-09をリリースしてかなり精度アップしていたが,今回はそれを大きく上回るマルチモーダルな大幅アップデートである.Hello, GPT-4o. OpenAI 2024 May 13 https://openai.com/index/hello-gpt-4o/ ■実は,このGPT-4oは事前公開されていた.多数のAIチャットボットを比較できるChatBot Arenaに,4月30日に突然GPT2-chatbotなるものが1日

                                  【AI】無料で利用可能な革新的性能のAIモデル「GPT-4o」がリリース | EARLの医学ノート
                                • No.1155 【グレムリン2―新・種・誕・生―】(1990年日本公開作品) - 08映画缶

                                  【週末息子と見る映画】のKONMA08がお送りする自己満足ブログ 【08映画缶】 間もなく開演です!! No.1155 【グレムリン2―新・種・誕・生―】(1990年作品) 今回はチラシとパンフレットと前売り券です。 《前売り券》 《解説》 あの3つの約束を決して忘れてはいけない。 もし、忘れると―― 1984年――それまで見たことも聞いたこともないクリーチャーが突如スクリーンに出現した。名前はモグワイ。中西部の小さな町に住む発明家が息子のビリーへのクリスマス・プレゼントにと見つけてきた不思議なペット。このペットを飼うには破ってはいけない3つの約束があった。 1.水をかけてはイケナイ。 2.日の光に当ててはイケナイ。 3.夜中12時を過ぎてエサをあげてはイケナイ。 ギズモという名を付けられ一家のアイドルとなったモグワイだが、うっかり水をかけられ、たちまち異常増殖し不注意にも夜中にエサを与え

                                    No.1155 【グレムリン2―新・種・誕・生―】(1990年日本公開作品) - 08映画缶
                                  • 「音声でしか操作できない苦行アクションRPG」発表。作者は『そろそろ寿司を食べないと死ぬぜ!』のただすめん氏、広大なオープンワールドのどこかにある“スイカ”を割る旅を描く

                                    2月26日、『そろそろ寿司を食べないと死ぬぜ!』を手がけたゲームクリエイターのただすめん氏は、新作オープンワールドアクションRPGの画像を公開した。投稿によると、本作は「音声でしか操作できない苦行アクションRPG」ということで、広大な世界のどこかにあるスイカを割ることを目的とした作品だ。 画像によると、「前に」と字幕がついており、プレイヤーが実際に音声入力をすることによってキャラクターを操作することが必須であることが伺える。公式の投稿には、「既に面白い」「配信映えしそう」と好意的なコメントが寄せられた。 まだまだ試作段階ですが、マイク(音声認識)でしか操作できない苦行アクションRPGを作っています。広大なオープンワールド風マップのどこかにある「スイカ」を割る冒険です。 pic.twitter.com/v7YvwECZe7 — ただすめん (@tadasumen) February 26,

                                      「音声でしか操作できない苦行アクションRPG」発表。作者は『そろそろ寿司を食べないと死ぬぜ!』のただすめん氏、広大なオープンワールドのどこかにある“スイカ”を割る旅を描く
                                    • 2023年11月くらいのAWS最新情報ブログとかをキャッチアップする – AWSトレンドチェック勉強会用資料 その2 | DevelopersIO

                                      こんにちは、臼田です。 みなさん、AWSの最新情報はキャッチアップできていますか?(挨拶 社内で行っているAWSトレンドチェック勉強会の資料をブログにしました。 AWSトレンドチェック勉強会とは、「日々たくさん出るAWSの最新情報とかをブログでキャッチアップして、みんなでトレンディになろう」をテーマに実施している社内勉強会です。 このブログサイトであるDevelopersIOには日々ありとあらゆるブログが投稿されますが、その中でもAWSのアップデートを中心に私の独断と偏見で面白いと思ったもの(あと自分のブログの宣伝)をピックアップして、だいたい月1で簡単に紹介しています。 11月と12月はアップデートの量が多いので、それぞれ2回に分けてお送りします。11月後半はre:Inventの新機能リリース真っ只中です!残念ながらあまりにも数が多すぎたので100本までで区切りました。残りの11月分も次

                                        2023年11月くらいのAWS最新情報ブログとかをキャッチアップする – AWSトレンドチェック勉強会用資料 その2 | DevelopersIO
                                      • OpenAIのWhisper, TTS, Assistants APIで長期記憶を持った音声会話型ボットを作る

                                        from openai import OpenAI client = OpenAI() assistant_name = "My AI Assistant" model_name = "gpt-4-1106-preview" instructions = """ あなたは優秀な会話型アシスタントです。 あなたはとてもフレンドリーな性格で常にテンションが高いです。 ### 指示 - 関西弁で話してください。 - 200文字以内で回答をしてください。 """ assistant = client.beta.assistants.create( name=assistant_name, model=model_name, instructions=instructions, ) 今回新たに追加されたAssistants APIを使ってAssistantを作成します。 アシスタント識別子の nam

                                          OpenAIのWhisper, TTS, Assistants APIで長期記憶を持った音声会話型ボットを作る
                                        • iPhoneで日本語のリアルタイム文字起こしができる「WhisperAX」(アスキー) - Yahoo!ニュース

                                          AI関連企業Argmaxは4月5日現在、OpenAIの音声認識AI「Whisper」を利用した文字起こしアプリ「WhisperAX」のベータ版を公開している。対応機種はiPhone、Apple Silicon搭載Macと「Apple Watch Series 9/Ultra 2」。アップルのテスト環境提供アプリ「TestFlight」から試用可能だ。 【もっと写真を見る】 AI関連企業のArgmaxは4月5日現在、OpenAIの音声認識AI「Whisper」を利用した文字起こしアプリ「WhisperAX」のベータ版を公開している。対応機種はiPhone、Apple Silicon搭載Macと、Apple Watch Series 9/Ultra 2。アップルのテスト環境提供アプリ「TestFlight」から試用可能だ。 注意:ベータ版アプリは端末に予期せぬ不具合を起こすリスクもあるため、一

                                            iPhoneで日本語のリアルタイム文字起こしができる「WhisperAX」(アスキー) - Yahoo!ニュース
                                          • 快適なゲームプレイを叶えるNintendo Switchゲームパッドのおすすめモデル - まきし☆blog

                                            皆さん、こんにちは。 今回は、快適なゲームプレイを叶えるNintendo Switchゲームパッドのおすすめモデルについてお話ししたいと思います。 ゲームパッドは、ゲームをプレイする上で欠かせないアイテムです。 Nintendo Switchの Joy-Conは、コントローラーとして非常に優れている一方で、長時間のゲームプレイや、競技性の高いゲームでは、より操作性や快適性を求めることがあります。 そのため、一部のユーザーは、Joy-Conだけではなく、別のゲームパッドを使用することを検討しているかもしれません。 そこで、本記事では、Nintendo Switchにおけるゲームパッドのおすすめモデルについてご紹介します。 これから紹介するゲームパッドは、操作性や快適性に優れており、より充実したゲームプレイを楽しむことができるでしょう。 また、ゲームパッド選びにおいては、個人のプレイスタイルや

                                              快適なゲームプレイを叶えるNintendo Switchゲームパッドのおすすめモデル - まきし☆blog
                                            • 自動文字起こしアプリ・ソフトのおすすめ18選!音声認識とAIを使った文字起こしソフトをPC/スマホごとにご紹介! | リコー

                                              RICOH Smart Support(スマートサポート) 「はたらく」をもっと快適に、リコーの複合機がお手伝いできること。

                                                自動文字起こしアプリ・ソフトのおすすめ18選!音声認識とAIを使った文字起こしソフトをPC/スマホごとにご紹介! | リコー
                                              • 第102回 連載100回記念第2弾「OSSデータベースは100ヶ月後も生き残れるか?」、MySQL 8.3.0のリリース、PostgreSQL最新情報 | gihyo.jp

                                                OSSデータベース取り取り時報 第102回連載100回記念第2弾「OSSデータベースは100ヶ月後も生き残れるか?」⁠⁠、MySQL 8.3.0のリリース⁠⁠、PostgreSQL最新情報 この連載はOSSコンソーシアム データベース部会のメンバーがオープンソースデータベースの毎月の出来事をお伝えしています。前回紹介した連載100回記念セミナー第1弾につづく第2弾について報告します。 連載100回記念第2弾「OSSデータベースは100ヶ月後も生き残れるか?」 前回にお知らせしたとおり、1月27日のオープンソースカンファレンス(OSC)2024 Osaka(大阪開催)にて本連載の100回を記念した企画セミナーの第2弾を実施しました。今回のOSC 2024 Osakaは4年ぶりに展示とセミナーの両方が会場で開催することになり、OSSコンソーシアムメンバに加えてオープンソースソフトウェア協会(O

                                                  第102回 連載100回記念第2弾「OSSデータベースは100ヶ月後も生き残れるか?」、MySQL 8.3.0のリリース、PostgreSQL最新情報 | gihyo.jp
                                                • ソースネクスト、留守電をテキスト化する「スマート留守電」に海外の発信元を警告する機能を追加

                                                  ソースネクストは3月15日、留守電テキスト化サービス「スマート留守電」に国際電話番号の発信元を警告表示する機能を追加した。 本サービスは、音声認識エンジンで留守電音声を自動で文字に起こして、登録したLINEアカウントやメールアドレス宛に音声とテキスト化したメッセージを自動転送するものだ。発信元番号がユーザー電話帳に未登録でも、法人電話帳データベースと連携して発信元名を表示できるようになっている。 今回は、ユーザー電話帳や法人電話帳データベースに載っていない発信元について、イラストアイコンで見分ける機能を拡充。特殊詐欺にも悪用されやすい国際電話番号を赤いアイコンで警告表示するようになった。 お得な1年/3年ライセンスも登場 スマート留守電は従来、月額契約(Google Play決済では月額319円、App Store決済では月額360円)を基本としてきた。今回、より手頃な「年額ライセンス」が

                                                    ソースネクスト、留守電をテキスト化する「スマート留守電」に海外の発信元を警告する機能を追加
                                                  • OpenAIのWhisperでAI文字起こし!価格・使い方を解説

                                                    近年、AI技術の進歩が著しく、AIを活用した文字起こしサービスの幅も広がっています。 そんな中で、OpenAIが開発した「Whisper(ウィスパー)」という文字起こしサービスをご存じですか? 本記事では、Whisperの概要や利用料金を紹介しています。 また、Whisperの具体的な使用方法や、Whisperを搭載したおすすめツールであるSEOに強いAIライティングツール「トランスコープ」の文字起こし機能についても、実際の生成結果を掲載しております。 本記事を参考にすることで、Whisperを用いた効果的な文字起こし方法が身につくでしょう。 特に、ビジネスやインタビューの音声を迅速にテキスト化したいと考えている方には、本記事が非常に役立つと考えられます。 ご興味のある方はぜひ、最後まで目を通していただければ幸いです。 Whisperとは 引用元:Whisper Whisperは、高度な音

                                                      OpenAIのWhisperでAI文字起こし!価格・使い方を解説
                                                    • AIが誤変換する鹿児島弁、速記が頼り…鹿児島県議会事務局「AIにはまだ難しい」(読売新聞オンライン) - Yahoo!ニュース

                                                      かつて、国会や地方議会で欠かせない技術だった速記を廃止する動きが広がる中、鹿児島県議会は速記を維持し続け、県内では後継者の育成に取り組む。音声をAI(人工知能)で文字にする「音声認識システム」の導入を始める自治体も出ているが、同県議会は、AIがくみ取れない鹿児島弁の独自性を重視している。(小園雅寛) 【写真】「はっかぶりそうだ」⇔「吐きそうだ」、鹿児島弁翻訳AI

                                                        AIが誤変換する鹿児島弁、速記が頼り…鹿児島県議会事務局「AIにはまだ難しい」(読売新聞オンライン) - Yahoo!ニュース
                                                      • 1日3時間労働のフリーランスライターが、GPT-4などのツールで収入を50%以上増やした方法

                                                        2022年、バンクーバーに住むフリーランスライターのトニー・ドン(Tony Dong)氏は、週に約30時間働いて1年間に14万9000カナダドル(約1600万円、1カナダドル=107円換算)の年収を稼いだ。 会社を辞めて2022年3月からフリーランスになったばかりであることを考えれば好業績だったが、彼は収入の頭打ち感を覚えていたという。 「行き詰まっていました。選択肢は、労働時間を長くして収入を増やすか、仕事の効率を高めるかのどちらかでした」 長時間働くのはイヤだった。ということは、同じ時間で書く記事を増やす方法を考え出さなければならなかった。 ドン氏は、GPT-4などのツールのおかげで、2023年に収入を50%以上増やすことに成功した。2023年の年収は23万8000カナダドル(約2500万円)になる見込みだ。しかも労働時間は減っているにもかかわらずだ。Business Insiderは

                                                          1日3時間労働のフリーランスライターが、GPT-4などのツールで収入を50%以上増やした方法
                                                        • 「コクヨの役員だったらGPTで何する?」で語られた活用アイデアとは? | Web担当者Forum

                                                          多くの企業が生成AIの活用を模索する中、コクヨでは、人材教育・実践プログラム「KOKUYO DIGITAL ACADEMY(コクヨ デジタル アカデミー)」から生まれた、GPTアイデアの実践経験の場「GPT-Lab(ジーピーティー ラボ)」の第1期成果発表会が2024年4月11日、東京・品川オフィス「THE CAMPUS」で開催された。 第一部では、参加者59名(5チーム)による生成AI活用事例の成果発表会が行なわれ、第二部では、社外ゲストを迎えて「コクヨの役員だったらGPTで何する?」をテーマにパネルディスカッションが実施された。 第一部:発表会 社内研修プログラムで非エンジニア社員たちが16個の「生成AI業務アプリ」を開発「GPT-Lab」は、GPTアイデアの実践経験の場として、コクヨグループ社員向けのデジタル人材教育・実践プログラム「KOKUYO DIGITAL ACADEMY」(2

                                                            「コクヨの役員だったらGPTで何する?」で語られた活用アイデアとは? | Web担当者Forum
                                                          • Whisperを使ってYouTube字幕ファイルの作成がこれほど簡単だったなんて! - uepon日々の備忘録

                                                            少し前のエントリでYouTubeから音声データをダウンロードするといった内容のことをやっていたのですが、それならその音声データをWhisperに入力し、生成された音声解析のテキストデータをYouTubeの字幕ファイルに変えてみたらどうなるかなと思っていました。Whisperのログ出力はほぼそのままでも字幕ファイルフォーマットであるSRTファイルに近い出力フォーマットになっているからです。 uepon.hatenadiary.com ただ、そのまま取り出した文字データはタイムコードのないモノになるので、後で処理を行うと面倒なことになります。今回はWhisperを使用し、ログファイルとして出力されたデータをファイル化してYouTubeでも使用可能な字幕データにしてやろうという試みです。 Whisperとは? Whisperは```OpenAI社のは音声認識と機械翻訳のサービスになります。詳細は

                                                              Whisperを使ってYouTube字幕ファイルの作成がこれほど簡単だったなんて! - uepon日々の備忘録
                                                            • No.939 【インディ・ジョーンズ/最後の聖戦】(1989年日本公開作品) - 08映画缶

                                                              【週末息子と見る映画】のKONMA08がお送りする自己満足ブログ 【08映画缶】 間もなく開演です!! No.939 【インディ・ジョーンズ/最後の聖戦】(1989年作品) 今回はチラシとパンフレットと前売り券です。 《前売り券》 《解説》 いま聖杯をめぐり、 父と息子のアドベンチャーが、 ここに始まる。 世界中の映画ファン…いや全世界の人々を興奮のるつぼに叩き込んだあのインディ・ジョーンズが三度帰ってきた!世界の映画界における最高のゴールデン・コンビジョージ・ルーカス&スティーブン・スピルバーグが生み出した無敵のヒーロー、考古学者にして無類の冒険家、我らがジョーンズ博士の新たしい活躍だ。 【レイダース/失われた《聖櫃》】ではヒトラーが台頭して来た1936年を背景に旧約聖書に登場するアーク《聖櫃》をめぐってナチス・ドイツと対決。一方【魔宮の伝説】では遡ること一年前の上海やインドを舞台にこれ

                                                                No.939 【インディ・ジョーンズ/最後の聖戦】(1989年日本公開作品) - 08映画缶
                                                              • OpenAI APIの料金体系 | Hakky Handbook

                                                                OpenAI API の料金体系はじめに​OpenAIは、GPT-4などの先進的なAIモデルを提供しています。これらのモデルは、自然言語処理・画像認識・音声認識など、さまざまなタスクに使用できます。OpenAIでは、最初の3ヶ月間で使用できる5ドルの無料クレジットを提供しており、その後は使用したリソースのみを支払う料金体系を採用しています。この記事では、OpenAI APIの各モデルの料金体系について詳しく解説します。 ご紹介するのは、OpenAIの公式サイトに掲載されている(2023年8月3日時点)以下のモデルです。 GPT-4GPT-3.5 TurboFine-tuning modelsEmbedding modelsDALL·EWhisper尚、その他の旧モデル(非推奨/廃止予定)についても同公式サイトにてご確認いただけます。 OpenAI API 言語モデルの料金​OpenAI A

                                                                • 顔の映像から心拍・血圧などをAI解析 ⽇本と台湾スタートアップ3社が提携、PLEN Cubeと画像解析技術の連携で健康管理DXを開発 - ロボスタ ロボスタ - ロボット情報WEBマガジン

                                                                  PLEN Robotic、SS SAICHIと台湾のSGAItekは、画像解析による健康管理サービスの実現に向けて技術業務提携することに合意した。 具体的にはPLEN Roboticsが開発したエッジAI搭載カメラ端末「PLEN Cube」にSGAItekの画像解析プログラム「FACARE」を連携させ、約8秒の顔の映像データから血管の変化を捉え、呼吸、心拍、血圧、血中酸素などの生理パラメータを測定することにより、非接触かつスピーディーな健康管理サービスのDXが可能となる。 本サービスは、介護や建設現場など、さまざまな分野で利用されることが予想されている。 画像解析プログラム「FACARE」 「FACARE」は血液中のヘモグロビンが緑色光を吸収する性質を利用し、画像解析により、血管の拡張及び収縮を計測するソフトウェアプログラムです。「FACARE」は血圧、心拍数、発熱、血糖値、血中酸素など多

                                                                    顔の映像から心拍・血圧などをAI解析 ⽇本と台湾スタートアップ3社が提携、PLEN Cubeと画像解析技術の連携で健康管理DXを開発 - ロボスタ ロボスタ - ロボット情報WEBマガジン
                                                                  • 2023年にMicrosoftが非推奨にしたWindows 10/11の機能、何か使ってる? | スラド IT

                                                                    Microsoft が 2023 年に Windows クライアントで非推奨とした機能を Neowin の記事がまとめている。 もともと Microsoft Learn の記事でまとめられているものではあるが、スラドでもその多くを取り上げていたのでまとめてみよう。 32 ビット Arm 用のユニバーサル Windows プラットフォーム (UWP) アプリケーション (2023 年 1 月) Microsoft サポート診断ツール (MSDT) (2023 年 1 月) Windows の Cortana (2023 年 6 月) TLS 1.0 と 1.1 (2023 年 8 月 1 日) AllJoyn (2023 年 8 月 17 日) ワードパッド (2023 年 9 月 1 日) Vbscript (2023 年 10 月) Microsoft Entra アカウントのタイムライ

                                                                    • ルネサスの独自開発RISC-V CPUコアの衝撃、その狙いを読み解く

                                                                      ルネサス エレクトロニクスが2023年11月30日、独自開発の32ビットRISC-Vコアを発表したことが、半導体業界で注目を集めることとなった。外部からCPUコアを調達するのではなく、自前で用意する動きを見せた背景にはどのような意図があるのか、公になっている情報を中心に読み解いていってみたい。 ルネサスが独自開発した32ビットRISC-Vコアの機能ブロック図 (出所:ルネサス) 水面下で長年RISC-Vと向き合ってきたルネサス RISC-Vが日本で注目を集めるようになったのは2017年12月に開催されたワークショップ「RISC-V Day 2017 Tokyo」の前後ではないかと思われる。当時、同ワークショップに参加されたHisa Ando氏のレポートでは、立ち見も出る盛況ぶりであったと記されているほどの注目を集めた。折しも2016年にソフトバンクグループがArmの買収を実施。Armアーキ

                                                                        ルネサスの独自開発RISC-V CPUコアの衝撃、その狙いを読み解く
                                                                      • [電話対応無人化] 「はい」「いいえ」を聞き取るAmazon Lexボットを作成し、Amazon Connectフローから呼び出す | DevelopersIO

                                                                        はじめに Amazon ConnectでAIによる電話の自動応答を実装する場合、以下のように「はい」「いいえ」を聞き取る機会があります。 ユーザーの発話内容を復唱した際、問題ないか「はい」「いいえ」で確認 発信元番号から本人確認時、「はい」「いいえ」で確認 今回は、「はい」「いいえ」を聞き取るAmazon Lexボットを作成し、Amazon Connectのフローから呼び出してみます。 Lexについて Lexは、Alexaと同じテクノロジーを利用したチャットボット向けの会話型 AIサービスで、音声やテキストを使用してあらゆるアプリケーションに対話型インターフェイスを構築可能です。 自然言語理解(NLU)と自動音声認識(ASR)を用いて、ユーザーの発話から意図(インテント)を理解し、適切な応答を返します。 今回のユースケースでは、「はい」「いいえ」という限定的な応答を判定するため、比較的シン

                                                                          [電話対応無人化] 「はい」「いいえ」を聞き取るAmazon Lexボットを作成し、Amazon Connectフローから呼び出す | DevelopersIO
                                                                        • AIリライトツールの革命:時間とコストを劇的に削減する最新テクノロジー

                                                                          文章作成の効率を飛躍的に向上させるAIリライトツール。その驚くべき機能と利点について、詳しく解説します。 >>>AIリライトツール ブレインライターの詳細はこちら<<< AIリライトツールが変える文章作成の未来 AIリライトツールは、文章作成の世界に革命をもたらしています。その驚くべき機能と利点を見ていきましょう。 驚異的な時間短縮:数分で高品質な文章を生成 コスト削減:外注費用を大幅カット 24時間稼働:締め切りに追われる心配なし SEO対策:検索エンジン最適化を自動で実現 品質の一貫性:疲れを知らないAIが安定した品質を提供 多言語対応:グローバル展開も容易に プラグイアリズム回避:オリジナリティの高い文章を生成 ユーザーフレンドリー:専門知識不要で誰でも簡単に使用可能 カスタマイズ性:ブランドの声を反映した文章作成が可能 AIリライトツールは、文章作成の効率を劇的に向上させる革新的な

                                                                            AIリライトツールの革命:時間とコストを劇的に削減する最新テクノロジー
                                                                          • 書籍『2035年の人間の条件』で落合先生が言っている「ヒュッとやるとだいたいできてる」をやってみた - karaage. [からあげ]

                                                                            2035年の人間の条件 AI研究者のshi3zさんが「AIが浸透すると人類はネコになる!?暦本vs落合のぶっ飛び対談本」という記事で紹介していた本、暦本先生と落合先生の対談ということで面白そうなので買ってみました。 2035年の人間の条件(マガジンハウス新書) 作者:暦本純一,落合陽一マガジンハウスAmazon 全体的に面白かったのですが、そのなかで目を引いたのが序盤のこちらの記載。 落合  音声のほうが速いですね。最近は展覧会の計画を立てるときも、チャットGPTのアプリに向かって喋りながら会場を歩いて回るんですよ。「最初の部屋の左には○○を置いて、その先は××にしようかな」とか何とかブツブツ喋る。帰ってきてヒュッとやると、だいたい展示計画ができているわけです。 「ヒュッとやるって何!?」と思ったのですが、ChatGPTとおしゃべりした内容をドキュメントにするっていうのは結構便利そうで面白

                                                                              書籍『2035年の人間の条件』で落合先生が言っている「ヒュッとやるとだいたいできてる」をやってみた - karaage. [からあげ]
                                                                            • 音声で手軽に登録するToDoリストのシステムをつくる - Qiita

                                                                              ToDoリストって仕事なら多少面倒でもやるんだけど、 プライベートのちょっとした買いものリストのメモとか、割引券やポイントの有効期限とか、 家庭内でやらないといけないことのToDoリストって、登録すること自体が面倒で結構忘れそうになります。 そこで音声なら即座に手軽に管理できるのではと思い作ってみました。 完成品 古いタブレットPCにNotionのTodoリストをブラウザで表示しています。 この白い箱自体がボタンになっており、Arduino経由でタブレットPCのマイクを起動し録音します。 録音されたデータは音声認識をして、Notionにタスクが追加されます。 このシステムをリビングとかに置いたら、誰でも気軽に登録できます。 Notion APIの準備 Secret Key を作成する こちらからインテグレーションを作成するとAPIで使うシークレットキーが作成できます。 https://ww

                                                                                音声で手軽に登録するToDoリストのシステムをつくる - Qiita
                                                                              • 生成AIをめぐる規制動向、世界各国はAI原則を共有しつつ、それぞれの思惑反映した枠組みを導入 | AMP[アンプ] - ビジネスインスピレーションメディア

                                                                                生成AIをめぐる規制動向、世界各国はAI原則を共有しつつ、それぞれの思惑反映した枠組みを導入 AI市場の成長ポテンシャルとリスク ChatGPTが火付け役となった生成AIトレンドだが、その市場成長ポテンシャルに関する予測レポートが多数発表されている。 たとえば、コンサルティング大手マッキンゼーが2023年6月に発表したレポートでは、生成AI活用による生産性向上により、2045年頃には最大で年間4兆4,000億ドルもの経済価値が追加される可能性があると予想されている。 また、Furtune Business Insightsは、2023年の生成AI市場規模を438億7,000万ドルと推計した上で、今後47.5%の年間成長率で拡大し、2030年には6,679億6,000万ドルに達すると予想している。 こうした強気の市場予測を背景に、現在テック大手を中心に生成AI関連の投資や研究開発が活発化して

                                                                                  生成AIをめぐる規制動向、世界各国はAI原則を共有しつつ、それぞれの思惑反映した枠組みを導入 | AMP[アンプ] - ビジネスインスピレーションメディア
                                                                                • 【今さら聞けない】NVIDIAがサカナAIの大株主になったニュースが注目を集める理由5選

                                                                                  1. はじめに:営業における生成AI活用の重要性 2024年、営業の世界は大きな転換点を迎えています。生成AI、特にChatGPTに代表される自然言語処理技術の進化により、営業活動のあり方が根本から変わろうとしています。もはや生成AIは単なるツールではなく、営業の「優秀な部下」として不可欠な存在となりつつあります。 生成AI活用が重要な理由 効率性の飛躍的向上 生成AIは、顧客データの分析からパーソナライズされた提案書の作成まで、従来人間が時間をかけて行っていた作業を瞬時に処理します。これにより、営業は本質的な顧客との対話や戦略立案に集中できるようになります。 データドリブンな意思決定 生成AIは膨大なデータを分析し、人間では気づきにくいパターンや傾向を見出すことができます。例えば、過去の取引データと市場動向を分析し、「この業界のクライアントは四半期末の2週間前にアプローチすると成約率が2

                                                                                    【今さら聞けない】NVIDIAがサカナAIの大株主になったニュースが注目を集める理由5選