並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 66件

新着順 人気順

文字起こし googleの検索結果1 - 40 件 / 66件

  • 唐突に使っているChrome拡張を紹介 - laiso

    ページ閲覧 AutoPagerize chromewebstore.google.com ページネーションされたウェブページを自動で読み込み続けます。無かったら違和感あるレベルで日常になっています。 daily.dev chromewebstore.google.com 開発者向けニュースを空タブに表示します。 タブを開くときに自然に視界に入るのに加えて、検索で「過去話題になったもの」から探したりします(はてなブックマークやHacker Newsも似た用途で使います) ホームタブとは別です。ホームはperplexity.aiにしてます。 Google Scholar PDF Reader chromewebstore.google.com 標準のPDFビュワーを科学論文を読みやすく強化します。参考文献の追跡や引用、ジャンプ機能を提供します。ついでに官庁資料やクリプト系のホワイトペーパーなど

      唐突に使っているChrome拡張を紹介 - laiso
    • 10倍速の効率に専門医レベルの回答精度―医師はChatGPTなどの生成AIをどう扱うべきか?|医師のキャリア情報サイト【エピロギ】

      10倍速の効率に専門医レベルの回答精度―医師はChatGPTなどの生成AIをどう扱うべきか? 「医師による医師のためのChatGPT入門 臨床がはかどる魔法のプロンプト」著者インタビュー 大塚 篤司 氏(皮膚科医/近畿大学医学部皮膚科学教室主任教授) 2024.07.18 簡単な指示文(プロンプト)を入力するだけで、専門家のような文章や画像などを即座に回答する生成AI。2022年にOpenAI社が発表したChatGPTに始まり、精度や機能のめざましい進歩とともに各業界で存在感を増しています。 医療分野でも、生成AIへの期待は高まっています。しかし、中には使い方がわからなかったり、安全性の懸念がぬぐえなかったりして活用に踏み切れない医師の方もいらっしゃるのではないでしょうか。 「確実にできることは増えるし、仕事が早くなります。作業速度は体感”10倍速”」と生成AI活用による驚異的な変化を語る

        10倍速の効率に専門医レベルの回答精度―医師はChatGPTなどの生成AIをどう扱うべきか?|医師のキャリア情報サイト【エピロギ】
      • Google Meet REST API の概要  |  Google for Developers

        フィードバックを送信 Google Meet REST API の概要 コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。 Google Meet REST API を使用すると、Google Meet と Google Meet を使用したビデオ会議を アプリからユーザーに直接、エントリ ポイントを提供します。 Meet REST API を使用すると、次のことができます。 会議スペースを作成して、ビデオでユーザーをつなぐ。 会議室または会議をリソース名で取得します。 参加者と参加者セッションのリストを取得する。 会議のアーティファクト(録画、文字起こし、文字起こしのエントリ)を取得する。 Google Meet のカレンダーの招待状を使用して Google Workspace Events API。変更の通知を受け取るには、 指定したユーザーに属するすべて

          Google Meet REST API の概要  |  Google for Developers
        • 第1回 生成AIの得意・不得意 2024・夏 | gihyo.jp

          皆さんこんにちは。スリーシェイク代表の吉田です。 今回より生成AIを、金融業界や製造業、医療業界など各事業ドメイン固有の課題解決にどう使われているのか、具体的なユースケースを提示しながら、それを実現するアーキテクチャについて解説していきます。この連載を通して、これまで生成AIを実際のシステムに組み込むイメージが湧かない方への第一歩として手助けになれば幸いです。 第1回は、生成AI自体の一般的な得意不得意を踏まえながらユースケースを解説します。 生成AIが得意とする処理とは? 生成AIが得意とするのは、「⁠専門性のない一般的な知識をベースにした」テキスト生成、コード生成、画像認識や画像生成が挙げられます。RAG(Retrieval-Augmented Generation)やプロンプトエンジニアリングにより固有ドメインに特化させることは可能ですが、教師あり学習データを前提としたMLやDeep

            第1回 生成AIの得意・不得意 2024・夏 | gihyo.jp
          • まだ人力? 無料で使える文字起こしサービス使ってみようよ

            まだ人力? 無料で使える文字起こしサービス使ってみようよ2024.07.16 15:0029,845 David Nield - Gizmodo US [原文] ( mayumine ) 今どき自力で文字起こしをやってる人なんていない? いやまだまだいるって? ここ1〜2年で、AIのおかげで文字起こしの性能が飛躍的に便利になりました。 会議の議事録、授業内容、インタビューのメモ等の録音データは、今や数時間…どころか数秒でテキストに変換してくれるのが当たり前。数年前は当然のように文字起こしは人力でやっていたというのに…。 また、「ライブキャプション」といったアクセシビリティ機能も充実してきて、元の動画に字幕がなくても、リアルタイムに字幕まで付くようになりました。 音声の文字起こし処理には時間・リソースを食うので、無料でできる範囲は限られていますが、今すぐ無料で利用できる文字起こしサービス5つ

              まだ人力? 無料で使える文字起こしサービス使ってみようよ
            • Google Pixelスマホのレコーダーアプリを使いこなすコツ

              Google Pixelスマホのレコーダーアプリを使いこなすコツ2024.06.30 19:0029,467 山田ちとら 録音するだけ、じゃないんです。 Google Pixel 3以降のスマートフォンにあらかじめインストールされているレコーダーアプリは、会議の内容やインタビューなどあらゆる音声を録音できて、一回の録音で最大18時間記録できます。 デバイス上で処理が完結するため、特定のGoogleアカウントに紐付けることなくレコーダーアプリを使用し、録音をデバイス上のみに保存することも可能です。 加えて、以下のようなレコーダーアプリならではの機能も備わっています。 レコーダーアプリの活用法はさまざま使い方を心得ておけば、レコーダーアプリは仕事に、勉強に、または自分磨きに大いに活用できそうです。たとえば… 【メモ書きに】良いアイデアを思いついたんだけど、​あいにくパソコンやメモ用紙を持ち合わ

                Google Pixelスマホのレコーダーアプリを使いこなすコツ
              • 3大クラウド×日米両リージョンでハニーポットを動かしてみる【後編】 | gihyo.jp

                前編の振りかえり 前編ではOSSのハニーポットであるT-PotをAWS、Azure、Google Cloudの3大クラウドサービスの日米両リージョンにデプロイしました。後編となる本記事ではT-Potを24時間程動かした結果をご紹介していきます。 T-Potの実行結果について 各クラウドサービスの日米両リージョンで収集したデータをT-Potのダッシュボードに表示した様子のスクリーンショットを以下に掲載します。なお表示期間はデータ収集を行った2024年6月12日17時から翌日の2024年6月13日17時までの24時間に揃えています。 24時間という比較的短時間かつ各リージョンで1インスタンスのみでしかデータ収集していないため統計学的な考察というよりは一参考情報としてお読み頂けますと幸いです。 図1 AWS東京リージョン(ap-northeast-1) 図2 AWS米国東部リージョン(us-ea

                  3大クラウド×日米両リージョンでハニーポットを動かしてみる【後編】 | gihyo.jp
                • CL 字幕の自動生成 | CyberAgent Developers Blog

                  目次 はじめに CLでの取り組み 字幕の仕組み 字幕の自動生成 音声抽出 文字起こし 翻訳 今後について はじめに こんにちは、FANTECH本部の古谷です。 今回は、「LDH動画配信サービス「CL」、生成AIを使用した字幕・翻訳機能を提供開始」に伴い、CLにおける多言語対応についてご紹介します。 CLでの取り組み CLでは、世界中のユーザへ最高のエンターテイメントを届けるため、多言語対応に力を入れています。 CLが提供する配信は以下の3種類あり、それぞれ配信の特性に応じて多言語化の課題があります。 ライブキャス配信 オンデマンド配信 ライブ配信 ライブキャス配信は、複数のアーティストによるライブ配信で低遅延、かつリアルタイムで配信を楽しむことができます。 この特性に合わせ、アーティストの発言を話者分離した上でリアルタイムに7ヶ国語に翻訳しユーザへ伝搬する仕組みを取り入れています。 この仕

                    CL 字幕の自動生成 | CyberAgent Developers Blog
                  • 大垣市武道館東「ふづきの池」の花ハスを見てきた&ウナギ料理専門店「なまずや」で鰻丼の昼食 - 🍉しいたげられたしいたけ

                    意図せずしてハスネタの連投になった。先週、実家にいたとき身内から中日新聞地方面の、こんな記事を見せられた。連れていけ、ということである。スキャンする余裕がなかったので、スマホ写真で示す。 中日新聞2024年7月4日付朝刊より 見出しと最後のほうに「午前中が(観賞に)おすすめ」と書いてあるが、すでに午後だったので「来週でいいですか?」と尋ねてみた。「いい」とのことだった。 ぐぐった。「ふづきの池」と言うらしい。「文月(7月)」の意かな。大垣市武道館の場所、知らなかったが実家から近いじゃないか。 四季の花 開花状況 | 大垣市公式ホームページ/水の都おおがき その来週すなわち今日(7/12)は、朝から本降りの雨だった。だが「車の中から見られるかも知れない。車の中から見られたらいい」とのことだったので、ダメモトで行ってみた。 幸いなことに、本当に車の中から観賞可能だった。 一般公道からハス池の外

                      大垣市武道館東「ふづきの池」の花ハスを見てきた&ウナギ料理専門店「なまずや」で鰻丼の昼食 - 🍉しいたげられたしいたけ
                    • 「涼感ハスまつり」2024年7月 - 🍉しいたげられたしいたけ

                      最寄り駅前のテラス状スペースで、今年も「涼感ハスまつり」という展示をやっていた。 毎年ブログネタにしているから今年はもういいかなと思ったが、看板左側にこんな張り紙があったので今年もネタにする気になった。なにか変わったことがあると、記録したくなる。 弊ブログ勝手に恒例、Googleレンズによる文字起こし。改行位置、変更しています。 今季は連日の高温により、開花がすでに終わったものや、反して開花が遅れているものが少なくなく、遺憾ながら予定に対して展示品種数、鉢数ともに少なくなってしまったことを、お詫び申し上げます。 とよあけ花マルシェプロジェクト いえいえ毎年タダで見せていただいていることですし、お詫びには及びません、と私一人が言うべきことではない。 去年の拙過去記事はこちら。それ以前の何年分かの記事も、ここから辿れるはず。 www.watto.nagoya 弊ブログはアフィリエイト広告を利用

                        「涼感ハスまつり」2024年7月 - 🍉しいたげられたしいたけ
                      • 宗教系というと大袈裟だが宗教系としか言いようのない小ネタ2件 - 🍉しいたげられたしいたけ

                        坂部無縁墓地の石碑が撤去されていた 去年の8月に、こんな過去記事を上げた。ご近所のご縁といういことで、それからもたまに通りがかるたびに、ちょいと手を合わせていた。 www.watto.nagoya うちの近所は、まあまあ新築工事がある。この周辺も、何件か工事をしていた。 今月の初め、通りがかると石碑というか墓石というかが撤去されていた! 説明書きの看板はまだ残っていたが、いずれ撤去されそうな気配である。 文字起こしは上掲8月28日付拙記事中でやった。 道路側の鉄製階段はまだ残っていたが、道路から遠いこのあたりにコンクリート製の石段があったはず。それもなくなっていた。 想像だけど、ここも工事が始まるのだろうか。定点観測しようかな。 石碑は、おそらくどこかのお寺の墓地に集められているのだろう。 ブログネタにはしなかったが、拙宅から最寄り駅への経路上にお地蔵さんがあったのだが、それも何年か前に撤

                          宗教系というと大袈裟だが宗教系としか言いようのない小ネタ2件 - 🍉しいたげられたしいたけ
                        • 【小ネタ集】予約3件 - 🍉しいたげられたしいたけ

                          機会あるごとに繰り返していますが、弊ブログの主目的は自分用備忘メモです。忘れないと思うけど、念のためエントリーに仕立てる。 結論を先に書いてしまうと、歯科クリーニング、運転免許証更新、車の3ヶ月定期点検の予約をして、それぞれ今週後半、来週、2週間後に予約が取れたということに尽きる。 目次 歯科クリーニング 運転免許証更新 車の3ヶ月定期点検 弊ブログはアフィリエイト広告を利用しています 歯科クリーニング 3ヶ月に1度来てくれと言われているが、そんなには行けない。うがいの水が冷たいと滲みるのが嫌なので、暑い季節を狙って年に一度行くことにしている。これでいいのか悪いのかは知らない。 去年も小ネタ集にしたのだった。 www.watto.nagoya なんだか思った以上にみっちり書いていたな。すっかり忘れていた。 電話を掛けたら、今週後半にあっさり予約が取れた。何もヘンなことを言われませんように。

                            【小ネタ集】予約3件 - 🍉しいたげられたしいたけ
                          • パーソルグループ、社内の生成AIシステムに「GPT-4o」を先行導入、グループ1万9000人が活用 | IT Leaders

                            IT Leaders トップ > テクノロジー一覧 > AI > 事例ニュース > パーソルグループ、社内の生成AIシステムに「GPT-4o」を先行導入、グループ1万9000人が活用 AI AI記事一覧へ [事例ニュース] パーソルグループ、社内の生成AIシステムに「GPT-4o」を先行導入、グループ1万9000人が活用 2024年7月3日(水)日川 佳三(IT Leaders編集部) リスト パーソルホールディングス(本社:東京都港区)は2024年7月1日、国内グループ全社に展開している社内利用の生成AIシステム「PERSOL Chat Assistant」にAzure OpenAI Serviceの最新LLM「GPT-4o」を適用し、同年6月7日に利用開始したと発表した。日本マイクロソフトより、国内におけるGPT-4oの先行導入企業に選出されたことを受けて、グループの社員約1万9000

                              パーソルグループ、社内の生成AIシステムに「GPT-4o」を先行導入、グループ1万9000人が活用 | IT Leaders
                            • 続・AI入門 第1回 生成AIの仕組みを知ろう | NTTデータ先端技術株式会社

                              1. はじめに 2018~2019年に、本コラムの旧シリーズとなる全5回のAI入門コラムを書かせていただきました。それ以降、この人工知能に関しては、皆さんもご存じの通り、2022年の中旬以降に大きな進展がありました。当時のコラムでは深層学習(Deep Learning)は人工知能の3次ブームだ!という表現をしましたが、今回解説する生成AI(Generative AI)は、さらに第3.5次ブームとか、第4次ブームともいわれるほどの大きな進展です。この技術は進展が速く、本コラムはすぐに陳腐化してしまうかもしれませんが、できるだけ普遍的な基礎理解のための続編の位置付けとして投稿します。既に沢山の解説記事や書籍が存在しますが、私なりの視点で生成AIについて、分かりやすく解説してみたいと思います。今回も数式は使いませんので、ご安心を。 2. 人工知能への期待と挑戦 さて、深層学習(Deep Lear

                                続・AI入門 第1回 生成AIの仕組みを知ろう | NTTデータ先端技術株式会社
                              • 未開拓な「音声」をAIで企業の資産に RevCommが新発表と書籍を紹介

                                2024年7月5日、トーク解析AI「MiiTel」を手がけるRevComm(レブコム)はQRコードから発信できる新サービス「MiiTel Scan To Call」とRevComm 代表取締役 曾田武史氏が執筆した書籍の発表会を開催した。テキストや画像に比べて、未開拓な音声データをMiiTelで解析することで、音声コミュニケーションを企業の資産にしていくという。 AmazonやGoogleを超える認識精度を武器に音声を価値に変える 2017年創業のRevCommは自社開発のトーク解析AI「MiiTel」をベースに、ビジネスでの音声の利活用を実現するサービスを提供している。サービスとしては電話解析サービスの「MiiTel Phone」やコンタクトセンター用の「MiiTel Call Center」、Web会議の解析サービス「MiiTel Meeting」、対面会話用の「MiiTel RecP

                                  未開拓な「音声」をAIで企業の資産に RevCommが新発表と書籍を紹介
                                • なぜサムスン電子は30万円超えの「折り畳みスマートフォン」を日本で販売するのか

                                  韓国Samsung Electronics(サムスン電子)は、折り畳みスマートフォンの新機種「Galaxy Z Fold6」と「Galaxy Z Flip6」を2024年7月31日から国内で販売する。円安の影響もあって、最も高いモデルでは30万円を超える。同社が高額なモデルを販売する理由はどこにあるのだろうか。 AI機能に注力した折り畳みスマホ新機種 2024年5月の連休明けから夏にかけて、スマホ新機種の発表が相次いでいる。例えば米Google(グーグル)は米国時間2024年6月25日、同2024年8月13日に「Pixel」シリーズの新機種を発表すると予告した。例年より2カ月ほど早い発表である。グーグルに限らず、全体的にスマホの新機種発表の時期が早まっている。 世界最大手のサムスン電子もそのうちの1社だ。同社はこれまで、折り畳みスマホ「Galaxy Z」シリーズの新機種を8月に発表すること

                                    なぜサムスン電子は30万円超えの「折り畳みスマートフォン」を日本で販売するのか
                                  • AIの嘘に対抗できるのはAIだけ 「ネットのクソ化」と戦う世界のファクトチェッカーの秘策は

                                    世界のファクトチェックをリードする国際ファクトチェックネットワーク(IFCN)の第11回年次総会「グローバル・ファクト11(GF11)」が6月26-28日、ボスニア・ヘルツェゴビナの首都サラエボで開かれました。生成AIの進化によって、世界中でますます拡散する偽・誤情報とどう戦うか。様々なAIツールやその活用法の報告に注目が集まりました。 参加者は89カ国303組織から会場520人、オンライン98人。そのうちテック企業からは5社45人が参加しました(2024年7月13日追記)。 「インターネットのクソ化」が進む世界「インターネットのクソ化は全力で進行中です。今年1月の時点で、ネットの57.1%を低品質なコンテンツが占めます」 2021年にノーベル平和賞を受賞したフィリピンのジャーナリスト、マリア・レッサ氏はメインスピーカーとして初日に登壇し、オンラインプラットフォームが利益を追求する中でコン

                                      AIの嘘に対抗できるのはAIだけ 「ネットのクソ化」と戦う世界のファクトチェッカーの秘策は
                                    • “応答高速化”のためにはキャッシュデータをどこに保存する? 可能な限りアクセスを減らすための3つの置き場所

                                      株式会社MIXIの信田氏が、家庭用のコミュニケーションロボット「Romi」の応答の高速化について、インフラ・アプリケーションサーバーと、AIの2つにおける取り組みを紹介しました。全2回。 家庭用のコミュニケーションロボット「Romi」について 信田春満氏:「テンポ感よく会話するために〜Romiの応答高速化の技術」というタイトルで、信田が発表します。 まず私は信田春満と申します。2017年に「Romi」というしゃべるAIロボットを作るプロジェクトが始まったんですが、その「Romi」の最初のエンジニアとして開発に入り、今まで「Romi」を率いてきました。 さて、「Romi」を見たことある方はいますか? たぶん全員手が挙がるはずです。先ほど案内をしていたロボットですね。これは、案内をするためのロボットではなくて、家庭用のコミュニケーションロボットです。 コンセプトとしては「ペットのように癒し、家

                                        “応答高速化”のためにはキャッシュデータをどこに保存する? 可能な限りアクセスを減らすための3つの置き場所
                                      • Google Chrome 127のベータ版にAIモデル「Gemini Nano」が追加されたのでチャットしてみた

                                        Googleは2024年5月に、AIモデルのGemini NanoをChromeデスクトップクライアントに直接組み込むことを明らかにしていました。そして2024年6月に公開されたGoogle Chrome 127のベータ版でGemini Nanoが組み込まれていることが確認されたので、実際に使ってみました。 Chrome is adding `window​.ai` — a Gemini Nano AI model right inside your browser. It already works with the AI SDK:https://t.co/Edzs9qDA8jpic.twitter.com/mTmFTCwqHB— Guillermo Rauch (@rauchg) June 27, 2024 Googleは2024年5月に開催された「Google I/O 2024」にお

                                          Google Chrome 127のベータ版にAIモデル「Gemini Nano」が追加されたのでチャットしてみた
                                        • Gemini のロングコンテキストの使い方|npaka

                                          以下の記事が面白かったので、簡単にまとめました。 ・Long context  |  Gemini API  |  Google for Developers 1. Gemini のロングコンテキスト「Gemini 1.5 Flash」には100 万トークン、「Gemini 1.5 Pro」には200万トークンのコンテキストウィンドウが付属します。歴史的にLLMは、一度にモデルに渡すことができるテキスト (またはトークン) の量によって大幅に制限されていました。ほぼ完璧な検索 (>99%) を備えた「Gemini 1.5」のロングコンテキストウィンドウにより、多くの新しいユースケースと開発者パラダイムが実現できるようになりました。 2. コンテキストウィンドウとは「Gemini 1.5」を使用する基本的な方法は、情報 (コンテキスト) をモデルに渡し、その後モデルが応答を生成するというもの

                                            Gemini のロングコンテキストの使い方|npaka
                                          • Googleドキュメントの「画像からの文字起こし」の実力を「武道館」で試してみた(オトナライフ) - Yahoo!ニュース

                                            結果は「画像から 文字 できるのか?」。「起こし」が認識されないという悲しい結果になってしまいました。とはいえ今後もこの機能の精度は高まっていくでしょう。いつかは筆者の「起こし」も認識される日がくると思われます。 とにかくGoogleドキュメントの画像認識の精度は、抜け漏れが起きたり、認識されない文字もあるとはいえ、無料で使える機能として優れたものであることは間違いありません。文字起こししたい写真やPDFが手元にあれば、ぜひ一度機能を使ってみることをおすすめします!

                                              Googleドキュメントの「画像からの文字起こし」の実力を「武道館」で試してみた(オトナライフ) - Yahoo!ニュース
                                            • SBC6802 plus Bus、Altair Basic、スタートレック

                                              電脳伝説様作の SBC6800 向けに、はせりん様が Altair 680 Basic パッチを作成されました。2021 年版 sbc6800 データパックに含まれています。 Altair 8800/680 の当時(1976 年頃)は、Basic インタプリタを実行できる環境を整えるのに相当な投資が必要だったという話です。CPU、メモリ、I/O モジュール、端末コンソール、記憶装置(紙テープまたは CMT?)それぞれの機材が今よりはるかに大掛かりだったので、一式揃えて動かすのは大仕事だったことでしょう。今では 10cm 角基板の SBC とノート PC、USB-シリアルインターフェイスケーブルだけで準備が整います。 Altair Basic を 32KB RAM で使用する この Altair 680 Basic パッチは SBC6800 対応ということで、以前の投稿で紹介した SBC68

                                                SBC6802 plus Bus、Altair Basic、スタートレック
                                              • ついに「LINEの全トーク履歴(15日以上前)※1」のデータ移行が可能に Galaxyデータ移行「Smart Switch」が 7月10日にアップデート

                                                他社スマートフォンからの乗り換えがさらに便利&簡単! サムスン電子ジャパン株式会社(以下サムスン)は、Galaxyデータ移行アプリ「Smart Switch」のアプリアップデートにより、LINE※2の全トーク履歴(15日以上前)※1のデータ移行が可能になったことをお知らせいたします。今回の「Smart Switch」のアップデートは2024年7月10日22時以降、順次利用可能になります※3。 他社(iOS)スマートフォンからのGalaxyへの乗り換えは、これまでLINEのトーク履歴は直近14日間のデータのみしか転送されませんでしたが、今回のアップデートにより今まで通りの使い心地でご使用いただけるようになりました。なお、OS変更(iOS→Galaxy、Galaxy以外のAndroid→Galaxy)の機種変更でLINEの全トーク履歴が移行可能なブランドは、現在Galaxy製品(Smart S

                                                  ついに「LINEの全トーク履歴(15日以上前)※1」のデータ移行が可能に Galaxyデータ移行「Smart Switch」が 7月10日にアップデート
                                                • AppleやAnthropicがYouTubeの文字起こしをAIトレーニングに無断で使用との報道

                                                  米メディアのProof Newsは7月16日(現地時間)、Wiredと共同で調査した結果、米Appleや米Anthropicなどが自社のAIのトレーニングに大量のYouTube動画の素材を使っていることが分かったと報じた。 調査によると、4万8000以上のチャンネルから抜き出された17万3536本のYouTube動画の字幕が、Anthropic、Nvidia、Apple、SalesforceなどのAIトレーニングに使われていたという。 これらの企業は、YouTubeから直接動画を取り込んでいるのではなく、米非営利団体EleutherAIが公開しているAIトレーニング用データセットを利用している。 EleutherAIはこのデータセット「The Pile」を、「大企業と競争するリソースを持たない個人や企業のために」まとめたとしている。データセットにはYouTubeのスクリプトAPI経由でダウ

                                                    AppleやAnthropicがYouTubeの文字起こしをAIトレーニングに無断で使用との報道
                                                  • WhisperをGoogle Colabで試す|しろ

                                                    Whisperとは、OpenAIが開発した音声認識モデルです。 Whisperは、68万時間分の多言語音声データで訓練されたTransformerモデルです。英語や日本語をはじめとする98言語の音声認識と文字起こし、そして英語以外の言語を英語に翻訳することができます。 利用するのはGitHubに公開されているWhisper-WebUIを使います。 Google Colabで試すWhisper-WebUIにアクセスしhereをクリックするとColabにアクセスできます。 Colabが開いたらランタイム▶すべてのセルを実行をクリックもしくはショートカットCtrl+F9入力 警告が出ますがそのまま実行します。 オプションには何も入力しなくていいです 実行中に警告が出ますが無視をします RunセッションのセルにURLが出てきたらアクセスします アクセスすると以下のWebUIが表示されます Whis

                                                      WhisperをGoogle Colabで試す|しろ
                                                    • SRT形式 - Google 検索

                                                      2023/12/29 · SRTファイルが使える動画編集ソフト3選 · 1位.SRT ファイル、自動文字起こし機能が使えて初心者でも簡単に使いこなせる「PowerDirector」 · 2位.プロ向け ...

                                                      • Google Developer Preview Programに参加 - Google Meet API(プレビュー版のAPI)などを早期利用する|Shadow-Director

                                                        Google Developer Preview Programに参加 - Google Meet API(プレビュー版のAPI)などを早期利用する Google デベロッパープレビュー プログラムに参加して、Googleさんが現在開発中の まだ一般公開されていない段階のAPIや新機能 - Google Meet APIなどを早期テスト&それらを利用したアプリをいち早く開発(※公開はまだ不可)してみます。 ①「Google デベロッパー プレビュープログラム」への参加方法 ② 「Google Meet API」や「Meet アドオン SDK」を実際に使ってみる この2つについて、この投稿では書いてみます。 主に①「Google デベロッパー プレビュープログラム」についてをこの記事では記載しています。 ②は、Meet APIでできること/Meet Addons SDKでどんなアプリが作れる

                                                          Google Developer Preview Programに参加 - Google Meet API(プレビュー版のAPI)などを早期利用する|Shadow-Director
                                                        • 人工知能AIニュース(2024年6月分)Podcast配信・文字起こし | ネットビジネス・アナリスト横田秀珠

                                                          LINEで更新通知を受け取れます 先日に伺った福井の皆様 ありがとうございました! イーンスパイアの横田です。 https://www.enspire.co.jp さて、本題です。 人工知能AIに関するニュースなどは 以下で随時更新して配信しています。 早速、2024年6月分の人工知能(AI)に 関するニュースを解説したいと思います↓ https://yokotashurin.com/etc/ai-seminar2.html#202406 https://yokotashurin.com/etc/image.html#202406 https://yokotashurin.com/etc/facial-recognition.html#202406 https://yokotashurin.com/youtube/fake.html#202406 https://yokotashurin.

                                                            人工知能AIニュース(2024年6月分)Podcast配信・文字起こし | ネットビジネス・アナリスト横田秀珠
                                                          • Yahoo!検索、飲食店のクチコミを生成AIが要約 8万店舗以上が対象

                                                            LINEヤフーは、7月17日に「Yahoo!検索で」飲食店名の検索結果へ生成AIが飲食店のクチコミを要約した説明文を表示する機能を提供開始。新たに8万店舗以上の飲食店で説明文が表示されるようになる。 本機能は各飲食店などが公式に説明文を登録しておらず、かつ「Yahoo!マップ」に一定数以上のクチコミが投稿されているなどの条件を満たす店舗が対象。生成AIがクチコミから飲食店の雰囲気やメニューなどのおすすめポイントを抽出して説明文を作成するため、説明文が表示されない飲食店の情報を把握しやすくなるという。 関連記事 Google検索にも生成AIを導入 計画やブレストの手助けに 動画撮影しながら質問も Googleが、Google検索用に生成AIモデル「Gemini」を導入する。単に調べるだけでなく、計画やブレインストーミングなどに関する質問もできるようになる。動画を撮影しながら検索する機能も提供

                                                              Yahoo!検索、飲食店のクチコミを生成AIが要約 8万店舗以上が対象
                                                            • グーグル翻訳に直接音声ファイルを - Google 検索

                                                              2024/04/23 · Transkriptorを使用すると、ユーザーは大きなオーディオ/ビデオファイルを簡単に文字起こしし、プラットフォーム上で翻訳できます。 Google Translateで ...

                                                              • 動画生成AI「NoLang」対話・アバター・ショート動画・画像生成OK | ネットビジネス・アナリスト横田秀珠

                                                                LINEで更新通知を受け取れます 今週は平日が全て日帰りなので 買いだめしたけど買いすぎた(笑) イーンスパイアの横田です。 https://www.enspire.co.jp レビュー動画ご覧ください。 https://www.youtube.com/watch?v=B72CU2MNWc0 さて、本題です。 対話型動画生成プロダクト「Nolang」をローンチ https://prtimes.jp/main/html/rd/p/000000004.000129953.html と2023年12月21日に発表した際には あまり話題にならなかったNo Lang。 NoLang(ノーラン)とは? https://no-lang.com/ Xで開発者のツイートから大ブレイク。 https://twitter.com/sayhi2ai_jp/status/1772405627924742611 【重

                                                                  動画生成AI「NoLang」対話・アバター・ショート動画・画像生成OK | ネットビジネス・アナリスト横田秀珠
                                                                • ネットビジネス・アナリスト2024年6月ブログ更新スライド126枚 | ネットビジネス・アナリスト横田秀珠

                                                                  LINEで更新通知を受け取れます 先日に行ったZoomセミナーで 新しい試みしてみて良かった! イーンスパイアの横田です。 https://www.enspire.co.jp 記念すべき200回目のネットビジネス研究会は 昨夜にオンラインでZoom開催されました。 月1回なので16年半も一度も休まずセミナーを 開催し続けることが出来て良かったですね。 300回を目指して頑張ります(笑) さて、本題です。 お陰様でセミナー三昧の6月でして コンテンツ販売も充実してきました。 STORESで教材を販売しています。 ⇒ https://yokotashurin.net/ 教材数も121テーマになりました。 2008年9月1日より1日も欠かさずに ブログを書き続け丸15年10ヶ月です。 閏年が2012、2016、2020年なので 365記事×15年+3記事で5478記事に +30+31+30+31

                                                                    ネットビジネス・アナリスト2024年6月ブログ更新スライド126枚 | ネットビジネス・アナリスト横田秀珠
                                                                  • ドコモ、「iPhone 15/15 Pro」を3.3万~4.4万円割引 7月22日から

                                                                    NTTドコモは、7月22日以降にドコモオンラインショップの割引額/進呈ポイントを変更する。金額は全て税込み。 MNPで購入する際に「iPhone 15」を4万4000円、「iPhone 15 Pro」を3万3000円割引する。機種変更、契約変更、MNPで購入する際に「iPhone 14 Plus (128GB/256GB)」「Galaxy S23 SC-51D」「Galaxy S23 Ultra 512GB SC-52D」は1万1000円、「Google Pixel 8 Pro(512GB)」は5500円割引する。 機種変更、契約変更で購入する際に「Galaxy Z Flip5 SC-54D」を1万1000円割引し、新規契約で「キッズケータイ KY-41C」購入時に利用者が22歳以下の場合はdポイントを1万ポイント進呈する。 関連記事 ソフトバンクの「iPhone 14(128GB)」、M

                                                                      ドコモ、「iPhone 15/15 Pro」を3.3万~4.4万円割引 7月22日から
                                                                    • 音声読み上げ、音読さんのよくある質問(FAQ)|音声読み上げソフト 音読さん

                                                                      よくあるご質問 利用について 音声ファイル・ダウンロードについて 読み上げや機能について 支払いについて 法人利用について 利用について 音読さんは無料で使えますか? はい、毎月一定の文字数の読み上げを無料でご使用いただけます。もしたくさんの読み上げを行いたい場合は有料プランをご検討ください。 音読さんで無料で使える文字数は? ・非会員(フリー) :1000文字/毎月 ・無料会員(ライト):5000文字/毎月 読み上げ可能文字数はどこで確認できますか? ログイン後、履歴をご確認ください。 次回更新日や現在のプランはどこで確認できますか? ログイン後、設定をご確認ください。 利用せずに残っている文字数は翌月繰り越されますか? 利用せずに残っている文字数は毎月リセットされるるため翌月には繰り越されません。 文字数が更新されるタイミングはいつですか? 次回更新日に更新されます。サーバーに負荷がか

                                                                        音声読み上げ、音読さんのよくある質問(FAQ)|音声読み上げソフト 音読さん
                                                                      • 「YouTube Summary with ChatGPT & Claude」が便利すぎた|ChatGPT部 Produced by NOB DATA

                                                                        ChatGPT部でChatGPTヘビーユーザーのこーたろーです。 Yotubeの切り抜きやYoutube動画を自前のHPで公開、説明している人にはもってこいのChrome拡張機能があります。 それが「YouTube Summary with ChatGPT & Claude」です。 本編では、設定から実際に使ってみた内容をご紹介します。 実は、以前ChatGPT部のふくもっしーさんが同じ拡張機能を使われていたのですが、今回はアップデートされて拡張機能のツール名も更新されているとのことで、改めて使って行きます。 本編に移る前に、私のやっているAI関連情報発信用アカウントの宣伝をしておきます。是非、フォローをお願いします。 【Twitter情報収集アカウント:https://twitter.com/info_AI_x_DX 】 それでは、本編をご覧ください。 1. はじめに今日は特に忙しい方、

                                                                          「YouTube Summary with ChatGPT & Claude」が便利すぎた|ChatGPT部 Produced by NOB DATA
                                                                        • 国内版「Zenfone 11 Ultra」とZenfone 10の違いを解説 - 秋葉原ぶらり

                                                                          日本で発売されたASUS「Zenfone 11 Ultra」。早くも「超高速でカメラもいい」と評判です。しかし、その一方で「問題点がある」との口コミがあり、購入をためらっている人もいるのではないでしょうか? そこで今回はその性能を確かめるため、7つの観点で検証していきます。 ディスプレイ プロセッサ 冷却性能 カメラ性能 バッテリー・充電 機能 デザイン(サイズ・重量) また、前モデル「Zenfone 10」との違いや引き継いだメリットも紹介!購入する前に知っておきたいデメリットや評価、詳細な価格情報も掲載しているので、ぜひ参考にしてみてください。 「Zenfone 11 Ultra」国内版が発売開始! 2024年7月5日、日本で台湾 ASUS(エイスース)の新製品「Zenfone 11 Ultra」(ゼンフォーン 11 ウルトラ)が発売されました。 Android 14 を搭載した6.7

                                                                          • 【AWS】今年度学習したAWSサービスの特徴をまとめておく - AWS Machine Learning編 - Vの技術ブログ

                                                                            概要 インフラ系のクラウドエンジニアとして、日々自己研鑽に努めています。 本投稿は今年度の学習のまとめとして、今後も覚えておきたい情報を記載したものです。 Machine Learningに含まれるサービスの特徴と効果的に活用するためのTipsを記載しています。また、サービスを利用するときに必要となる一般的な機械学習に関するナレッジも用語集的に整理しています。 記載内容は、AWS公式ドキュメントやインターネットから拾い集めた情報を個人的に解釈した結果を記載しています。実機確認等による裏付けがされた内容ではない点、ご留意ください。また、私は機械学習エンジニアではないため、特に"一般的な機械学習に関するナレッジ"はおおよそのイメージで記載しており、正確性に欠ける記載が多いかもしれません。あらかじめご了承ください。 AI services Forecast 時系列データの学習。多数のビルトインア

                                                                              【AWS】今年度学習したAWSサービスの特徴をまとめておく - AWS Machine Learning編 - Vの技術ブログ
                                                                            • YouTubeの「文字起こし」機能で話を文章化する方法

                                                                              IT・メディアKiev, Ukraine - May 21, 2014: Woman holding a brand new Apple iPad Air with YouTube logo on a screen. YouTube is the world's most popular online video-sharing website that founded in February 14, 2005 皆さんはこの記事をスマホでお読みだろうか? それともPCで? 筆者は視力の衰えもあるし入力をし易いので、外出時以外はもっぱらPCを使っている。しかも最近、23.8インチのモニター(ASUS製)の中古(1万円也)をAmazonで買って繋いだので、ネット環境が更に改善された。 gmailのアドレスで登録した外国のニュースレターやメルマガを、google翻訳アプリで日本語記事同様に読める

                                                                                YouTubeの「文字起こし」機能で話を文章化する方法
                                                                              • 【2024年4月最新】バリ島の運転免許について&自力で取るマニュアル|Beyond Bali Surf Retreat

                                                                                バリ島での運転についてバリ島で運転免許を取得する方法は主に2つあります: 1. エージェントを通して警察に頼む(短期旅行者でも可能) 2. 自力で取る(日本で言う一発試験ですが緩め、学科試験だけがちょっとネック、KITASが必要) 有効期限は5年間です。 本来インドネシアに居住し、KITASを持っていないと運転免許は取れません。 なのでKITASを持っていない人は1. で進めてください。 日本の免許証や国際免許は厳密に言うとバリでの運転は不可です。 日本の免許証は無論ですが、インドネシアはジュネーブ条約締結国ではないため、国際免許も認められていません。 取り締まりが厳しい時期もあれば、厳しくない時期もあります。 短期旅行者の場合、現状皆さん免許を取らずにレンタルバイクをしていることが多いです。捕まったら警察官に少し「気持ち」を渡して見逃してもらう、という具合です。 求められる「気持ち」もど

                                                                                  【2024年4月最新】バリ島の運転免許について&自力で取るマニュアル|Beyond Bali Surf Retreat
                                                                                • 古代エジプトの彫刻には精密な 3次元測定技術と加工技術が使われていた ⇒ この謎を解く(+追加) | UFO/Bigfoot/Missing-411/Supernatural Research

                                                                                  履歴​ (2024-07-26) 追加。 (2024-02-11) 完成。❏ (2024-02-11) (2021-05-03) 追加。古代エジプトの彫刻には精密な 3次元測定技術と加工技術が使われていた (+追加2) (2021-05-03) (2020-11-18) 追加。古代エジプトの彫刻には精密な 3次元測定技術と加工技術が使われていた (+追加) (2020-11-18) (2017-08-08) 作成。古代エジプトの彫刻には精密な 3次元測定技術と加工技術が使われていた (2017-08-08) はじめに​ この件は過去記事の中でオマケ的にチョロッと紹介したような気がするが、下の画像のような彫刻には現代レベルの 3次元測定技術と加工技術が必要だ…という話はしていなかった筈。 たしか素材は花崗岩(うろ覚え)で、当時の加工ツールは銅製のタガネのみ。歯が立たない。まして硬い花崗岩にこ

                                                                                    古代エジプトの彫刻には精密な 3次元測定技術と加工技術が使われていた ⇒ この謎を解く(+追加) | UFO/Bigfoot/Missing-411/Supernatural Research