並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 18 件 / 18件

新着順 人気順

文字起こしの検索結果1 - 18 件 / 18件

  • 時間無制限、無料の文字起こしアプリを開発したので、アプリ紹介と学びまとめ。|にょす

    みなさん、こんにちは!9月は久しぶりに個人開発をしてました。 今回はGeminiを使って、ちょっと変わった文字起こしアプリを開発したので、その裏側をお話ししていきたいと思います。その名も「無限もじおこし」です! 「無限もじおこし」はその名の通り、時間無制限、無料で使える文字起こしアプリです。普通に考えたら「え?大丈夫なの?」って感じですよね笑 でも、ちゃんと収益的に成り立つ算段を立てています。この記事ではそこらへんの考えや、アプリ開発における技術的な学びについてまとめていきたいと思います! 「無限もじおこし」の紹介主な特徴音声の文字起こしが無制限に可能 (10時間でも100時間でも!)使いやすさにこだわった機能 (コピー、シェア、自動タイトル生成など)「よく使う単語帳」に登録すると、文字起こしの変換精度アップバックアップ機能があるので、機種変更などが発生しても簡単に引き継げます そして、無

      時間無制限、無料の文字起こしアプリを開発したので、アプリ紹介と学びまとめ。|にょす
    • 芦原妃名子さん自◯事件について日本シナリオ作家協会の削除された密談動画の全文文字起こし公開|新宮ラリのAIシンギュラリティー

      パナマ文書リークさんのご依頼で、バズっていた日本シナリオ作家協会の動画を全文文字起こしさせて頂きました😊 (※音声が不明瞭なため聞き取りにくい箇所も多々ありました。文字起こしの中で**は聞き取れなかった部分です。最後の方ちょっとだけタイムコードが消えてしまいました。) 本家動画は消されていますが、こちらに再アップしました。👇🤗 🎧スピーカー:黒沢久子、伴一彦、佐野、木崎(敬称略) 黒沢 [24.30s -> 25.00s] こんばんは [25.00s -> 29.00s] 脚本家たちの深夜密談です [29.00s -> 35.62s] 今週はちょっと先週からの予告を変更しまして [35.62s -> 42.34s] 急遽セクシー田中さんの話をしたいと思っております [42.34s -> 45.00s] と言いますのもですね [45.00s -> 48.38s] やっぱり脚本家の深夜

        芦原妃名子さん自◯事件について日本シナリオ作家協会の削除された密談動画の全文文字起こし公開|新宮ラリのAIシンギュラリティー
      • 「録音データを“無料で文字起こし”できるツールを比較してみた」――急遽テレワークを導入した中小企業の顛末記(173)【急遽テレワーク導入!の顛末記】

          「録音データを“無料で文字起こし”できるツールを比較してみた」――急遽テレワークを導入した中小企業の顛末記(173)【急遽テレワーク導入!の顛末記】
        • PCの操作をすべて録画&文字起こしして過去の操作を丸ごと検索可能にするアプリ「Windrecorder」

          PCを使っていると、過去の操作内容やブラウザで閲覧していた情報を思い出したくなるタイミングが頻繁に発生します。そんな時に役立ちそうなPC操作記録アプリ「Windrecorder」がオープンソースで開発されています。 GitHub - yuka-friends/Windrecorder: Windrecorder is a memory search app by records everything on your screen in small size, to let you rewind what you have seen, query through OCR text or image description, and get activity statistics. https://github.com/yuka-friends/Windrecorder I made an o

            PCの操作をすべて録画&文字起こしして過去の操作を丸ごと検索可能にするアプリ「Windrecorder」
          • 「iPhoneとPCを連携させて、無料で通話を録音・文字起こしする方法」――急遽テレワークを導入した中小企業の顛末記(181)【急遽テレワーク導入!の顛末記】

              「iPhoneとPCを連携させて、無料で通話を録音・文字起こしする方法」――急遽テレワークを導入した中小企業の顛末記(181)【急遽テレワーク導入!の顛末記】
            • 録音の文字起こし超ラクで仕事のやり方に変化。私生活はひたすら運動した【私の2023】 - 家電 Watch

                録音の文字起こし超ラクで仕事のやり方に変化。私生活はひたすら運動した【私の2023】 - 家電 Watch
              • 文字起こしアプリで伝言ゲーム

                1971年東京生まれ。デイリーポータルZウェブマスター。主にインターネットと世田谷区で活動。 編著書は「死ぬかと思った」(アスペクト)など。イカの沖漬けが世界一うまい食べものだと思ってる。(動画インタビュー) 前の記事:影だけ悪魔の人になりたい > 個人サイト webやぎの目 ルール 肉声で喋る→アプリで文字起こし→その結果をiPhoneで読み上げ→ 別のアプリで文字起こし → また読みあげ → またまた別のアプリで文字起こし …を繰り返す。 そうして文章がずれていくさまを楽しもう。

                  文字起こしアプリで伝言ゲーム
                • 自動文字起こしサービスである、OpenAIの「Whisper API」とAWSの「Amazon Transcribe」の精度を比較してみた | DevelopersIO

                  自動文字起こしサービスである、OpenAIの「Whisper API」とAWSの「Amazon Transcribe」の精度を比較してみた はじめに 今回は、OpenAIのWhisper APIとAmazon Transcribeという2つの音声文字起こしサービスを試し、それぞれの精度を比較してみました。 Amazon Transcribeは、音声をテキストに変換する自動音声認識サービスです。 ストリーミングとバッチ処理のどちらでも文字起こしが可能です。 攻撃的な言葉を指定すると、Amazon Transcribeがそれらの言葉を文字起こしから自動的に削除する語彙フィルタリングなどの機能もあります。 Amazon Transcribeの詳細は、下記の記事をご参考ください。 OpenAIには音声をテキストに変換する「Whisper」という音声認識モデルがあり、WhisperをAPIの形で呼び

                    自動文字起こしサービスである、OpenAIの「Whisper API」とAWSの「Amazon Transcribe」の精度を比較してみた | DevelopersIO
                  • 無料で自動文字起こし&テキストで音声編集も可能な「audapolis」を使ってみた

                    オープンソースで開発される「audapolis」は書き起こし機能を備えたメディアエディターで、音声を自動的にテキストに書き起こすだけでなく、書き起こしたテキストを編集することで同時に音声も編集できるツールで、無料で使うことができます。 GitHub - bugbakery/audapolis: an editor for spoken-word audio with automatic transcription https://github.com/bugbakery/audapolis audapolisはオープンソースで開発されるフリーアプリで、AGPL-3.0ライセンスの下で配布されています。GitHubのページにアクセスし、「Release」にある最新バージョンをクリック。記事作成時点での最新バージョンはv0.3.0です。 audapolisはmacOS・Linux・Window

                      無料で自動文字起こし&テキストで音声編集も可能な「audapolis」を使ってみた
                    • 会議の文字起こしから議事録をまとめるLLMツールを作った

                      Leaner 開発チームの黒曜(@kokuyouwind)です。 Leaner では先月(2024 年 9 月)に葉山で開発合宿を行いました。合宿全体については既に開発者ブログの記事が上がっています。 今回、自分は議事録の自動まとめツールを作るチームでプロンプトを調整し、結構いい感じに動いたため記事を書くことにしました。 やりたかったこと 商談や社内のミーティングなどの実施後に議事録を作ることがあるのですが、結構時間がかかるため ChatGPT などの LLM を使って自動化できないか、というのを試しました。 やりたいこととしては LabBase さんの以下の記事が近いです。 ただし前提が異なる部分もあったため、諸々検証したうえで最終的には異なる構成になりました。 Amptalk を利用しており文字起こしが取得できているため、文字起こし部分はこれより精度が良いかが基準になる tl;dv や

                        会議の文字起こしから議事録をまとめるLLMツールを作った
                      • 脚本家の密談:文字起こしの改定版 1

                        黒沢 こんばんは 脚本家たちの深夜密談です 今週はちょっと先週からの予告を変更しまして 急遽セクシー田中さんの話をしたいと思っております と言いますのもですね やっぱり脚本家の深夜密談ということで 脚本家の名前を返している以上 ちょっと脚本家の立場からこの話をして ご理解していただきたいところもあるなというところから はい急遽決めました なかなか勇気のある決断だったので 私たちだけでは心もとないので 40年にわたってテレビドラマで活躍されている 伴一彦さんに急遽ゲストとして来ていただきました 伴さんどうかよろしくお願いいたします 伴さんのお話を お伺いしたいと思いますが お伺いする前に 一応ちょっとここまでの経緯を 簡単にお伝えしますと まずこの件の発端というのが 12月の24日に脚本家の方が そして今月の26日に原作者である芦原妃名子さんが それぞれなぜセクシー田中さんの9話と10話を

                          脚本家の密談:文字起こしの改定版 1
                        • [みんなのケータイ]自動文字起こしの精度が爆上がりして不可逆になってしまった件

                            [みんなのケータイ]自動文字起こしの精度が爆上がりして不可逆になってしまった件
                          • AWS Step Functionsで、音声ファイルがS3バケットに保存される度にAmazon Transcribeで文字起こしし、内容をメール送信してみた | DevelopersIO

                            はじめに AWS Step Functionsを利用し、音声ファイルがS3バケットに保存されるたびにAmazon Transcribeで文字起こしを行い、文字起こし内容をメール送信する方法を紹介します。 今回構築する構成は以下の通りです。 処理の流れは以下の通りです。 音声ファイル(WAV)をS3バケットにアップロードする アップロードをトリガーにEventBridgeからStep Functionsステートマシンを起動する 音声ファイルからAmazon Transcribeで文字起こしし、文字起こした内容をAmazon SNSでメール送信する この構成を構築するきっかけは、以前執筆した「Amazon Connectでエージェントの介在がない場合でも電話中の発話を録音する」記事の構成に、録音ファイルに対して文字起こしとメール通知機能を追加する必要が生じたためです。 執筆した記事の構成図は以

                              AWS Step Functionsで、音声ファイルがS3バケットに保存される度にAmazon Transcribeで文字起こしし、内容をメール送信してみた | DevelopersIO
                            • NHKはColaboに対して謝罪してないかもしれない/文字起こしが興味深い

                              私はNHKはColaboに対して情報漏洩の件で謝罪したとばかり思っていた。各種報道でもそう記載されていた。(https://www.kanaloco.jp/news/social/article-1042398.html、https://www.asahi.com/sp/articles/ASRDG5JHSRDGUCVL038.html、https://mainichi.jp/articles/20231214/k00/00m/040/215000c など。盛りあがっている各種増田やブコメでもNHKが謝罪したというのは大前提となっていたようだ。) いつも人に迷惑かけまくっても大々的に個別謝罪なんて滅多に行わない大マスコミが、直接的な被害者じゃないColaboにわざわざ出向いて謝罪してしかもそれが記事になるとか、珍しいこともあるもんだと思っていたが、一次ソースに当たるとどうも違う風景が見えて

                                NHKはColaboに対して謝罪してないかもしれない/文字起こしが興味深い
                              • 【特集】 Wordの翻訳機能がいつの間にか高精度に!AI文字起こし+Word翻訳は現状最高の組み合わせ

                                  【特集】 Wordの翻訳機能がいつの間にか高精度に!AI文字起こし+Word翻訳は現状最高の組み合わせ
                                • Neural Audio Codec を用いた大規模配信文字起こしシステムの構築 - Mirrativ Tech Blog

                                  こんにちは ハタ です。 最近Mirrativ上に構築した配信の文字起こしシステムを紹介したいなと思います 音声からの文字起こしは、各社SaaSでAPI提供されているものがあると思いますが、今回紹介するものはセルフホスト型(自前のGPUマシンを使う)になります 構築していく上で色々試行錯誤したのでそれが紹介できればなと思っています どんなものを作ったか 前提知識: 配信基盤 前提知識: Unix Domain Socket Live Recorder Archiver DS Filter VAD Filter NAC / Compress Transcriber NAC / Decompress Speach To Text コンテナイメージ まとめ We are hiring! どんなものを作ったか 今回作ったものは Mirrativで配信されるすべての音声を対象に文字起こしを行う シス

                                    Neural Audio Codec を用いた大規模配信文字起こしシステムの構築 - Mirrativ Tech Blog
                                  • 文字起こし「Whisper」の高速化モデル「Distil-Whisper」、スマホで別人の声になりきる「LLVC」、感情付きプロンプトなど重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge

                                    2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第19回目は、人気の文字起こしソフト「Whisper」の高速化版、スマホでできるAIボイチェン、プレッシャーをかける感情付きプロンプトをはじめとする、生成AI最新論文の概要5つをお届けします。 生成AI論文ピックアップOpenAIの文字起こしAI「Whisper」を軽量かつ高速にするモデル「Distil-Whisper」 Hugging Faceが開発 3.2兆以上のトークンで学習された、130億のパラメータを持つオープン大規模言語モデル「Skywork」 テキストや画像から高品質な動画を生成するオープンソースモデル「VideoCrafter1」 中国テンセント含む研

                                      文字起こし「Whisper」の高速化モデル「Distil-Whisper」、スマホで別人の声になりきる「LLVC」、感情付きプロンプトなど重要論文5本を解説(生成AIウィークリー) | テクノエッジ TechnoEdge
                                    • Amazon Connectでお問い合わせ内容をWhisper APIで文字起こしし、ChatGPTで要約して音声出力してみた(一次対応の無人化) | DevelopersIO

                                      Amazon Connectでお問い合わせ内容をWhisper APIで文字起こしし、ChatGPTで要約して音声出力してみた(一次対応の無人化) はじめに Amazon Connectを使用して、お問い合わせ内容をOpenAIのWhisper APIで文字起こしとChatGPTで要約し、通話中に音声出力する方法をまとめました。 Connectで無人対応の場合、顧客からの発話を聞き取る方法としては、チャットボットサービスであるAmazon Lexもしくは、Kinesis Video Stream(KVS)で音声のストリーミングなどがあります。 Amazon Lexを利用する場合は、1度に15秒以上は聞き取ることができない点や文字起こしにはAmazon Transcribeを利用する制約があります。 今回は、文字起こしにWhisper APIを利用し、ChatGPTで要約した内容をConne

                                        Amazon Connectでお問い合わせ内容をWhisper APIで文字起こしし、ChatGPTで要約して音声出力してみた(一次対応の無人化) | DevelopersIO
                                      1