タグ

ブックマーク / blog.takuya-andou.com (2)

  • 高精度な文字起こしAIでYoutubeの字幕を作ってみた - ニートの言葉

    どうもこんにちは、あんどう(@t_andou)です。 今回はOpenAIの高精度な文字起こしAIwhisper」を試してみました。 ただ試すだけでは面白くないのでもう少し実用的なことを…と言うことで、Youtube用の字幕を作ってみました。 実行環境 使用した動画と結果 まずはモデルごとに精度確認 small 処理時間 結果 所感 medium 処理時間 結果 所感 large 処理時間 結果 所感 使用した動画と結果その2 最後に 実行環境 GoogleColabGPUはT4でした。 使用した動画と結果 以前、リアルな顔がしゃべるAIを作ったので、その動画を使います。 声もAIによるもののため、僕の耳には聞き取りやすいですが、whisperにとってはどうでしょうか。気になります。 (ちなみに、この動画内で話しているニュースの文章もAIによる生成物です。) www.youtube.co

    高精度な文字起こしAIでYoutubeの字幕を作ってみた - ニートの言葉
    NAPORIN
    NAPORIN 2022/09/28
    ツイッタースペースとユーチューブのリアタイ字幕がこのラージくらいだといいなぁ
  • 画像生成AIで無料の画像素材サイトを作ってみた【Stable Diffusion】 - ニートの言葉

    みなさんこんにちは、あんどう(@t_andou)です。 最近、画像生成AIの「Stable Diffusion」がとても話題になっていますね。 オープンソース・商用利用可能・精度も良いということで、僕もこれを使って何かしたいと思いましたが、ただ画像を生成するだけでは面白くありません。 そこで、 ・AIが生成した画像や「呪文(画像生成に使う文章)」を売買出来るマーケット ・生成した画像のNFT化をするサイト などを作れたら面白そうだと思ったのですが、時間がかかりそうなので、まずはサクッと着手できそうなところから試してみました。 作ったもの 前置きが長くなりましたが、今回作ったのはタイトルにもあるように『画像の素材配布サイト』です。 imagemart.net 画像の生成、ドメイン取得やサイト構築など全てを5時間くらいで作ったため、使い勝手はまだまだですが、どうぞ自由に使ってください。 画像の

    画像生成AIで無料の画像素材サイトを作ってみた【Stable Diffusion】 - ニートの言葉
    NAPORIN
    NAPORIN 2022/08/26
  • 1