2022年9月28日のブックマーク (2件)

  • 高精度な文字起こしAIでYoutubeの字幕を作ってみた - ニートの言葉

    どうもこんにちは、あんどう(@t_andou)です。 今回はOpenAIの高精度な文字起こしAIwhisper」を試してみました。 ただ試すだけでは面白くないのでもう少し実用的なことを…と言うことで、Youtube用の字幕を作ってみました。 実行環境 使用した動画と結果 まずはモデルごとに精度確認 small 処理時間 結果 所感 medium 処理時間 結果 所感 large 処理時間 結果 所感 使用した動画と結果その2 最後に 実行環境 GoogleColabGPUはT4でした。 使用した動画と結果 以前、リアルな顔がしゃべるAIを作ったので、その動画を使います。 声もAIによるもののため、僕の耳には聞き取りやすいですが、whisperにとってはどうでしょうか。気になります。 (ちなみに、この動画内で話しているニュースの文章もAIによる生成物です。) www.youtube.co

    高精度な文字起こしAIでYoutubeの字幕を作ってみた - ニートの言葉
    awawawann
    awawawann 2022/09/28
    メモメモ
  • 画像生成AIで自分が作りたいイメージから類似画像を見つけてプロンプト・呪文を次々に探していける「KREA」

    画像生成AI「Stable Diffusion」は「プロンプト」として文字列を入力することで、その文字列の内容に沿った絵や写真を自動で生成してくれます。しかし、自分の理想により近い画像を生成してもらうためには、多種多様な文字列を大量にプロンプトとして入力する必要があり、この複雑なプロンプトを探ることが画像を生成する工程の中でも特に大変な作業の1つです。「KREA」はAIで生成された画像とそのプロンプトをまとめたデータベースで、自分が理想とする画像を生成するためのプロンプトを探る作業がはかどります。 KREA — create better prompts. https://www.krea.ai/ KREAのトップページはこんな感じ。 上段の「search for prompt」に「anime」と入力してみると、以下のようにサジェストが表示されました。 今回はサジェストを無視し、「anim

    画像生成AIで自分が作りたいイメージから類似画像を見つけてプロンプト・呪文を次々に探していける「KREA」
    awawawann
    awawawann 2022/09/28
    AI