タグ

ブックマーク / blog.takuya-andou.com (7)

  • 文字起こしAIで誰でも無料でYoutubeの字幕ファイルを作る方法 - ニートの言葉

    どうもこんにちは、あんどう(@t_andou)です。 前回宣言した通りに誰でも簡単にYoutubeの字幕ファイルを作る方法を書きます。 「Youtubeの」と書いていますが、実際はどの動画でも対応してます。 前回の記事 blog.takuya-andou.com まずはGoogleColabの共有 colab.research.google.com 使い方 GoogleColabに記載していますが 1.GPUを使用するように切り替え 上の「ランタイム」→「ランタイムのタイプを変更」からからGPUを選択 2.右上の接続 下のセルを実行すると自動的に接続されるので省略可能です 3.動画をアップロード ここにドラッグ&ドロップでアップできます 大容量のデータの場合、GoogleDriveと連携した方が効率的です 4.入出力のパスの変更 ファイル名に合わせて変更してください 5.全セルを実行 あと

    文字起こしAIで誰でも無料でYoutubeの字幕ファイルを作る方法 - ニートの言葉
    misshiki
    misshiki 2022/10/03
    文字起こし“「Youtubeの」と書いていますが、実際はどの動画でも対応してます。”これは使えそう。
  • 高精度な文字起こしAIでYoutubeの字幕を作ってみた - ニートの言葉

    どうもこんにちは、あんどう(@t_andou)です。 今回はOpenAIの高精度な文字起こしAIwhisper」を試してみました。 ただ試すだけでは面白くないのでもう少し実用的なことを…と言うことで、Youtube用の字幕を作ってみました。 実行環境 使用した動画と結果 まずはモデルごとに精度確認 small 処理時間 結果 所感 medium 処理時間 結果 所感 large 処理時間 結果 所感 使用した動画と結果その2 最後に 実行環境 GoogleColabGPUはT4でした。 使用した動画と結果 以前、リアルな顔がしゃべるAIを作ったので、その動画を使います。 声もAIによるもののため、僕の耳には聞き取りやすいですが、whisperにとってはどうでしょうか。気になります。 (ちなみに、この動画内で話しているニュースの文章もAIによる生成物です。) www.youtube.co

    高精度な文字起こしAIでYoutubeの字幕を作ってみた - ニートの言葉
    misshiki
    misshiki 2022/09/28
    “固有名詞はやはり苦手”
  • 【画像生成AI】素材画像を作るWebサービスを作りました【無料】 - ニートの言葉

    どうもこんにちは、あんどう(@t_andou)です。 今回はかいどうさん(@odiak_)と一緒に、画像を入れるとそれに似た画像素材を生成してくれるサービスを作りましたので紹介させてください。 経緯 作ったもの 機能紹介 比較 比較1.お皿に何個かのいちごが乗っている写真 比較1-1.StableDiffusionのimg2imgを呪文無しで使った場合 比較1-2.ImageMartで生成したもの 比較2.某魔法の映画に出てきそうな男の人の画像 比較2-1.StableDiffusionのimg2imgを呪文無しで使った場合 比較2-2.ImageMartで生成したもの その他の例 最後に 記事で利用した画像 経緯 以前、画像生成AIで書き出した画像を配布するサイトを作りましたが、その際に 今後は『検索をするように画像を生成して使うようになる。』そして『生成をするための文章をうまく表現す

    【画像生成AI】素材画像を作るWebサービスを作りました【無料】 - ニートの言葉
    misshiki
    misshiki 2022/09/12
    “現時点での機能としては、「画像を入れるとそれに似た画像を生成してくれる」という機能の一点だけになります。 ”画像を入力するだけでよく文章は不要。
  • 画像生成AIで無料の画像素材サイトを作ってみた【Stable Diffusion】 - ニートの言葉

    みなさんこんにちは、あんどう(@t_andou)です。 最近、画像生成AIの「Stable Diffusion」がとても話題になっていますね。 オープンソース・商用利用可能・精度も良いということで、僕もこれを使って何かしたいと思いましたが、ただ画像を生成するだけでは面白くありません。 そこで、 ・AIが生成した画像や「呪文(画像生成に使う文章)」を売買出来るマーケット ・生成した画像のNFT化をするサイト などを作れたら面白そうだと思ったのですが、時間がかかりそうなので、まずはサクッと着手できそうなところから試してみました。 作ったもの 前置きが長くなりましたが、今回作ったのはタイトルにもあるように『画像の素材配布サイト』です。 imagemart.net 画像の生成、ドメイン取得やサイト構築など全てを5時間くらいで作ったため、使い勝手はまだまだですが、どうぞ自由に使ってください。 画像の

    画像生成AIで無料の画像素材サイトを作ってみた【Stable Diffusion】 - ニートの言葉
    misshiki
    misshiki 2022/08/29
    これは使えそう。
  • 人工知能にコウメ太夫さんのツイートを学習させてみた - ニートの言葉

    どうもこんにちは、最近何かを生成する系のAIで遊ぶことにハマってます、あんどう(@t_andou)です。 5年以上前の話ですが、人工知能に哲学書を読ませて哲学的な文章を書いてもらいました。 blog.takuya-andou.com 今回はその時よりも高度な「GPT-2」というものを使って、コウメ太夫さんのツイートを学習させてみたいと思います。 なぜコウメ太夫さんなのか コウメ太夫さんと言えば、毎日とても面白いギャグツイートすることで有名なかたです。 ですが、ごく稀に難解すぎてAIがツイートしてると疑われ、記事になることもあります。*1 AIが考えたと言われているツイート ミリンは10%でミリン風調味料{アルコール分1%未満}は8%ということはキリン風ゾウ{シマウマ縞数100程度}はドツチになるか考えいたら~、 竜宮城の乙姫さま生牡蠣当たってタイやヒラメにガスバナ~当ててました~。 チクシ

    人工知能にコウメ太夫さんのツイートを学習させてみた - ニートの言葉
    misshiki
    misshiki 2021/11/01
    事例
  • AIに絵本を描いてもらった - ニートの言葉

    どうもこんにちは、あんどう(@t_andou)です。 最近『何かを生成するAI』に興味があり、触ってみました。 しかし、ただ「試してみた」だけでは面白みが無いので、何か作品を作りたいと考え、絵を描いてもらうことにしました。 まずは完成作品をご覧ください。 youtu.be 違和感がすごいですね。 お気づきになった方も多いかとは思いますが、実はこちらの作品 絵だけじゃなく、物語、読み上げ音声、BGM、全てがAIによる生成物です。 完成度はまだ低いものの、あと数年もすれば違和感の無い作品が作れるようになりそうな予感がしますね。 使用した技術 全てを把握しているわけではないため自分用のメモ程度になりますが、使った技術を記載しておきます。 絵 絵にはVQGANとCLIPという技術を使っています。 これは凄くて、描いて欲しいものを文章で伝えると描いてくれます。 しかも、どんな画風で描いて欲しいかま

    AIに絵本を描いてもらった - ニートの言葉
    misshiki
    misshiki 2021/10/11
    事例“絵だけじゃなく、物語、読み上げ音声、BGM、全てがAIによる生成物”
  • 高精度でテキスト分類を行えるAIの環境を用意しました【BERT】 - ニートの言葉

    こんにちは、あんどう(@t_andou)です。 最近、自然言語処理のAIの一種であるBERTをよく触っています。 今回はBERTのソースを読まなくてもサクッと試せる環境を用意しましたので、メモとして残しておきます。 BERTとはどういうものか 画像引用:https://arxiv.org/pdf/1810.04805.pdf 凄くざっくりと説明すると、BERTとは2018年末にGoogleの人たちが開発した自然言語処理において汎用的に使えて精度の良いAIです。 自然言語処理において精度を測るためにいくつかのタスクがあるのですが、発表された時点ではダントツの成績でした。 仕組みなどの詳細については論文を読むか解説記事をググってください。 2019/09/22時点で既により精度の良い手法がどんどん発表されていますが、BERTの情報量と比べるとまだ少ないため、入門としてはBERTを触ってみるのが

    高精度でテキスト分類を行えるAIの環境を用意しました【BERT】 - ニートの言葉
  • 1