slay-tのブックマーク - はてなブックマーク

高精度な文字起こしAIでYoutubeの字幕を作ってみた - ニートの言葉
どうもこんにちは、あんどう（@t_andou）です。今回はOpenAIの高精度な文字起こし AI「whisper」を試してみました。ただ試すだけでは面白くないのでもう少し実用的なことを…と言うことで、Youtube用の字幕を作ってみました。実行環境使用した動画と結果まずはモデルごとに精度確認 small 処理時間結果所感 medium 処理時間結果所感 large 処理時間結果所感使用した動画と結果その２最後に実行環境 Google ColabでGPUはT4でした。使用した動画と結果以前、リアルな顔がしゃべるAIを作ったので、その動画を使います。声もAIによるもののため、僕の耳には聞き取りやすいですが、whisperにとってはどうでしょうか。気になります。（ちなみに、この動画内で話しているニュースの文章もAIによる生成物です。） www.youtube.co
slay-t 2022/09/28
AI

動画

technology

技術
リンク
人工知能にコウメ太夫さんのツイートを学習させてみた - ニートの言葉
どうもこんにちは、最近何かを生成する系のAIで遊ぶことにハマってます、あんどう(@t_andou)です。 5年以上前の話ですが、人工知能に哲学書を読ませて哲学的な文章を書いてもらいました。 blog.takuya-andou.com 今回はその時よりも高度な「GPT-2」というものを使って、コウメ太夫さんのツイートを学習させてみたいと思います。なぜコウメ太夫さんなのかコウメ太夫さんと言えば、毎日とても面白いギャグツイートすることで有名なかたです。ですが、ごく稀に難解すぎてAIがツイートしてると疑われ、記事になることもあります。*1 AIが考えたと言われているツイートミリンは１０％でミリン風調味料｛アルコール分１％未満｝は８％ということはキリン風ゾウ｛シマウマ縞数１００程度｝はドツチになるか考えいたら～、竜宮城の乙姫さま生牡蠣当たってタイやヒラメにガスバナ～当ててました～。チクシ
slay-t 2021/11/01
学習

AI

勉強

ネタ

machinelearning

人工知能

機械学習

techfeed

hatena
リンク
24時間生放送をし続ける人工知能youtuberを作るその1 - ニートの言葉
こんにちは、あんどう（@t_andou）です。少し前ですが、こんなニュースが話題になっていました。詳細は深追いしていませんが、ニュースキャスターの人物モデルをコンピューターで再現して音声も読み上げさせているようです。 japan.cnet.com また、政治やエロ方面で問題になっていましたが、deepfakesと言う「顔をすごくリアルに入れ替えることができる技術」も話題になっています。 japanese.engadget.com 去年は3Dモデルを使った『Vtuber』が流行りましたが、今後はこう言ったリアルなアバター？がいろんな方面で出てくるんでしょうね。と言うことで、今回からその基礎になるようなものを作ってみたいと思います。*1 とは言え、ただリアルな見た目・リアルな声のYoutuberだとしたら、実写で良いのでは？と突っ込まれそうですので、生身だと出来ないこと…具体的には『2
slay-t 2019/01/17
機械学習

生放送

Youtuber

プログラミング
リンク
【プログラミング不要】ディープラーニング（h2o.ai）で株価予測をやってみた - ニートの言葉
2017/07/20　追記本記事の内容に関してTwitter・メールで問い合わせをいただきますが、全員に対して返信を差し上げることが出来ないため、VALU保有者優先で相談を受けます。 valu.is 対象読者自前のデータでディープラーニングを体験したい人 tensorflowなどのチュートリアルまでやったが、その次の道が見えない人株価の予測に興味がある人はじめにこんにちは。あんどう（@t_andou）です。最近、人工知能の技術の一種「ディープラーニング」に注目しています。ディープラーニングとは、簡単に言うと「これまでは人間が教えていた『特徴』を機械が勝手に見つけてくれる」ものらしいです。最初は画像処理系のプログラムで遊んでみました。ディープラーニングという言葉はよく耳にするようになってきましたが、何ができるかわからなかったので、まずは体験するためにまずはディープラーニング
slay-t 2016/06/06
人工知能

AI

Deep Learning

プログラミング

ディープラーニング
リンク
1