わいせつ画像を出力する可能性が高いAIモデルを公開・提供したり、同モデルを利用したサービスを提供する行為は、わいせつ物頒布等罪(刑法175条)に該当するか。 *以下日本法を前提とします。
最近話題になった「音楽生成AI」をまとめました。 1. AudioGenテキストからオーディオを生成するAIモデルです。「風が吹く中で口笛をする音」や 「大勢の歓声の中で話す男性の声」といったテキストから、それらしい音を生成してくれます。 現在のところ、モデルやAPIは提供されていません。 We present “AudioGen: Textually Guided Audio Generation”! AudioGen is an autoregressive transformer LM that synthesizes general audio conditioned on text (Text-to-Audio). 📖 Paper: https://t.co/XKctRaShN1 🎵 Samples: https://t.co/e7vWmOUfva 💻 Code & mod
OpenAIの音声認識モデルWhiper、いやー、まじですごすぎて感動しました。 配信中のpodcast番組 白金鉱業.FMを頑張って文字起こしするために、この記事とか、この記事とかでかなり真面目に既存文字起こしAPIの精度などを比較していましたが、もう今回は比べるまでもなく本当に雲泥の差です。ほぼ一言一句正確に文字起こしできます。GCP, AWS, Azureの文字起こしAPIは文字起こし精度が体感30~60%くらいでしたが、whisperは90%超えている印象です。もう笑うしかないです。 最初に結論 インストール 実行方法 結果 tinyモデルの結果 baseモデルの結果 smallモデルの結果 mediumモデルの結果 largeモデルの結果 まとめ 追記 カタカナ英語 完全制覇 whisperくん せんでんせんでん 最初に結論 whisperは異なるモデルサイズが5種が利用可能であ
ホーム ブログ 人工知能(AI)、ビッグデータ法務 Midjourney、Stable Diffusion、mimicなどの画像自動生成AIと著作権|知… はじめに Midjourney、Stable Diffusion、mimicなど、コンテンツ(画像)自動生成AIに関する話題で持ちきりですね。それぞれのサービスの内容については今更言うまでもないのですがMidjourney、Stable Diffusionは「文章(呪文)を入力するとAIが自動で画像を生成してくれる画像自動生成AI」、mimicは「特定の描き手のイラストを学習させることで、描き手の個性が反映されたイラストを自動生成できるAIを作成できるサービス」です(サービスリリース後すぐ盛大に炎上してサービス停止しちゃいましたが)。 で、この手の画像自動生成AIのようなコンテンツ自動生成AIですが、著作権法的に問題になる論点は大体決ま
世界のルールが根本的に変わってしまう… そういう展開は、マンガや映画ではよく起こる。それが現実でも起きそうだ。 あと数日(から数週間)で「トップレベルの画像生成AI」が、世界中にフリーで配布される。 イラスト、マンガはおろか3D CGや建築、動画、映像…果てはフェイクニュースからポルノまで…あらゆる創作に携わる全ての人を巻き込む、歴史的な転換点が訪れようとしている。 凄さ的には、悪魔の実がメルカリで買えるようになる。念能力トレーニング動画がYoutubeにアップされる。それぐらいヤバい。 メルカリで悪魔の実が買える世界では、誰もが能力者(一流とは限らない)になれる。そんな、漫画やゲームのラスボスが語るようなユートピアが、あと数日で現実になってしまうかもしれない。 Stable Diffusionで出力したドワーフの王様Stable Diffusionで出力したホビットのスタディ Stabl
一応、StableDiffusionとははっきりまず言います…とにかくやばいです。 分かりやすく、他のDALL・E2、Midjourney、Disco Diffusion、他有象無象Text to image machine learning系サービスと比較しますと… クオリティがかなり高い。 制限がなくなり、かなり細かい調整ができるようになったDALL・E2のような感じです。 生成が早い。 設定なしで使えば正直体感DALLE2より早いです。6秒..くらい? 安い。 3円くらいだと思います。 DALL・E2は1生成17円。Midjourneyは月4000円。 オープンソース これからいろんなサービスにこのAIが搭載されます。 他AIではかけられている学習データのフィルターがない。 各国の代表者や、有名人、ポルノがデータに含まれています。 PC上で使用できる。( = その場合無料) いや、こ
「AIのべりすと」とは、小説を生成する人工知能。GPT-3をモデルとした、日本語の自然言語処理プロセッサです。『Tone Sphere』で知られるBit192 LabsのStaさんに、小説生成の仕組みや使い方についてインタビューしました。 ダ・ヴィンチ・恐山と申します。 私は「品田遊(しなだゆう)」名義で小説を書いていまして、これまでに3冊の本を出しています。 一丁前に本を出し、普段はライター業なんて営んでいる私ですが、いつもはキーボードを叩きながら「文章考えるのめんどくせ~」と思っています。 世の中には書いても書いてもアイデアが湧き出てくる油田みたいなクリエイターもいるようですが、あいにく自分はそうじゃありませんでした。 とにかく文字を書くのは面倒くさい。だれか代わりに書いてくれないかな…… と思っていたら、「小説を書いてくれる人工知能」が使えるようになったという噂を目にしました。 ほん
鈴木裕氏: ただ、そうね……僕は全盛期に世界のトップシェアを取っていた日本が、こんなふうに海外に負けてしまったことが、やっぱり悔しいんですよ。だって、セガが全盛期の頃、僕たちは圧倒的な世界一のゲーム大国だったんです。(中略)ちゃんと新しい武器を製造しないとダメです。だって、良い武器があったら、色々なツールを工夫したりして、少人数でも勝てるんですよ。 そんな鈴木裕氏がインタビュー中、非常に強い興味を持って語っていたのがAI技術だった。そして先にズバリ言ってしまうと、この記事は、日本のゲーム産業が21世紀に世界市場で存在感を失い、今や新興国の国々までもが背後に迫ってきたシビアな状況に、実は「AI技術の軽視」という問題が一つあるのでは――という視点から強く光を当てるものだ。例えば、しばしば日本のゲーム業界の「敗因」として、グラフィックの人材不足や大規模マネジメントの失敗などの問題が挙げられる。だ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く