Your Local AI Travel PlannerFor the ultimate personalised askLAYLA experience download the app. It's like having a travel agent in your pocket 24/7 - the perfect ai itinerary planner.
Dola is an AI agent calendar assistant “tool” powered by GPT-4.
Turn your Selfies into Professional Business Headshots - Create Your Headshot 👩🏻💼👨🏻💼
MusicLM: Generating Music From Text |paper|dataset| Andrea Agostinelli, Timo I. Denk, Zalán Borsos, Jesse Engel, Mauro Verzetti, Antoine Caillon, Qingqing Huang, Aren Jansen, Adam Roberts, Marco Tagliasacchi, Matt Sharifi, Neil Zeghidour, Christian Frank Google Research Abstract We introduce MusicLM, a model generating high-fidelity music from text descriptions such as "a calming violin melody bac
Easy-Peasy.AI is the AI Content Generator that helps you and your team break through creative blocks to create amazing, original content 10X faster. Create amazing content 10X fasterEasy-Peasy.AI is an AI Content tool that can help you with a variety of writing tasks, from writing blog post, creating better resumes and job descriptions to composing emails and social media content, and many more. W
それを、完全とは言えないまでも、かなり元の人に肉薄する品質で再現できる技術がDiff-SVCです。元になる音声データが1時間くらいあれば、与えた音声を、希望する声質に変換することが可能になるのです。 しかも、基本的にお金はかかりません。AI歌声合成が、ちょっとハードルは高いものの、無料で使えて、データさえ集めてくれば誰でも手が出せる。AI歌声合成の民主化と言っていいでしょう。 筆者は10年近く前に旅立った妻の歌声を、UTAU-Synthという、短く切り出した音素をピッチや長さを合わせながら組み合わせていくソフトウェアで再構成しています。1フレーズずつ音素を繋いで、できるだけ不自然にならないように調整していくため、短くて数日、長いと数カ月も時間をかけて完成させていきますが、もうその作業をしなくてもよくなります。 ただ、自分で歌って、もしくは他のボーカルシンセソフトでボーカルトラックをDiff
新世紀エヴァンゲリオンにでてくる超AI、MAGIシステムを作ってみたメモ。 OpenAI社のGPT3を使って、三頭制合議型のAIシステムを組んでみた。 MAGIシステムとは?MAGIは、アニメ「新世紀エヴァンゲリオン」にでてくる超AI。 このAIの面白い特徴は、性格の異なる3体のAIが、それぞれ独立に見解をだし、それを集約して1つの結論をだすという合議制のシステムです。 キリストの祝福を告げた三賢者にちなみ「メルキオール」、「バルタザール」、「カスパー」という3つのAIが、それぞれ開発者である赤城博士の「科学者」、「母」、「女」として側面をから答えを出します。 MAGI GPT3の実装最近話題のChat GPTの凄さをみるに、「MAGIシステム」現実に作れるのでは?と思って、Google Colabで実装してみました。 1つの質問に対し、GPT3を4回ぶんまわすシステム図のように、1つの質
従来のモデル撮影は、モデル、カメラマン、アシスタント、スタイリスト、ヘアメイクなど多くの人手が必要になり、コストや時間がかかってしまう。加えて、既存モデルでは独自の世界観を表現しづらい点も悩みといえる。 同サービスを手掛けるAI model(AIモデル)社の谷口大季CEOは、「アパレルにおけるモデル撮影の負荷を軽減し、新たな価値を創出したい」と創業の目的を語る。AIモデルが広がれば、アパレル業界はどのように変化するのか。 関連記事 「サクマ式ドロップス」製造元が廃業に追い込まれた、これだけの理由 「サクマ式ドロップス」を製造する佐久間製菓が2023年1月に廃業する。廃業の理由として、同社は「コロナ」と「原材料高騰」の2つを挙げているが、本当にそうなのか。筆者は違った見方をしていて……。 「マルチ商法の優等生」アムウェイは、なぜこのタイミングで“お灸”を据えられたのか 日本アムウェイ合同会社
10月27日、Synthesizer Vの新しい歌声データベースとして、Maiがお披露目となり、その歌唱動画が公開されました。実際にユーザーが入手可能になるまでには、まだもう少し待つ必要がありそうですが、遅くとも年内には登場するそうですから心待ちにしたいところです。 今回、Synthesizer Vの開発元であるDreamtonicsによって公開されたMaiの歌声のビデオを見ると、驚くほど滑らか、スマートな歌い方であり、もはや人間の歌声と区別がつかない次元まで進化しているように感じます。しかも、とくに調声をしなくても、音符と歌詞を入力するだけで、非常にリアルな歌い方をしてくれる、というのも、嬉しいところです。一方で、先日リリースされたSynthesizer V Studio Proの最新バージョン1.7.1において、歌声データベースの複数バージョンを利用できる機能が追加されています。なぜそ
1.はじめに AI画像生成を行うStable Diffusionに、img2img(画像と文から画像生成する機能)が追加されました。前回に続いて、Google Colabで動かしてみたいと思います。 2.コード Hugging Faceからアクセス・トークンの取得をしていない方は、前回のブログの「2.アクセス・トークンの取得」を参考に取得してから下記に進んで下さい。 コードはGoogle Colabで動かす形にしてGithubに上げてありますので、それに沿って説明して行きます。自分で動かしてみたい方は、この「リンク」をクリックし表示されたノートブックの先頭にある「Colab on Web」ボタンをクリックすると動かせます。 まず、セットアップをおこないます。 #@title **セットアップ** # ライブラリ・インストール ! pip install transformers gradi
OpenAIの音声認識モデルWhiper、いやー、まじですごすぎて感動しました。 配信中のpodcast番組 白金鉱業.FMを頑張って文字起こしするために、この記事とか、この記事とかでかなり真面目に既存文字起こしAPIの精度などを比較していましたが、もう今回は比べるまでもなく本当に雲泥の差です。ほぼ一言一句正確に文字起こしできます。GCP, AWS, Azureの文字起こしAPIは文字起こし精度が体感30~60%くらいでしたが、whisperは90%超えている印象です。もう笑うしかないです。 最初に結論 インストール 実行方法 結果 tinyモデルの結果 baseモデルの結果 smallモデルの結果 mediumモデルの結果 largeモデルの結果 まとめ 追記 カタカナ英語 完全制覇 whisperくん せんでんせんでん 最初に結論 whisperは異なるモデルサイズが5種が利用可能であ
Stable Diffusionがオープンソースで公開されてちょうど1ヶ月が立ちました。OpenAIがDall-E2をリリースしたのが4月。こういう異次元なリソースを使ってモデルを作れるのはごく限られたプレーヤーだけと思い込んでいたものが、若干十数人のチームがMidjourneyをリリースしたのが7月。一連の騒ぎがここ半年程度の出来事で、1ヶ月前に深津さんも予見していた「世界変革」が目の前で怒涛の勢いで進行しています。 このブログも書いた瞬間に古くなるだと思うけど、この文化的特異点とも言える1ヶ月に起こったことを振り返ってみたいと思います。それにしても手書き文字の生成に感動していた2015年から比べるとずいぶん遠いところまで来ましたね。DataRobotでも「AIの民主化」を掲げて様々な企業のAI活用を推進していたけれど、今起こっている変化を見ているとそのスピード感に愕然とします。 少し宣
最近話題のお絵描きAIをGoogle Colabで試してみようという記事です。 ここで使うAIは、stability.aiの stable diffusion というモデルで、つい最近 CreativeML Open RAIL-Mライセンスの下、オープンソースでリリースされました。 StableDiffusionに関する日本語記事は、深津 貴之さんの記事が面白いので是非こちらをお読みください。 stability.aiの記事で、Google Colabを用いて使う方法についての説明があり、試してみたところ本当に簡単に実行できてしまったので、その手軽さを紹介できればと思います。 実際に試したい場合は、元記事のGoogle Colabのノートブックが丁寧に説明しているので、そちらをご覧いただければと思います。 試してみる。 必要なもの Google アカウント Hugging Face アカウ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く