F Lite Model Card F Lite is a 10B parameter diffusion model created by Freepik and Fal, trained exclusively on copyright-safe and SFW content. The model was trained on Freepik's internal dataset comprising approximately 80 million copyright-safe images, making it the first publicly available model of this scale trained exclusively on legally compliant and SFW content. Usage Experience F Lite insta
写真家・五味彬さんによる作品集「Yellows」は、米Kodak(コダック)によって開発されたデジタルカメラで1992年に撮影された、たぶん世界でも最も早い時期に作られたデジタルカメラによる作品集だ。カシオの「QV-10」の発売が95年だから、相当早い。 五味彬によるオリジナル「Yellows」より、「中村沙弥」。モデル一人に対し、このような顔のアップ、服を着た全身、全裸の全身の正面、横向き、後ろ向きなどの写真を同じ背景、同じライティングで撮った、人体標本的な作品集だった(画像提供:五味彬さん、以下同) その五味さんは現在、生成AIを駆使した作品「Yellows AI」の作品展などを行っている。デジタルと写真の最前線を走り続けた彼による、デジタル写真の最先端が生成AIだとするなら、その捉え方、作品制作に関する写真家の技術や考え方の変化を知った上で、「Yellows AI」やその他の現在の五
(ICLR2021) Score-Based Generative Modeling through Stochastic Differential Equations
はじめに .NET Frameworkと.NET 8.0-windowsで、System.Drawing.Bitmapに依存した実装に十年以上も縛られ続けてきました。 いい加減、真面目に非Windows環境での動作に対応しようという事で、各種画像ライブラリーについて真面目に評価してみました。ただし、あくまで画像ファイルからのデコードと二値化処理に特化した評価になっていますので、かなりニッチな評価だとは思います。 参考になるようであれば、ぜひご利用ください。 評価内容 JPEGと二値のTIFF、WebPの3種類の画像ファイルをデコードし、画像解析用の二値のバイト列へデコードする。 評価結果 先に結論だけ記載すると、つぎのようになりました。 ImageSharpのJPEGデコードアルゴリズムが、System.Drawing.Bitmapと微妙に異なっていました。 目視では分からないレベルだとは
はじめに Googleが2025年3月14日に発表したGemini-2.0と、続けてOpenAIが2025年3月26日に発表したGPT-4oの画像生成能力は、これまでの画像生成AIでは到達しえないレベルの制御性・品質での画像生成を実現しました。 ここ1年半ほど画像生成AIいじりを仕事にしてきた者としては、これまで積み上げてきた成果や進捗がすべて無に帰すレベルでの進化が突然起き、巨人にすべてを蹴散らされたという感じです。別のスキルを身につけたほうがいいかな… しかし一方で、この進化は決して1日にして為されたものではなく、これまでの研究成果が地道に蓄積された結果です。本記事では、その驚異的な画像生成能力、ひいてはAny-to-Anyの生成能力の裏にある技術的な背景を、分かる範囲でサクッと解説していきます。 これまでの画像生成AI TL;DR: これまで広く利用されてきた画像生成AIは、拡散モデ
日本時間2025年3月26日、OpenAIはChatGPTの基盤モデル「GPT-4o」に、ネイティブな画像生成機能を統合し、一般提供を開始しました。 今回のアップデートは単なる画像生成機能の追加ではなく、言語モデルの中核的な機能として画像生成を位置づける、非常に重要なアップデートです。特にテキストのレンダリング精度や複雑な指示への対応力が飛躍的に向上し、従来難しかった実用的な表現が可能となりました。 AIによるクリエイティブな画像生成が新たな段階に進んだことを実感できる、画期的な進化を遂げています。 最新の画像生成機能で生成 GPT-4oによるネイティブ画像生成機能の詳細今回のアップデートで最も大きな特徴は、画像生成能力がGPT-4oモデル自体にネイティブに組み込まれた点です。テキストと画像の連携がよりスムーズになり、以下の機能向上が実現しています。 特徴: 高精度なテキストレンダリング:
TL;DR 日本語から danbooru タグに翻訳する LLM を作った LLM を使ってデータセットを合成した 成果物 Danbooru tags Translator で略して Danbot です (Danbooru + Bot にもなります)。前回は Dart でしたが流石に名前被りが多くて検索しずらそうなので変えました。 モデル: 作成したデータセット: ComfyUI カスタムノード: 結果だけ見たい方は #画像生成結果 へ。 前提 この記事は、前回の プロンプトは考えたくないけど画像生成がしたい! となっています。 割と前回の手法について触れることがあるので、前回の記事を読まないと理解できない箇所があるかもしれません。 はじめに 前置きは前回の記事と同じなのでざっくり説明します。 画像生成モデルのプロンプト、考えるの難しい じゃあプロンプトを LLM で生成しよう という感じ
概要 Unity6でインポートしたSpriteをUGUIのImageに上手くアサインできない現象が発生しました この記事はその解決方法になります 結論 Sprite ModeがSingleになっていないと、Imageにアサインできません Spriteをそのまま使いたいときは、Sprite ModeをSingleに変更してApplyします 補足 Unity6ではテクスチャをインポートした際にデフォルトでSprite ModeがMultipleになっているようです この状態だとImageにSpriteをアサインすることができません Sprite ModeをSingleに切り替えてApplyするとImageにSpriteをアサインできるようになります 参考記事 Unity 6 - PNG sprites and UI Images
Object の細部の描写を表現する Mesh 表面に張られている Texture は Bit map 画像 Photoshop などの Digital contents 作成 Application で Texture を作成し、Unity に import する Texture は Material を通して Object に適用される Material は Shader と呼ばれる Graphics 用の特別な program を使用して、Mesh 表面に Texture を描画 Shader には、周囲の様々な影響を受ける物体表面の光沢や凹凸などを simulate するための、Lighting と Coloring の効果を実装可能
異方性フィルタリング(Anisotropic Filtering, AF)とは 異方性フィルタリングは、3Dグラフィックスにおいてテクスチャの鮮明さを向上させるフィルタリング技術の一つです。特に、視点の角度が浅い(斜め方向から見た)テクスチャのぼやけを低減するために使用されます。 テクスチャフィルタリングの問題 3Dレンダリングでは、テクスチャをポリゴンに貼り付けて表示します。 しかし、テクスチャが画面上で縮小・拡大されるとき、ピクセルごとの適切な色を計算するフィルタリング処理が必要になります。この処理が適切でないと、以下の問題が発生します。 エイリアシング(Aliasing):ギザギザやモアレ模様が発生 モザイク(Blurring):ぼやけたテクスチャになる 視点の角度によるぼやけ:視線が斜めのときにテクスチャが不明瞭になる このような問題を解決するために、異方性フィルタリングが使われま
Cloudflareを使った画像の配信パターンを紹介します。 Cloudflareで画像配信をする方法はたくさんあります。例えば、Cloudflare Imagesというプロダクトがありますが「それだけ」を使うのではなく、Cloudflare Workersをプロキシのように使ってR2をバックエンドにするといった画像配信の方法もあります。たくさんあるがゆえ、アプリケーションに最適な方法とその実装が分からないことがあるので、少しでも分かるようにしたいです。 Cloudflare Imagesについて 名称からして、画像配信というとこのプロダクトに辿り着きます。 ただ、Cloudflare Imagesは機能の集合です。これから紹介するようにCloudflare Imagesだけで配信ができるパターンもありますし、他のパターンでは、Cloudflare Imagesの画像変換や最適化の機能を使
タイムラインで流れてきたポストから、Googleが作っているImageFXが作ってくれる画像のクオリティが高いように見えたので、触ってみていた。 ImageFXの作例 これが自分で撮った紅葉の写真で、 こっちが、Image FXに、京都の紅葉、50mm f1.4バブルボケ、とか伝えて作ってもらったもの。 ChatGPTに同じ入力を渡すと、こんな画像なので、仕上がりの違いがわかると思う。 どこか嘘っぽいというかメルヘンな仕上がりになりがち。 ここまでできるなら、手持ちの画像そっくりな画像を作れるのでは、と思って試してみる。 手持ちのラーメンの画像そっくりなラーメン画像を作る ChatGPTに、自分で撮影したラーメンの写真をアップロードして、この画像を作るためのプロンプトを作って、とお願いする。 この画像と同じ写真を生成AIで作りたいので、プロンプトを生成してください。内容だけでなく、レンズの
はじめに 今回は、満を持してVAE(Variational Auto Encoder)をちゃんと理解していこうと思います。 VAEに関しては、だいたい知っていますが、MusicGenという音楽生成AIを理解しようと思った時に、関連してRVQ-GANが出てきたので、再勉強をしています。 今後、下記の流れで記事を書いていく予定です。 VAE(今回) ↓ VQ-VAE ↓ RQ-VAE,RVQ-GAN ↓ MusicGen 今回は、流れの最初であり、現在でも非常に重要な概念であるVAEに関して記事を書きます。 VAEは、Stable Diffusionの中でも中核として使われていたりと、比較的古い概念でありながら、まだまだ活躍が期待できる汎用ネットワークです。 本記事が、みなさまの理解の手助けになれば、これほど嬉しいことはございません。 参考文献 VAEの論文です。 ゼロから作るDeep Lea
はじめにこんにちは、AI Picasso社の開発チームです。皆様に重要なお知らせがあります。高品質AIアート用画像生成AI、Emi 3 を商用利用可能で無償公開します。この画像生成AIは、基盤モデルの学習においてオプトアウトが実施されており、追加学習において無断転載画像を学習していません。 Emi 3は以下のURLから無料でダウンロードできます。 Emi 3の特徴1.表現能力が高いこのモデルは、イラストやアニメ、マンガのようなAIアート生成に特化しています。モデルマージやフルファインチューニングといったAI Picasso社のノウハウを用いて表現能力が高い画像が生成されるように尽力しました。参考として簡単な生成例を以下に紹介します。 Happy Holidays!といっている少女手に炎をまとった男子基盤モデルに Stable Diffusion 3.5 Largeという最先端のモデルを用い
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く