Adobe Fireflyとは?Fireflyは、Adobeが独自に開発した画像生成AIです。 Fireflyは昨年以来、Photoshopにアスペクト比を拡大させる生成拡張機能などを搭載するなど、少しずつPhotoshopと統合されてきました。しかし今まで、いちから画像を生成する機能はFirefly Webアプリに制限されていました(空白のキャンバスに生成塗りつぶしを使用するというずるい方法を除きます)。 Fireflyは、Adobeが所有するストック写真や画像にトレーニングデータを限定することで、ほかのAIアートモデルとの差別化を図っています。その目的は、商用利用においてより安全性を確保することです。 「Firefly Image 3」は同モデルの最新アップデートで、「より高品質の画像」を提供しています。構成やライティングに重点が置かれ、プロンプトの理解も向上しています。 AI画像を生
過酷な資源ごみのビン色選別を自動化、PFUがイメージスキャナー技術から新規事業:人工知能ニュース(1/2 ページ) PFUは、廃棄物の分別を自動化する「廃棄物分別特化AIエンジン」シリーズの第1弾として、ビンの色選別を自動化する「Raptor VISION BOTTLE」の提供を開始する。世界シェアトップのイメージスキャナー開発で培った独自アルゴリズムによる99.8%という高い認識精度が最大の特徴だ。 PFUは2024年4月10日、廃棄物の分別を自動化する「廃棄物分別特化AIエンジン」シリーズの第1弾として、ビンの色選別を自動化する「Raptor VISION BOTTLE」の提供を開始すると発表した。世界シェアトップのイメージスキャナー開発で培った光学技術/画像認識技術を応用した独自アルゴリズムによる99.8%という高い認識精度が最大の特徴。共創パートナーである工作機械メーカーの高松機械
Appleがカリフォルニア大学サンタバーバラ校と協力し、言葉で指示するだけで写真を編集してくれるAIモデル「MGIE」をリリースしました。 [2309.17102] Guiding Instruction-based Image Editing via Multimodal Large Language Models https://arxiv.org/abs/2309.17102 apple/ml-mgie https://github.com/apple/ml-mgie MGIEはMLLM-Guided Image Editingの略称で、画像内の物体の形状を変更したり、明度を編集したりするなどさまざまな画像編集タスクを行う事が可能です。MGIEは画像と自然言語の両方を扱うマルチモーダル大規模言語モデルであり、ユーザーは自然言語で指示するだけで良いとのこと。ユーザーの入力をベースに「表
Metaが現地時間2024年2月6日、InstagramやFacebook、Threadsに投稿されたAIが生成した画像を検出し、ラベル付けを行う方針であることを発表しました。この機能は早ければ数カ月以内に全ての言語で導入される予定です。 Labeling AI-Generated Images on Facebook, Instagram and Threads | Meta https://about.fb.com/news/2024/02/labeling-ai-generated-images-on-facebook-instagram-and-threads/ Meta to start labeling AI-generated images from companies like OpenAI, Google | Reuters https://www.reuters.com
OpenAIが2024年2月6日、画像生成AIの「DALL-E 3」で生成された画像に対し、技術標準のCoalition for Content Provenance and Authenticity(C2PA)に基づく電子透かしをメタデータに埋め込む方針であることを発表しました。これにより、人間によって作成されたコンテンツなのか、AIが生成したコンテンツなのかの識別が容易になるとされています。 C2PA in DALL·E 3 | OpenAI Help Center https://help.openai.com/en/articles/8912793-c2pa-in-dall-e-3 OpenAI is adding new watermarks to DALL-E 3 - The Verge https://www.theverge.com/2024/2/6/24063954/ai
人工知能 2024/02/02 画像生成AI「Bing Image Creator」とは?特徴や使い方を徹底解説 Bingの画像生成AI機能について見聞きしたことがあるものの、 ・使い方が分からない…。 ・商用利用も可能かどうか知りたい…。 という方も多いのではないでしょうか。そこでこの記事では、 ・Bingの画像生成AI「Bing Image Creator」の特徴や使い方 ・Bingの画像生成AIを利用する際の注意点 について解説します。 Bingの画像生成AI「Bing Image Creator」とは 「Bing Image Creator」は、Microsoft社によって提供されている画像生成AIツールです。Microsoftアカウントを作成するだけで、AIによる画像作成機能を無料で利用できます。 「Bing Image Creator」は、MicrosoftのWebブラウザ「E
Googleの研究チームが動画生成AI「Lumiere」を2024年1月24日(水)に発表しました。Lumiereではフレーム同士が自然につながった違和感の少ない動画を生成可能で、テキストや画像を入力して動画を生成できるほか、動画の一部分を指定して別の動画に置き換えたり、写真の一部分だけを動かしたりといった操作も可能です。 Lumiere https://lumiere-video.github.io/ テキストや画像を入力して動画を生成できるAIは数多く存在していますが、それらのAIの多くは「フレームを複数枚生成し、フレーム同士を補間する」という手法で動画を生成しているため、フレーム同士のつながりが不自然になりがちです。一方で、Lumiereは「動画全体のフレームを一度に生成する」という手法を採用しており、フレーム同士のつながりが自然で違和感の少ない動画を生成可能。生成可能な動画のフレー
ストックフォトサービス・iStockが、NVIDIA Picassoを搭載したAI画像生成サービス「iStockの生成AI」の提供を開始しました。 iStockのAI画像生成ツール | 商業使用対応のAI画像生成ツール - iStock https://www.istockphoto.com/jp/ai/generation/about 世界最大級のストックフォトサイト「iStock」生成AIツール「iStockの生成AI」の提供を開始 | ゲッティイメージズ ジャパン株式会社のプレスリリース https://prtimes.jp/main/html/rd/p/000000033.000018083.html Generative AI by iStock Powered by NVIDIA Picasso | NVIDIA Blog https://blogs.nvidia.com/bl
AI技術の発展によって、実写と見分けが付かない精巧な画像を作成できるようになりました。しかし、画像生成AIで作成した精巧な画像は偽情報の拡散に用いられる可能性があるため、画像生成AIによって生成した画像とカメラで撮影した本物の写真を正確に見分ける技術の開発が求められています。新たに、キヤノン・ニコン・ソニーといったカメラメーカーが写真に「実写であることを証明するデジタル署名」を埋め込む技術を開発していることが報じられています。 ニコンやソニー、「AI偽画像」防ぐカメラ 電子署名で - 日本経済新聞 https://www.nikkei.com/article/DGXZQOUC21C520R21C23A2000000/ Nikon, Sony and Canon fight AI fakes with new camera tech - Nikkei Asia https://asia.ni
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第24回目はさらに豊作で、生成AI最新論文の概要6つをお届けします。Stable Diffusionベースとした単眼深度推定手法「Marigold」、高品質のビデオを数分間出力できる動画生成モデル「Vchitect」などです。 生成AI論文ピックアップ写真内の奥行きを推定するStable Diffusionベースの単眼深度推定手法「Marigold」 本物過ぎる動く実写アバターをリアルタイム生成する手法をMetaが開発。毛穴や髪の毛1本まで精密に再現しライティングも変更可能 映画品質のビデオを数分間出力できる動画生成モデル「Vchitect」 “言語に頼らない”画像理
顧客が生成した画像を安全に使うために、Google DeepMindの電子透かし「SynthID」を組み込む。また、潜在的に有害なコンテンツjの生成を防止するための「包括的な安全フィルター」が含まれているという。(GoogleはImagenのトレーニングデータについては開示していない。) Vertex AIでのImagenの利用可能範囲は以下の通り。 関連記事 Google、企業と開発者向け「Gemini Pro」提供開始 Googleは、新しい生成AIモデル「Gemini」のミドルサイズ「Gemini Pro」を企業と開発者向けに提供開始した。「Vertex AI」と「Google AI Studio」で利用できる。まずは無料で提供し、将来的には“競争力のある価格”にする計画。 Google、「Vertex AI」での生成AIサポート一般提供開始 「PaLM 2」も使える Google
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第26回目は、生成AI最新論文の概要5つをお届けします。画像生成の高速化技術を大幅に向上させた、日本人著者らによる「StreamDiffusion」をはじめとした最新論文を紹介します。 生成AI論文ピックアップ複数の動く3Dオブジェクトをテキスト指示で作成する4D生成モデル「AYG」、NVIDIAなどが開発 SD-turboで毎秒100枚以上の画像を生成できるシステム「StreamDiffusion」。著者による解説動画あり 細部まで一貫性のある被写体主導の画像・動画を生成できるモデル「DreamTuner」、ByteDanceが開発 人間が使うようにタップやスワイプ
AIの技術的進化において、テキストによる画像生成はそのほかの分野に比べて視覚的に「わかりやすく凄い」というのも相まって、広く認知されるようになった。約6年前は鳥の姿形をようやく制御できるかできないか(※1)という具合だったのにもかかわらず、現在では鳥に限らず様々なコンテンツを、美しく高解像度に生成できるようになった。 しかし、文字の完全な描写には未だ困難が伴っている。試しにAdobeが提供する画像生成AI『Firefly』にSign with the words "Real Sound" painted on it(訳:"Real Sound"という文字の描かれた看板)と入力して画像を生成してみよう。 こちらの期待に反して看板に描かれているのはすべて大文字であり、SOUNDの"N"が抜けてしまった。 この生成はなぜ失敗してしまったのか、そしてAIが文字を生成することはなぜ難しいのか。本記事
Intel Ignite 2023で優勝! AV1やH.266を超える圧縮率を実現するDeep Renderの「AIベースの動画圧縮技術」って何?:Intel Ignite 2023(1/4 ページ) 有望なベンチャー企業を支援すべく、Intelは2019年から「Intel Ignite」という支援プログラムを展開している。支援対象になれば同社から数百万ドルの資金援助を受けられるということもあって、多くのスタートアップ企業がこのプログラムに参加/応募している。 →Intel Ignite 9月に行われたイベント「Intel Innovation 2023」では、本プログラムの年度決勝に相当する「2023 Intel Startup Innovator Award」の表彰式が開催された。このアワードは、2023年度にIgniteに応募したベンチャー企業の中から選出された“トップ3”の優勝者を
AppleのiPhoneやGoogleのPixelなど、ハイエンドスマートフォンには高機能なカメラが搭載されており、誰でも簡単にいつでも美麗な写真を撮影できます。そんなiPhoneのカメラで「決して現実では起こり得ない光景」が偶然撮影できてしまった非常に珍しい例を、カメラ関連のニュースサイトであるPetaPixelが紹介しています。 'One in a Million' iPhone Photo Shows Three Versions of the Same Woman | PetaPixel https://petapixel.com/2023/11/16/one-in-a-million-iphone-photo-shows-two-versions-of-the-same-woman/ 以下は、イギリスのコメディアンであるテッサ・コーツさんがウェディングドレスを試着中にiPhone
Microsoftの検索エンジンであるBingには、画像生成AIを用いた「Bing イメージクリエーター」という機能があります。この画像生成AI機能では暴力・テロリズム・ヘイトスピーチなどに関するプロンプトが利用できないようにブロックされており、Bing イメージクリエイターの使用に関するポリシーでもこれらのコンテンツの作成は明確に禁じられています。しかし、ユーザーはBing イメージクリエーターを使って禁止されているはずのコンテンツを簡単に作成することができており、もはや人間の制御できる範疇を逸脱してしまっていると、メディアが指摘しました。 Bing Is Generating Images of SpongeBob Doing 9/11 https://www.404media.co/bing-is-generating-images-of-spongebob-doing-9-11/
アドビは9月13日、同社の生成AI「Adobe Firefly」の一般提供を開始した。同社は6カ月間ほどβ版としてFireflyを提供してきたが、これまでは商用利用は不可となっていた。今回の正式提供により商用利用も可能となる。無料でも利用可能だが、後述の通り提供されるクレジットに差がある。 Adobe Fireflyは、画像生成、テキスト効果、ベクター用の生成AIモデルを基盤としており、日本語を含む100以上の言語のプロンプト入力をサポート。同社のストックフォト「Adobe Stock」にアップされている許諾済み写真や、一般に公開されているライセンスコンテンツ、著作権が執行しているパブリックドメインの画像などを中心に学習しており、同社では商用利用可能な点をアピールしている。 また、Fireflyで生成されるコンテンツには、コンテンツクレデンシャル機能が含まれている。コンテンツの名前、日付、
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く