[B! Image Processing] moo_sanのブックマーク

moo_san id:moo_san

Image Processingに関するmoo_sanのブックマーク (150)

生成AI活用の「Microsoft Designer」、iPhoneとAndroidで利用可能に
moo_san 2024/07/19
AI(Artificial Intelligence)

Image Processing

Product

Microsoft
リンク
Photoshopで「イチからAI画像を生成」できるように！豊富な機能で、理想の画像を作成 | ライフハッカー・ジャパン
Adobe Fireflyとは？Fireflyは、Adobeが独自に開発した画像生成AIです。 Fireflyは昨年以来、Photoshopにアスペクト比を拡大させる生成拡張機能などを搭載するなど、少しずつPhotoshopと統合されてきました。しかし今まで、いちから画像を生成する機能はFirefly Webアプリに制限されていました（空白のキャンバスに生成塗りつぶしを使用するというずるい方法を除きます）。 Fireflyは、Adobeが所有するストック写真や画像にトレーニングデータを限定することで、ほかのAIアートモデルとの差別化を図っています。その目的は、商用利用においてより安全性を確保することです。「Firefly Image 3」は同モデルの最新アップデートで、「より高品質の画像」を提供しています。構成やライティングに重点が置かれ、プロンプトの理解も向上しています。 AI画像を生
moo_san 2024/07/02
AI(Artificial Intelligence)

Image Processing

Product

Adobe
リンク
過酷な資源ごみのビン色選別を自動化、PFUがイメージスキャナー技術から新規事業
過酷な資源ごみのビン色選別を自動化、PFUがイメージスキャナー技術から新規事業：人工知能ニュース（1/2 ページ） PFUは、廃棄物の分別を自動化する「廃棄物分別特化AIエンジン」シリーズの第1弾として、ビンの色選別を自動化する「Raptor VISION BOTTLE」の提供を開始する。世界シェアトップのイメージスキャナー開発で培った独自アルゴリズムによる99.8％という高い認識精度が最大の特徴だ。 PFUは2024年4月10日、廃棄物の分別を自動化する「廃棄物分別特化AIエンジン」シリーズの第1弾として、ビンの色選別を自動化する「Raptor VISION BOTTLE」の提供を開始すると発表した。世界シェアトップのイメージスキャナー開発で培った光学技術／画像認識技術を応用した独自アルゴリズムによる99.8％という高い認識精度が最大の特徴。共創パートナーである工作機械メーカーの高松機械
moo_san 2024/04/19
AI(Artificial Intelligence)

Image Processing
リンク
Appleが言語で指示するだけで写真を編集してくれる画像編集AIモデル「MGIE」をリリース、デモも公開されたので使ってみた
Appleがカリフォルニア大学サンタバーバラ校と協力し、言葉で指示するだけで写真を編集してくれるAIモデル「MGIE」をリリースしました。 [2309.17102] Guiding Instruction-based Image Editing via Multimodal Large Language Models https://arxiv.org/abs/2309.17102 apple/ml-mgie https://github.com/apple/ml-mgie MGIEはMLLM-Guided Image Editingの略称で、画像内の物体の形状を変更したり、明度を編集したりするなどさまざまな画像編集タスクを行う事が可能です。MGIEは画像と自然言語の両方を扱うマルチモーダル大規模言語モデルであり、ユーザーは自然言語で指示するだけで良いとのこと。ユーザーの入力をベースに「表
moo_san 2024/02/08
AI(Artificial Intelligence)

Image Processing

Apple
リンク
MetaがInstagram・Facebook・ThreadsでAI生成された画像に対しラベル付けを行うことを発表
Metaが現地時間2024年2月6日、InstagramやFacebook、Threadsに投稿されたAIが生成した画像を検出し、ラベル付けを行う方針であることを発表しました。この機能は早ければ数カ月以内に全ての言語で導入される予定です。 Labeling AI-Generated Images on Facebook, Instagram and Threads | Meta https://about.fb.com/news/2024/02/labeling-ai-generated-images-on-facebook-instagram-and-threads/ Meta to start labeling AI-generated images from companies like OpenAI, Google | Reuters https://www.reuters.com
moo_san 2024/02/08
AI(Artificial Intelligence)

Image Processing

Meta
リンク
OpenAIの画像生成AI「DALL-E 3」にAI生成作品であることを示す技術標準「C2PA」を使った電子透かしの埋め込みがスタート
OpenAIが2024年2月6日、画像生成AIの「DALL-E 3」で生成された画像に対し、技術標準のCoalition for Content Provenance and Authenticity(C2PA)に基づく電子透かしをメタデータに埋め込む方針であることを発表しました。これにより、人間によって作成されたコンテンツなのか、AIが生成したコンテンツなのかの識別が容易になるとされています。 C2PA in DALL·E 3 | OpenAI Help Center https://help.openai.com/en/articles/8912793-c2pa-in-dall-e-3 OpenAI is adding new watermarks to DALL-E 3 - The Verge https://www.theverge.com/2024/2/6/24063954/ai
moo_san 2024/02/08
AI(Artificial Intelligence)

Image Processing

OpenAI
リンク
画像生成AI「Bing Image Creator」とは？特徴や使い方を徹底解説｜Udemy メディア
人工知能 2024/02/02 画像生成AI「Bing Image Creator」とは？特徴や使い方を徹底解説 Bingの画像生成AI機能について見聞きしたことがあるものの、・使い方が分からない…。・商用利用も可能かどうか知りたい…。という方も多いのではないでしょうか。そこでこの記事では、・Bingの画像生成AI「Bing Image Creator」の特徴や使い方・Bingの画像生成AIを利用する際の注意点について解説します。 Bingの画像生成AI「Bing Image Creator」とは「Bing Image Creator」は、Microsoft社によって提供されている画像生成AIツールです。Microsoftアカウントを作成するだけで、AIによる画像作成機能を無料で利用できます。「Bing Image Creator」は、MicrosoftのWebブラウザ「E
moo_san 2024/02/02
AI(Artificial Intelligence)

Image Processing

Microsoft

Product
リンク
Googleが超高品質な動画生成AI「Lumiere」を発表、フレーム同士のつながりが自然で「テキストや画像から動画生成」「写真の一部を動画化」「動画の一部分を指定して加工」などなど機能てんこもり
Googleの研究チームが動画生成AI「Lumiere」を2024年1月24日(水)に発表しました。Lumiereではフレーム同士が自然につながった違和感の少ない動画を生成可能で、テキストや画像を入力して動画を生成できるほか、動画の一部分を指定して別の動画に置き換えたり、写真の一部分だけを動かしたりといった操作も可能です。 Lumiere https://lumiere-video.github.io/ テキストや画像を入力して動画を生成できるAIは数多く存在していますが、それらのAIの多くは「フレームを複数枚生成し、フレーム同士を補間する」という手法で動画を生成しているため、フレーム同士のつながりが不自然になりがちです。一方で、Lumiereは「動画全体のフレームを一度に生成する」という手法を採用しており、フレーム同士のつながりが自然で違和感の少ない動画を生成可能。生成可能な動画のフレー
moo_san 2024/01/25
AI(Artificial Intelligence)

Image Processing

Google
リンク
NVIDIA Picasso搭載の生成AIを用いた画像生成サービス「iStockの生成AI」がスタート
ストックフォトサービス・iStockが、NVIDIA Picassoを搭載したAI画像生成サービス「iStockの生成AI」の提供を開始しました。 iStockのAI画像生成ツール | 商業使用対応のAI画像生成ツール - iStock https://www.istockphoto.com/jp/ai/generation/about 世界最大級のストックフォトサイト「iStock」生成AIツール「iStockの生成AI」の提供を開始 | ゲッティイメージズジャパン株式会社のプレスリリース https://prtimes.jp/main/html/rd/p/000000033.000018083.html Generative AI by iStock Powered by NVIDIA Picasso | NVIDIA Blog https://blogs.nvidia.com/bl
moo_san 2024/01/10
AI(Artificial Intelligence)

Image Processing

NVIDIA
リンク
キヤノン・ニコン・ソニーが写真にデジタル署名を埋め込むカメラ技術を開発中、AIが生成した精巧な偽物と写真を区別するのに役立つ可能性あり
AI 技術の発展によって、実写と見分けが付かない精巧な画像を作成できるようになりました。しかし、画像生成AIで作成した精巧な画像は偽情報の拡散に用いられる可能性があるため、画像生成AIによって生成した画像とカメラで撮影した本物の写真を正確に見分ける技術の開発が求められています。新たに、キヤノン・ニコン・ソニーといったカメラメーカーが写真に「実写であることを証明するデジタル署名」を埋め込む技術を開発していることが報じられています。ニコンやソニー、「AI偽画像」防ぐカメラ　電子署名で - 日本経済新聞 https://www.nikkei.com/article/DGXZQOUC21C520R21C23A2000000/ Nikon, Sony and Canon fight AI fakes with new camera tech - Nikkei Asia https://asia.ni
moo_san 2024/01/08
Image Processing

Steganography

Fact-Checking
リンク
【Ubuntu日和】【第42回】RadeonだってStable Diffusionは高速だ。そう、Ubuntuならね
moo_san 2024/01/06
AI(Artificial Intelligence)

Image Processing

Ubuntu
リンク
写真内の奥行きを推定する「Marigold」、言語に頼らず画像理解する「Large Vision Model」、数分間の高品質ビデオ作成する「Vchitect」など重要論文6本を解説（生成AIウィークリー） | テクノエッジ TechnoEdge
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless（シームレス）を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第24回目はさらに豊作で、生成AI最新論文の概要6つをお届けします。Stable Diffusionベースとした単眼深度推定手法「Marigold」、高品質のビデオを数分間出力できる動画生成モデル「Vchitect」などです。生成AI論文ピックアップ写真内の奥行きを推定するStable Diffusionベースの単眼深度推定手法「Marigold」本物過ぎる動く実写アバターをリアルタイム生成する手法をMetaが開発。毛穴や髪の毛1本まで精密に再現しライティングも変更可能映画品質のビデオを数分間出力できる動画生成モデル「Vchitect」 “言語に頼らない”画像理
moo_san 2024/01/04
AI(Artificial Intelligence)

Image Processing
リンク
Google、テキスト→画像生成AIモデル「Imagen 2」をVertex AIでリリース　画質大幅アップ
顧客が生成した画像を安全に使うために、Google DeepMindの電子透かし「SynthID」を組み込む。また、潜在的に有害なコンテンツjの生成を防止するための「包括的な安全フィルター」が含まれているという。（GoogleはImagenのトレーニングデータについては開示していない。） Vertex AIでのImagenの利用可能範囲は以下の通り。関連記事 Google、企業と開発者向け「Gemini Pro」提供開始 Googleは、新しい生成AIモデル「Gemini」のミドルサイズ「Gemini Pro」を企業と開発者向けに提供開始した。「Vertex AI」と「Google AI Studio」で利用できる。まずは無料で提供し、将来的には“競争力のある価格”にする計画。 Google、「Vertex AI」での生成AIサポート一般提供開始　「PaLM 2」も使える Google
moo_san 2024/01/03
AI(Artificial Intelligence)

Image Processing

Google
リンク
毎秒100枚の画像を高速生成できる「StreamDiffusion」、文章指示で複数の動く3Dキャラを生成するNVIDIA開発「AYG」など重要論文5本を解説（生成AIウィークリー） | テクノエッジ TechnoEdge
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless（シームレス）を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第26回目は、生成AI最新論文の概要5つをお届けします。画像生成の高速化技術を大幅に向上させた、日本人著者らによる「StreamDiffusion」をはじめとした最新論文を紹介します。生成AI論文ピックアップ複数の動く3Dオブジェクトをテキスト指示で作成する4D生成モデル「AYG」、NVIDIAなどが開発 SD-turboで毎秒100枚以上の画像を生成できるシステム「StreamDiffusion」。著者による解説動画あり細部まで一貫性のある被写体主導の画像・動画を生成できるモデル「DreamTuner」、ByteDanceが開発人間が使うようにタップやスワイプ
moo_san 2023/12/27
AI(Artificial Intelligence)

Image Processing
リンク
画像生成AIはなぜ文字を上手く“描けない”のか
AIの技術的進化において、テキストによる画像生成はそのほかの分野に比べて視覚的に「わかりやすく凄い」というのも相まって、広く認知されるようになった。約6年前は鳥の姿形をようやく制御できるかできないか（※1）という具合だったのにもかかわらず、現在では鳥に限らず様々なコンテンツを、美しく高解像度に生成できるようになった。しかし、文字の完全な描写には未だ困難が伴っている。試しにAdobeが提供する画像生成AI『Firefly』にSign with the words "Real Sound" painted on it（訳："Real Sound"という文字の描かれた看板）と入力して画像を生成してみよう。こちらの期待に反して看板に描かれているのはすべて大文字であり、SOUNDの"N"が抜けてしまった。この生成はなぜ失敗してしまったのか、そしてAIが文字を生成することはなぜ難しいのか。本記事
moo_san 2023/12/19
AI(Artificial Intelligence)

Image Processing
リンク
Intel Ignite 2023で優勝！　AV1やH.266を超える圧縮率を実現するDeep Renderの「AIベースの動画圧縮技術」って何？
Intel Ignite 2023で優勝！　AV1やH.266を超える圧縮率を実現するDeep Renderの「AIベースの動画圧縮技術」って何？：Intel Ignite 2023（1/4 ページ）有望なベンチャー企業を支援すべく、Intelは2019年から「Intel Ignite」という支援プログラムを展開している。支援対象になれば同社から数百万ドルの資金援助を受けられるということもあって、多くのスタートアップ企業がこのプログラムに参加／応募している。 →Intel Ignite 9月に行われたイベント「Intel Innovation 2023」では、本プログラムの年度決勝に相当する「2023 Intel Startup Innovator Award」の表彰式が開催された。このアワードは、2023年度にIgniteに応募したベンチャー企業の中から選出された“トップ3”の優勝者を
moo_san 2023/12/12
AI(Artificial Intelligence)

Image Processing
リンク
iPhoneが100万分の1の確率で偶然撮影してしまった「あまりにも不思議で奇妙な写真」とは？
AppleのiPhoneやGoogleのPixelなど、ハイエンドスマートフォンには高機能なカメラが搭載されており、誰でも簡単にいつでも美麗な写真を撮影できます。そんなiPhoneのカメラで「決して現実では起こり得ない光景」が偶然撮影できてしまった非常に珍しい例を、カメラ関連のニュースサイトであるPetaPixelが紹介しています。 'One in a Million' iPhone Photo Shows Three Versions of the Same Woman | PetaPixel https://petapixel.com/2023/11/16/one-in-a-million-iphone-photo-shows-two-versions-of-the-same-woman/ 以下は、イギリスのコメディアンであるテッサ・コーツさんがウェディングドレスを試着中にiPhone
moo_san 2023/12/02
iPhone

Image Processing

Issue
リンク
Microsoft Bingの画像生成AI機能では禁止ワードの「9.11」とカービィやスポンジ・ボブなどの人気キャラクターを組み合わせた画像が簡単に作成できてしまい人間の制御できる範疇を超えてしまっているとの指摘
Microsoftの検索エンジンであるBingには、画像生成AIを用いた「Bing イメージクリエーター」という機能があります。この画像生成AI機能では暴力・テロリズム・ヘイトスピーチなどに関するプロンプトが利用できないようにブロックされており、Bing イメージクリエイターの使用に関するポリシーでもこれらのコンテンツの作成は明確に禁じられています。しかし、ユーザーはBing イメージクリエーターを使って禁止されているはずのコンテンツを簡単に作成することができており、もはや人間の制御できる範疇を逸脱してしまっていると、メディアが指摘しました。 Bing Is Generating Images of SpongeBob Doing 9/11 https://www.404media.co/bing-is-generating-images-of-spongebob-doing-9-11/
moo_san 2023/10/05
AI(Artificial Intelligence)

Image Processing

Microsoft Bing

Issue
リンク
アドビの生成AI「Firefly」正式リリース、商用利用OK　無料でも利用可能
アドビは9月13日、同社の生成AI「Adobe Firefly」の一般提供を開始した。同社は6カ月間ほどβ版としてFireflyを提供してきたが、これまでは商用利用は不可となっていた。今回の正式提供により商用利用も可能となる。無料でも利用可能だが、後述の通り提供されるクレジットに差がある。 Adobe Fireflyは、画像生成、テキスト効果、ベクター用の生成AIモデルを基盤としており、日本語を含む100以上の言語のプロンプト入力をサポート。同社のストックフォト「Adobe Stock」にアップされている許諾済み写真や、一般に公開されているライセンスコンテンツ、著作権が執行しているパブリックドメインの画像などを中心に学習しており、同社では商用利用可能な点をアピールしている。また、Fireflyで生成されるコンテンツには、コンテンツクレデンシャル機能が含まれている。コンテンツの名前、日付、
moo_san 2023/09/14
AI(Artificial Intelligence)

Image Processing

Adobe
リンク
アドビの生成AI「Adobe Firefly」が正式提供開始、商用利用も可能でフォトショやイラレとの連携も
moo_san 2023/09/14
AI(Artificial Intelligence)

Image Processing

Adobe
リンク
1 2 3 4 5 6 7 8 次のページ