
機械が深度(奥行き)を認識する方法を大幅に進歩させるモデル「Depth Pro」をAppleのAI研究チームがリリースしました。他の方法では見落とされがちな「髪の毛」や「草木」といった細かいディテールを持った物体の深度も正確に認識可能で、高解像度の深度マップをわずか0.3秒で生成することが可能な点が特徴。自動運転車などリアルタイムで深度を推定するシステムに応用可能だと期待されています。 [2410.02073] Depth Pro: Sharp Monocular Metric Depth in Less Than a Second https://arxiv.org/abs/2410.02073 GitHub - apple/ml-depth-pro: Depth Pro: Sharp Monocular Metric Depth in Less Than a Second. https
写真を撮影していると「写真Aは人物の顔が見切れて、写真Bは顔が写ったけど逆光で暗すぎる」といったようにベストショットを撮影できないことがよくあります。Googleとコーネル大学の研究チームが開発したAI「RealFill」を使えば、複数の失敗写真をもとにベストショットを後から作り出せるとのことです。 RealFill https://realfill.github.io/ RealFillによる処理例はこんな感じ。以下の画像の左側が処理に用いる参考画像で、右側が参考画像をもとに生成されたベストショットです。参考画像には全身画像や背景が写る写真が含まれており、それぞれの要素をもとにベストショットが生成されています。 以下の例では、参考画像に「逆光ではないものの狭い写真」や「広範囲を写したものの逆光になった写真」が含まれており、参考画像をもとに広範囲かつ逆光ではない写真が生成されています。 以
画像のノイズ除去やボケ除去、超解像といった従来の画像修復問題は、特定の劣化状態、既知の単純な劣化にのみ効果的であった。 これに対して、実際の環境下での多様な劣化を考慮した「Blind Image Restoration」(BIR)という手法が注目されている。BIRは、一般的な画像と、それが持つさまざまな劣化に対して、リアルな画像再構築を目指している。特に、BIRの研究は以下の3つのカテゴリーに分けられる。 (1)Blind Image Super-Resolution(BSR):低解像度で劣化が不明瞭な画像の超解像問題に取り組む技術、(2)Zero-Shot Image Restoration(ZIR):これは新しい研究の方向性で、劣化の前提条件を明確に定義した上で、クラシックな画像修復タスクで印象的なゼロショット復元を達成する方法、(3)Blind Face Restoration(BF
先日、革新的な画像の異常検知(SAA)が出てきました。 何やら革命的な臭いがする... SAMを使った異常検知手法https://t.co/wmwFcbULdq コードはこちらhttps://t.co/3npK3FhnEz pic.twitter.com/JDs30bEJyQ — shinmura0 (@shinmura0) May 22, 2023 本稿では、操作手順 & 触ってみた感想をご報告します。 特長 本題に入る前に、どこら辺が革新的なのかざっくり説明します。 ※ SAAの詳細は論文をご参照ください。 学習データは不要 通常、学習(正常)データを数百枚用意しますが、この手法では正常データを必要としません。 ドメイン知識を導入できる 予め、異常の傾向をプロンプトに入れることにより、異常の特徴をモデルに教えることができます。 二点目が特に大きく、今までの異常検知では、積極的に異常の傾
Unreal Engine アセット アセット-Asset FluidNinja LIVE 2.0 PRE-ALPHA - Niagara活... 2025-04-05 Andras Ketzer氏によるUnreal Engine向け2.5D流体ソリューション「FluidNinja LIVE」の次期メジャーアップデート版の動画がちらほら公開されております。 続きを読む Blender アセット アセット-Asset Wolf Tools - 雪や雨、ケーブル&ロープや蔦、蜘蛛の巣やクロス、パーテ... 2025-04-05 Blender向けアセットなどを公開しているWolf(@wolfstudioart)による無料のGeometry Nodesライブラリ「Tools」が公開されています! 続きを読む
「撮影した写真に必要ない小物や人物が写り込んでしまった!」という状況は多くの人が経験しているはず。そんな画像の中の邪魔な被写体を「上からなぞるだけ」で消し去ってくれるウェブサービス「Cleanup.pictures」が公開されていたので、実際に使って手軽に被写体を削除してみました。 Cleanup.pictures - Remove objects, people, text and defects from any picture - 100% free https://cleanup.pictures/ Cleanup.picturesのトップページでは、写真に写り込んだ物体・人物・文字などを削除できることがアピールされています。 Cleanup.picturesを使うには、まず削除したい被写体が写り込んだ写真を灰色のエリアにドラッグ&ドロップします。 すると、こんな感じに写真と緑色の
風景ミキサーは、2つの風景画像を組み合わせて新しい画像を生成する機能。これにより、写真の季節を変えたり、昼から夜に変更といったことができるのだが、街の写真と草木の風景をミックスすると、街並みが緑化し、まるで人類が滅亡したあとのような荒廃した画像が生成されるという。 この画像を見たTwitterユーザーからは「映画やアニメで見たことのある風景だ」や「Photoshopがすごく欲しくなった」「人間も木にしちゃうの怖すぎる」「どこ荒廃させたら楽しいかな」などの感想が投稿されている。 同社では風景ミキサー以外にも、別の画像の色調を再現する「カラーの適用」や、2つの画像の色相とトーンを調節し違和感のない合成画像を作る「色調和」といったフィルターも追加。既存のフィルターも大幅に強化している。 Adobeによると、風景ミキサーなどの追加した3種のフィルターは、β版であり、ユーザーからのフィードバックを基
ベクトル量子化(VQ)を用いたVAEである「VQ-VAE」を、敵対的生成ネットワーク(GAN)に発展させた新しい画像生成モデルが「VQGAN」です。このVQGANと、テキストと画像という異なるデータを結びつけるニューラルネットワークの「CLIP」を組み合わせることで、「入力したテキストから画像を生成するモデル」をライアン・モールトンさんが作成しています。 Tour of the Sacred Library – Ryan Moulton's Articles https://moultano.wordpress.com/2021/07/20/tour-of-the-sacred-library/ モールトンさんは、画像生成モデルの「VQGAN」と、画像とテキストを結びつけるニューラルネットワークの「CLIP」を組み合わせ、「入力したテキストから画像を生成するモデル」を作成しました。 このモ
2021年6月に最新版へとアップデートされたPhotoshop(フォトショップ)バージョン22.4.2。 Adobe Sensei のAIテクノロジーを駆使し、わずか数クリックで難しいワークフローを大幅削減できるニューラルフィルター機能がより使いやすくなっています。 今回は一新された「白黒写真のカラー化」、そしてより強力になった「写真の深度ぼかし」の使い方を詳しくみていきましょう。作業時間はほんの数秒です。 ニューラルフィルター「カラー化」 2020年に新しく追加されたニューラルフィルター機能は、Adobe のAI技術を活用することで肌をなめらかにしたり、人物の表情を変えたり、写真を絵画スタイルにするなど、面倒な編集作業も数クリックで完了できるのが特長。 Photoshopが進化!新しいCC 2021の便利な新機能まとめ(空を置き換え, ニューラルフィルター) 以前から「カラー化」機能はあ
モバイルバッテリーとは呼べない。「ほぼポタ電」なコレ1台で有事の時もアウトドアも大活躍!【AmazonスマイルSALE】
Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 台湾大学、米Google、米カリフォルニア・マーセッド大学、米バージニア工科大学による研究チームが開発した「Learning to See Through Obstructions」は、画像内の手前に映りこんだ不要な障害物を除去する、機械学習ベースの技術だ。窓越しに撮影したときの水滴やガラスの反射、被写体の手前にあるフェンスなどを自然に消すことができる。 背景にある対象物と障害物要素はそれぞれのレイヤーがカメラに対して異なる深度に位置しているため、撮影した画像では2つのレイヤー間で動きが異なる。フレームごとに視点がずれるよう連続に複数枚撮影することで発生する背景と映り込み箇所の位置ずれ量の
クリエイティブAIを提供するRADIUS5、1枚の写真から動画を生成するAI「Moving Photo Maker」をリリース 株式会社ラディウス・ファイブ(本社:東京都新宿区、代表取締役:漆原大介、以下 RADIUS5)は、1枚の画像ファイルからズームやドリー、トラック等、14種類のカメラワークの動画を生成するAI「Moving Photo Maker(ムービング フォト メーカー)」をAIプラットフォーム「cre8tiveAI(クリエイティブAI)」に公開しました。 ▼「Moving Photo Maker」 URL:https://ja.cre8tiveai.com/mpm Moving Photo Maker 開発の背景 RADIUS5 は、「人の創造性を最大化する」をビジョンに据えてクリエイティブに関連する様々なAIの研究・開発およびサービス化を行うスタートアップ企業です。これま
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く