ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 アップルの研究者らが、入力した文章によって画像を編集できるAIモデル「MGIE」を発表、公開しました。 MGIEとはMLLM-Guided Image Editingの略で、テキストベースのコマンドを解釈するマルチモーダル大規模言語モデル(MLLM)を使用しています。 MLLMは単純であいまいな文章を、フォトエディターで処理する詳細で明確な指示に変換できます。 例えば、ユーザーがペパロニ・ピザの写真を「もっとヘルシーに」見えるようにしたいと思い入力したなら、MLLMはヘルシーとは何かを解釈し「野菜のトッピングを追加する」という文章に変換します。 MGIEでは、このMLLMを2つの方法で画像編集プロセスに統合し
