タグ

ブックマーク / zenn.dev/mattyamonaca (2)

  • 入力線画を全く変えずに画像生成AIに色塗りさせる方法

    タイトル通り、入力線画を(基的には)1pixelも変えずに画像生成AIに色塗りをさせる方法について解説していきます。 題に入る前に そもそも画像生成AIによる色塗り(着彩)について知らない方向けに、既存技術AIに色塗りをさせるとはどのような事を指すか?またどのような課題があるか?について一度整理します。 画像生成AIによる着彩 テキストから画像を生成できるという事で一躍有名になった画像生成AIですが、テキストだけでは生成したい画像を詳細に指示することが困難であるという課題を抱えていました。 そこで、テキストと比較してより具体的に生成したい画像を指示する方法として。ControlNetを用いた画像とテキストを入力して新たな画像を生成する手法が現れます。 この応用として、色塗りがされていない線画と指示テキストを入力することで、入力した線画に対し色を塗った状態の画像を生成するという方法が存

    入力線画を全く変えずに画像生成AIに色塗りさせる方法
    Imamura
    Imamura 2024/05/30
    いいですね
  • GPT4oを使って、訓練無しで物体検出(BBox)ができるか試してみる

    今日も今日とてopenAIの新発表が機械学習界隈を賑わせていますね。 今回は、2024/05/14に発表されたGPT4oについてです。 返答速度があがったり画像認識精度があがったり音声会話の性能が良くなったりと色々話題が尽きません。 具体的にどのあたりが凄くなったのかは僕以外にもまとめている人が多そうなのでこの記事では触れません。 個人的に特に気になっているのが画像認識の精度向上部分で、今回は画像認識精度がどの程度あがったのか?というのを画像系機械学習の主要なタスクであるBBoxによる物体認識というタスクで簡単にチェックしてみようと思います。 BBoxとは BBoxはBoundingBoxの略で、画像内の特定のオブジェクトを囲むために使用される長方形のボックスの事を指します。 BoundingBoxの定義は以下の通り このBBox検出は画像系機械学習モデルの基的なタスクであり、自動運転の

    GPT4oを使って、訓練無しで物体検出(BBox)ができるか試してみる
    Imamura
    Imamura 2024/05/15
    入力画像から検出した物体をChatGPTに明示させるには「bbox形式で」と指示すればいいんだね。ねじが散らばった写真から長さが違うものだけ検出してもらうときはこれを使おう
  • 1