タグ

ブックマーク / qiita.com/key353 (1)

  • 画像入力で楽々!ChatGPT-4V と Python GUI 開発 - Qiita

    1. はじめに ついに ChatGPT-4V が使えるようになりました! これまでGUIを作成するときには、ChatGPT に 「まず左上にテキストボックスがあって、その右にボタンがあって...」 とちまちま指示する必要があったのですが、GPT-4V により画像を渡せるようになります。 この記事では、ChatGPT-4V を使うと GUI 作成がどのくらい楽になるのかを検証してみたいと思います! 作成するGUIはこちらのものです。 2. GPT-4V の読み取り精度の確認 2.1. 日語のポンチ絵 まず、元の記事で使用した日語のポンチ絵を渡して、どのように読み取れるのかを確認します。 GUIの各要素の位置はなんとなく読み取れている感じがしますが、日語の読み取り精度はあまり高くないようです。 2.2. 英語のポンチ絵 先ほどのポンチ絵を英語に変換してみます(左下だけ詳しく書き直しました

    画像入力で楽々!ChatGPT-4V と Python GUI 開発 - Qiita
  • 1