タグ

画像とgptに関するshion214のブックマーク (10)

  • Dify API と GASのカスタム関数を組み合わせてスプレッドシートからLLMを利用する

    この記事では、LLMアプリケーション開発プラットフォームであるDifyとGoogle Apps Script(GAS)のカスタム関数を使って、スプシに記載した画像URLに写っているのがわんこかどうかをDifyを使って自動で判定してみました。 なぜDifyとGASカスタム関数の組み合わせなのか? GASのカスタム関数から直接OpenAIなどのAPIを叩くのが実装としては一番早いのですが、RAGを使いたい、複数のGASから呼び出したい、GAS以外からも呼び出したい、LLMのモデルを柔軟に変えたい、などが発生することも多いです。 そのため実際にLLMアプリケーションを作っていく際は単純にAPIを叩くだけでは解決できないことがおおく、LLMに関わる処理をどこかにまとめておき、まとめておいたものをAPI経由で呼び出すという形にするのが好ましいです。 そこで登場するのがDifyです。 Difyはチャッ

    Dify API と GASのカスタム関数を組み合わせてスプレッドシートからLLMを利用する
  • GPT-4oを使って2Dの図面から3DのCADモデルを作る

    はじめに 株式会社ファースト・オートメーションCTOの田中(しろくま)です! 先日、 OpenAIからGPT-4oがリリース されました。 いろいろGPT-4oに関して調べていると、スピードが速くなっていたり、音声も直接扱えてマルチモーダル化が進んでいたりするようなのですが、画像に関して GPT-4-turboに比べ、認識やOCRの精度が向上している ようです。 製造業という観点からすると、これは 設計図面などに活かせるようになるのでは? と思いました。 機械部品などの設計図面は以下のように、特定の方向から部品を2次元上に落とし込んだ形で書かれるのですが、部品体を描いている図以外に、寸法や名称といった文字も含まれた画像になっています。 このような 図と文字の複合データにおいて、GPT-4oの進化は有効なのではないか と考えました。 ※画像元URL: http://cad.wp.xdoma

    GPT-4oを使って2Dの図面から3DのCADモデルを作る
  • Power Apps & GPT-4oを使って超高速で画像解析アプリを作る! - Qiita

    GPT-4o凄すぎる!! 出たときから騒ぎまくっていましたが、GPT-4oの登場で興奮しっぱなしの私です。 先日こちらのQiitaの記事を拝読し、「Power Appsでやったらどうなるだろう🧐」という思いが抑えられず、作ってみたら超高速で画像解析アプリが作成できました! あらためて記事を出してくださったことに感謝いたします! まずは初弾!ということでGPT-4oを使って、 Power Appsで画像解析アプリを作成する方法 を書いていきます! まずは見た目(Power Apps)から! まずはPower Appsでサクっと画面を作ります! PowerPoint感覚で作れることが強みですからね! 最低限のもので構成しています。 画面 ├─ ScreenContainer - スクリーン全体 ├─ HeaderContainer │ └─ Header - ヘッダーコントロール ├─ Bo

    Power Apps & GPT-4oを使って超高速で画像解析アプリを作る! - Qiita
  • 【GPT Store神ランキングTOP17】世界一ChatGPTを巧みに操るOpenAI本家のGPTsの使い方 | WEEL

    【速報&朗報】GPT Storeが遂に公開 待ちに待ったGPT Storeが遂に公開されました!🔥 公式発表によると、GPT公開からのたった2ヶ月で300万以上のGPTsが作成されているとのこと。 注目ポイント👀 ・毎週Open AIからの注目GPTsが特集される… pic.twitter.com/94WCTnwDiJ — 木内翔大@SHIFT AI代表「日AI先進国に」𝕏 (@shota7180) January 10, 2024 ChatGPTには「GPTs」という機能があり、ユーザーがChatGPTを自由にカスタムできます。 さらにGPT StoreではGPTsが公開され、将来的には収益化も可能になる予定です。 AIを使って稼げる時代が、目の前まで来ていますね。 今回は、そんなGPT Storeの中でOpenAI社が開発した公式のGPTsをご紹介します。 生活に役立つ便利な

  • 【決定版】GPTs開発の教科書|ChatGPT研究所

    この記事は、一度使われて終わるような、ChatGPT にちょっとした機能を追加しただけの GPTではなく、当に使われる素晴らしく便利な GPTs を作成、開発するための教科書として、書きました。 今までの GPTs 開発関連の情報を全てまとめた内容になっています。 この note 一冊を読めば、GPTs 制作の基礎から応用まで全部わかります。 記事の内容は必要に応じて適宜アップデートしていきます。 目次は以下です: 第1章 GPTsの概要とその可能性そもそも GPTs とはなんでしょうか? 一言で言うと、ChatGPTを自分独自に大幅にカスタマイズできる機能とそのカスタマイズされたAIのことです。 ただし、GPTsを単なるChatGPT のいち機能の一つとして考えるのは非常にもったいないです。 OpenAI は、GPT Store という、他の人が作ったGPTsを使えるようになるストアの

    【決定版】GPTs開発の教科書|ChatGPT研究所
  • 【GPT 4 All Tools】ChatGPTもはやAGIじゃん…!革命的な活用事例10選をご紹介 | WEEL

    【GPT 4 All Tools】ChatGPTもはやAGIじゃん…!革命的な活用事例10選をご紹介 2023 11/06 ChatGPTイラスト作成やデザインの修正が手軽にできるようになったことはご存知でしょうか? 2023年10月29日にChatGPTの機能がアップデートされ、GPT-4 All ToolsとしてGPT-4搭載の全ての機能を切り替えることなく使えたり、様々な形式のファイルの入出力に対応できる機能が追加されました。 実際にこんなことができるようになるんです! ただし、まだ実装されたばかりの機能であるため、具体的な活用方法がわからない方がほとんどだと思います。 そこで記事では、GPT-4 All Toolsの具体的な活用事例を10個ご紹介します。 最後まで目を通していただくと、GPT-4 All Toolsの機能を使いこなせるようになり、クリエイター業務の効率化が加速す

  • ロゴデザイン案の作り方-ChatGPT×画像生成-|しょーてぃー/ Experience Designer

    ※おまけ枠以外は、全文無料で読める記事です 下記のツイートをRT応援すると今は50%OFFになります(noteSNS*プロモ機能利用) ※SNSプロモーション機能って? →https://note.jp/n/n1878ea0f7824 🎉AIと共同制作したロゴ完成を祝い.... 無料公開の8,000文字に追加で、 10,000文字の有料おまけ枠を”75%OFF”で読めるようにしておいたで〜。 条件:このツイートをRT応援(noteSNSプロモ機能利用) 期間:5月中? 【ロゴデザイン案の作り方-ChatGPT×画像生成- 】 https://t.co/WCgcux5Qht@shoty_k2 — しょーてぃー / Experience Designer & Prompt Designer (@shoty_k2) May 28, 2023 ------Prompt to me------

    ロゴデザイン案の作り方-ChatGPT×画像生成-|しょーてぃー/ Experience Designer
  • GPT-3.5に画像分類タスクを解かせる - DROBEプロダクト開発ブログ

    概要 背景・目的 関連研究 提案手法 実験 終わりに 参考文献 DROBEで機械学習エンジニアをしております、藤崎です。 概要 ファッションの分野ではトレンドの変化とそれに伴う属性情報の変動に対応するため、画像分類AIモデルを頻繁にアップデートする必要性がある。 しかし、既存の画像分類AIモデルのアップデートには、労力と時間が掛かる。 様々なタスクの遂行能力が高いGPT-3.5に画像処理能力を付与し、画像分類タスクに挑戦した。 既存の研究(ex. HuggingGPT)と違って、GPT-3.5自体が画像分類の推論を行う点がユニークである。 実験からは有望な結果が得られた。 今後の性能向上はプロンプトを工夫するなど、比較的簡単な方法で達成できる可能性がある。 背景・目的 ファッションの業界は、トレンドの変化が早く、新しいスタイルが次々と提案されます。それに伴い、スタイルに付随する属性情報も常

    GPT-3.5に画像分類タスクを解かせる - DROBEプロダクト開発ブログ
  • 【GPT-4V】ChatGPTが画像入力と音声入力に対応!使い方〜実践まで徹底解説 | WEEL

    2023年9月25日にリリースされた新たな機能で、ChatGPTがついに、目と声を手に入れました。 具体的には、画像解析機能と音声出力機能のAPI「GPT-4V」が追加され、マルチモーダルAIになったとのこと。 要するに、ChatGPTで画像入力と音声出力ができるようになり、今までよりさらに便利になったということですね! 今回はそのGPT-4Vの概要や新機能について、特徴を踏まえながら詳しくご紹介します。ぜひ最後までご覧ください! GPT4Vの概要 GPT-4V(Vision)は、Open AI社が開発した従来のGPT-4に画像解析機能と音声出力機能を持たせたマルチモーダルAIです。マルチモーダルAIとは、複数のデータをもとに情報を集めて、解析・出力を可能とするAIのことです。 つまりGPT-4を搭載したChatGPTに「目」と「声」が実装されたことで、画像・音声・テキストという異なる情報

  • 生産性を圧倒的に向上できるオススメChatGPTプラグイン3選|梶谷健人 / 新著「生成AI時代を勝ち抜く事業・組織のつくり方」

    新しくリリースされたChatGPTプラグインを使うことで、世界中の最新ニュースや研究論文を効率的に知ることができたり、高度なSEO分析、高クオリティな画像生成AIのプロンプトを自動で生成、動画の自動生成などなど、今までChatGPT単体ではできなかったことが簡単に実現可能になっている。 ここではそんな便利なChatGPTプラグインの中でも、特に業務効率化に役立つプラグインを3つ紹介する。 基礎)ChatGPTプラグインの導入方法Chat GPTプラグインを使用できるのは、現時点では有料版のChatGPT Plusを利用している方限定になっている。 実際にプラグインの導入方法と使用方法について解説する。 すでにこの方法はご存知という方はこのセクションはスキップして頂いて結構だ。 ChatGPT Plusに登録している状態で、画面左下にあるSettingsのBeta featuresからPlu

    生産性を圧倒的に向上できるオススメChatGPTプラグイン3選|梶谷健人 / 新著「生成AI時代を勝ち抜く事業・組織のつくり方」
  • 1