タグ

apiに関するproto_jpのブックマーク (169)

  • AIラジオ『zenncast』の技術構成(プロンプトつき)

    先日、個人開発していたzenncastというWebサービスをリリースしました。 Zennでトレンドになっている記事を、毎日AIが10分のラジオにして届けてくれるというサービスです。 ありがたいことに公開後はたくさんの方に試してもらえ、技術的な質問も多数いただきました。 このZennではzenncastの技術構成や仕組みを紹介します(プロンプトつき)。 作ったもの まずはエピソードを一つ選んで1分くらい聴いてみてください! AIラジオの雰囲気が掴めると思います。 主な機能・特徴 毎朝10分のラジオを生成 Zennでトレンドになっている記事を要約して紹介 お便りを投稿すると、翌日のエピソードでAIパーソナリティが拾ってコメントしてくれる BGMをつけて爽やかな聴き心地 これらのステップは人の手を介さずすべて自動化されています。 Spotifyなどの各種プラットフォームへの配信はSpotify

    AIラジオ『zenncast』の技術構成(プロンプトつき)
  • OpenAIのGPT-4oを日本語OCRとして使ってみる

    昨日、OpenAIが生成AIの新しいモデルであるGPT-4oを発表しました。消費するトークン数の節約や、音声合成機能の改善、応答速度の向上など着実な品質改善を見せているようです。私も、特に音声合成Text To Speech)の表現力について非常に興味を持っています。 私は以前、「OpenAIのGPT-4 Turbo with visionを日語OCRとして使ってみる」で、GPT-4 Turboの画像認識機能の日語OCRについて検証を行いました。その当時は、既存のコグニティブAI APIに比べて認識精度が十分でないという評価をしています。とはいえ、その後に出てきたClaude 3 Opusは驚くべき認識精度だったので、OpenAIも巻き返す可能性は十分にあると感じました。Azure OpenAI Serviceを使っている場合は、Vision enhancementという既存のコグニ

    OpenAIのGPT-4oを日本語OCRとして使ってみる
  • GitHub - openai/openai-assistants-quickstart: OpenAI Assistants API quickstart with Next.js.

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - openai/openai-assistants-quickstart: OpenAI Assistants API quickstart with Next.js.
  • 準備0でローカルLLMを動かす(LM Studio)

    はじめに Metaが新しく公開したLLMの性能が他の最新モデルに匹敵する性能となっており、ベンダーから提供されるAPIを使わずに、自分のPC上でLLMを動かしたい欲求が高まりました。 ローカルでLLMを動かすメリットとして、以下が考えられます。 従量課金制のAPIの費用を気にしなくて良い (※PC電気代はかかるが) 個人情報を第三者に送信しないので、プライバシー面を考慮する必要がない LM Studio ローカルでLLMを動かす懸念として、環境構築など準備に時間がかかることが一つ挙げられます。 そこで、便利なツールを探していたところ、LM Studioを発見しました。 このツールは、GUI上でLLMの取得から起動までをボタンクリックで進めることができます。 さらに、チャットのUIやローカルサーバの起動・Pythonコード例の提示までしてくれる便利ツールとなっていました。 操作手順 使用し

    準備0でローカルLLMを動かす(LM Studio)
  • 2025 年 3 月での files.upload API 廃止と移行方法について

    こんにちは、Slack の公式 SDK 開発と日の Developer Relations を担当している瀬良 (@seratch) と申します 👋 この記事では、日発表された files.upload API の deprecation (非推奨) と移行方法について日語で解説します。アナウンスメント(英語)は、以下のページでご確認いただけます。 files.upload API 廃止までの流れ files.upload API は、2025 年春に廃止されます。それまでのスケジュールは以下の通りです。 2024 年 5 月 8 日以降、新しく作成された Slack アプリは files.upload API にアクセスできなくなります。すでに存在している既存のアプリは廃止日(3. 参照)までは API を使用することができます。 2024 年 6 月〜 2025 年 2 月の間

    2025 年 3 月での files.upload API 廃止と移行方法について
  • ChatGPTのライバル「Claude 3」の使い方 良い点、悪い点まとめ (1/5)

    3月4日の公開以来、「Claudeやばくない?」「GPT-4を越えた」と、界隈で話題の「Claude 3」は、OpenAIの元メンバーによって設立されたAIベンチャー「Anthropic」が開発する最新の大規模言語モデル(LLM)だ。今回はChatGPTのライバルClaude 3の有料版を2週間ほどヘビーに使ってみて感じたことを、良い点と悪い点どちらも書いていきたいと思う。 Claude 3とは? 既報の通り、Claude 3はAnthropicが開発する大規模言語モデルの名称だ。 パラメーターのサイズなどが異なる3つのモデルがラインアップされている。 「Claude 3 Opus」は最も知能が高く、複雑なタスクでも最高のパフォーマンスを発揮する強力なモデル。APIやデータベースを介した複雑なアクションの計画や実行、インタラクティブコーディングなどの高度な活用が想定されている。 「Clau

    ChatGPTのライバル「Claude 3」の使い方 良い点、悪い点まとめ (1/5)
  • Overview | Eagle API Document

    This is the official document for Eagle API. By releasing Eagle's API, we hope that every user could make the most of these functions and develop more personalized plugins or add-ons to address various needs. In this document, along with the exhaustive introduction to the Eagle API, we also provided some examples for reference to inspire users to make creative plugins on basis of these scripts. Re

    Overview | Eagle API Document
    proto_jp
    proto_jp 2024/01/20
  • 今年の書初めコーディングはAITuberを創る!

    はじめに あけましておめでとうございます。去年は何といってもAIの年でした。ChatGPTStableDiffusion2022年末に登場してから、想像を超えてAI周りが進化しましたね。今回は年の初めという事もあり、前から興味のあったAITuberを作ってみる事にしました。 「AITuberを作ってみたら生成AIプログラミングがよくわかった件」 っても買ったし。LLM部分だけでは無く、OBSやYouTubeのコメント取得などAITuberに必要な内容が一式揃っていて非常に参考になりました。 また、私はプログラミングは多少できますが、イラスト音楽に関しては全くスキルの無い人間です。そのためそのあたりに関してはStable DiffusionやSunoAIの力を借りて作っているので、結果的にオール生成AIという感じですね。そのあたりも含めて記事にまとめたいと思います。 TL;DR 素の

    今年の書初めコーディングはAITuberを創る!
  • Build with the Gemini API  |  Google AI for Developers

    Stay organized with collections Save and categorize content based on your preferences. @�à V �K � V

    Build with the Gemini API  |  Google AI for Developers
  • ブラウザ自動操作API入門: WebDriver APIとChrome DevTools Protocol(CDP)

    ウェブブラウザを自動操作する際には、WebDriverやChrome DevTools Protocol (CDP) などのAPIが広く利用されています。 これらのAPIを基盤に構築された様々なブラウザ自動操作フレームワークが、テスト自動化の分野で重要な役割を果たしています。 例えば、SeleniumやPlaywrightといったフレームワークを利用して、テストの自動化に取り組まれている方もいらっしゃると思います。 私もテスト自動化フレームワークの便利さを享受する一方で、フレームワークを介さずにブラウザを自動操作する方法についての興味がわいてきました。 そこで、この記事ではWebDriverやCDPが提供するAPIを直接利用してブラウザを操作する方法を基礎から探求してみることにしました。 これにより、私たちが普段利用しているフレームワークの背後にある原理を理解し、より深い知見を得ることを目

    ブラウザ自動操作API入門: WebDriver APIとChrome DevTools Protocol(CDP)
  • GPTのAPIとText2Speechを組み合わせてAIとの会話体験を実装してみる | DevelopersIO

    はじめに OpenAIのDevDayで発表されたText2SpeechのAPIを使ってみたいと思います。Text2Speechとは簡単にいうとテキストの読み上げ機能です。 日語を読ませる場合、まだ少し英語訛りですが、なかなか人間っぽい発音を行います。 今回はこのText2SpeechのAPIを使って遊んでみたいと思います。 なにを作るのか? 先程記載したように、Text2Speechでは発話を行うことができます。 この特徴とGPTの会話ができる特性を組み合わせれば、会話っぽいことができるのではないかと思い実装してみました。 今回は試験的に実装を行うため、GPTには「動物博士」としてのロールを与えて動物の雑学を教えてもらいました。 完成形は以下のような動画になります。Text2Speechを利用しているため音声ONの状態での閲覧を推奨します。 発音が英語話者っぽくなっていることや漢字を稀に

    GPTのAPIとText2Speechを組み合わせてAIとの会話体験を実装してみる | DevelopersIO
  • Google Apps ScriptでGPTsのCustom ActionsのAPIを作ってみた - Qiita

    はじめに GPTsのCustom Actions(カスタムアクション)をつかって、外部のAPIを呼び出して、データを取得することができるようになりました。 たとえば、郵便番号検索APIを呼び出して、ユーザーから入力された住所から、郵便番号を回答するGPTを作ることができます。 詳細についてはこちら。 この記事では、Custom Actionsから呼び出されるAPIを、Google Apps Scriptを使って無料で作る方法について説明します。 この記事の対象者 GPTsのCustom ActionsのAPIを自作したい方 Google Apps Scriptで簡単なスクリプトを作ったことがある方 Zapierの連携よりも複雑な処理を求めている方 APIの概要 シーケンス図で表現しました。 "Google Apps Script"にあたるところが、今回作成するAPIになります。 処理として

    Google Apps ScriptでGPTsのCustom ActionsのAPIを作ってみた - Qiita
  • 「ねこGPT」GPTsのActionsを理解して、外部APIをコールする - Qiita

    GPTsのActionsを使って、カスタムアクションを定義して、外部APIをコールできるようになるまでのハウツーです。 公式のActionsのドキュメントを読んでもいまいちピンと来なかったので、CAAS(Cats as a Service)こと、The Cat APIからねこ画像を取得してアンサーしてくれるGPTsを実装してみました。完成したサンプルはこちらから。 The Cat API まずはThe Cat APIの利用方法です。サンプルでは、以下のエンドポイントをGPTsからコールしてねこ画像を取得します。 ランダムでねこ画像を取得する https://api.thecatapi.com/v1/images/search?breed_ids=beng breed_idsで品種、種?を指定できます。bengはベンガルネコです。 種の一覧を取得する https://api.thecat

    「ねこGPT」GPTsのActionsを理解して、外部APIをコールする - Qiita
  • OpenAI DevDay で発表された新モデルと新開発ツール まとめ|npaka

    以下の記事が面白かったので、かるくまとめました。 ・New models and developer products announced at DevDay 1. GPT-4 Turbo「GPT-4 Turbo」は、「GPT-4」より高性能です。2023年4月までの知識と128kのコンテキストウィンドウを持ちます。さらに、「GPT-4」と比較して入力は1/3、出力は1/2の安い価格で提供します。 開発者はモデルID「gpt-4-1106-preview」で試すことができます。今後数週間以内に、安定した実稼働モデルをリリースする予定です。 1-1. Function Calling の更新「Function Calling」に、単一メッセージから複数のFunction (「車の窓を開けてエアコンをオフにする」など) を呼び出す機能などが追加されました。精度も向上しています。 1-2. 構造

    OpenAI DevDay で発表された新モデルと新開発ツール まとめ|npaka
  • 【Python】インスタ写真・動画を投稿|Instagram Graph APIで運用自動化

    Python環境でInstagram Graph APIを活用し、インスタ運用を効率化したいInstagram Graph APIで「インスタに写真や動画をアップロードする方法」が知りたい Instagramの運用自動化とは|何ができるの? Instagramの運用自動化とは、これまで手作業で行なってきたインスタ操作をシステムで自動化することを指します。 Instagramの運用自動化は、Meta(旧Facebook)が提供するInstagram Graph APIを活用すると実現でき、具体的に上記の操作が自動化できるようになります。 インスタアプリ上での操作は全て自動化できることが分かりますね。Instagram APIの機能を組み合わせると、インスタデータの自動収集、グラフ作成や結果考察という一連作業もまとめて効率化できるようになります。 Instagram運用の自動化|APIの利用

    【Python】インスタ写真・動画を投稿|Instagram Graph APIで運用自動化
  • Instagram Graph APIで自動投稿!画像もリールもストーリーも! - 旅アトリーチ

    今回はInstagram Graph APIを使った、自動投稿について解説をしていきたいと思います。 APIを使った投稿公開方法が知りたい APIを使って自動投稿をしたい といった方向けの記事となっております。 自動でプログラミングを動かす仕組みは、みなさんの環境によってさまざまだと思います。 この記事では、「Instagramの投稿をAPIを使って公開する方法」に絞って解説していきます。 実際に実装をして、各パターン網羅しましたのでご確認ください。 このサイトではInstagramのAPIについて、網羅的に解説しています。 (ぜひブックマークなどして必要な時にみてください) ページ 概要

  • 週刊Life is beautiful 2023年8月15日号: LangChain、幻に終わった常温・常圧超電導物質 LK-99 - まぐまぐ!

    週刊Life is beautiful 2023年8月15日号: LangChain、幻に終わった常温・常圧超電導物質 LK-99 週刊 Life is beautiful 今週のざっくばらん LangChain 一緒に働いているメンバーから、LangChainについて質問されたので、私なりの答えをここにまとめてみます。 LangChainは、LLM向けのライブラリとして有名で、最も多く使われているライブラリとも言える存在です。LLMの使い方を紹介するサンプルコードやチュートリアルでも、LangChainを使っているものが多いし、LangChainの上に作られたオープンソースライブラリも多数存在します。 私が、最初にLangChainの存在を知ったのは、私の息子(洋平)のBabyAGIを通してでした。彼がオープンソース化した、BabyAGIは、LangChainを使って作ったAIエージェン

    週刊Life is beautiful 2023年8月15日号: LangChain、幻に終わった常温・常圧超電導物質 LK-99 - まぐまぐ!
  • GPT-4のAPIが7月6日より誰でも利用可能と一般公開!ウェイトリスト不要に | AutoWorker〜Google Apps Script(GAS)とSikuliで始める業務改善入門

    ChatGPTはGPT3.5系でしたが、GPT-4はメジャーバージョンアップで大きく性能が向上しています。 ChatGPTでのGPT-4のモデル利用と合わせて、GPT-4をAPIで使うためのウェイトリストが公開されました。 GPT-4をAPI経由で使いたい場合はウェイトリストに登録する必要がありました。 登録後にOpenAIから招待メールが届けば、ChatGPTAPIと同じようにGPT-4が利用できるようになります。 ウェイトリスト登録も招待メールが来ないSNSではGPT-4のウェイトリストに登録したあと、GPT-4の招待メールが届いたというユーザーからの報告がありました。 OpenAIからこのようなGPT-4の招待メールが届きます。 一方でGPT-4の招待メールがいつまで経っても来ないユーザーもいます。 周りのOpenAIAPIアカウントでGPT-4の招待メールが届いたか調べましたが

    GPT-4のAPIが7月6日より誰でも利用可能と一般公開!ウェイトリスト不要に | AutoWorker〜Google Apps Script(GAS)とSikuliで始める業務改善入門
  • ChatGPTのWebUIをローカル環境で実現できる「Chatbot UI」を試してみた | DevelopersIO

    データアナリティクス事業部のueharaです。 今回は、ChatGPTのWebUIをローカル環境で実現できるChatbot UIを試してみたいと思います。 家WebUIとの相違点 まず一番大きな違いとして、Chatbot UIOpenAIAPI経由でGPTを利用することから、「オプトインしない限りユーザーが送信したデータが学習に利用されることはない」ということが挙げられます。 逆に言うと家のWebUIを使う場合、入力情報を学習データとして使用させないようにするためにオプトアウトの申請が必要になります。 ChatGPTAPIリリースに伴う、OpenAIAPIデータ利用ポリシーの改定は以下でも紹介されているので、気になった方は読んでみて下さい。 また、細かい点は後述しますが、APIならではのパラメータ設定が可能な点や、会話履歴をJSONでエクスポートできる機能など、家WebUI

    ChatGPTのWebUIをローカル環境で実現できる「Chatbot UI」を試してみた | DevelopersIO
  • How to Build Your Own AI Chatbot With ChatGPT API: A Step-by-Step Tutorial