Vertex AI の最先端マルチモーダル モデルである Gemini 1.5 Pro をお試しいただき、100 万トークンのコンテキスト ウィンドウで可能な構築の詳細をご確認ください。
![AI と ML のプロダクトやサービス](https://cdn-ak-scissors.b.st-hatena.com/image/square/0e132c7916d37a3584f9bf1740f19a7c8aaf839e/height=288;version=1;width=512/https%3A%2F%2Fcloud.google.com%2F_static%2Fcloud%2Fimages%2Fsocial-icon-google-cloud-1200-630.png)
こんにちは、東京大学で医師かつ脳や人工知能の研究をしている紺野大地と申します。 2023年11月6日、OpenAI社から「自分専用のChatGPTを作れる機能」であるGPTs(ジーピーティーズ)が発表されました。 早速触ってみたところ、 「この技術を使えば、誰もが論文を読めるAIを作れる!」と確信し、論文解説AI「Paper Interpreter」を作って公開したところ、非常に大きな反響がありました! (こちらのリンクから、今すぐ使えます。) 論文の内容を分かりやすく解説してくれる「Paper Interpreter」を公開しました! 使い方は簡単で、論文のPDFをアップロードするだけです。 テキストだけでなく、図やグラフについても説明してくれる点がポイントです! 早速公開したので、ぜひ使ってみてください😊https://t.co/xHhKGO4WOZ pic.twitter.com/
OpenAIが開発したプラグイン「Code Interpreter」を使用すると、ChatGPTにプログラミングのコードを生成してもらうことが可能ですが、インターネットに接続できないのに加え、使用できるパッケージやアップロードの容量、実行時間などに制限があります。「Open Interpreter」はローカルで動作することでそうした制限を突破し、柔軟にさまざまなプログラムを生成・実行してくれるオープンソースなAIツールとのことなので、実際に使って試してみました。 KillianLucas/open-interpreter: OpenAI's Code Interpreter in your terminal, running locally https://github.com/KillianLucas/open-interpreter/blob/main/docs/README_JA.m
AIチャットボット「ChatGPT」が注目を集めている。どのように仕事に活用すればよいのか。初期の頃からChatGPTを“使い倒している”という深津貴之さんは「ChatGPTは、結構知ったかぶりしてウソをついたりするので、検索エンジンのように使うのはお勧めしない。しかし、コツを押さえて使うと、アシスタントのように使えて仕事にとても役立つ」という――。 ChatGPTは「確率で話す」 ChatGPTの最大の特徴は「コンピューター言語(プログラミング言語)などではなく、人間の使う言葉で命令でき、回答してくれること」です。 うまく使えば、仕事の効率化や高度化が実現しますが、そのためにはChatGPTにできることとできないこと、またChatGPTの得意なことと不得意なことを理解する必要があります。 まず覚えておきたいのは、「ChatGPTは確率でしゃべるマシンである」ということです。基本的には、こ
以下の要件に沿う、AWS Lambdaで利用できるコードを生成してください。 ## 要件 - Python 3.10で記載すること - 指定のS3バケットに格納されたファイル一覧と合計ファイルサイズを、Slackの特定のチャンネルに通知する - 前日の0:00から23:59までに格納されたものを、当日08:00に通知する import boto3 import datetime import json import logging import requests # 設定 S3_BUCKET_NAME = "your-s3-bucket-name" SLACK_CHANNEL_ID = "your-slack-channel-id" SLACK_WEBHOOK_URL = "https://hooks.slack.com/services/your-slack-webhook-url" #
こんにちは、CX事業本部 Delivery部の若槻です。 ChatGPT の回答でインターネット上の画像を表示させてみたので方法をご紹介します。 ※ 04/26 タイトル含め更新(旧タイトル「ChatGPT の回答でインターネット上の画像が表示可能になっていました」) 表示してみた 利用環境は以下の通りです。 バージョン:GPT-4 ブラウザ:Microsoft Edge その1 犬の画像のURLをもらえることを期待して次の質問をしてみます。 質問 あなたが知っている犬の画像のURLを`- ![](URL)`という形式で5個表示して すると回答で犬と猫の画像が表示されました。ChatGPT の回答上ではブラウザの画像表示機能が働くようです。また「私の知識が更新された2021年9月時点で利用可能な」という断りが入っており、自分が GPT をベースにした AI だという自覚はあるようです。 ま
chilled_remixとは? chilled_remixはStableDiffusionとよばれる画像生成AIで動作する生成モデルの一つで、リアルなアジア系美少女の生成を得意としています。以下の画像はchilled_remixを使用して私が作成した画像です。 リアルなアジア系美少女が得意なStableDiffusion生成モデルには、他に有名なものとしてChilloutMixやChilled_re_genericなどがあります。しかし、これらのモデルは現在商用利用ができません。 一方でchilled_remixは商用利用が可能なため、とても重宝されるモデルとして注目を集めています。 chilled_remixのライセンス表記 chilled_remixはChilled_re_genericのレシピ発案者として知られる鎖城郎郭様によって4/19に公開されました。生成した画像の販売だけでな
対話型AI「ChatGPT」が世界中で話題をさらっている。ChatGPTは、人が入力した質問や要望を解釈し、その答えを返すAIチャットボット。米国のベンチャーOpenAIが開発し、2022年11月末に公開した。AIのチャットボットは以前から存在するが、ChatGPTのクオリティは“革命的”とさえ評される。質問文を入力すると自然な文章で回答し、情報の検索から文章の翻訳・要約、レポートや小説の執筆、プログラミングまで可能。さまざまなコンテンツを作り出す生成AI(Generative AI)の代表格として、その活用がブームとなっている。 そんな中、表計算ソフトの「Excel」でChatGPTの機能を利用できるようにするアドインが登場した。APPS DO WONDERSが公開した「ChatGPT for Excel」だ(図1)。SUM関数やVLOOKUP関数のように、セルに関数式を入力するだけで、
GPT-4は医師国家試験に合格するという研究結果が発表されて話題だったので、我々も馴染み深い IPA の試験にGPT-4は合格できるのか試してみた。 高度情報処理技術者試験の 午前I に限って言えば合格しているので、レポートをこちらに置いておく。 github.com まとめ 高度情報処理技術者試験の共通科目である午前I に 合格できる解答(正答率6割を超える)をGPT-4は生成する GPT-3.5 では合格できない。GPT-4 の賢さが際立つ ちなみに図表読み取り問題は入力できないので、すべて不正解扱いした やりかた IPA の Webサイトから、2022年度秋試験の午前I問題のPDFを取得 (PDF) Google Docs の OCR 機能でテキスト取得 手でコピペして整形 整形したファイルは こちら にある OpenAI の API に問い合わせて解答を取得。スクリプトはこちら。
ほしいWebアプリの説明を書くだけで、ChatGPTが作って即Web公開してくれるサービス「GPTApp」を、ゲームアプリの企画・開発を手掛けるミリオンダウト代表のTakayuki Fukudaさんが公開した。 アプリのイメージを考えてフォームにテキストで入力すると、ChatGPT(GPT-3.5)がコードを出力してWebに実装する。開発にかかるのは約30秒と“爆速”。Web単体で動く簡単なアプリのみ開発できる。 うまくいけばきちんと動くが、失敗することも多い。アプリ完成画面で「ChatGPTの返信を見る」をクリックすると、ChatGPTが書いたコードも表示される。 GETAppはFukudaさんの個人開発だが、経営するミリオンダウトでは、ChatGPTなどのAIを使ったアプリを開発しているという。 関連記事 LINEでChatGPTと会話「AIチャットくん」100万ユーザー・2000万メ
GPT-4時代のエンジニアの生存戦略 ※ この記事の内容の一部はこちらのイベントでお話したことと重複します。 はじめに 2023年3月1日にOpenAI社よりChatGPTのAPIが公開されました。 さらに14日にはGPT-4が登場し、その翌々日にはMicrosoft 365 CopilotでGPT-4をOffice製品に搭載することが発表されるなど、AI領域で大きな変化が起きています。 変化の速度の速さと変化量の大きさにより、私自身も追いつくのが精一杯な状態です。 個人的には、iPhoneの登場時以上の衝撃を受けています。 人類の歴史上、過去3回AIブームがありました。Generative AIが4回目のブームになります。 そして、特に日本においては顕著なのですが、AIへの過度な期待とそれへの失望の繰り返しがここ数十年にわたって繰り返されてきました。 直近だと数年前のDeep Learn
カリフォルニア大学バークレー校などの研究チームがオープンソースの大規模言語モデル「Vicuna-13B」を公開しました。Vicuna-13BはOpenAIのChatGPTやGoogleのBardに近い精度で回答を生成でき、日本語にも対応しているとのこと。実際に動かせるデモも公開されていたので、使ってみました。 Vicuna: An Open-Source Chatbot Impressing GPT-4 with 90%* ChatGPT Quality | by the Team with members from UC Berkeley, CMU, Stanford, and UC San Diego https://vicuna.lmsys.org/ GitHub - lm-sys/FastChat: An open platform for training, serving, a
ChatGPTでインテリアデザインを出力 この記事では、CnatGPTとほかのツールを連携させて高品質なインテリアデザインを出力させる方法が紹介されています。 ok, I got ChatGPT working with Additive Prompting Here's a 1 paragraph ChatGPT prompt you can use to generate infinite interior design/architecture photographs w/ 90%+ coherence to the prompt in Midjourney Full prompt w/ examples in thread. Try reading the prompts as you go 🧵 pic.twitter.com/zhGB03UGpD — Nick St. Pier
OpenAIが開発した対話型AIのChatGPTには、「インターネット上の最新情報を収集する」といった機能を追加できるプラグインシステム「ChatGPT plugins」が用意されています。ハッカーのrez0(@rez0__)氏が、ChatGPTのAPIをハッキングすることで公開されていない80以上の「秘密のプラグイン」を発見したと報告しました。 Hacker Uncovers Secret ChatGPT Plugins in OpenAI API | Deepleaps https://deepleaps.com/news/hacker-uncovers-secret-chatgpt-plugins-in-openai-api/ ChatGPTは膨大な量のテキストを基にトレーニングして構築された対話型AIであり、さまざまなプラグインを使用して能力を拡張することが可能です。たとえば、トレ
最近、見つけた技。知らない言語でコードかくときChatGPTが神すぎる。 そのテクはなんと「プログラミングまるごとを、ChatGPTに突っ込む」というもの。 え、そんなの動くの!? と思うんですが、動くんですそんなの。直球すぎて盲点だった。 試してみよう たとえば、下記はGoogleサービス使って、リアルタイムにマイク音声を文字起こしするサンプル。 こいつをチャットAIで音声会話をやろうと、軽く読んでみたのですが…うん、よくわからん。 Pythonだし、Streamingだし、音声の操作だし、普段つかわない技術が満載すぎてわからん。 雑にコードを突っ込むと人生が解決こういう時は 以下のコードを、わかりやすく説明して。 <以下、上記コードをそのままコピペ>とすると…… こうなる。 このコードは、Google Cloud Speech-to-Text APIを使用して、マイクからの音声をリア
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く