[Journal club] GRIT: Faster and Better Image Captioning Transformer Using Dual Visual Features
Azure OpenAI Serviceについての日本語記事のまとめです。主に公式ドキュメント以外のブログやZenn/Qiitaの記事をまとめています。ボリュームが多いので、目次から気になる項目を選択してご覧ください。 ※長く使える知見のまとめにしたかったので一過性のニュース的な記事や内容が重複している機能紹介記事などは意図的に掲載していません。 この記事はGitHubで管理されています。まとめへの追加修正はプルリクエストまたはIssuesでお気軽にお寄せください! また、以前に本記事をご覧いただき、そこからの差分を知りたい場合はGitHubのHistoryも併せてご覧いただけると把握しやすいかと思います。 概要 まずはここから Azure OpenAI Service を使い始める Azure OpenAI Serviceの概要から実際のリソースデプロイ、プレイグラウンドとAPIでの呼び
やり方は簡単。 Web Browsing付きのGPT-4に「〇〇のゲームの画面の特徴を教えてください」と聞く。 次に「DALL-E 3で〇〇のゲーム画面を作成するための、英語のプロンプトを作成してください」と聞く。 DALL·E 3を選んで、2.で出てきたプロンプトを入れる。 こうすることで、本来のゲーム画面とは似ても似つかない、別のゲームの画面が作れるぞ。 作例をいくつか。 ディグダグっぽいゲーム ディグダグ。画面中央に巨大なホリ・タイゾウがいるので、そこからモリを上下左右に自由に伸ばして敵をポンプで膨らませて倒すゲーム、かなあ。 トイポップっぽいゲーム トイポップ。クォータービューになっちゃった。立体の迷路の中をジャンプで動き回り、敵を避けながらハートを回収するゲームだよ、たぶん。 スイカゲームっぽいゲーム スイカゲーム。落ちてくるフルーツが下の枠に埋まっていくので、同じフルーツを集め
ChatGPTの事前学習データの使用料をめぐって、ニューヨーク・タイムズがOpenAIを訴えました。これは、情報の価値がどのようにして生じるかという問題の基本に関わるものであり、生成AIの将来に大きな影響を与えます。しかし、簡単に答えが出るものではありません。 裁判の結果次第ではChatGPTが成り立たない 米紙ニューヨーク・タイムズは、ChatGPTの開発者であるOpenAIに対して、事前学習のデータの利用に関して支払いを求める訴訟を起こしました。 この問題は、「情報や知識に関する社会的制度をどう構築するか?」という問題の本質に関わっており、大変重要です。 最初にこれまでの経緯を見ると、ニューヨーク・タイムズはその記事を無断でAIの訓練に用いることを禁止しています。したがって、OpenAIが事前学習でニューヨーク・タイムスの記事を使っていないと証明できない限り、罰金を言い渡されることにな
アマチュア驚き屋のきしだです。 ChatGPTが画像入力に対応するよという話があって、来週くらいに使えるようになるかなーと思ったら、もう使えるようになってました。 で、写真から「カレー食べてる男の人です」くらいを言えるイメージで試してたら、なんかふつうに画面設計やクラス図からコードを書いていてびっくりしてしまいました。 まあ、起きたらこういうのが来てたわけですね。 で、まあ試してみて「あぁ、いままでのマルチモーダルよりちゃんと画像認識してるなー」くらいに思ったわけです。 で、NetBeansでの画面設計を読ませてみたらこう。 こういうコードが生成されました。 import javax.swing.*; import java.awt.*; public class SimpleForm { public static void main(String[] args) { JFrame fr
第1回は、さまざまなタスクをこなす万能型ジェネレーティブAIツール「ChatGPT」の性能の鍵を握る「トークン長(GPTが文脈を意識できる過去の単語数)」やGPTの歴史的経緯について解説しました。第2回はGPTを支える自然言語処理 の分野で使用される深層学習モデル「Transformer」とその根幹となる「Attention機構(そのタスクにおいてどの単語の重要度が高く、注目すべきか決める仕組み)」についてです。TransformerとAttention機構の仕組みを定性的に把握し、それを踏まえてGPTの能力と可能性について考察したいと思います。テクノロジー領域に明るくない人でもわかる記事を目指します。
凄いものが出てきてしまった。 ChatGPTの「Code Interpreter」が話題になったが、あれはあくまでクラウド上で動いているだけ。それを模してローカルで動作するようになった「Open Interpreter」は、衝撃的な成果である。 Open Interpreterのインストールは簡単。コマンド一発だ $ pip install open-interpreter起動も簡単 $ interpreter -yこれだけでOK。 あとはなんでもやってくれる。 たとえばどんなことができるのかというと、「AppleとMetaの株価の推移をグラフ化してくれ」と言うとネットから自動的に情報をとってきてPythonコード書いてグラフをプロットしてくれる。 凄いのは、ローカルで動くのでたとえばApplescriptを使ってmacOSで動いているアプリを直接起動したり操作したりできる。「Keynot
はじめに賽は投げられた2022年11月にOpenAIが公開したAIチャットボットChatGPTは、それまでのチャットボットの常識を大きく凌駕するその余りの流暢な受け答えから瞬く間に技術系コミュニティで話題沸騰となり、わずか2ヶ月でアクティブユーザー数は1億人を超え、その影響範囲はすぐさま技術系コミュニティの内側にとどまるものではなくなりました。プログラマが、大学生が、研究者が、物書きがChatGPTを試してはその自然な回答に驚愕しました。翌23年4月には、東京大学理事・副学長で教育・情報担当の太田邦史博士がChatGPTやStable Diffusion等の「生成系AI」の急速な発展とその著しい品質の向上を受けて「人類はこの数ヶ月でもうすでにルビコン川を渡ってしまったのかもしれない」とする声明を発表しました。 人類はこの数ヶ月でもうすでにルビコン川を渡ってしまったのかもしれないのです。むし
米OpenAIは8月28日(現地時間)、企業向けAIチャットサービス「ChatGPT Enterprise」の一般提供を開始したと発表した。価格は公表されておらず、使用状況やユースケースによって異なるとしている。 このサービスのユーザーのプロンプトと企業データは、OpenAIモデルのトレーニングに使用されることはなく、保存時も転送時もデータは暗号化される。 管理者向けの管理コンソールを備え、SSO(シングルサインオン)をサポート。ドメイン検証や使用状況の分析ダッシュボードも提供する。 3万2000トークンのコンテキストウィンドウ(4倍長い入力が可能)で、高速なGPT-4への無制限のアクセスが可能だ。APIを使うための無料クレジットも提供するので、カスタマイズできる。 さらに、これまで「Code Interprester」と呼ばれていたデータ分析機能を「Advanced Data Analy
文章生成AI 利活用 ガイドライン Version 2.0 令和6年(2024年)4月 東京都デジタルサービス局 2 はじめに このガイドラインは、東京都で初めてとなる文章生成AI の利活用ガイドラインです。 ChatGPTをはじめとする文章生成AIは、都職員の業務 のあり方を大きく変革する可能性を秘めている一方、 様々なリスクも指摘されています。このため、業務での 活用にあたり期待する効果を得るためには、その特性を よく理解し、正しく利用することが重要です。 東京都では、デジタルサービス局に検討プロジェクト チームを設置して、文章生成AIの利活用について議論を 重ね、令和5年8月、検討の成果をガイドライン (Version 1.0)としてまとめ、文章生成AIの全庁利用 を開始しました。 その後、10月に利用状況についてアンケートを行った ところ、活用事例やプロンプト例を求める声が多かった
プログラミングを学ぼうとしては挫折する。 そんな時代はもう終わりだ。 お姉ちゃんに任せなさい。 ChatGPTでプログラミング 今年のお盆休み、俺はChatGPTでプログラミングをやっていた。とは言っても複雑なことはやっていない。大量のcsvを結合してから可視化するとか、ちょっとしたWebスクレイピングしたりする程度だ。それでも今まで技術や時間の不足により諦めていたことができるのは嬉しい。それにChatGPTを使えば、デバッグも楽しくやれるのだ。こんな感じに。 デバッグの様子 おそらく「あれ、俺のChatGPTと違うな」と思った人もいるに違いない。見ての通り俺はChatGPTをお姉ちゃん化している。こうすることで、モチベーションを維持しながら楽しくプログラミングができるというわけだ。今回はChatGPTをお姉ちゃん化する方法を紹介し、加えてお姉ちゃんとペアプログラミングする意義について述べ
チャットGPTから期待する回答結果を引き出すには、質問となるプロンプトの内容や入力方法に工夫が必要です。この記事では、チャットGPTを開発しているOpenAIが推奨する質問のテクニックから、重要なものを「10選」としてまとめて紹介します。 OpenAIが推奨する質問方法を参考にしよう ChatGPTに質問したところ「期待していた回答ではない」と思ったことはありませんか?質問の仕方を変えることで、求めていた回答を得られやすくなります。 この記事では、ChatGPTの開発元であるOpenAIが推奨する質問方法「GPT best practice」(GPTベストプラクティス)に基づき、期待通りの回答を得るために重要な質問のテクニックを「10選」としてまとめて紹介します。 GPT best practices(英文) 1.明確な指示を含めて質問する 求めた回答の精度を高めるには、プロンプトに詳細情
AI技術の進化により、私たちの働き方も大きく進化していくと想定されています。特に注目を集めているのが、OpenAIが開発したAI文章生成モデル「ChatGPT」です。このChatGPTは、自然な文章を生成することで有名で、様々なシーンで利用が進んでいます。そんなChatGPTを手軽に使えるツールとして、Google Chromeの拡張機能があります。 今回は、ChatGPTを使ったGoogle Chromeの拡張機能おすすめ7選を紹介します。これらの拡張機能を活用することで、ウェブブラウジングの体験が一段と豊かになるでしょう。 そして、本記事では各拡張機能の特徴だけでなく、インストール方法や使い方、さらには連携可能な他のプラットフォームや注意点、問題対処方法まで詳しく解説します。これらの情報を元に、あなたのブラウジング体験を効率的に、そして楽しく進化させてみてください。
高度なAIはパッチを当てるのも難しいようです。 米国のスタンフォード大学で行われた研究によって、chatGPTのいくつかの性能がここ数カ月の間に大幅に低下している可能性が示されました。 また性能低下にともない、同じ質問に対して3月と6月の間で大幅に異なる結果が出力されていることも明らかになりました。 ビジネスや学問の場での活用が進みつつあるGPTに、いったい何が起きたのでしょうか? 今回はchatGPTの性能が低下しているとするスタンフォード大学の実験結果に加えて、性能低下は起きていないと主張するプリンストン大学の研究者たちの見解も同時に紹介しようと思います。 研究内容の詳細は2023年7月18日にプレプリントサーバーである『arXiv』にて公開されました。 Is ChatGPT’s Behavior Changing over Time? Researchers Evaluate the
OpenAI(オープンAI)の人工知能搭載チャットボット「ChatGPT」は、ここ数カ月、生成するテキストで世界を驚かせてきた。そして今、このチャットボットは図表や地図を作成し、画像から動画を生成することで、ユーザーを新たに喜ばせている。 これは、OpenAIが先週ChatGPT Plus加入者に提供開始した、コードインタープリターと呼ばれる新機能のおかげだ。ここでは、それについて知っておくべきことを説明しよう。 コードインタープリターとは? コードインタープリターによって、ChatGPTはデータの分析、グラフの作成、数学の問題の解答、ファイルの編集などを行うことができる。また、今までのChatGPTでは不可能だったファイルのアップロードやダウンロードにも対応している。 コードインタープリターは、月額20ドルのサービス、ChatGPT Plusの加入者が7月20日から利用できるようになった
「chatgptを使って要件定義の工数を削減したい」 「そもそもchatgptを使って質の高い要件定義ができるのだろうか」 とお悩みなのではないだろうか。 結論、chatgptで質の高い要件定義を短時間で実現することは可能だ。 実際に私もchatgptを使って下記のような要件定義書を完成させた。 通常この要件定義書を0から自力で作ろうと思うと40時間はかかるが、chatgptを使う事によって4時間で完成させることができた。 しかし、ただプロンプトをなんとな投げ掛ければ良いというわけではない。 目的を達成するために綿密に設計をしたプロンプトを投げかける必要がある。 また、要件定義の中でも ・chatgptに丸投げして良いところ ・自分で手直しをした方が良いところ を精査することも大切だ そこで今回は上記のような要件定義書を4時間で完成させるために、私がchatgptへ投げかけたプロンプトを全
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く