はじめに 2023/3/14にOpenAIがGPT-4という新しいAIモデルを公開しました。 このモデルはさまざまなタスクにおいてChatGPT(GPT-3.5)を大幅に上回る結果を示しています。 この記事ではGPT-4を用いて競技プログラミングがどのくらい解けるのかについて調べてみました。 下馬評 OpenAIが公開した論文によると、GPT-4のCodeforcesレーティングは392だそうです。 これはパーセンタイルでいうと下から5%らしいので、 そこまで競技プログラミングが得意なわけではないようです。 ただし、おそらくこれはGPT-4が完全自動でチャレンジした場合のことだと思われます。 GPT-4が書いたコードを人間がレビューすることでバグを修正し、より難しい問題が解ける可能性があると 筆者は考えました。 TL; DR ChatGPTを用いてAtCoder Beginners Con
やはり予想を超えてこなかったGPT-4と、GPUの未来、ホビイストへの手紙 2023.03.16 Updated by Ryo Shimizu on March 16, 2023, 08:00 am JST 3月14日の早朝、GPT-4が公開され、筆者は早速試した。 その後、開けて3月15日の早朝、APIも部分的に解放され、筆者はそれも試した。 その上で、先週書いた記事の内容についての確信が深まった。 やはり、GPT-4は期待を超えてはこなかった。 GPT-4は、ChatGPT Plusに入会すると誰でもすぐに使うことができる。APIだけは招待制だが、それも筆者と同じくらいのタイミングでアンロックされた方も少なくないのではないか。 100倍規模のパラメータがあっても、アプローチには限界があるのである。 また、ChatGPTが注目を集めたことで、これまで下火になっていた他の大規模言語モデル(
GPT-4なら、確定申告のための税額計算もラクラク――米OpenAIが3月14日(現地時間)に公開した、次世代の大規模自然言語モデル「GPT-4」のデモで、GPT-4に税法と家族構成を読み込ませ、控除額を簡易的に計算するシーンがあった。 河野太郎デジタル大臣は15日、自身のTwitterでこれに触れ、「e-Taxに実装したい」とコメントした。 デモでは、「誰もやりたくないが、やらなければならないタスクを行う」方法として、16ページにわたる税法のドキュメントを読み込ませたうえで、家族構成や収入を入力し、税金の控除額を計算さる様子を紹介した。 このデモを、梶谷健人氏(XR Creative Studio創業者)が「全人類が欲しているやつ」などと動画付きでツイート。河野氏はこれを引用し、「e-Taxに実装したい」とツイートした。 関連記事 「GPT-4」で何ができる? ラフからWebサイトを瞬間
日本時間で3月15日未明、OpenAIが大規模言語モデルのGPTシリーズ最新バージョンであるGPT-4を発表しました。 GPT-4は、人間向けの試験問題やベンチマークテストで従来のモデルよりも高い成績を収め、日本語でもGPT-3.5の英語性能を超えているそうです。 また、GPT-4は、ChatGPTの有料版(月20ドル)に加入していれば、すぐに使用できます。 今回、MicrosoftがBingのチャットモードもGPT-4を利用していることを明らかにしました。そこで、実際にGPT-4の性能とBingの性能を比較してみることにしました。 ※表紙の画像は、プロンプトに「GPT-4」と入力して生成した画像です。 1.GPT-4についてChatGPTに聞いてみた ChatGPT(Model:GPT-4)に、GPT-4について聞いてみたところ、回答は以下のとおりでした。 問 GPT-4について教えてく
こんにちは!逆瀬川 ( https://twitter.com/gyakuse ) です! 今日発表されたGPT-4について見ていきたいと思います。 なにがすごいのか 専門的な問題を解けるようになった たとえば米国司法試験で上位10%、GPT-3.5は下位10%だった 非常に長い文章を入出力できるようになった 最大で32k tokens (日本語で約2.5万文字、文庫で50pくらい) 画像をもとに会話できるようになった (これは実験段階でまだ提供されません) 特に嬉しいのは32k tokensまで文章を扱えるようになったことでしょう。 たとえば小説を書くみたいなときも、プロット、設定等に3000文字使っても、残り2.2万文字くらい使えます。 画像をもとにした会話の例 USER: この画像はどこがおかしいですか?パネルごとに説明してください GPT-4: この画像は、3つのパネルで構成される
米Microsoftは3月14日(現地時間)、米OpenAIによる「GPT-4」発表を受け、2月から提供しているチャットbot「新しいBing」は「検索用にカスタマイズしたGPT-4」をエンジンとしていると公式ブログで明らかにした。 Microsoftはこれまで、新しいBingは「OpenAIが昨夏に共有したGPT-3.5よりはるかに強力な、ChatGPTを強化するLLM」とのみ説明していたが、「過去5週間に新しいBingプレビューを使った人は、GPT-4の初期版を既に体験済みだ」とコーポレートバイスプレジデント兼コンシューマーチーフマーケティングオフィサーのユスフ・メディ氏は語った。 OpenAIによるGPT-4の更新は、随時Bingに反映される。 2月に新しいBingのAIモデル「プロメテウス」について説明したジョルディ・リバス氏は「プロメテウスで使う次世代モデルはGPT-4だ」とツイ
We’ve created GPT-4, the latest milestone in OpenAI’s effort in scaling up deep learning. GPT-4 is a large multimodal model (accepting image and text inputs, emitting text outputs) that, while less capable than humans in many real-world scenarios, exhibits human-level performance on various professional and academic benchmarks. We’ve created GPT-4, the latest milestone in OpenAI’s effort in scalin
「GPT-4」発表 日本語でもChatGPT英語版より高性能、司法試験で上位10%、「この画像何が面白いの?」にも回答(1/3 ページ) 米OpenAIは3月14日(現地時間)、大規模言語モデル「GPT-4」を発表した。テキストでのやりとりだけでなく、新たにユーザーから画像を受け取り、適切な情報も返せるようになったという。司法試験の模擬問題を解かせたところ、現在の「ChatGPT」が採用しているGPT-3.5では受験者の下位10%ほどのスコアしか取れないのに対し、GPT-4では上位10%のスコアで合格するとしている。 ChatGPTの有料版「ChatGPT Plus」やAPI経由ですでに利用できるようになっている。 専門的領域なら人間レベル 日本語でもGPT-3.5の英語版より高性能に GPT-4の性能について、同社は「現実世界のシナリオにおいては人間に劣ることも多いが、(司法試験の模擬問
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く