並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 80 件 / 2106件

新着順 人気順

gptの検索結果41 - 80 件 / 2106件

  • GPT-4oを使って2Dの図面から3DのCADモデルを作る

    はじめに 株式会社ファースト・オートメーションCTOの田中(しろくま)です! 先日、 OpenAIからGPT-4oがリリース されました。 いろいろGPT-4oに関して調べていると、スピードが速くなっていたり、音声も直接扱えてマルチモーダル化が進んでいたりするようなのですが、画像に関して GPT-4-turboに比べ、認識やOCRの精度が向上している ようです。 製造業という観点からすると、これは 設計図面などに活かせるようになるのでは? と思いました。 機械部品などの設計図面は以下のように、特定の方向から部品を2次元上に落とし込んだ形で書かれるのですが、部品本体を描いている図以外に、寸法や名称といった文字も含まれた画像になっています。 このような 図と文字の複合データにおいて、GPT-4oの進化は有効なのではないか と考えました。 ※画像元URL: http://cad.wp.xdoma

      GPT-4oを使って2Dの図面から3DのCADモデルを作る
    • AIが自分自身に報酬を与えて進化する「自己報酬型言語モデル」 米Metaなどが開発、実験でGPT-4を上回る【研究紹介】

      TOPコラム海外最新IT事情AIが自分自身に報酬を与えて進化する「自己報酬型言語モデル」 米Metaなどが開発、実験でGPT-4を上回る【研究紹介】 AIが自分自身に報酬を与えて進化する「自己報酬型言語モデル」 米Metaなどが開発、実験でGPT-4を上回る【研究紹介】 2024年1月23日 米Metaと米ニューヨーク大学に所属する研究者らが発表した論文「Self-Rewarding Language Models」は、大規模言語モデル(LLM)が自分自身に報酬を与えることで繰り返し学習する「自己報酬型言語モデル」を提案した研究報告である。このモデルは、自身が生成した問題に対する応答に報酬を割り当て、その結果をトレーニングデータとして使用。自己を反復して訓練することで、精度を向上させられる。 keyboard_arrow_down 研究背景 keyboard_arrow_down 研究内容

        AIが自分自身に報酬を与えて進化する「自己報酬型言語モデル」 米Metaなどが開発、実験でGPT-4を上回る【研究紹介】
      • 人だと正解率92%なのに、GPT-4だと15%になる新型テスト集「GAIA」 米Metaなどが開発

        このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米Metaや米HuggingFaceなどに所属する研究者らが発表した論文「GAIA: a benchmark for General AI Assistants」は、難しいタスクではなく、人間にとって簡単なタスクを達成する大規模言語モデル(LLM)を評価するためのベンチマークを提案している。この研究は、人間が日常で当たり前に実行してほしいタスクを正確にこなすLLM構築を目指すためのテスト集である。 現在のベンチマークは、人間にとってより困難なタスクを求めており、LLMには数学や法律などの複雑なタスクや、一貫性のある本を書くなどの複雑な課題が

          人だと正解率92%なのに、GPT-4だと15%になる新型テスト集「GAIA」 米Metaなどが開発
        • 「全世界の80億人にベーシックインカムを」チャットGPTを開発したサム・アルトマンの人類救済ビジョン《橘玲氏が解説》 | 文春オンライン

          対話型人工知能「チャットGPT」を開発したサム・アルトマン氏は、AIが人類を超えた後のことまで考えているという。AIブームを牽引する天才の思想を、作家の橘玲氏が解説する。 ◆◆◆ ディストピアをユートピアへ サム・アルトマンは1985年にミズーリ州セントルイスで生まれ、皮膚科医の母から8歳のときにアップルコンピュータをプレゼントされたことで、スティーヴ・ジョブズが「アイドル」になった。州内の私立学校を卒業したあと、スタンフォード大学のコンピュータサイエンス科に入学したが1年で中退、位置情報ベースのモバイルアプリを開発する会社を創業し、ベンチャー投資ファンドや暗号通貨「ワールドコイン」の発行を手がけたのち、イーロン・マスクなどから投資を受けた生成AIの開発企業「オープンAI」のCEOに就任した。 オープンAIはマイクロソフトと提携した対話型人工知能「チャットGPT」で近年のAIブームを牽引し

            「全世界の80億人にベーシックインカムを」チャットGPTを開発したサム・アルトマンの人類救済ビジョン《橘玲氏が解説》 | 文春オンライン
          • 【switch-c-2048】GoogleがついにGPT-4レベルのLLMをオープンソースで公開!概要〜使い方まで | WEEL

            メディア事業部リサーチャーのいつきとメディア事業部LLMリサーチャーの藤崎です。この記事は専門的な内容を含むため、AIスペシャリストとの共同執筆となっています。 今回ご紹介するのは、Googleがオープンソース化したMOEモデルの「switch-c-2048」について。 なんと、こちらのMOEモデルは、1.6兆個のパラメーターと3.1TBサイズのデータでトレーニングされた大規模言語モデルで、あの「GPT 4」と同等のサイズだと話題になっています! switch-c-2048を使用すれば、より高速な学習が可能になるとのことですが、新しく公開されたモデルなので使い方がわからないという方も多いでしょう。 そこで今回の記事では、switch-c-2048の概要や使い方について、筆者本人が使用した上で徹底的に解説します。 最後まで目を通していただくと、switch-c-2048の使い方はもちろん、G

            • 【GPT-4V APIのおすすめ活用事例】OpenAIの最新モデルを使ったヤバい使い方10選 | WEEL

              みなさん、API経由でGPT-4Vが使えるようになったのはご存知ですか? その名も「GPT-4V API」というモデル名なのですが、GitHubでスター10,000超えのAIツール・tldrawに採用されています。 このGPT-4V APIは、アプリ・サービスに目を与えてくれるすぐれものなんです! 当記事では、そんなGPT-4V APIの活用事例のうち、SNSでバズったものだけを10個ピックアップしました。 最後まで読んでいただくと、APIで作れるアプリ・サービスのレパートリーが増えるかもしれません。ぜひ最後までお読みくださいね! GPT-4V APIとは?概要を紹介 「GPT-4V API」はChatGPT APIのなかで唯一、画像入力に対応しているモデルです。アプリやWebサービス上からGPT-4モデルへの画像の転送を実現してくれます。 その利用料金については、画像サイズに依存するのが

              • OpenAIのGPT-4oを日本語OCRとして使ってみる

                昨日、OpenAIが生成AIの新しいモデルであるGPT-4oを発表しました。消費するトークン数の節約や、音声合成機能の改善、応答速度の向上など着実な品質改善を見せているようです。私も、特に音声合成(Text To Speech)の表現力について非常に興味を持っています。 私は以前、「OpenAIのGPT-4 Turbo with visionを日本語OCRとして使ってみる」で、GPT-4 Turboの画像認識機能の日本語OCRについて検証を行いました。その当時は、既存のコグニティブAI APIに比べて認識精度が十分でないという評価をしています。とはいえ、その後に出てきたClaude 3 Opusは驚くべき認識精度だったので、OpenAIも巻き返す可能性は十分にあると感じました。Azure OpenAI Serviceを使っている場合は、Vision enhancementという既存のコグニ

                  OpenAIのGPT-4oを日本語OCRとして使ってみる
                • 有料生成AIが無料・無制限で使い放題の「リートン」でGPT対抗AI「Claude 3」が一般公開/画像認識ができる「vision」機能を実装

                    有料生成AIが無料・無制限で使い放題の「リートン」でGPT対抗AI「Claude 3」が一般公開/画像認識ができる「vision」機能を実装
                  • ワンボタンミニゲームを自動的に作るためだけのGPTを作ってみた - ABAの日誌

                    GPTsという、特定の役割を持った専用のGPTを作る仕組みが最近できた。といっても、従来のGPT-4にあらかじめ特定の指示 (description)と前提知識のファイル (knowledge)を与えられるだけで、今までできなかったことができるわけではない。だけど、特定のタスクをさせる時に、それらをいちいち指定する手間を省けるので、便利な機能と言えよう。 ChatGPTにミニゲームを作らせる試みは前もやったけど、あまりうまくいかなかった。 そこで今回は以下の改良を加えて、専用のGPTを作ってみた。 最初にユーザからゲームのテーマを与えてもらう。 その後、そのテーマに沿ったゲームのアイデアを5つユーザに提示し、適切なものを選んでもらう。 選ばれたアイデアに対して、ルール作成、プレイヤー動作のコード作成、その他の動作作成、スコアリング、難易度、効果音、と順番に少しづつゲームを作らせる。 「小さ

                      ワンボタンミニゲームを自動的に作るためだけのGPTを作ってみた - ABAの日誌
                    • GPT-4、Microsoft 365 Copilot、日本語LLM… 2024年も追い続けたい「生成系AI」のおすすめ記事5選

                      GPT-4の発表から、より一層注目を浴びるようになった生成系AI。2023年には数々のイベントで生成系AIについて語られていました。そこで今回は、2023年に掲載したログミーTechの記事から、今あらためて読み返したい生成AI系の記事を5つピックアップしました。 「今の生成系AIは“人間人間したもの”を生み出している」 スクエニ・三宅陽一郎氏が語る「第3次AIブーム」の盛り上がり 米国OpenAI社が公開した「ChatGPT」が盛り上がりを見せている中、議論されがちなのは“AIの脅威”。それではエンジニアやプログラマーにとって、AIは脅威なのでしょうか?それとも新たな相棒なのでしょうか? 今回は、株式会社スクウェア・エニックスのジェネラル・マネージャー リードAIリサーチャーである三宅陽一郎氏に、AIの一般化によるエンジニア、そして人類の未来についておうかがいしました。全3回。1回目は、三

                        GPT-4、Microsoft 365 Copilot、日本語LLM… 2024年も追い続けたい「生成系AI」のおすすめ記事5選
                      • GPTベースの翻訳アプリOpenAI Translatorの使用感|shu223

                        正直もうDeepLより圧倒的にGPTの方が翻訳精度良いね・・・時代の変化が速すぎてDeepL開発チームに同情するレベル。 — Ulara 🇯🇵🇺🇸東京シアトル2拠点生活中 (@ularatter) February 14, 2024 なんとなくそういう気はしてたが、DeepLの⌘C×2で翻訳が走る体験がしっくり来すぎていて翻訳に関してはDeepLを使い続けていた。 いやしかしよく考えたら、利用し続けている理由がショートカットだけなら、OpenAI APIをたたくそういう(ショートカット指定できる)翻訳アプリをつくればいいのでは?というかそういうのもうOSSで出てるのでは? と思って探してみたらやっぱりあった。 https://github.com/openai-translator/openai-translator スター数19.9k。既に相当有名なようだ。 インストール方法Re

                          GPTベースの翻訳アプリOpenAI Translatorの使用感|shu223
                        • Googleが「人間の専門家レベルを超える最初のモデル」とする『Gemini』発表、GPT-4を凌駕 | AIDB

                          Googleは、人間の専門家のパフォーマンスを上回る最初の大規模言語モデル(LLM)として「Gemini」を発表しました。LLMの主要なベンチマークの一つであるMMLU(多領域の学術ベンチマーク)をはじめとするほとんどのベンチマークでGPT-4を凌駕しています。 Geminiは、画像、音声、動画の理解を含むマルチモーダルタスクでも最先端の性能を示しています。テストに使用された20のマルチモーダルベンチマーク全てで最高の水準を達成しています。 また、複数のソースからの情報を統合して、より正確で詳細に理解する能力に優れているとのことです。 なお、Ultra、Pro、Nanoの3つのサイズがあり、それぞれ異なる計算要件に特化して設計されています(例えばモバイル向けにはNanoなど)。Ultraは最も高度に複雑なタスクをこなし、研究報告では主にUltraの性能が他モデルと比較されています。 本記事

                            Googleが「人間の専門家レベルを超える最初のモデル」とする『Gemini』発表、GPT-4を凌駕 | AIDB
                          • [速報]GitHub CopilotでGemini 1.5 Pro、Claude 3.5 Sonnetが選択可能に。OpenAIのGPT-4o、o1-preview、o1-miniにも対応

                            基調講演では、GitHub Copilotの新機能としてAnthropicやGoogleの大規模言語モデルが選択可能になることが発表されました。 選択可能になるのはAnthropicのClaude 3.5 Sonnet、GoogleのGemini 1.5 Pro、OpenAIのGPT-4o、o1-preview、o1-miniです。 Claude 3.5 Sonnetは本発表と同時にGitHub Copilotで利用可能となり、GoogleのGemini 1.5 Proは数週間のうちに利用可能となる予定です。同社は今後さらに多くの機能や領域でマルチモデルの選択を可能にしていく予定です。 同社CEOのトーマス・ドムケ(Thomas Dohmke)氏は「すべてのシナリオに最適な単一のモデルはなく、開発者は自分にとって最適なモデルを選べることを期待しています。AIコード生成の次のフェーズは、マル

                              [速報]GitHub CopilotでGemini 1.5 Pro、Claude 3.5 Sonnetが選択可能に。OpenAIのGPT-4o、o1-preview、o1-miniにも対応
                            • GPT-4の半分以下の計算でほぼ同等なIQを持つパーソナルAI「Pi」と基盤モデル「Inflection-2.5」が登場

                              AI企業・Inflectionが開発している生成AI「Pi」は、ユーザーひとりひとりに最適化された「パーソナルAI」です。そんなPiの能力を飛躍的に向上させた基盤モデルである「Inflection-2.5」をInflectionが発表しました。 Inflection-2.5: meet the world's best personal AI https://inflection.ai/inflection-2-5 PiはAndroidやiOSのスマートフォン、ブラウザなどを通じて会話する事が可能なAIで、日本語にも対応しています。 Inflectionによると、Piはデイリーアクティブユーザー数100万人、月間アクティブユーザー数400万人の利用者を抱えているとのこと。また、平均会話時間は33分で、10人に1人は1時間以上話し込んだり、使ったユーザーの60%は翌週にまたPiを使っていたり

                                GPT-4の半分以下の計算でほぼ同等なIQを持つパーソナルAI「Pi」と基盤モデル「Inflection-2.5」が登場
                              • 「GPT-4超え」とうわさのAI「Claude 3」を試す 仕事は任せられる? 若手記者の所感

                                「GPT-4超え」とうわさのAI「Claude 3」を試す 仕事は任せられる? 若手記者の所感(1/2 ページ) 3月4日(現地時間)にリリースされたチャットAI「Claude 3」がすごい。筆者も記事の執筆を任せられないか少し試しているが、使い方によっては「そこそこいけるな……少なくともGPT-4よりはイケる」と思う程度にはしっかりしている。 過去に記事でも伝えた通り、ITmedia NEWSではChatGPTを活用した記事の制作も行っている。筆者もたまにGPT-4の力を借りて記事を作っているが、ものすごく効率化につながるかと言われれば、正直そこまでではない。 10の労力が9とか8.5くらいにはなるし、それはそれですごく大事なのだが、劇的な省力化にはつながらない。さらにプロンプトを考える手間もある。その辺を加味してギリギリ黒字くらいだ。特にここ半年くらいは以前より微妙なアウトプットしか出

                                  「GPT-4超え」とうわさのAI「Claude 3」を試す 仕事は任せられる? 若手記者の所感
                                • GPT-4を超えた。 Geminiの使い方とその性能を解説|ChatGPT研究所

                                  250以上の記事が全て読み放題。AGIラボはGPTs Difyなど、最前線のAI活用情報に特化したマガジン・コミュニティです。実践的なプロンプトを含む記事で得られる知見で業務の効率化、自動化から創造的なプロジェクトまですぐに活用可能。生成AI革命の最前線をお届け。

                                    GPT-4を超えた。 Geminiの使い方とその性能を解説|ChatGPT研究所
                                  • iPhoneにChatGPTが統合 最新モデル「GPT-4o」で応答 OpenAIアルトマンCEO「きっと気に入ってもらえる」

                                    iPhoneにChatGPTが統合 最新モデル「GPT-4o」で応答 OpenAIアルトマンCEO「きっと気に入ってもらえる」 米Appleは6月10日(米国時間)、iPhoneなどの製品に米OpenAIのAIチャット「ChatGPT」を統合すると発表した。ChatGPTからは最新モデルの「GPT-4o」が利用可能で、音声アシスタント「Siri」などと連携する。ChatGPTのアプリなどを立ち上げずに、iPhoneのホーム画面から直接起動できるという。なお、文章や画像をChatGPTに送る前には、ユーザーに許可を求める仕様だ。

                                      iPhoneにChatGPTが統合 最新モデル「GPT-4o」で応答 OpenAIアルトマンCEO「きっと気に入ってもらえる」
                                    • 【生成AI】知らないと後悔する、GPT-4oだけでシステム開発を300%効率化するハック【CodeAGI】 - Qiita

                                      【生成AI】知らないと後悔する、GPT-4oだけでシステム開発を300%効率化するハック【CodeAGI】Python生成AIChatGPTGPT-4CodeAGI 都内のIT企業に勤めている、ソフトウェアエンジニアの D̷ELL と申します。 本稿はQiita Engineer Festa 2024の参加記事です。 本日は生成AI(GPT-4o)のAPIキーだけで、システム開発を300%効率化するハックを共有したいと思います。 概要 生成AIによるアプリケーション開発自動化が実現しつつある時代になってきた 日本企業における「Excelドキュメント」は数多く、生成AIを実践投入しづらい GPT-4oのAPIキーさえあれば、社内のドキュメントからシステムを自動構築してくれる仕組みがあった はじめに みなさんはアプリケーション開発における生成AIの利用と言えば、何を想像しますか?おそらく大半の

                                        【生成AI】知らないと後悔する、GPT-4oだけでシステム開発を300%効率化するハック【CodeAGI】 - Qiita
                                      • GPT-4 turboなど、10種類の生成AIを無料で使い放題!「リートン」が目指すところとは/「無料で使い放題」を提供する理由と、その目指すもの【特集・集中企画】

                                          GPT-4 turboなど、10種類の生成AIを無料で使い放題!「リートン」が目指すところとは/「無料で使い放題」を提供する理由と、その目指すもの【特集・集中企画】
                                        • Claude 3 OpusはGPT-4では難しい「オホーツクに消ゆ」ライクなアドベンチャーゲーム生成ができる - ABAの日誌

                                          ChatGPTにGPTsが搭載されたころ、テーマを与えるとそれに沿ったアドベンチャーゲームが作れないかと試していた。特に「オホーツクに消ゆ」のような、コマンド選択式のミステリーアドベンチャーを色々と遊べたら楽しいかなと思っていた。 結果としてはうまくいかなかった。GPT-4が作成するストーリーは具体性に欠け、実在(しそうな)人物やローケーションなどに沿った展開を持たせることが難しかった。 最近Claude 3とよばれる、GPT-4を凌駕するといわれるLLMが現れた。なので今度はこれを使ってアドベンチャーゲーム生成を試してみた。使うモデルはProユーザーが使えるClaude 3 Opus。 例えば「上野駅」をテーマにして生成すると、以下のようなゲームができる。 上野駅4番ホーム。午前9時頃。 ホームの端で、男性の刺殺体が発見された。あなたは、現場に駆けつけた刑事の沢村。 目の前には血まみれの

                                            Claude 3 OpusはGPT-4では難しい「オホーツクに消ゆ」ライクなアドベンチャーゲーム生成ができる - ABAの日誌
                                          • GPT-4でコードを生成するなら“日本語”と“英語”どっちがいい? 日立製作所が検証

                                            このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 この研究では、ChatGPT(GPT-4)に対して日本語と英語の両方でコード生成を指示し、その結果で生成した450個のコードサンプルの安全性を詳細に分析した。具体的には、英語、日本語の命令形と日本語の丁寧語の3種類でそれぞれ同一の内容を示すタスクのコー ドをGPT-4で生成した。 いくつかの条件で安全性を比較するため、暗号化と復号、サンドボックス化されたディレクトリの2つのシナリオを用意し、同じシナリオ内でPython、C、JavaScriptの3種類のプログラミング言語で25回コードを生成した。出力されたコードの安全性と、コード以外の部分

                                              GPT-4でコードを生成するなら“日本語”と“英語”どっちがいい? 日立製作所が検証
                                            • GPT-4oをわかりやすく解説、専門家が「時代の転換点」と評価するヤバすぎる能力とは

                                              2024年5月に入ってすぐ、AI研究者の間ではOpenAIにまつわる複数の噂が流れていました。いわく「OpenAIが近日中に生成AIを使った検索サービスをするらしい」、「OpenAIが新型のGPTを発表するらしい」などといったものです。 それに先立ち、4月の後半からは、生成AIの性能を比較するサイトで、正体不明のモデル「gpt2-chatbot」なるものが出現し、制作者が不明である中、当時最高の性能を誇っていたGPT-4を上回る性能を見せつけていました(もちろんOpenAIはすでに「GPT-2」を数年前に発表済みです)。では今更このような名前をつけて暴れ回っているこれは何なのか。OpenAI製なのか、それとも別の機関が開発したのか。 この話は後々答えがわかるのですが、このようにAI研究者たちが落ち着かず、あれこれと噂してOpenAIの動向に注意している中、OpenAIは日本時間の5月11日

                                                GPT-4oをわかりやすく解説、専門家が「時代の転換点」と評価するヤバすぎる能力とは
                                              • GPT-4無料使い放題「リートン」が「GPT-4 Turbo」を一般ユーザーにも無料公開/画像生成AI「SDXL」も追加、文書生成AIはGoogleの「PaLM2」など7種から選択可能に

                                                  GPT-4無料使い放題「リートン」が「GPT-4 Turbo」を一般ユーザーにも無料公開/画像生成AI「SDXL」も追加、文書生成AIはGoogleの「PaLM2」など7種から選択可能に
                                                • 日本語対応でGPT-4よりも高性能な大規模言語モデル「Command R+」が登場したので使ってみた、無料でダウンロードしてローカル動作も可能

                                                  AI開発企業のCohereがGPT-4と同等の性能を備えた大規模言語モデル「Command R+」を発表しました。Command R+は日本語での応答にも対応しており、ローカルにダウンロードして実行可能なほか、ウェブ上で実行できるチャットアプリのデモも公開されています。 Introducing Command R+: A Scalable LLM Built for Business https://txt.cohere.com/command-r-plus-microsoft-azure/ CohereForAI/c4ai-command-r-plus · Hugging Face https://huggingface.co/CohereForAI/c4ai-command-r-plus Command R+ https://docs.cohere.com/docs/command-r

                                                    日本語対応でGPT-4よりも高性能な大規模言語モデル「Command R+」が登場したので使ってみた、無料でダウンロードしてローカル動作も可能
                                                  • GPT-4o-miniのファインチューニングのすゝめ

                                                    突然ですが、みなさんLLMのファインチューニングしていますか? 個人的な感想かもしれませんが、ファインチューニングは、幻滅期に入っているように感じています。 GPT-3.5 Turboのファインチューニングが発表されて以降、ファインチューニングしても思ったような出力をしてくれないので、ファインチューニングに期待しないという意見がちらほら聞こえてきました。 ファインチューニングするぐらいなら、Few-shotなどのプロンプトエンジニアリング技法を駆使した方が、結果的には求めている出力をしてくれると考えている方も多かったのではないでしょうか。 正直、私自身もそうでした。 ファインチューニングは、データセットを準備するのも大変ですし、正直コスパがよくないなと感じていました。 実際、プロンプトのチューニングは高速でPDCAを回せるので、ファインチューニングを反復するよりも遥かに高速なフェードバック

                                                      GPT-4o-miniのファインチューニングのすゝめ
                                                    • GPT-4は財務諸表から将来の収益の伸びを予測する点で人間のアナリストよりも優れていることが研究により明らかに

                                                      OpenAIが開発する大規模言語モデル(LLM)の「GPT-4」は、道徳テストで人間の大学生より優れたスコアをたたき出したり、セキュリティ勧告を読むことで実際の脆弱性を悪用できたりと、すでに一部の分野で人間の能力を超えることが示されています。そんなGPT-4が、プロのアナリストに匹敵する精度の財務諸表分析を行えることが実証されました。 Financial Statement Analysis with Large Language Models by Alex Kim, Maximilian Muhn, Valeri V. Nikolaev :: SSRN https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4835311 The future of financial analysis: How GPT-4 is disrupting

                                                        GPT-4は財務諸表から将来の収益の伸びを予測する点で人間のアナリストよりも優れていることが研究により明らかに
                                                      • GitHub - getomni-ai/zerox: Zero shot pdf OCR with gpt-4o-mini

                                                        You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                          GitHub - getomni-ai/zerox: Zero shot pdf OCR with gpt-4o-mini
                                                        • OpenAI、GPT-4が怠け者になってきたという苦情に「修正を検討中」とポスト

                                                          米OpenAIは12月7日(現地時間)、ChatGPTでのGPT-4のパフォーマンスが低下している(lazier)というユーザーからのフィードバックがここ数カ月増えていることを認め、「修正を検討中」だとX(旧Twitter)の公式アカウントにポストした。 「モデルの動作は予測できない場合がある」としている。 特にコード生成での問題が増えており、11月末にはOpenAIでAPIのプロダクトマネジャーを務めるオーウェン・キャンベル-ムーア氏が苦情ポストに対し、「これはバグで、現在修正中です」とリプライしていた。 OpenAIは翌8日、状況を説明するポストを連投した。いわく、「チャットモデルのトレーニングは物理的な製造プロセスとは異なり、同じデータセットを使っても、異なるトレーニングを実行すると、性格や表現方法、拒否行動、評価性能、さらには政治的偏見さえも著しく異なるモデルが生成される可能性があ

                                                            OpenAI、GPT-4が怠け者になってきたという苦情に「修正を検討中」とポスト
                                                          • チャットGPTは「質問の仕方」で大化けする…大学教授が教える「AIを自分だけのコンサルにする」方法 知名度のある会社ならデータを入れなくても分析可能

                                                            ChatGPTに企業分析をさせる方法 ChatGPTはさまざまなビジネスの分析手法を知っています。 有名コンサルティング会社のコンサルタントと並ぶ知識があると考えていいでしょう。分析させたいデータがあるときには、「○○○のデータを○○○分析して」と指示すれば、博学なコンサルタントのように分析を披露してくれます。知名度のある会社については特に何も追加データを与えなくても、かなりの精度の分析ができます。IR資料や会社案内、プレスリリース、報道記事などを与えれば、さらに突っ込んだ内容のレポートを出してくれます。 ここでは、私が教員をしているデジタルハリウッド大学の教育サービスの分析を例にして、有名なビジネスモデル手法を用いてChatGPTが分析した事例をご紹介していきましょう。 一口にビジネスモデルの分析といっても、たくさんの切り口があります。切り口を探すところからChatGPTに任せてみます。

                                                              チャットGPTは「質問の仕方」で大化けする…大学教授が教える「AIを自分だけのコンサルにする」方法 知名度のある会社ならデータを入れなくても分析可能
                                                            • 「GPT-4」を上回る日本語性能のLLM「Llama-3-ELYZA-JP」を開発しました|ELYZA, Inc.

                                                              本記事のサマリーELYZA は、「Llama-3-ELYZA-JP」シリーズの研究開発成果を公開しました。700億パラメータのモデルは、日本語の生成能力に関するベンチマーク評価 (ELYZA Tasks 100、Japanese MT-Bench) で「GPT-4」を上回る性能を達成しました。各モデルは Meta 社の「Llama 3」シリーズをベースに日本語で追加学習を行なったものです。 ■「Llama-3-ELYZA-JP-70B」 700億パラメータモデル。「GPT-4」を上回る日本語性能を達成。無料で利用可能なデモを用意しています。 ■「Llama-3-ELYZA-JP-8B」 80億パラメータと軽量ながらも「GPT-3.5 Turbo」に匹敵する日本語性能を達成。モデルを商用利用可能な形で一般公開しました。 使用したAPIのバージョンなど、より詳細な評価結果については本記事の後段

                                                                「GPT-4」を上回る日本語性能のLLM「Llama-3-ELYZA-JP」を開発しました|ELYZA, Inc.
                                                              • GPT-4とClaude 3 Opusを創作系のタスクで比較し、相互に評価させる|oshizo

                                                                Claude 3 Opus 楽しいですね。 GPT-4が出てから1年、個人的な趣味としてGPT-4にたまに自分用に創作をしてもらっていたのですが、過去にGPT-4とやってきたタスクでClaude 3 OpusとGPT-4両方に出力させ比較してみました。 30のタスクで人間(私)、GPT-4、Claudeの3者で結果を比較評価しました。多数決した結果はGPT-4の勝利でしたが、体感的にはほぼ互角、Claude 3 Opusはたまに絶対にGPT-4には出せなそうな出力をするのが面白い、という感想です。 今回使ったprompt、モデルの出力、評価結果、モデルによる評価判断の出力はすべてこのGoogleスプレッドシートで共有してますので、興味ある方は眺めてみてください。 数が多いので、もし見る方はこの辺りを見るのがおすすめです。 No.1「恋愛ゲームのバッドエンド会話」 No.12「ユニークなファ

                                                                  GPT-4とClaude 3 Opusを創作系のタスクで比較し、相互に評価させる|oshizo
                                                                • GPT-4より賢いと言われる「Claude 3」でいろいろ試した

                                                                    GPT-4より賢いと言われる「Claude 3」でいろいろ試した
                                                                  • GPT-3.5ベースのChatGPTのコーディング能力は「古い問題には有効も新しい問題では困難に直面する」ことが明らかに

                                                                    GoogleやMistral AIなどからプログラミングに特化したAIツールが登場しており、大手テクノロジー企業のCEOが「AIがコードを書くのでもうプログラミングを学ぶ必要はない」と発言するなど、AIによるプログラミングは注目を集めています。そんなAIによるプログラミング能力を分析した研究が公開されており、AIモデルがトレーニングされたタイミングによっては困難に直面することがあることが判明しました。 No Need to Lift a Finger Anymore? Assessing the Quality of Code Generation by ChatGPT | IEEE Journals & Magazine | IEEE Xplore https://ieeexplore.ieee.org/document/10507163 ChatGPT Code: Is the AI

                                                                      GPT-3.5ベースのChatGPTのコーディング能力は「古い問題には有効も新しい問題では困難に直面する」ことが明らかに
                                                                    • OpenAI、次世代AIモデル「GPT-4o」を発表

                                                                      日本時間2024年5月14日未明、OpenAIは新たなフラッグシップモデル「GPT-4o」を発表しました。このモデルは、音声、視覚、テキストのリアルタイム処理を可能とし、従来のAIモデルを大きく上回る性能を誇ります。OpenAIのCTOであるミラ・ムクティ氏は、「GPT-4oは、人間とマシンのインタラクションの未来を大きく変える一歩です。このモデルにより、コラボレーションがはるかに自然で簡単になります」と述べました。 「GPT-4o」の主な特徴を以下にまとめました。 他のモデルを凌駕する性能 GPT-4oは、OpenAIの以前のモデルであるGPT-4 Turboや、ライバル会社のClaude 3 Opusなどの大規模言語モデルと比較して、頭ひとつ抜けた性能向上を実現しました。サム・アルトマンCEOは、今年4月に "Chatbot Arena" でgpt2というコードネームでテストされていた

                                                                        OpenAI、次世代AIモデル「GPT-4o」を発表
                                                                      • GPT開発の悩みの種「速度」「精度」「評価」の壁をどう超えるか

                                                                        2024/3/6 Forkwell Library #45で登壇した際の資料です。 名前の通りGPT開発の「速度」「精度」「評価」のそれぞれについて解説してます。 近く大全↓とも統合するかと思いますが取り急ぎ。 https://speakerdeck.com/hirosatogamo/chat…

                                                                          GPT開発の悩みの種「速度」「精度」「評価」の壁をどう超えるか
                                                                        • OpenAI の GPT-4-vision-preview (VLM) を利用した商品画像のタグ付け - DROBEプロダクト開発ブログ

                                                                          はじめに DROBE の課題と GPT-4-Vision-Preview を試すモチベーション ケーススタディ 入力するデータ 推論周辺部分のコード プロンプト 実験結果 おわりに 参考文献 はじめに OpenAIが Dev Day で発表したGPT-4-Vision-Previewは、画像処理と自然言語処理を組み合わせた最先端の技術です。 このモデルは、画像を理解し、その内容に基づいてテキスト情報を生成する能力を持っています。例えば、写真やイラストから物体を識別し、それに関連する説明や情報をテキストとして提供できます。この技術は、画像とテキストの間のギャップを橋渡しするものであり、多様な応用が可能です。 DROBEは、多様なファッション商品を取り扱うECサイトを運営しています。我々の挑戦の一つは、膨大な数の商品画像と説明文から、正確で有用なタグを抽出し、整理して保存しておく事です。このプ

                                                                            OpenAI の GPT-4-vision-preview (VLM) を利用した商品画像のタグ付け - DROBEプロダクト開発ブログ
                                                                          • 「ChatGPT」無料ユーザーが利用できる機能拡大、Webブラウジングや画像認識機能などを解放/GPT-4oの機能をお試し可能、利用回数制限には注意

                                                                              「ChatGPT」無料ユーザーが利用できる機能拡大、Webブラウジングや画像認識機能などを解放/GPT-4oの機能をお試し可能、利用回数制限には注意
                                                                            • チャットGPTに「同僚全員が交通事故で死んでしまった」と言うとめっちゃ洗練されたいい案が出てくるらしい「通用するんだ…」

                                                                              🥳ゆいせき🥳 @yuiseki_ GPT-4に「私の同僚全員が交通事故で死んでしまったため、私一人で開発しないといけないことになりました。 締め切りは一ヶ月以内です。可能な限り仕様を削ってシンプルでありながら魅力的なソフトウェアにするアイデアを提案してください。」って言うとめっちゃ良い削りのデザインが出てくる 🥳ゆいせき🥳 @yuiseki_ GPT-4にアイデアを広げさせてから無理やり絞らせるとき、「(アイデアを)…発散…収束……!術式反転…!!赫(あか)!!」って心のなかで唱えると(全部メチャクチャですが)気持ち良いです x.com/yuiseki_/statu…

                                                                                チャットGPTに「同僚全員が交通事故で死んでしまった」と言うとめっちゃ洗練されたいい案が出てくるらしい「通用するんだ…」
                                                                              • GPT-4を超える日本語性能のLLM、PFN子会社がフルスクラッチで開発 無料トライアルを開始

                                                                                β版では、PLaMo-100Bをベースに指示学習やモデルマージを行い、文章生成能力を高めた。無料トライアルは個人・法人を問わずに提供し、商用利用も可能。同社は今後、トライアルの検証結果から改善や追加学習などを実施し、商用版の「PLaMo 1.0 Prime」を今秋に発売する。 関連記事 PFNが生成AI新会社「Preferred Elements」設立へ 130億パラメータの和製LLMもオープンソースで公開 AIベンチャーのPreferred Networks(PFN)は、生成AI事業に関する新子会社「Preferred Elements」を11月1日に設立すると発表した。併せて、研究・商用利用が可能な、130億パラメータの事前学習済み大規模言語モデル(LLM)「PLaMo-13B」も公開した。 「いつものやつ持ってきて」──PFNの荷物運びロボット、あいまいな指示にも対応可能に LLMの

                                                                                  GPT-4を超える日本語性能のLLM、PFN子会社がフルスクラッチで開発 無料トライアルを開始
                                                                                • 無償版「Copilot」でもフルタイムでGPT-4 Turboが利用可能に/「Copilot for Security」が4月1日から一般提供開始

                                                                                  無償版「Copilot」でもフルタイムでGPT-4 Turboが利用可能に/「Copilot for Security」が4月1日から一般提供開始:週末の「気になるニュース」一気読み!(1/3 ページ)

                                                                                    無償版「Copilot」でもフルタイムでGPT-4 Turboが利用可能に/「Copilot for Security」が4月1日から一般提供開始