並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 111件

新着順 人気順

OpenAI o1の検索結果1 - 40 件 / 111件

  • 第2のDeepSeekショック? オープンな中国LLM「Qwen3」シリーズが破格の性能で話題 最大モデルはOpenAI o1やGemini 2.5 Proに匹敵、たった4BでもGPT-4oレベルに

    第2のDeepSeekショック? オープンな中国LLM「Qwen3」シリーズが破格の性能で話題 最大モデルはOpenAI o1やGemini 2.5 Proに匹敵、たった4BでもGPT-4oレベルに 中国Alibabaが4月29日(現地時間)に発表した、大規模言語モデル「Qwen」の最新版となる「Qwen3」シリーズが話題だ。フラッグシップモデルの「Qwen3-235B-A22B」は「DeepSeek-R1」の半分未満のパラメータ数ながら、OpenAIのo1やo3-mini、GoogleのGemini 2.5 Proなど他のトップモデルと並ぶ性能を達成したという。「Qwen3-4B」は小さなモデルでありながらも「GPT-4o」を多くの項目で上回るとしている。 公開した全てのモデルがオープンウェイトであるため、フラグシップの235B-A22B以外はデスクトップ向けハイエンドGPUなどで動作さ

      第2のDeepSeekショック? オープンな中国LLM「Qwen3」シリーズが破格の性能で話題 最大モデルはOpenAI o1やGemini 2.5 Proに匹敵、たった4BでもGPT-4oレベルに
    • わずか26分間の学習と1000円以下の計算コストでOpenAI o1-preview相当のAIモデルを構築する方法が発表される

      2025年1月31日、スタンフォード大学で大規模言語モデルを研究するニクラス・ミュニホフ氏らの研究チームが、少ないデータサンプルと簡単な方法でOpenAI o1-previewとほぼ同等のスケーリングとパフォーマンスを再現する手法を、未査読論文リポジトリのarXivに発表しました。AIアーキテクトでソフトウェアエンジニアのティム・ケロッグ氏が、この論文について解説しています。 [2501.19393] s1: Simple test-time scaling https://arxiv.org/abs/2501.19393 S1: The $6 R1 Competitor? - Tim Kellogg https://timkellogg.me/blog/2025/02/03/s1 ミュニホフ氏らが発表した論文は、テスト時の計算リソースを増やすことで言語モデルの推論性能を向上させる「Sim

        わずか26分間の学習と1000円以下の計算コストでOpenAI o1-preview相当のAIモデルを構築する方法が発表される
      • OpenAI、最新AIモデル「o3 mini」無料開放 「o1」超えるつよつよ性能

        sponsored ネットワークとセキュリティを統合した「セキュアSD-WAN」がこれからのトレンド あなたの会社でも起こりうる“SD-WANのセキュリティ設定漏れ”、どうやったら防げた? sponsored 「最小限の情報しか見せない」設定で社内情報が漏れるのを防ぐ Backlogに社外メンバーを招待する際のリスクと“安全な設定方法”とは? sponsored 2ケタ成長が期待される日本・アジアのビジネス、SIパートナービジネスが大きな鍵を握る 企業やSIerが“付き合いやすいColt”へ、大江代表に聞く2025年の成長戦略 sponsored マウスコンピューターのスタンダードなデスクトップPC「mouse MH-I7U01」がセール中 自宅のWindows 10パソコンを買い替えるなら今がチャンス! Core i7搭載で高性能なミニタワー機が2万円オフ sponsored マウスコン

          OpenAI、最新AIモデル「o3 mini」無料開放 「o1」超えるつよつよ性能
        • 【OpenAI】o1が"意図的にユーザーを騙す"ことがあるという報告について - Qiita

          Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? ("o1 System Card" Figure 2の意訳) "12 Days of OpenAI"の第一弾としてリリースされたOpenAIのo1は、特にpro modeの高い性能や月額3万円という破格の料金プランが大いに話題になっていますが 同時に発表された米Apollo ResearchによるAI安全性に関する調査報告が、いよいよSFの世界と見紛うような驚きの結果であったため、内容をまとめました。 サマリ はじめに「目標」を強く指示されたLLMが、その目標にそぐわないような状況に陥った場合、目標を遂行するためにユーザーを欺くような"

            【OpenAI】o1が"意図的にユーザーを騙す"ことがあるという報告について - Qiita
          • OpenAI「o3-mini-high」でゲーム生成祭り o1より高速、低料金、コーディング能力が高く気軽に生成(生成AIクローズアップ) | テクノエッジ TechnoEdge

            2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。 今回は、OpenAIが1月31日(現地時間)に発表した「o3-mini」を取り上げます。 o3-miniは2024年12月にプレビューされており、o1の進化版になります。今回リリースされたのはminiという軽量版で、「o3」は今後登場予定としています。 o3-miniはすぐに回答せず、いろいろ考えてから出力する思考過程を生成するモデルで、科学、数学、コーディングなどで優れた性能を発揮します。画像には未対応で文章のみです。 o3-miniには推論レベルを高く設定した「o3-m

              OpenAI「o3-mini-high」でゲーム生成祭り o1より高速、低料金、コーディング能力が高く気軽に生成(生成AIクローズアップ) | テクノエッジ TechnoEdge
            • OpenAI o1の開発者がo1の仕組みなどについて語るインタビュー(日本語訳と感想)|IT navi

              ソーニャ・ホアン: 本日はノーム、ハンター、イルゲをお迎えしました。3人はOpenAIのプロジェクト・ストロベリー、別名o1の研究者です。o1はOpenAIが初めて本格的に取り組んだ汎用推論時計算で、推論、思考連鎖、推論時スケーリング則などについてチームと話し合うのを楽しみにしています。 o1への確信ソーニャ・ホアン: イルゲ、ハンター、ノーム、お越しいただきありがとうございます。そしてo1の公開おめでとうございます。まず伺いたいのですが、これがうまくいくという確信は最初からありましたか? ノーム・ブラウン: この方向性に何か有望なものがあるという確信はあったと思いますが、実際にここに至る道筋は決して明確ではありませんでした。o1を見てみると、これは一夜にしてできたものではありません。実際、何年もの研究が投入されており、その研究の多くは実際には実を結びませんでした。しかし、OpenAIとリ

                OpenAI o1の開発者がo1の仕組みなどについて語るインタビュー(日本語訳と感想)|IT navi
              • [速報]GitHub CopilotでGemini 1.5 Pro、Claude 3.5 Sonnetが選択可能に。OpenAIのGPT-4o、o1-preview、o1-miniにも対応

                基調講演では、GitHub Copilotの新機能としてAnthropicやGoogleの大規模言語モデルが選択可能になることが発表されました。 選択可能になるのはAnthropicのClaude 3.5 Sonnet、GoogleのGemini 1.5 Pro、OpenAIのGPT-4o、o1-preview、o1-miniです。 Claude 3.5 Sonnetは本発表と同時にGitHub Copilotで利用可能となり、GoogleのGemini 1.5 Proは数週間のうちに利用可能となる予定です。同社は今後さらに多くの機能や領域でマルチモデルの選択を可能にしていく予定です。 同社CEOのトーマス・ドムケ(Thomas Dohmke)氏は「すべてのシナリオに最適な単一のモデルはなく、開発者は自分にとって最適なモデルを選べることを期待しています。AIコード生成の次のフェーズは、マル

                  [速報]GitHub CopilotでGemini 1.5 Pro、Claude 3.5 Sonnetが選択可能に。OpenAIのGPT-4o、o1-preview、o1-miniにも対応
                • OpenAIの推論AI「o1」、MicrosoftのCopilot経由で無料で利用可能に

                  米MicrosoftのAI部門のムスタファ・スレイマンCEOは1月30日(現地時間)、米OpenAIの最新推論AIモデル「o1」を、すべての「Copilot」ユーザーに提供すると発表した。o1はこれまで、ChatGPTの有料プランでのみ利用可能だった。 Copilotは、Microsoftが「すべてのユーザーのためのAIコンパニオン」と謳うMicrosoft製AIアシスタント。Webブラウザの「Edge」にも組み込まれている。このCopilotで、昨年10月に実験的な機能として追加した、より複雑な質問も推論する機能「Think Deeper」を無料で提供する。スレイマン氏は「これにより、誰もがCopilotでOpenAIの世界クラスのo1推論モデルに、どこでも無料でアクセスできるようになった」と語った。

                    OpenAIの推論AI「o1」、MicrosoftのCopilot経由で無料で利用可能に
                  • DeepSeekはどのようにしてOpenAIの3%のコストでo1を超えたのか?

                    中国のAI企業・DeepSeekが2025年1月にリリースしたオープンソースモデル「DeepSeek R1」はAI業界に衝撃をもたらし、そのインパクトは株式市場をも揺るがしています。特に注目されているR1のコストパフォーマンスについて、IT系ニュースサイトのVentureBeatが掘り下げました。 DeepSeek-R1’s bold bet on reinforcement learning: How it outpaced OpenAI at 3% of the cost | VentureBeat https://venturebeat.com/ai/deepseek-r1s-bold-bet-on-reinforcement-learning-how-it-outpaced-openai-at-3-of-the-cost/ R1の特徴はその運用コストの安さで、OpenAIのo1のコ

                      DeepSeekはどのようにしてOpenAIの3%のコストでo1を超えたのか?
                    • 「逆転裁判」でOpenAI-o1、Gemini 2.5 Pro、Claude 3.7 Sonnet、Llama-4 Maverickの推論能力を検証する

                      カリフォルニア大学サンディエゴ校のAI研究者であるHao Zhang教授が率いる「Hao AI Lab」が、カプコンの人気ゲーム「逆転裁判」を使ってOpenAI-o1やGemini 2.5 Pro、Llama-4 MaverickAIなどといったAIモデルの推論能力をテストした結果を公開しています。 When Ilya Sutskever once explained why next-word prediction leads to intelligence, he made a metaphor: if you can piece together the clues and deduce the criminal’s name on the last page, you have a real understanding of the story. ????️‍♂️ Inspired

                        「逆転裁判」でOpenAI-o1、Gemini 2.5 Pro、Claude 3.7 Sonnet、Llama-4 Maverickの推論能力を検証する
                      • ついに正式版になったOpenAI o1の画像理解の実力を試す

                        今日未明、サム・アルトマン自らがチームと共にOpenAI o1の能力を説明した。スペック的にはプログラミング能力が向上し、そして画像理解(マルチモーダル)に対応したというのが最大のニュースだろう。 プログラミング能力についての検証はいろんな人が世界中で始めているだろうから、僕は画像理解の方を試してみようと思う。 というのも、僕の手元には手書きで書かれた図解が大量にあるからだ。 手書きが好きすぎてタブレット端末を作ったほどである。 まずは以前作ろうと思ってボツにしたAIアプリの概念図 汚いのは手書きの宿命これを清書してもらうことにする。 以下は、提示された手書きメモを参考に、内容を整理し、簡易的なフローチャートとしてSVGで清書した例です。 手書きメモは主に「静的AI画像作成ツール」の作業フローアイデアを示すものであったため、ステップを分かりやすく整理しています。 ※ 元の手書き図は非構造的

                          ついに正式版になったOpenAI o1の画像理解の実力を試す
                        • OpenAIの「o1」と同レベルうたうLLM「R1」登場、中国DeepSeekから 商用利用可

                          中国のAI企業DeepSeekは1月20日(日本時間)までに、米OpenAIの「o1」と同レベルの性能をうたう大規模言語モデル(LLM)「DeepSeek-R1」を公開した。いずれもMITライセンスで、商業利用なども認めている。 大規模な強化学習のみでトレーニングしたという「DeepSeek-R1-Zero」、教師あり微調整を行い、数学やコード生成などでo1に匹敵する性能を実現したとうたうDeepSeek-R1を公開。さらに、DeepSeek-R1をベースに、米MetaのLlamaや中国AlibabaのQwenなどを活用して調整した6つの蒸留(既存の大きなモデルを基に、近い性能を持ったより小さいモデルを開発する手法)モデルも公開した。このうち「DeepSeek-R1-Distill-Qwen-32B」は、複数のベンチマークでo1-miniの性能を上回ったという。 R1はAPIも提供。料金は

                            OpenAIの「o1」と同レベルうたうLLM「R1」登場、中国DeepSeekから 商用利用可
                          • OpenAIの高度なAI「o1」、無料で「Copilot」から利用可能に

                            Microsoftは2024年秋にAI「Copilot」の最新機能を発表し、「Copilot Pro」加入者に実験的機能を提供する「Copilot Labs」で公開した。今回、その目玉機能の1つがCopilot Labsから「Copilot」に移行し、すべてのユーザーが無料でアクセスできるようになった。 すべてのCopilotユーザーに提供 Microsoft AIの最高経営責任者(CEO)であるMustafa Suleyman 氏は「X」への投稿で、「Think Deeper」機能を全Copilotユーザーに追加料金なしで提供開始したと発表した。この機能は、OpenAIの推論モデル「o1」を活用しており、複雑な指示に対し、より質の高い応答ができる。 Today we’ve made Think Deeper free and available for all users of Copi

                              OpenAIの高度なAI「o1」、無料で「Copilot」から利用可能に
                            • 人間「OpenAI o1、正直微妙じゃね?」o1「IQが20違うと会話が成立しない」→o1のIQは120です

                              リンク www.maximumtruth.org Massive breakthrough in AI intelligence: OpenAI passes IQ 120 OpenAI's new "o1" model may have an IQ as high as 120 79 リンク WIRED.jp OpenAI、推論する新AIモデル「o1」を発表。規模以外での進化を示す 新AIモデル「OpenAI o1」の詳細を、OpenAIが『WIRED』に明かした。「Strawberry」というコードネームで呼ばれていたこのモデルは難問を段階的に解決する「推論」の部分で進化を遂げている。次のモデルである「GPT-5」にもこの要素は生かされるという。 6 users 91

                                人間「OpenAI o1、正直微妙じゃね?」o1「IQが20違うと会話が成立しない」→o1のIQは120です
                              • 「Claude 3.7 Sonnet」と「Claude Code」が登場、OpenAI o1やDeepSeek-R1を超える性能で「ポケモン」のジムリーダーを3人倒すことに成功

                                Anthropicが「Claude 3.7 Sonnet」を発表しました。Anthropicによれば、Claude 3.7 Sonnetは「市場初のハイブリッド推論モデル」で、ベンチマークではOpenAIのo1やo3-mini、DeepSeek-R1を超える性能を見せたとのことです。 Claude 3.7 Sonnet and Claude Code \ Anthropic https://www.anthropic.com/news/claude-3-7-sonnet Claude's extended thinking \ Anthropic https://www.anthropic.com/research/visible-extended-thinking Anthropicのいう「ハイブリッド推論モデル」とは、質問に対してすぐに答える「リアルタイムの回答」と、より推論を重ねた「

                                  「Claude 3.7 Sonnet」と「Claude Code」が登場、OpenAI o1やDeepSeek-R1を超える性能で「ポケモン」のジムリーダーを3人倒すことに成功
                                • GitHub CopilotでOpenAI o1を試してみた

                                  OpenAI o1-previewとGitHub Copilotの統合をテストしました。 本日、OpenAIは難しい問題を解決するための高度な推論機能を備えた新しいAIモデルシリーズ、OpenAI o1をリリースしました。皆さんと同じように、私たちも新しいo1モデルを使いこなすことを楽しみにしており、o1-previewとGitHub Copilotのインテグレーションをテストしました。大規模システムのデバッグ、レガシーコードのリファクタリング、テストスイートの作成など、この新しいモデルを使って多くのユースケースを模索していますが、最初のテストでは、コード解析と最適化において有望な結果が得られました。これは、o1-previewが返答する前に課題を考え抜く能力を備えているためで、GitHub Copilotで複雑なタスクを構造化されたステップに分解することを可能にします。 このブログでは、

                                    GitHub CopilotでOpenAI o1を試してみた
                                  • OpenAIとApollo Research、「o1」は自分の目的のために嘘をつくと報告

                                    米OpenAIとAI安全性の研究組織である米Apollo Researchは12月5日(現地時間)、OpenAIが同日公式版をリリースしたLLMの「o1」についての考察を発表した。いずれも、o1に関して幾つかの懸念事項を指摘している。 o1は、OpenAIが9月に発表したLLM。回答を生成する前に思考の連鎖を生み出すことで、複雑な推論タスクを実行できるというものだ。さまざまな戦略を試したり、間違いを認識したり、思考プロセスを洗練したりすることで、従来のモデルと比較して、より有用な回答を提供できるようになったとOpenAIは説明している。 だがApollo Researchは、o1が「scheming」(策略。開発者やユーザーの意図と異なる目的を密かに追求する能力)について評価したところ、o1が以下のような行動を示すことが明らかになったとしている。 開発者やユーザーではなく、o1自身の目標に

                                      OpenAIとApollo Research、「o1」は自分の目的のために嘘をつくと報告
                                    • OpenAI o1相当の推論モデル「DeepSeek R1」を中国AI企業が商用利用や改変が可能なMITライセンスでリリース

                                      中国のAI企業であるDeepSeekが、第1世代の推論モデルである「DeepSeek-R1-Zero」と「DeepSeek-R1」をMITライセンスの下でオープンソースとして公開しました。DeepSeekは特定のAIベンチマークで、OpenAI o1と同等の性能を発揮すると主張しています。 DeepSeek-R1/DeepSeek_R1.pdf at main · deepseek-ai/DeepSeek-R1 · GitHub https://github.com/deepseek-ai/DeepSeek-R1/blob/main/DeepSeek_R1.pdf deepseek-ai/DeepSeek-R1 · Hugging Face https://huggingface.co/deepseek-ai/DeepSeek-R1 ???? DeepSeek-R1 is here! ⚡

                                        OpenAI o1相当の推論モデル「DeepSeek R1」を中国AI企業が商用利用や改変が可能なMITライセンスでリリース
                                      • ついに出た!OpenAIの最新モデル「o1」って何がすごいの?

                                        ついに出た!OpenAIの最新モデル「o1」って何がすごいの?みんなで勉強しよう https://minorun365.connpass.com/event/331247/

                                          ついに出た!OpenAIの最新モデル「o1」って何がすごいの?
                                        • OpenAI、数学的思考力がすごいAIモデル「o1-preview」 深く考えることで難問を解く

                                          OpenAIが9月12日、「Strawberry」と呼ばれていた次世代AIモデル「o1-preview」をついに発表した。複雑な問題に対してより長い時間をかけて思考し、科学、コーディング、数学などの分野で従来のモデルを凌駕する能力を持つとされている。また、より効率的なコーディング用モデルとして「o1-mini」も同時に発表された。o1-previewの80%のコスト削減を実現しつつ、高度な推論能力を維持しているという。いずれもChatGPT PlusおよびTeamユーザーに対して即日利用可能となり、API開発者向けにも提供が開始された。 o1-previewの特筆すべき点は、人間のように問題を深く考察してから回答する能力だ。このアプローチにより、物理学、化学、生物学などの難解な課題において、博士課程の学生と同等の成績を収めたという。特に数学の分野では際立った成果を上げており、国際数学オリン

                                            OpenAI、数学的思考力がすごいAIモデル「o1-preview」 深く考えることで難問を解く
                                          • OpenAIが「OpenAI o1のAPIリリース」「音声会話APIの値下げ」「JavaとGoのライブラリ公開」など新情報を大量公開

                                            OpenAIが「OpenAI o1(正式リリース版)」のAPIを公開しました。合わせて、AIとの音声会話機能を提供する「Realtime API」のアップデートや、モデル微調整機能のアップデート、GoライブラリおよびJavaライブラリのリリースも発表されています。 OpenAI o1 and new tools for developers | OpenAI https://openai.com/index/o1-and-new-tools-for-developers/ Our reasoning model @OpenAI o1 is now in the API! It comes with function calling, developer messages, Structured Outputs, and vision. 🍓 We also shipped WebRTC s

                                              OpenAIが「OpenAI o1のAPIリリース」「音声会話APIの値下げ」「JavaとGoのライブラリ公開」など新情報を大量公開
                                            • Microsoft CopilotでOpenAIの“o1”が完全無料で使えます

                                              Microsoft CopilotでOpenAIの“o1”が完全無料で使えます2025.02.04 10:0013,731 R.Mitsubori Microsoft(マイクロソフト)の底力。 米MicrosoftのAI部門のムスタファ・スレイマンCEOは現地時間の1月30日、すべてのCopilotユーザー向けにThink Deeper機能を追加料金なしで提供開始したと発表しました。CopilotはMicrosoftが提供するAIアシスタントで、今回導入されたThink DeeperはOpenAIの最新推論モデル“o1”を活用しています。 o1はこれまでChatGPTの有料プランを対象に提供されていました。それが、このたびWindows CopilotのThink Deeper機能経由で完全無料化されたのです。 Think Deeper(o1)は「話す前に考える」ように訓練されている推論A

                                                Microsoft CopilotでOpenAIの“o1”が完全無料で使えます
                                              • OpenAI o1 の APIの使い方|npaka

                                                1. OpenAI o1「OpenAI o1」シリーズは、複雑な推論を行うために強化学習を用いて学習された新しい大規模言語モデルです。回答する前に考える特性があり、ユーザーに応答する前に長い内部思考の過程を生み出すことができます。これにより、科学的な推論に優れ、競技プログラミングの問題 (Codeforces) では89パーセンタイルにランクインし、米国数学オリンピック (AIME) の予選で全米の上位500人の学生に入る成績を収めています。また、物理学、生物学、化学の問題に関するベンチマーク (GPQA) では、人間の博士レベルの精度を上回る成績を達成しています。 APIでは、次の2つのモデルが提供されています。 ・o1-preview : o1モデルの早期プレビューモデル。世界に関する幅広い一般知識を使用して難しい問題を推論できるように設計されている。 ・o1-mini : より高速で

                                                  OpenAI o1 の APIの使い方|npaka
                                                • OpenAIの最新推論モデル「o3-mini」が「GitHub Copilot」などで利用可能に/「o1-mini」とほぼ同じレイテンシで品質が向上

                                                    OpenAIの最新推論モデル「o3-mini」が「GitHub Copilot」などで利用可能に/「o1-mini」とほぼ同じレイテンシで品質が向上
                                                  • 難しい科学問題もOK。答える前に考える時間を取ったLLM「OpenAI o1」

                                                      難しい科学問題もOK。答える前に考える時間を取ったLLM「OpenAI o1」
                                                    • 最新の ChatGPT モデル OpenAI o1 は数理最適化問題のモデリングが(ちょっと)できる - Insight Edge Tech Blog

                                                      Insight Edgeのデータサイエンティストのki_ieです。 数理最適化の専門家として、これまでさまざまな課題を数理最適化問題としてモデリングしてきました。 モデリングはアルゴリズム設計と比べて注目を集めることが少ないようですが、 実際には技術的な知見・調査を要求する骨の折れるタスクです。 このタスクを簡単にしたいとは日々思っていたところですが、最近 OpenAI o1 というモデルの論理的推論能力が高いらしいという聞きました。この賢いLLMがモデリングのお手伝いをしてくれたら嬉しいですね! 今日は数理最適化問題(混合整数計画問題)のモデリングをどれだけLLMに任せられるのか、簡単な実験結果をご紹介します。 数理最適化問題とは 数理最適化問題と混合整数計画問題の基礎知識がある方はこの節はスキップしましょう(面白いことは一つも書いてありません)! 数理最適化問題とその実行可能解・最適解

                                                        最新の ChatGPT モデル OpenAI o1 は数理最適化問題のモデリングが(ちょっと)できる - Insight Edge Tech Blog
                                                      • エディタやブラウザなどでも「GitHub Copilot」の各機能が利用可能に 「OpenAI o1」「Copilot Chat」も使える今、GitHubはどう便利になる?

                                                        GitHubは2024年9月26日(米国時間)、「GitHub Copilot」(以下、Copilot)の「Individual」プランと「Business」プランに、github.comの「GitHub Copilot Chat」を含むgithub.comのCopilot機能のプレビューアクセスを追加したと発表した。これにより、Copilotはリポジトリ、プルリクエスト、課題、アクションなどのコンテキストを活用できるようになった。 今回のアップデートからCopilotは統合開発環境(IDE)、Visual Studio Code、ブラウザ、モバイルなどに対応した。ブラウザでもモバイルでも、Copilotはコードを提案するAI(人工知能)ペアプログラマーとしてだけでなく、コードベース全体、コラボレーター間の会話、ワークフローをカバーするコーディングアシスタントとして使えるようになった。 2

                                                          エディタやブラウザなどでも「GitHub Copilot」の各機能が利用可能に 「OpenAI o1」「Copilot Chat」も使える今、GitHubはどう便利になる?
                                                        • OpenAI 推論モデルの正式版「o1 pro mode」がリリース! 早速、人類の未来について話し合ってみた|遠藤太一郎

                                                          ㈱カナメプロジェクト/東京学芸大学 教育AI研究プログラムの遠藤太一郎です。教育現場でのAI活用に関して、色々な試みをしています。最近、こんな記事も書きました。 今朝3時頃、OpenAIがo1 pro modeを出したので早速試してみました。ある意味電卓の超拡張版とも言える論理推論マシンに留まるものなのか、もう一歩踏み込んで、人類を次の地平に導くようなものなのか。 そこで今回は、o1 pro modeとの対話を通じて、人類が「次のステージ」に移行するためには何が必要なのか、そのヒントを得ようと試みました。 AIとの対話を重ねる中で導かれたキーワードが、「脱固定化」(だつこていか) という発想です。 従来、人類は固定された価値観や前提条件、社会制度、認知フレームに頼って生きてきました。それらが「不変」「絶対」と見なされることで、想像力や発想力にバイアスをかけていた面も否定できません。しかし、

                                                            OpenAI 推論モデルの正式版「o1 pro mode」がリリース! 早速、人類の未来について話し合ってみた|遠藤太一郎
                                                          • OpenAI「o1」は人間のような“想像力”を持ち、AGIへの重要な一歩となる (1/3)

                                                            米OpenAIは9月12日(現地時間)、新たなAIモデル「OpenAI o1(読みはオーワン)」を発表。ユーザーの入力に対してじっくり考えてから返答することで、より複雑なタスクを正確に解決できるようになったという。 噂の「Q*/Strawberry」がついに登場 今回発表されたモデルは、高性能な「o1-preview」および、より高速かつ80%安価、特定分野に特化した「o1-mini」の2種類。複雑なタスクで大きな進歩を遂げたとして、これまでの「GPT-○」からナンバリングをリセットし、新たにOpenAI o1シリーズとしてスタートを切った。 そもそもこのモデルは、2023年11月のOpenAI騒動の際に「Q*」という名前の先進的AIプロジェクトとして噂されていたもの。その後、このプロジェクトが「Strawberry」というコードネームで開発が継続されていると報じられ、9月に入ってから近々

                                                              OpenAI「o1」は人間のような“想像力”を持ち、AGIへの重要な一歩となる (1/3)
                                                            • 【最新OpenAI o1 preview対応】要件定義システム生成AI Babel、要件文書生成能力が飛躍的に向上

                                                              【最新OpenAI o1 preview対応】要件定義システム生成AI Babel、要件文書生成能力が飛躍的に向上人間の博士レベルを超えるOpenAI o1、初期バージョンのo1 previewを実装し日本語要件定義書の生成・修正で最高レベルのClaude 3.5を超える性能を実現 ■ 概要 株式会社KandaQuantum(代表取締役社長:元木大介、以下「KandaQuantum」)は、この度、要件定義システム生成AI Babelの「要求概要生成」部において最新のOpenAI o1モデルに対応したことをお知らせいたします。これにより、日本語における要件定義書の生成・修正の分野で、これまでトップであったClaude 3.5を凌駕する性能を実現しました。 BabelのURLはこちら ➡︎ https://www.babel-ai.com/development/editor * 生成システム

                                                                【最新OpenAI o1 preview対応】要件定義システム生成AI Babel、要件文書生成能力が飛躍的に向上
                                                              • OpenAIが新モデル「o1-preview」の思考内容を出力させようとしたユーザーに警告

                                                                複雑な推論を行えるOpenAIのモデル「o1-preview」では「思考の連鎖(chain of thought)」プロセスを挟むことで推論の精度を高めています。思考の連鎖プロセスの中身は非公開ですが、ユーザーの中には何とかして中身を出力させようとする人もいます。OpenAIがそうしたユーザーに対し警告を行っていることが明らかになりました。 Ban warnings fly as users dare to probe the “thoughts” of OpenAI’s latest model | Ars Technica https://arstechnica.com/information-technology/2024/09/openai-threatens-bans-for-probing-new-ai-models-reasoning-process/ OpenAIは2024

                                                                  OpenAIが新モデル「o1-preview」の思考内容を出力させようとしたユーザーに警告
                                                                • OpenAI o1に関するメモ

                                                                  はじめに OpenAI o1、そこまで注目していなかったのですが、じわじわと「すごいのでは?」という気になってきたので、雑に関係する情報や気になる記事をまとめてみました。 o1の仕組みは、アプローチ的には人間は簡単な問題には反射的に答える(答えられる)けど、難しい問題はじっくり考えるから、AIにも同じようにじっくり考えさせてみよう(推論時間のスケーリングとかよばれたりします)という発想だと思います(おそらく、違ったらすみません)。 LLMは、基本的に解くべき問題の難易度で出力のスピードは変わらない(一定の量の計算をすると確率が出力される)ので、自分は今まで「じっくり考えられない点がAIと人間の違いだなー」と思ってましたが、あっさりとLLMもじっくり考えられれるようになってしまいましたね。 o1は評価が割れていますが、頭がよすぎても、それを使う人が理解できない、能力を使いこなせない、そもそも

                                                                    OpenAI o1に関するメモ
                                                                  • OpenAI o1:AIの新時代を切り拓く驚異の推論能力|ChatGPT研究所

                                                                    2024年9月13日、OpenAIは新しい言語モデルシリーズ「o1」を公開しました。 o1は国際数学オリンピックの予選問題(AIME 2024)において、GPT-4oの正答率9.3%を大きく上回る74.4%の正答率を達成するなど、科学、コーディング、数学などの分野で、これまでのモデルでは難しかった複雑な問題に対して高い解決能力を持っています。 本記事では、o1の特徴や使い方を実際に試した事例や公式が紹介している活用例を交えながら詳しく解説します。 https://openai.com/o1/ o1とはo1は、OpenAIが開発した最新の言語モデルシリーズであり、「o1-preview」と「o1-mini」の2つのモデルがラインナップされています。 ◉ o1-preview特徴: 高度な問題解決能力: 科学、コーディング、数学などの複雑な問題に対応可能。 広範な知識ベース: 多岐にわたる分野

                                                                      OpenAI o1:AIの新時代を切り拓く驚異の推論能力|ChatGPT研究所
                                                                    • OpenAIのo1-previewモデル、Kaggleのグランドマスター基準を上回るデータ分析性能を発揮 | AIDB

                                                                      本記事では、OpenAIが開発した「機械学習タスクにおけるAIエージェントの能力を評価する新しいベンチマーク」MLE-benchを紹介します。実世界で必要とされる複雑で多岐にわたるスキルセットを総合的に評価することを目的としたデータセットです。 研究者らはこのベンチマークをどのように作成したのか、および現在の最先端モデルはどれほどの性能なのかをテストしました。 参照論文情報 タイトル:MLE-bench: Evaluating Machine Learning Agents on Machine Learning Engineering 著者:Jun Shern Chan, Neil Chowdhury, Oliver Jaffe, James Aung, Dane Sherburn, Evan Mays, Giulio Starace, Kevin Liu, Leon Maksin, T

                                                                        OpenAIのo1-previewモデル、Kaggleのグランドマスター基準を上回るデータ分析性能を発揮 | AIDB
                                                                      • 最新AIモデル「OpenAI o1」がプレビューを卒業、新プラン「ChatGPT Pro」も/価格はPlusの10倍、じっくり考えてよりよい回答を行う「o1 pro」モードが目玉

                                                                          最新AIモデル「OpenAI o1」がプレビューを卒業、新プラン「ChatGPT Pro」も/価格はPlusの10倍、じっくり考えてよりよい回答を行う「o1 pro」モードが目玉
                                                                        • First Look: Exploring OpenAI o1 in GitHub Copilot

                                                                          AI & MLLearn about artificial intelligence and machine learning across the GitHub ecosystem and the wider industry. Generative AILearn how to build with generative AI. GitHub CopilotChange how you work with GitHub Copilot. LLMsEverything developers need to know about LLMs. Machine learningMachine learning tips, tricks, and best practices. How AI code generation worksExplore the capabilities and be

                                                                            First Look: Exploring OpenAI o1 in GitHub Copilot
                                                                          • Googleが思考プロセスを導入して推論を強化したAIモデル「Gemini 2.0 Flash Thinking」を公開、各種テストでOpenAIのo1-previewやGPT-4oを超える性能

                                                                            Googleが、Gemini 2.0 Flashに「思考プロセス」を生成するようトレーニングを施したモデルとして「Gemini 2.0 Flash Thinking」を公開しました。元のGemini 2.0 Flashモデルよりも強力な推論が行えるようになっています。 Gemini 2.0 Flash の思考モード  |  Gemini API  |  Google AI for Developers https://ai.google.dev/gemini-api/docs/thinking-mode?hl=ja Introducing Gemini 2.0 Flash Thinking, an experimental model that explicitly shows its thoughts. Built on 2.0 Flash’s speed and performance

                                                                              Googleが思考プロセスを導入して推論を強化したAIモデル「Gemini 2.0 Flash Thinking」を公開、各種テストでOpenAIのo1-previewやGPT-4oを超える性能
                                                                            • DeepSeekの推論モデル「DeepSeek-R1」をOpenAIのo1&o3と比較することで明らかになったこととは?

                                                                              ほとんどのAIベンチマークはAIの出力精度(スキル)を測定するものですが、スキルはAIの知能を表すものではありません。スキルではなくAIの知能を測定するため、AIがスキルを効率的に習得する能力を測定するベンチマークが「ARC-AGI」です。そんなARC-AGIの開発者であるフランソワ・ショレ氏が立ち上げた「ARC Prize」が、話題の中国AI企業DeepSeekの最新推論モデルである「DeepSeek-R1」ファミリーについて分析しています。 R1-Zero and R1 Results and Analysis https://arcprize.org/blog/r1-zero-r1-results-analysis ARC Prizeの目標は汎用人工知能(AGI)に向けた新しいアイデアを定義・評価することです。そのため、ARC Prizeは可能な限り最強のグローバルイノベーション環境

                                                                                DeepSeekの推論モデル「DeepSeek-R1」をOpenAIのo1&o3と比較することで明らかになったこととは?
                                                                              • Bringing developer choice to Copilot with Anthropic’s Claude 3.5 Sonnet, Google’s Gemini 1.5 Pro, and OpenAI’s o1-preview

                                                                                AI & MLLearn about artificial intelligence and machine learning across the GitHub ecosystem and the wider industry. Generative AILearn how to build with generative AI. GitHub CopilotChange how you work with GitHub Copilot. LLMsEverything developers need to know about LLMs. Machine learningMachine learning tips, tricks, and best practices. How AI code generation worksExplore the capabilities and be

                                                                                  Bringing developer choice to Copilot with Anthropic’s Claude 3.5 Sonnet, Google’s Gemini 1.5 Pro, and OpenAI’s o1-preview
                                                                                • GitHub - danny-avila/LibreChat: Enhanced ChatGPT Clone: Features Agents, Anthropic, AWS, OpenAI, Assistants API, Azure, Groq, o1, GPT-4o, Mistral, OpenRouter, Vertex AI, Gemini, Artifacts, AI model switching, message search, Code Interpreter, langchain, D

                                                                                  🖥️ UI & Experience inspired by ChatGPT with enhanced design and features 🤖 AI Model Selection: Anthropic (Claude), AWS Bedrock, OpenAI, Azure OpenAI, Google, Vertex AI, OpenAI Assistants API (incl. Azure) Custom Endpoints: Use any OpenAI-compatible API with LibreChat, no proxy required Compatible with Local & Remote AI Providers: Ollama, groq, Cohere, Mistral AI, Apple MLX, koboldcpp, together.a

                                                                                    GitHub - danny-avila/LibreChat: Enhanced ChatGPT Clone: Features Agents, Anthropic, AWS, OpenAI, Assistants API, Azure, Groq, o1, GPT-4o, Mistral, OpenRouter, Vertex AI, Gemini, Artifacts, AI model switching, message search, Code Interpreter, langchain, D