[B! openai][language-model] nabinnoのブックマーク

nabinno id:nabinno

openaiとlanguage-modelに関するnabinnoのブックマーク (49)

DeepSeek, China, OpenAI, NVIDIA, xAI, TSMC, Stargate, and AI Megaclusters | Lex Fridman Podcast #459
nabinno 2025/02/03
movie

lex-fridman

deepseek

language-model

openai

nvidia

tsmc

stargate-project

ai-cold-war
リンク
OpenAI o3-mini
nabinno 2025/02/01
openai

o3-mini

o3

language-model
リンク
Chinese tech start-up DeepSeek unnerves US with low-costs AI model on par with OpenAI's o1 - Global Times
nabinno 2025/01/30
global-times

liu-caiyu

deepseek

openai

language-model

open-source-software

usa-china-disputes
リンク
II. From AGI to Superintelligence: the Intelligence Explosion - SITUATIONAL AWARENESS
AI progress won’t stop at human-level. Hundreds of millions of AGIs could automate AI research, compressing a decade of algorithmic progress (5+ OOMs) into ≤1 year. We would rapidly go from human-level to vastly superhuman AI systems. The power—and the peril—of superintelligence would be dramatic. Let an ultraintelligent machine be defined as a machine that can far surpass all the intellectual act
nabinno 2025/01/29
situational-awareness

leopold-aschenbrenner

openai

language-model
リンク
LLMアプリケーションの Fine-tunningと蒸留を活用した改善
PharmaXは、健康を一生涯サポートするかかりつけオンライン薬局『YOJO』を運営しています。 YOJOでは、LLMのマルチエージェント・アプリケーションを構築し、メッセージの薬剤師への提案や一部自動送信を行っています。LLMを用いることで、柔軟でパーソナライズされた対応が迅速に可能になり、ユーザー…
nabinno 2025/01/12
speaker-deck

pharmax

openai

fine-tuning

language-model
リンク
OpenAIのフルパワー「o1 pro mode」に、書き仕事はどこまで任せられるか　若手記者の所感
OpenAIのフルパワー「o1 pro mode」に、書き仕事はどこまで任せられるか　若手記者の所感（1/2 ページ） AI、俺の代わりに文章書いてくれ──この記事を書いている若手編集記者は最近、そんなことばかり考えている。今のAIには、記事としてそこまでクオリティーの高い文章を出す能力はないので、結局は自分でキーボードをカチカチしているが、キーをたたく時間をもっと減らせたら、取材に行く時間がもっと確保できて仕事が楽しくなるのに、と妄想する今日このごろだ。 GPT-4やClaude 3など、これまでもいろいろ試したが、正直「仕事をほぼ丸投げできるぞ！」のラインには至らず「文字起こしや構成の検討など一部を手伝ってもらう」がせいぜいだった（それはそれで大事だが）。そんな折、米OpenAIがChatGPTの新プラン「ChatGPT Pro」を発表。目玉は同社最高性能のAIモデル「OpenAI o
nabinno 2024/12/14
itmedia

hiroki-yoshikawa

openai

chatgpt

chatgpt-pro

o1-pro-mode

o1

language-model

prompt-engineering
リンク
月額3万円のチャットAI「o1 Pro mode」に引っ掛け問題を出しまくってみた
米OpenAIが12月5日（現地時間）に発表した、ChatGPTの新プラン「ChatGPT Pro」。目玉は、最高性能のAIモデル「OpenAI o1」でより高度な思考を行って難問に対して優れた回答を提供するという「o1 Pro mode」だ。一方、月額200ドル（1ドル150円換算で約3万円）という価格体系も話題に。果たしてその値段に見合う価値はあるのか──試しに、過去のGPTシリーズや他の大規模言語モデルが引っ掛かりがちだった問題を出して、確かめてみた。解けるか、“おっぱお問題” GPT-4でもたまに間違えていた「いっぱいの“い”を“お”に変えて」という問題。o1 Pro modeは引っ掛からず回答できた。「9.11」と「9.9」、大きいのは？「9.11」と「9.9」どちらが大きいか、というのも、過去のモデルがよく間違えた問題だ。Pro modeでない「o1」も、以下のように正し
nabinno 2024/12/14
itmedia

hiroki-yoshikawa

openai

chatgpt

chatgpt-pro

o1-pro-mode

o1

language-model

prompt-engineering
リンク
OpenAIのCEOが「o2が博士号レベルのベンチマークで105％のスコアを達成」とSNSに投稿、次期AIモデルはGPT-4oでも53.6％しか記録できなかった高難度テストで約2倍のスコアを達成か
OpenAIのサム・アルトマンCEOが自身のXアカウントに「o2がGPQAで105％のスコアを達成したと聞いた」と2024年11月3日(日)に投稿しました。「o2」の正式名称は不明ですが、OpenAIが開発中の次世代AIモデルが驚異的な性能を備えている可能性が濃厚となっています。 i heard o2 gets 105% on GPQA— Sam Altman (@sama) November 2, 2024 GPQAはAIの性能を測定するベンチマークの1種で、生物学・物理学・化学の専門家が作成した448問の選択問題で構成されています。GPQAの問題はかなりの高難度で、「専門家でない人間」がGoogle検索を駆使して挑んだ場合は34％、「博士号保持者または博士号の取得を目指す学生」の場合も65％のスコアしか獲得できません。 GPQAはすでに各種高性能AIのベンチマークとして利用されており、
nabinno 2024/11/04
gigazine

openai

gpt-o1

gpt-o2

gpt

language-model
リンク
Apple、OpenAIへの投資を取りやめか　WSJ報道 - 日本経済新聞
【シリコンバレー=中藤玲】米紙ウォール・ストリート・ジャーナル（WSJ）は27日、米アップルが米新興オープンAIへの投資を取りやめたと報じた。理由は明らかになっていない。オープンAIは65億ドル（約9240億円）規模の資金調達交渉を来週中にも完了するとされている。オープンAIは1500億ドルの企業価値評価を前提とした増資を計画し、米ベンチャーキャピタル（VC）のほかアップルや米エヌビディアが投
nabinno 2024/09/28
nikkei

apple

openai

language-model

stock-market
リンク
Using reasoning for data validation | OpenAI Cookbook
In this guide, we’ll explore how to use the o1 model, specifically o1-preview, to perform data validation through reasoning. We’ll walk through a practical example involving a synthetic medical dataset and demonstrate how to assess the model’s accuracy in identifying issues within the data. Overview Data validation is a critical step in ensuring the quality and reliability of datasets, especially
nabinno 2024/09/14
openai

roy-ziv

gpt

gpt-o1

logical-reasoning

prompt-engineering

language-model
リンク
https://x.com/snakajima/status/1834345484665946469?t=8tV66q-T6q1_j4_LrlSeOA
- 1 user
- x.com
- 学び
nabinno 2024/09/13
x

satoshi-nakajima

openai

gpt

gpt-o1

language-model
リンク
https://openai.com/index/introducing-openai-o1-preview/
nabinno 2024/09/13
openai

language-model

chain-of-thought
リンク
https://openai.com/index/prover-verifier-games-improve-legibility/
nabinno 2024/07/18
openai

tining-chen

jan-hendrik-kirchner

gpt

language-model
リンク
PR-Agent を使って Pull Request をAIレビューしてみた。（日本語対応もしてみた） - LayerX エンジニアブログ
LayerXの suguru です。今日は、バクラクの開発に導入した PR-Agentの話をしようと思います。 PR-Agent は、Codium AI によってオープンソースで開発されている ChatGPT を使ったプルリクエストを便利にするためのAIツールです。現時点で、下記のような機能を持っています。 Pull Request の自動分析およびレビュー Pull Request のタイトルと説明文を自動入力コード改善の提案フリーテキストな質問への回答 CHANGELOG の自動生成必要なものは、 OpenAI のキーのみのため、CIに簡単に導入できます。 GitHub上へのインラインコメントなどにも対応しており、普段開発する際に面倒なプルリクエストに関する様々な作業を自動化することができます。裏側ではデフォルトで GPT-4 を使っており、ソースコードを解析し、高精度な結
nabinno 2024/07/14
layerx

pr-agent

openai

gpt

language-model

github
リンク
Introduction - SITUATIONAL AWARENESS: The Decade Ahead
Leopold Aschenbrenner, June 2024 You can see the future first in San Francisco. Over the past year, the talk of the town has shifted from $10 billion compute clusters to $100 billion clusters to trillion-dollar clusters. Every six months another zero is added to the boardroom plans. Behind the scenes, there’s a fierce scramble to secure every power contract still available for the rest of the deca
nabinno 2024/06/05
situational-awareness

leopold-aschenbrenner

openai

language-model
リンク
OpenAI、「GPT-4o」の新しいデータ分析機能を発表--有料ユーザー対象
Maria Diaz （ZDNET.com）翻訳校正：緒方亮吉武稔夫（ガリレオ） 2024-05-20 09:24 OpenAIは先ごろ、AIチャットボット「ChatGPT」のデータ分析機能の変更を発表した。ChatGPTを使ってインタラクティブでカスタマイズ可能な表とグラフを作成し、プレゼンテーションや書類としてダウンロードできるようになる。「Google Drive」や「Microsoft OneDrive」からChatGPTにファイルをアップロードすることも可能だ。ただし、新しいデータ分析機能はすべてのユーザーが利用できるようになるわけではない。アップグレードは今後数週間をかけて段階的に「ChatGPT Plus」「ChatGPT Enterprise」「ChatGPT Team」のユーザーに提供される。データ分析の新機能は、OpenAIが先日「Spring Update」
nabinno 2024/05/21
zdnet

openai

gpt-4o

gpt

language-model

analytics
リンク
Hello GPT-4o
GPT-4o (“o” for “omni”) is a step towards much more natural human-computer interaction—it accepts as input any combination of text, audio, image, and video and generates any combination of text, audio, and image outputs. It can respond to audio inputs in as little as 232 milliseconds, with an average of 320 milliseconds, which is similar to human response time(opens in a new window) in a conversat
nabinno 2024/05/14
openai

gpt-4o

language-model
リンク
Introducing the Model Spec
To deepen the public conversation about how AI models should behave, we’re sharing the Model Spec, our approach to shaping desired model behavior. We are sharing a first draft of the Model Spec, a new document that specifies how we want our models to behave in the OpenAI API and ChatGPT. We’re doing this because we think it’s important for people to be able to understand and discuss the practical
nabinno 2024/05/09
openai

language-model

deep-learning

ethics
リンク
Introducing OpenAI Japan
As we grow our operations internationally, we’re expanding into Asia with a new office in Tokyo, Japan. We are committed to collaborating with the Japanese government, local businesses, and research institutions to develop safe AI tools that serve Japan’s unique needs and to unlock new opportunities. We chose Tokyo as our first Asian office for its global leadership in techno logy, culture of servi
nabinno 2024/04/15
openai

gpt

language-model

japanese
リンク
OpenAI Platform
Explore resources, tutorials, API docs, and dynamic examples to get the most out of OpenAI's developer platform.
nabinno 2023/11/07
openai

openai-platform

assitants-api

web-api

language-model
リンク
1 2 3 次のページ

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx