gyu-tangのブックマーク - はてなブックマーク

OpenAI o3 と o4-mini の概要｜npaka

以下の記事が面白かったので、簡単にまとめました。・Introducing OpenAI o3 and o4-mini 1. はじめに本日、「OpenAI o3」と「o4-mini」をリリースしました。このモデルは、応答する前により長く考えるように学習された最新のモデルです。これらは、ChatGPT内のすべてのツールを使用することができます。これには、Web検索、アップロードしたファイルの分析、視覚入力のReasoning、さらには画像生成が含まれます。重要なのは、より複雑な問題を解決するために、適切な出力形式で、通常は1分以内に、詳細で思慮深い回答を生み出すために、ツールをいつどのように使用するかについてReasoningするように学習されています。 2. OpenAI o3 と o4-mini「OpenAI o3」は、コーディング、数学、科学、視覚などのフロンティアを推し進める最も強力

gyu-tang 2025/04/17

リンク

GPT-4.1 の概要｜npaka

以下の記事が面白かったので、簡単にまとめました。・Introducing GPT-4.1 in the API 1. GPT-4.1本日、API に 3 つの新しいモデル、「GPT-4.1」「GPT-4.1 mini」「GPT-4.1 nano」をリリースします。これらのモデルは、コーディングと指示追従において大幅な改善が見られ、「GPT-4o」「GPT-4o mini」を全般的に上回る性能を発揮します。また、コンテキストウィンドウが拡大し、最大100万トークンのコンテキストをサポートすることで、ロングコンテキスト理解が向上し、そのコンテキストをより有効に活用できます。これらのモデルは、2024年6月を期限として更新されています。「GPT-4.1」は、以下の業界標準指標において優れています。・コーディング「GPT-4.1」は「SWE-bench Verified」で54.6%のスコ

gyu-tang 2025/04/15

リンク

Agent2Agent の概要｜npaka

以下の記事が面白かったので、簡単にまとめました。・Announcing the Agent2Agent Protocol (A2A) 1. Agent2Agent (A2A)本日、Atlassian、Box、Cohere、Intuit、Langchain、Mongo DB、PayPal、Salesforce、SAP、ServiceNow、UKG、Workdayといった50社以上のテクノロジーパートナー、そしてAccenture、BCG、Capgemini、Cognizant、Deloitte、HCLTech、Infosys、KPMG、McKinsey、PwC、TCS、Wiproといった大手サービスプロバイダーの協力を得て、「Agent2Agent」(A2A) という新しいオープンプロトコルをリリースします。「A2A」は、エージェントに役立つツールとコンテキストを提供する「MCP」(An

gyu-tang 2025/04/11

リンク

Llama 4 の概要｜npaka

以下の記事が面白かったので、簡単にまとめました。・The Llama 4 herd: The beginning of a new era of natively multimodal AI innovation 1. Llama 4本日、「Llama 4 Scout」と「Llama 4 Maverick」がリリースしました。これらは、前例のないコンテキスト長のサポートを備えた初のオープンウェイトネイティブマルチモーダルモデルであり、MoEアーキテクチャを使用して構築されています。また、新しいモデルの教師として機能する最も強力な「Llama 4 Behemoth」のプレビューも行います。・Llama 4 Maverick ・17Bのアクティブパラメータ・128のエキスパート・合計400Bのパラメータ・100万トークンのコンテキスト長・Llama 4 Scout ・17Bのアク

gyu-tang 2025/04/07

リンク

GPT-4.5 の概要｜npaka

以下の記事が面白かったので、簡単にまとめました。・Introducing GPT-4.5 1. GPT-4.5「GPT‑4.5」は、最大かつ最高のチャットモデルです。事前学習と事後学習をスケールアップしています。教師なし学習をスケールアップすることで、「GPT‑4.5」はパターンを認識し、つながりを描き、Reasoningなしで創造的な洞察を生み出す能力を向上させます。初期のテストでは、「GPT-4.5」とのやり取りがより自然に感じられることが示されています。より幅広い知識ベース、ユーザーの意図を追う能力の向上、そして「EQ」の向上により、文章の改善、プログラミング、実用的な問題の解決などのタスクに役立ちます。ハルシネーションも少なくなると期待されます。「GPT-4.5」は、その長所と限界をより深く理解するための研究プレビューとして公開されています。OpenAIではまだその可能性を探

gyu-tang 2025/03/13

リンク

uv の使い方｜npaka

「uv」の使い方をまとめました。 1. uv「uv」は、高速なPythonパッケージ管理ツールです。従来のpipに代わるツールとして、高速性と効率性を重視して設計されています。特徴は、次のとおりです。・pip、poetry、pyenvなどを置き換える。・pipよりも10～100倍高速。・任意のバージョンのPythonのインストール・管理。・Pythonアプリケーションの実行・インストール。・インライン依存関係メタデータをサポートしたスクリプト実行。・ユニバーサルロックファイルで包括的なプロジェクト管理。・pip互換インターフェース。・Cargo-styleのワークスペース。・依存関係の重複排除のためのグローバルキャッシュ。・Rust・Pythonなしにcurlまたはpipを介してインストール可能。・macOS、Linux、Windowsをサポート。 2. インスト

gyu-tang 2025/01/14

リンク

最先端の量子チップ Willow の概要｜npaka

以下の記事が面白かったので、簡単にまとめました。・Meet Willow, our state-of-the-art quantum chip 1. Willow「Willow」は、最新の量子チップです。さまざまな基準で最先端のパフォーマンスを発揮し、2つの大きな成果を実現します。 (1) より多くの量子ビットを使用してスケールアップするにつれて、エラーを指数関数的に削減できます。これにより、この分野でほぼ30年間追求されてきた量子エラー訂正の重要な課題が解決されます。 (2) 今日の最速スーパーコンピュータで10 septillion (10の25乗) 年かかる標準的なベンチマーク計算を5分未満で実行しました。これは、宇宙の年齢を大幅に上回る数字です。「Willow」は、10 年以上前に始まった旅の大きな一歩です。2012年に「Google Quantum AI」を設立したとき、抱

gyu-tang 2024/12/11

リンク

LearnLM の概要｜npaka

以下の記事が面白かったので、簡単にまとめました。・How generative AI expands curiosity and understanding with LearnLM 1. LearnLM「LearnLM」は、Gemini をベースに人間の学習用にファインチューニングされたモデルです。技術レポートでは、教育向けの生成AIを改善するためのアプローチを紹介しています。教育者やその他の学習専門家と協力し、次のような学習科学の原則をモデルとそれが支える製品に取り入れています。・能動的な学習を促すタイムリーなフィードバックで練習と健全な努力を促す。・認知負荷を管理関連性のある、構造化された情報を複数の方法で提示。・学習者に適応関連する教材を基に、目標やニーズに合わせて動的に調整。・好奇心を刺激学習の過程を通じて意欲を高めるために、関心を喚起。・メタ認知を深める

gyu-tang 2024/11/21

リンク

Llama 3.2 の概要｜npaka

以下の記事が面白かったので、簡単にまとめました。・Llama 3.2: Revolutionizing edge AI and vision with open, customizable models 1. Llama 3.2「Llama 3.2 11B・90B」は、チャートやグラフを含むドキュメントレベルの理解、画像キャプション、自然言語の説明に基づいて画像内のオブジェクトの方向を正確に特定するなど、画像推論のユースケースをサポートします。「Llama 3.2 1B・3B」は、多言語テキスト生成とツール呼び出し機能に非常に優れています。これらのモデルにより、開発者は、データがデバイスから外に出ることのない強力なプライバシーを備えた、パーソナライズされたオンデバイスエージェントアプリケーションを構築できます。 2. モデル評価「Llama 3.2 11B・90B」の視覚モデルは、画像

gyu-tang 2024/09/26

リンク

Apple Intelligence の機能｜npaka

「Apple Intelligence」の機能をまとめました。・Apple Intelligence - Apple Developer 1. Apple Intelligence「Apple Intelligence」は、iPhone、iPad、Macに強力な生成モデルを組み込み、ユーザーのコミュニケーション、作業、自己表現をサポートするパーソナルインテリジェンスシステムです。これら「Apple Intelligence」の機能をアプリに組み込むことができます。 2. Writing Tools「Writing Tools」はシステム全体で利用でき、ユーザーがテキストを書き直したり、校正したり、要約したりするのに役立ちます。「TextField」をレンダリングするために標準のUIフレームワークのいずれかを使用している場合、アプリは自動的に「Writing Tools」を使用できるように

gyu-tang 2024/06/13

リンク

GPT-4o の概要｜npaka

以下の記事が面白かったので、簡単にまとめました。・Hello GPT-4o 1. GPT-4o「GPT-4o」 (「omni」の「o」) は、人間とコンピュータのより自然な対話に向けた一歩です。テキスト、音声、画像のあらゆる組み合わせを入力として受け入れ、テキスト、音声、画像の出力のあらゆる組み合わせを生成します。音声入力にはわずか232ミリ秒 (平均320ミリ秒) で応答できます。これは、人間の会話における応答時間とほぼ同じです。英語のテキストおよびコードでは「GPT-4 Turbo」のパフォーマンスに匹敵し、英語以外の言語のテキストでは大幅に改善されており、APIでははるかに高速で50%安価です。「GPT-4o」は、既存のモデルと比較して、特に視覚と音声の理解に優れています。 2. モデルの機能「GPT-4o」以前は、音声モードを使用して、平均2.8秒 (GPT-3.5) および5

gyu-tang 2024/05/14

リンク

Googleのオープンモデル Gemma の概要｜npaka

以下の記事が面白かったので、簡単にまとめました。・Gemma: Introducing new state-of-the-art open models 1. Gemma「Gemma」は、「Gemini」と同じ技術を基に構築された、軽量で最先端のオープンモデルです。「Google DeepMind」と「Google」の他のチームによって開発された「Gemma」は、「Gemini」からインスピレーションを受けており、その名前はラテン語で「宝石」を意味するgemmaを反映しています。モデルの重み付けに伴い、開発者のイノベーションをサポートし、コラボレーションを促進し、「Gemma」の責任ある使用をガイドするためのツールもリリースします。「Gemma」は本日より世界中で利用可能になります。知っておくべき重要な詳細は次のとおりです。・「Gemma 2B」「Gemma 7B」の2つのサイズの

gyu-tang 2024/02/22

リンク

Microsoft Copilot Studio によるカスタムCopilot の作成｜npaka

2. カスタムCopilotの作成手順「カスタムCopilot」の作成手順は、次のとおりです。 (1) 「Microsoft Copilot Studio」のサイトを開き、「try free」からログイン。 (2) 「コパイロットを作成する」の「新しいコパイロット」をクリック。 (3) 以下のように設定して、作成ボタンを押す。「日本語」は生成AI機能に未対応だったので「英語」、会話を強化するためのURLは「OpenAIのURL」にしました。・コパイロットの名前 : MyCopilot ・コパイロットの話す言語 : 英語・生成型の回答で会話を強化する : https://openai.com/ (4) 「Copilotのテスト」でメッセージを入力して動作確認。「GPT-4Vについて教えてください。」の質問に、ソース付きで回答してくれました。 (5) 公開タブの公開ボタンでCopilo

gyu-tang 2023/11/18

リンク

Windows Copilot の使い方｜npaka

「Windows Copilot」の使い方をかるくまとめました。・Welcome to Copilot in Windows 1. Windows Copilot「Windows Copilot」は「Windows 11」に搭載された人工知能ツールであり、「Bing Chat」と連携して、Windowsにまつわる各種作業をサポートします。「Windows Update」で最新版 (22H2以降) にアップデートすることで、利用できるようになります。 2. Windows Copilot の使い方「Windows Copilot」の使い方は、次のとおりです。 (1) 「タスクバーのCopilotアイコンをクリック」または「Win+C」で起動。サインイン中のMicrosoftアカウントを使用するため、Windowsにローカルアカウントでサインインしている場合は利用できません。 (2) 会話

gyu-tang 2023/09/28

リンク

Google Colab で LINE の japanese-large-lm を試す｜npaka

「Google Colab」でLINEの「japanese-large-lm」を試したので、まとめました。 1. japanese-large-lm「japanese-large-lm」は、「LINE」が開発した36億パラメータの日本語LLMです。 2. japanese-large-lmのモデル「japanese-large-lm」では、次の3種類のモデルが提供されています。・line-corporation/japanese-large-lm-3.6b : ベースモデル・line-corporation/japanese-large-lm-3.6b-instruction-sft : 指示モデル・line-corporation/japanese-large-lm-1.7b : ベースモデル 3. Colabでの実行Colabでの実行手順は、次のとおりです。 (1) Colabの

gyu-tang 2023/08/16

リンク

LlamaIndex 0.7.0 の新機能｜npaka

1. LlamaIndex 0.7.0「LlamaIndex 0.7.0」では、下位レベルでモジュール性 / カスタマイズ性を改善し、データに対するLLMアプリケーションのボトムアップ開発を可能にするというテーマを継続しています。LLM、レスポンスシンセサイザー、ドキュメントとノードオブジェクトなど、主要な抽象化の使用をさらに制御できるようになりました。・LLM抽象化のスタンドアロン化元はLangChainのクラスを利用していました。・応答合成モジュールのカスタマイズ応答合成モジュールとプロンプトの定型文を分離して、カスタマイズしやすくました。・メタデータ管理機能ドキュメント / ノードオブジェクトにメタデータ管理機能が追加されました。 2. LLM抽象化のスタンドアロン化2-1. LLM抽象化のスタンドアロン化LLM抽象化のスタンドアロン化しました。OpenAI、Huggin

gyu-tang 2023/07/07

リンク

Google Colab で RWKV を試す - ChatRWKV版｜npaka

「Google Colab」で「RWKV」を試したので、まとめました。 1. RWKV「RWKV」は、Transf ormerレベルのLLM性能を備えたRNNです。高性能、高速推論、VRAMの節約、高速学習、長い文脈長、自由な埋め込みを実現しています。 2. Colabでの実行Colabでの実行手順は、次のとおりです。 (1) メニュー「編集→ノートブックの設定」で、「ハードウェアアクセラレータ」で「GPU」の「プレミアム」を選択。 (2) Googleドライブのマウント。 # Googleドライブのマウント from google.colab import drive drive.mount('/content/drive')(3) 作業フォルダへの移動。 # 作業フォルダへの移動 import os os.makedirs("/content/drive/My Drive/work",

gyu-tang 2023/04/03

リンク

ChatGPTプラグインの作成方法｜npaka

1. ChatGPTプラグインの作成手順「ChatGPTプラグイン」の作成手順は、次のとおりです。 (1) APIの実装 (2) マニフェストファイルの作成 (3) OpenAPIドキュメントの作成 2. マニフェストファイルの作成2-1. マニフェストファイルの基本構成「マニフェストファイル」は、「ChatGPTプラグイン」のメタデータを記述するファイルです。APIのドメインの「/.well-known/ai-plugin.json」でホストします。「マニフェストファイル」の基本構成は、次のとおりです。 { "schema_version": "v1", "name_for_human": "TODO Plugin", "name_for_model": "todo", "description_for_human": "Plugin for managing a TODO list.

gyu-tang 2023/03/25

リンク

Unity ML-Agents と toio によるサッカーロボットの強化学習｜npaka

「AI・人工知能EXPO 2021 【春】」の「ギリア」ブースにて、「Unity ML-Agents」と「toio」によるサッカーロボットの強化学習を展示しました。動画を撮ってくれた人がいました。ありがとうございます。ソニー、強化学習により自律的に動く8台のサッカーロボットを展示。Unity-MLで学習した後、iphone単体で推論を行うらしい。8台の自律ロボット、すごい。個人的にAI Expoの中で最も面白い展示だった。#AI #Expo #Sony #強化学習 pic.twitter.com/OJRBSnI8Ta — S Choe (@wireless_power) April 9, 2021 「toio」はiPhoneでBluetooth経由で制御されており、1台のiPhoneで8台分の「toio」の推論を行っています。今回は、「Unity ML-Agents」と「toio

gyu-tang 2021/05/18

リンク

Stable Baselines と Raspberry Pi によるホッケーロボットの強化学習｜npaka

「AI・人工知能EXPO 2020 【秋】」の「ギリア」ブースにて、「Stable Baselines」と「Raspberry Pi」によるホッケーロボットの強化学習を展示しました。 Webカメラの映像を入力として使って、「Raspberry Pi」上で「Stable Baselines」による推論を行い、ロボットアームの操作して、ホッケーロボットの対戦を実現させています。今回は、「Stable Baselines」と「Raspberry Pi」によるホッケーロボットの強化学習の作成の流れを紹介します。【ステップ1】ロボットアームとホッケー台の選定はじめに、ロボットアームをいろいろ試してみて、KHRシリーズで有名な近藤科学の「KXR-A5」を選びましました。ホッケーするのに十分なサーボ速度、長時間動く耐久性、1台38,000円という値段の安さが決め手になりました。

gyu-tang 2021/05/18

リンク

はてなブックマーク

タグ

ブックマーク / note.com/npaka (21)

お知らせ

今週のはてなブックマーク数ランキング（2025年4月第3週）

今週のはてなブックマーク数ランキング（2025年4月第2週）

今週のはてなブックマーク数ランキング（2025年4月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス