タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。
はじめに 前にも別のモデルでやってる ただ o1-preview は、やり取りを重ねるよりも一発で終わらせるほうがいいらしいので、最終的なテスト全体を渡すようにした。 情報の提示方法が異なると当然結果も変わるので、 gpt-4o でも同様なことを試した。 材料 プロンプトは以下。 基本的に最初にやったときと同じ。ペアプロではないのでその部分の調整をしている - 私がテストコードを提示するのでそのテストケースをパスする最小限の実装をしてください - Vue.js のバージョン 3 と Typescript で実装を行ってください - コードのみを示してくださいコードの解説などは必要ありません - スタイリングは必要ありません - テストケースに失敗したらその内容をチャットで送信するので最小限のコードの修正をしてください - テストのコードには vitest を利用しています jest と互換
2025年1月31日、スタンフォード大学で大規模言語モデルを研究するニクラス・ミュニホフ氏らの研究チームが、少ないデータサンプルと簡単な方法でOpenAI o1-previewとほぼ同等のスケーリングとパフォーマンスを再現する手法を、未査読論文リポジトリのarXivに発表しました。AIアーキテクトでソフトウェアエンジニアのティム・ケロッグ氏が、この論文について解説しています。 [2501.19393] s1: Simple test-time scaling https://arxiv.org/abs/2501.19393 S1: The $6 R1 Competitor? - Tim Kellogg https://timkellogg.me/blog/2025/02/03/s1 ミュニホフ氏らが発表した論文は、テスト時の計算リソースを増やすことで言語モデルの推論性能を向上させる「Sim
Claude Code のデスクトップアプリに新しい Preview 機能がリリースされました。これを使用すると、コードから起動したアプリケーションの UI を直接確認しながら、同時にログやコードも確認して問題を解決できます。この記事では Preview 機能の使い方を紹介します。 Claude Code のデスクトップアプリに新しい Preview 機能がリリースされました。これを使用すると、コードから起動したアプリケーションの UI を直接確認しながら、同時にログやコードも確認して問題を解決できます。この記事では Preview 機能の使い方を紹介します。 Preview 機能を使用する まずは Claude Code のデスクトップアプリをインストールしましょう。Claude Code のドキュメント からお使いの OS に対応したインストーラーをダウンロードして、インストールを完了
Windows7 / 8からの無償アップグレードを終了 Windows10 / 11への無償アップグレードオファーは2016年7月29日に終了しています。Windows 7 / 8から無償アップグレードするためのインストールパスは削除されました。Windows10からWindows11へのアップグレードは引き続き無料です。 Microsoftは、以前にWindows7やWindows8.1からWindows10への無料アップグレードを実施していました。ずいぶん前にアップグレードキャンペーン終了のアナウンスがされましたが、その後もなんやかんやで普通に7~8.1のプロダクトキーを使用してWindows10やWindows11のライセンス認証ができていました。 しかし今回、Microsoftは、Windows7 / 8 / 8.1からWindows10 / 11へとアップグレードができなくなった
吉川@広島です。 Are you a React dev? Do you use Visual Studio Code? I just released the beta of React Preview for VS Code ?https://t.co/HnFpTpO9op pic.twitter.com/qU4sxTo30g — François Wouts (@fwouts) June 25, 2021 「お前らReactとVSCode使ってる? React Preview for VS Codeのベータ版を出したぜ」 こちらのツイートが目に入り、「え、これすごくない?」ということで試してみました。 本記事ではReactアプリケーションの初期構築手順は割愛します。 環境 react 17.0.2 typescript 4.3.2 styled-components 5.3.0 VS
基調講演では、GitHub Copilotの新機能としてAnthropicやGoogleの大規模言語モデルが選択可能になることが発表されました。 選択可能になるのはAnthropicのClaude 3.5 Sonnet、GoogleのGemini 1.5 Pro、OpenAIのGPT-4o、o1-preview、o1-miniです。 Claude 3.5 Sonnetは本発表と同時にGitHub Copilotで利用可能となり、GoogleのGemini 1.5 Proは数週間のうちに利用可能となる予定です。同社は今後さらに多くの機能や領域でマルチモデルの選択を可能にしていく予定です。 同社CEOのトーマス・ドムケ(Thomas Dohmke)氏は「すべてのシナリオに最適な単一のモデルはなく、開発者は自分にとって最適なモデルを選べることを期待しています。AIコード生成の次のフェーズは、マル
Docker Desktopを提供するDocker社は、Docker DesktopにWebAssemblyランタイムを統合したDocker DesktopのTechnical Preview 2をリリースしたと発表しました。 Technical Preview 2での最大の変更点は、runwasiを採用したことでWebAssemblyランタイムが選択できるようになったことです。 Technical Preview 1ではWasmEdgeのみに対応していた 2022年10月に発表されたTechnical Preview 1では、Docker DesktopにWebAssemblyランタイムを統合する手段として、WebAssemblyランタイムをまるでコンテナランタイムのように見せかけるための仕組みを持つ「containerd-wasm-shim」と呼ばれるソフトウェアを開発し、組み込んでい
WebAssemblyを進化させる「WASI Preview 2」が安定版に到達。OSや言語に依存しないコンポーネントモデルを実現 WebAssembly関連仕様の標準化を行っているW3C WebAssembly Community GroupのWASI Subgroupミーティングにおいて、2024年1月25日に行われた投票で「WASI Preview 2」(もしくはWASI 0.2.0)仕様が承認され、安定版に到達したことが明らかになりました。 WASI Preview 2では、WebAssemblyアプリケーションがOSなどのプラットフォームに依存せず、さまざまなプログラミング言語で開発したWebAssemblyコンポーネントを組み合わせて開発できるように、「コンポーネントモデル」とそのインターフェイスを記述するIDL(Interface Definition Language)であ
WebAssemblyの「WASI Preview 2」で、WebAssemblyコンポーネントの組み合わせによるアプリケーション開発を実現へ Webブラウザ上で高速に実行可能なバイナリフォーマットとして開発されたWebAssemblyは、その後Webブラウザ以外の環境でも実行可能にするため、ファイルシステムなどOSごとに異なるAPIを抽象化するための業界標準仕様「WebAssembly System Interface」(WASI)が策定されました。 WASIの登場により、WebAssemblyはWebブラウザでもWindowsやMacでも、Dockerコンテナでも共通のバイナリで実行可能なバイナリフォーマットへと進化したのです。 参考:WebAssemblyをWebブラウザ以外の実行環境へ。システムインターフェイスへのアクセスを可能にする「WASI」の策定開始。Mozillaが呼びかけ
AWS News Blog Introducing Amazon S3 Vectors: First cloud storage with native vector support at scale (preview) Today, we’re announcing the preview of Amazon S3 Vectors, a purpose-built durable vector storage solution that can reduce the total cost of uploading, storing, and querying vectors by up to 90 percent. Amazon S3 Vectors is the first cloud object store with native support to store large ve
はじめに DROBE の課題と GPT-4-Vision-Preview を試すモチベーション ケーススタディ 入力するデータ 推論周辺部分のコード プロンプト 実験結果 おわりに 参考文献 はじめに OpenAIが Dev Day で発表したGPT-4-Vision-Previewは、画像処理と自然言語処理を組み合わせた最先端の技術です。 このモデルは、画像を理解し、その内容に基づいてテキスト情報を生成する能力を持っています。例えば、写真やイラストから物体を識別し、それに関連する説明や情報をテキストとして提供できます。この技術は、画像とテキストの間のギャップを橋渡しするものであり、多様な応用が可能です。 DROBEは、多様なファッション商品を取り扱うECサイトを運営しています。我々の挑戦の一つは、膨大な数の商品画像と説明文から、正確で有用なタグを抽出し、整理して保存しておく事です。このプ
AI企業のAnthropicは2026年4月7日にAIモデル「Claude Mythos Preview」を発表しました。Claude Mythos Previewはサイバー攻撃性能が高すぎることから一般公開はされておらず、一部の組織を対象にサイバーセキュリティの強化を目的として限定公開されています。そんなClaude Mythos Previewについて、イギリスの政府機関であるAI Security Institute(AISI)がサイバー攻撃性能の検証結果を公開しました。 Our evaluation of Claude Mythos Preview’s cyber capabilities | AISI Work https://www.aisi.gov.uk/blog/our-evaluation-of-claude-mythos-previews-cyber-capabilit
Menu. Currently selected: GitHub Copilot CLI is now in public preview GitHub Copilot CLI is now in public preview We’re bringing the power of GitHub Copilot coding agent directly to your terminal. With GitHub Copilot CLI, you can work locally and synchronously with an AI agent that understands your code and GitHub context. What’s new: Terminal-native development: Work with Copilot coding agent dir
Today we’re releasing a new open source, official, local GitHub MCP Server. We’ve worked with Anthropic to rewrite their reference server in Go and improve its usability. The new server contains 100% of the old server’s functionality plus the ability to customize tool descriptions, support for code scanning and a new get_me function that improves the natural language user experience when asking th
マンガ投稿チームでWebアプリケーションエンジニアをしているid:stefafafanです。この記事では、最近私がチーム向けに整備したDeployment Preview環境の事例を紹介します。 Deployment Previewとはどのようなものか? チームとして求める要件 実現したDeployment Previewの全体像 1. DockerイメージをビルドしてArtifact RegistryにpushしてCloud Runで動かすまで GitHub Actionsでどのように実現したか 2. ロードバランサーと証明書の準備、またServerless NEGによる振り分け Certificate Managerでワイルドカード証明書を取得 Serverless NEGを用意してURL MaskでCloud Runのリビジョンタグと対応づける Identity-Aware Prox
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 2025/03/23追記 本記事の公開後に、GitHub公式ブログよりPreview版のオプトアウトについて記事が公開されました。 要約すると、「Free、Pro、Business、Enterpriseのすべてのプランにおいて、Preview版を使用しても入力データをモデルの学習に使用しない」 というものです。 本記事の内容が公式情報と大きく異なってしまったことをお詫びいたします。 はじめに GitHub Copilotは、VSCode上で使用できるコード生成AIです。 個人であれば月額10ドル、企業向けのBusinessプランでも月額
こんにちは、CX事業本部 Delivery部の若槻です。 以前に GitHub Next について紹介をしました。 その GitHub Next のプロジェクトの1つである GitHub Blocks では、GitHub Repository 上のドキュメントの表示や検索、編集のインターフェースを拡張できるドキュメントブロックが提供されます。 GitHub Blocks 今回は、今まで Waitlist ステータスだった GitHub Blocks が先日に Technical Preview となり、誰でも使えるプロトタイプが公開されていたので触ってみました。 プロトタイプにアクセスする GitHub Blocks トップページより、プロトタイプにアクセスできます。 初サインインの場合は Blocks (GitHub Next) へのアクセスを求められます。 プロトタイプにアクセスできま
WebAssembly/WASIに対応した「Ruby 3.2 Preview 1」公開。WebブラウザでRubyが動く世界がやってくる これまでリリースされてきたLinux版やWindows版、Mac版などのRubyバイナリに加えて、WebAssembly/WASI版のRubyが登場することになります。 これにより、LinuxやWindowsなどの上で実行していたRubyのアプリケーションが、これからはWebブラウザなどWebAssembly/WASIに対応したプラットフォーム上でも実行できるようになることが期待されます。 CRubyをコンパイルしてWebAssembly/WASI対応に Ruby言語のリファレンス実装となっているインタプリタのソースコードはC言語で実装されているため、一般にこのソースコードまたはその実装を「CRuby」と呼びます。 このCRubyのソースコードをコンパイル
AWS News Blog AWS Verified Access Preview — VPN-less Secure Network Access to Corporate Applications Today, we announced the preview of AWS Verified Access, a new secure connectivity service that allows enterprises to enable local or remote secure access for their corporate applications without requiring a VPN. Traditionally, remote access to applications when on the road or working from home is g
こんにちは!ミラティブの Android エンジニアの kitakkun です。 ミラティブでは年始に Android アプリの Material3 完全移行 QA を行いましたが、スクリーンショットテスト導入の成果もあり、ほとんどバグチケットの報告もなくスムーズに完了することができました。 Mirrativ の Android アプリでは、Jetpack Compose(以下、単に Compose)を2021年7月の1.0リリースから導入を開始しました。以来、新規画面は必ず Compose で実装しており、古い画面も積極的に Compose 化を進めています。 Jetpack Compose の Material ライブラリも2から3(以後簡単に M2, M3)へとバージョンアップし、M3 向けに開発されるコンポーネントも増えてきました。ミラティブの Android チームでは、昨年8月
OpenAIが9月12日、「Strawberry」と呼ばれていた次世代AIモデル「o1-preview」をついに発表した。複雑な問題に対してより長い時間をかけて思考し、科学、コーディング、数学などの分野で従来のモデルを凌駕する能力を持つとされている。また、より効率的なコーディング用モデルとして「o1-mini」も同時に発表された。o1-previewの80%のコスト削減を実現しつつ、高度な推論能力を維持しているという。いずれもChatGPT PlusおよびTeamユーザーに対して即日利用可能となり、API開発者向けにも提供が開始された。 o1-previewの特筆すべき点は、人間のように問題を深く考察してから回答する能力だ。このアプローチにより、物理学、化学、生物学などの難解な課題において、博士課程の学生と同等の成績を収めたという。特に数学の分野では際立った成果を上げており、国際数学オリン
Menu. Currently selected: 🔍 What is the Remote GitHub MCP Server? The GitHub MCP Server allows AI tools like GitHub Copilot in VS Code and Visual Studio, Claude Desktop, and others to seamlessly access live GitHub context and tools—like issues, pull requests and code files—to power smarter, more dynamic agent workflows. With the Remote GitHub MCP server, you don’t need to install or run it locall
イギリスの政府系機関・AI Security Institute(AISI)によるサイバー攻撃性能の検証で、GPT-5.5が「ネットワーク完全乗っ取り攻撃」を成功させられる性能を持っていることが明らかになりました。 Our evaluation of OpenAI's GPT-5.5 cyber capabilities | AISI Work https://www.aisi.gov.uk/blog/our-evaluation-of-openais-gpt-5-5-cyber-capabilities OpenAI’s GPT-5.5 is the second model to complete one of our multi-step cyber-attack simulations end-to-end 🧵 pic.twitter.com/eQWYbYaa6w— AI Sec
Ollama is now powered by MLX on Apple Silicon in preview March 30, 2026 Today, we’re previewing the fastest way to run Ollama on Apple silicon, powered by MLX, Apple’s machine learning framework. This unlocks new performance to accelerate your most demanding work on macOS: Personal assistants like OpenClaw Coding agents like Claude Code, OpenCode, or Codex Accelerate coding agents like Pi or Claud
Assessing Claude Mythos Preview’s cybersecurity capabilities April 7, 2026 Nicholas Carlini, Newton Cheng, Keane Lucas, Michael Moore, Milad Nasr, Vinay Prabhushankar, Winnie Xiao Hakeem Angulu, Evyatar Ben Asher, Jackie Bow, Keir Bradwell, Ben Buchanan, David Forsythe, Daniel Freeman, Alex Gaynor, Xinyang Ge, Logan Graham, Kyla Guru, Hasnain Lakhani, Matt McNiece, Mojtaba Mehrara, Renee Nichol, A
AWS Application Composer helps developers simplify and accelerate architecting, configuring, and building serverless applications. You can drag, drop, and connect AWS services into an application architecture by using AWS Application Composer’s browser-based visual canvas. AWS Application Composer helps you focus on building by maintaining deployment-ready infrastructure as code (IaC) definitions,
9月12日、OpenAIが新しい推論モデルのo1-previewとo1-miniを発表し、ChatGPT Plusなどの課金ユーザーは、即日、両モデルを利用できるようになりました。 これらのモデルは、応答前に時間をかけて考えるように設計されており、複雑なタスクを論理的に処理し、従来のモデルよりも科学、コーディング、数学における難しい問題を解決することができるとされています。 そこで、今回、新モデルのo1-previewとGPT-4oモデルの回答の性能を比較してみました。 👆僕の書いたGPTs解説書です。電子書籍版はAmazonポイント50%還元キャンペーン中です。(2024/9/13現在) 1.OpenAI o1モデルの概要(1) o1モデルの推論の仕組みo1モデルには、推論トークンの仕組みが導入されており、この推論トークンを使用して思考し、プロンプトの理解をブレークダウンして、応答を生
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く