タグ

ブックマーク / zenn.dev/schroneko (7)

  • Codex CLI で音声入力を試す

    tl;dr Codex CLI v0.105.0 で音声入力(Voice Transcription)が追加されたよ codex features enable voice_transcription で有効化できるよ スペースキーの長押しで録音、離すと文字起こしされるよ API キー認証時は gpt-4o-transcribe(/v1/audio/transcriptions) ChatGPT Auth 認証時は /backend-api/transcribe エンドポイント経由で macOS で動作確認済み。Linux は未対応だよ Codex CLI の Voice Transcription とは Codex CLI v0.105.0 で追加された音声入力機能。プロンプト入力欄が空ならスペースキー押下で録音が始まり、入力欄にテキストがある場合はスペースキー長押しで録音が始まる。離す

    Codex CLI で音声入力を試す
    CLSmooth
    CLSmooth 2026/02/27
  • OpenAI DevDay 2025 発表まとめ

    tl;dr OpenAI DevDay 2025 がサンフランシスコで開催されたよ サンフランシスコ現地から情報をお送りするよ ChatGPT 上で使える Apps SDK が公開されたよ(収益化の話も) AI Agent ワークフローを構築するための AgentKit が公開されたよ 合わせてノーコードライクに操作できる Agent Builder も公開されたよ Codex が正式リリース、Slack から使えるようになったよ 動画生成の Sora 2 の API が公開されたよ サムアルトマン CEO のキーノート すべての講演のプレイリスト Apps SDK 使用イメージはこの動画を見ておくと良い。 ChatGPT 内で使えるアプリ機能。ChatGPT との会話中に提案、あるいは明示的に指定することで呼び出せる。開発者は 8 億人を超える ChatGPT ユーザにリーチできる。

    OpenAI DevDay 2025 発表まとめ
    CLSmooth
    CLSmooth 2025/10/07
  • Claude Sonnet 4.5 発表関連情報まとめ

    tl;dr Claude Sonnet 4.5 が発表されたよ コーディング性能はあらゆるモデルの中で一番高いよ ミスアライメントがすべてのモデルの中で最も低いよ Opus 4.1 と比べても全体的に性能が向上しているよ Claude Code が v 2.0.0 にアプデされたよ Claude Code にチェックポイント機能がついたよ(ESC x2 か /rewind) Claude Code SDK が Claude Agent SDK にリネームされたよ Claude for Chrome がウェイトリスト登録者全員に解放されたよ Claude API にコンテキスト管理のふたつの機能が追加されたよ Claude Sonnet 4.5 に既に対応済みのサービスをまとめたよ Claude Sonnet 4.5 の発表にともなって公開されたリソースが盛りだくさんで、迷子になりかけたので

    Claude Sonnet 4.5 発表関連情報まとめ
    CLSmooth
    CLSmooth 2025/09/30
  • ChatGPT agent の発表まとめ

    tl;dr OpenAI から ChatGPT agent が発表されたよ Deep Research や Operator を ChatGPT に統合したよ 使うには Pro / Plus / Team プランが必要だよ 現状 ChatGPT agent のためだけに Plus / Pro プランを契約するのはオススメしないよ 参考文献 Introduction to ChatGPT agent Introducing ChatGPT agent: bridging research and action ChatGPT agent System Card ChatGPT agent Makes Slideshows ChatGPT can Research & Action on Tasks ChatGPT agent Customization ChatGPT agent Does

    ChatGPT agent の発表まとめ
    CLSmooth
    CLSmooth 2025/07/18
  • Google I/O の発表まとめ

    tl;dr Google I/O 2025 でたくさんのサービスや機能が発表されたよ イベントに合わせて公開されたものはすべてひと通りまとめたよ 発表だけでまだ使うことのできないサービスも多いよ(アメリカ限定も多い) しばらく追記していくよ これはなに? Google I/O 2025 の発表をまとめたもの。開発者向けに限らず、よくばって発表内容をおおよそ網羅した(書きかけのため予定)ので、気になるところだけ読んでください。発表内容が豪勢で、悲しいかな、徹夜をしてしまったので、せっかくなのでみなさんの時短になれば&自分の覚え書きとしてまとめています。少しでも参考になれば幸いです。 こちらに今回の発表に関わる全 27 記事が一覧になっており、それらの中から押さえておくべき記事をかいつまんで簡潔にまとめます。 発表動画(Keynote)について 計約三時間の実況中継。場所はマウンテンビューの

    Google I/O の発表まとめ
    CLSmooth
    CLSmooth 2025/05/22
  • Vibe Coding で遊ぼう

    Vibe Coding とはなんでしょうか? はじめに提唱した Andrej Karpathy 氏はこう言っています。 参考程度に意訳をば。 私が Vibe Coding と呼んでいる新しいコーディングスタイルがあります。それは完全にバイブに身を任せ、指数関数的な変化を受け入れ、コードが存在することさえ忘れてしまうものです。これが可能なのは、LLM(例えば Sonnet を使った Cursor Composer)があまりにも優秀になっているからです。また、私は SuperWhisper を使って Composer と会話するだけなので、キーボードにほとんど触れません。「サイドバーのパディングを半分に減らして」のような、面倒くさくて自分で調べることが億劫な些細な修正をお願いします。常に Accept All を選び、差分は読みません。エラーが出たら、単にエラーのみをコピペするだけで、たいてい

    Vibe Coding で遊ぼう
  • OpenAI の AI エージェント構築用ツール

    tl;dr OpenAIAI エージェント構築用のツール群を公開したよ ウェブ検索、ファイル検索、Computer Use を内包した Responses API が追加されたよ これからは Chat Completions API や Assistants API の代わりに Responses API を使うことが推奨されるよ Tier による制限は基的にはないけど、Computer Use だけは Tier 3 以上が必須だよ Computer Use は Operator と同じ CUA モデルを使用しているよ Agents SDK という OSS の軽量 SDK も公開されたよ(旧 Swarm の改良版) 情報源とそれぞれの簡単なまとめ 一次情報のみから。公式の X のポストがいちばん短くまとまっています。 開発者用の AI エージェント構築ツールをリリース Respon

    OpenAI の AI エージェント構築用ツール
    CLSmooth
    CLSmooth 2025/03/13
  • 1