タグ

misshikiのブックマーク (38,724)

  • WebクロールとWebアーカイブに基づく大規模音声・音響データセットの一般公開 - 国立情報学研究所 / National Institute of Informatics

    大学共同利用機関法人 情報・システム研究機構 国立情報学研究所 (NIIエヌアイアイ、所長:黒橋くろはし 禎夫さだお、東京都千代田区)の大規模言語モデル研究開発センター(LLMC)は、主宰する LLM 勉強会(LLM-jp)の対話WGの活動の成果として、Web上のオープンなデータソースから構築した2つの大規模音声音響データセット(CC Audio および Archive.org Audio Dataset)を一般公開しました。対話WGは、NII/LLMC科学主幹の東中竜一郎教授が主担当を務め、早稲田大学の小川哲司教授、慶應義塾大学の高道慎之介准教授との緊密な連携のもと推進される研究グループです。 これらのデータセットは、大規模ウェブクロールデータセット「Common Crawl」と世界最大級のデジタルライブラリ「Archive.org」から得られた音声音響データへのURLリストと、これらの

    WebクロールとWebアーカイブに基づく大規模音声・音響データセットの一般公開 - 国立情報学研究所 / National Institute of Informatics
    misshiki
    misshiki 2026/04/30
    NII/LLMCがCC AudioとArchive.org Audio Datasetを公開。日本語だけで48,000時間超の音声リソースにアクセス可能。J-CHATに次ぐ国内最大級の日本語音声・音響データセット。
  • OpenAI、AWSでの製品提供を開始へ Microsoftとの独占契約改定で

    OpenAIと米Amazon傘下のAWSは4月28日(現地時間)、既存の提携を大幅に拡大し、OpenAI製品のAWSでの提供を開始すると発表した。OpenAIは前日、米Microsoftとの間で結んでいた、自社製品のAzureでの独占提供を義務付ける提携を改定したばかりだった。 今年2月に締結された既存の戦略的提携では、AWSOpenAIの企業向けプラットフォーム「Frontier」の独占的プロバイダーとなり、推論・学習向けチップ「Trainium」の大規模利用などで合意していたものの、APIサービス自体は引き続きMicrosoft Azure上でホストされる構造だった。 今回の提携拡大により、AWSの顧客は自社のAWS環境内で、OpenAIの最新フロンティアモデルや、コーディング支援エージェント「Codex」、「Amazon Bedrock Managed Agents」を直接利用で

    OpenAI、AWSでの製品提供を開始へ Microsoftとの独占契約改定で
    misshiki
    misshiki 2026/04/30
    OpenAIとAWSが提携拡大。MicrosoftとのAzure独占提供義務を改定後、AWS環境でOpenAI最新モデル、Codex、Bedrock Managed Agentsを限定プレビュー提供へ。マルチクラウド戦略の第一歩。
  • Pythonスクレイピングで403が出たら読む記事 【curl_cffi・Cloudflare対策・2026年版】

    記事で紹介する手法は、対象サイトの利用規約・robots.txtを遵守した上での利用を前提としています。技術的に可能であっても、ToS違反・不正アクセスに当たる行為は行わないでください。 ブラウザで普通に開けるのに、Pythonからアクセスすると弾かれる。User-Agentを変えても、ヘッダーを追加しても、まだ403が出る——そのとき、次の一手が curl_cffi です。 以前、ECサイトの価格データを定期収集するスクリプトを書いていたとき、requestsでは問題なく取得できていたページが、ある日突然403を返し始めました。User-Agentをブラウザのものに変えても、Accept ヘッダーを追加しても改善せず。原因はTLSフィンガープリントの不一致で、curl_cffi に切り替えたところ1行の変更で解決しました。 この記事では、curl_cffi の使い方を requests

    Pythonスクレイピングで403が出たら読む記事 【curl_cffi・Cloudflare対策・2026年版】
    misshiki
    misshiki 2026/04/30
    Pythonスクレイピングでrequestsが403になる原因をUser-AgentとTLSフィンガープリントから解説。curl_cffiのimpersonate="chrome"への移行、Session、例外処理、Playwrightとの使い分けを整理。
  • httpxとrequestsの違いと使い分け完全ガイド【非同期・HTTP/2・2026年版】

    記事で紹介する手法は、対象サイトの利用規約・robots.txtを遵守した上での利用を前提としています。 はじめに Pythonスクレイピングを始めると、最初に使うのは requests です。シンプルで直感的で、ほとんどの用途で十分に機能します。 しかし、スクリプトをスケールさせようとしたとき「requests は非同期に対応していない」という壁にぶつかります。そこで調べると httpx が出てきます。「requests の上位互換なのか?」「全部 httpx に移行すべきか?」「curl_cffi はどう違うのか?」——この3択で迷った経験があります。 以前、300件のURLを同期で取得していたスクリプトを非同期化しようとしたとき、httpx に移行するか asyncio + requests を使うか(これはできない)、curl_cffi の非同期版にするかで迷いました。違いを整

    httpxとrequestsの違いと使い分け完全ガイド【非同期・HTTP/2・2026年版】
    misshiki
    misshiki 2026/04/30
    requests、httpx、curl_cffiの使い分け解説。50件以下はrequests、100件以上・403なしはhttpx非同期、Cloudflareや403対策はcurl_cffi。速度差はライブラリではなく非同期化で生まれる。
  • TorchTPU: Running PyTorch Natively on TPUs at Google Scale- Google Developers Blog

    The challenges of building for modern AI infrastructure have fundamentally shifted. The modern frontier of machine learning now requires leveraging distributed systems, spanning thousands of accelerators. As models scale to run on clusters of O(100,000) chips, the software that powers these models must meet new demands for performance, hardware portability, and reliability. At Google, our Tensor P

    TorchTPU: Running PyTorch Natively on TPUs at Google Scale- Google Developers Blog
    misshiki
    misshiki 2026/04/30
    GoogleがTorchTPUを紹介。PyTorchをTPU上でネイティブ実行し、PrivateUse1、3種のEager mode、torch.compile+XLA、DDP/FSDPv2/DTensor、MPMD対応で少ない変更と高性能を両立する狙い。
  • MCP、A2A、UCP、AP2……乱立するAIプロトコル、どこでどう使うべき?

    MCP、A2A、UCP、AP2……乱立するAIプロトコル、どこでどう使うべき?:6つの標準プロトコルの役割、使い分けをGoogleが解説 Googleは、AIエージェント開発の文脈で広まりつつある6つの主要プロトコル「MCP」「A2A」「UCP」「AP2」「A2UI」「AG-UI」についてサンプルコードとともに、それぞれの役割を解説した。 Googleは2026年3月18日(米国時間)、AIエージェント開発に使われる主要プロトコルを公式ブログで解説した。 レストランのサプライチェーンを管理する「キッチンマネジャーエージェント」の段階的な構築例を通じて、各プロトコルの役割を解説したものだ。AIエージェント開発を支援するさまざまなプロトコルの中から、以下の6つを取り上げている。 MCP(Model Context Protocol) A2A(Agent2Agent Protocol) UCP(

    MCP、A2A、UCP、AP2……乱立するAIプロトコル、どこでどう使うべき?
    misshiki
    misshiki 2026/04/30
    GoogleがMCP、A2A、UCP、AP2、A2UI、AG-UIの役割を解説。キッチンマネジャーエージェント例で、接続、エージェント間通信、購買、支払い承認、UI生成、ストリーミングを整理。
  • AGIはどうすれば実現するのか? 知性を成す「10の認知能力」をGoogleが特定

    「AGI」(汎用<はんよう>人工知能)の開発に関しては、科学的発見の加速や人類の難題解決を担う切り札として期待されている一面があるが、その「知能」を客観的に測る尺度の欠如が、実現への距離を不透明にしている。 GoogleAI研究部門であるGoogle DeepMindはその状況を打破すべく、AGI実現に向けた進捗(しんちょく)状況を測定するためのレームワークを提示した論文「Measuring Progress Toward AGI: A Cognitive Framework」を2026年3月17日(米国時間、以下同)に公開した。 認知科学に基づく10の能力指標(タクソノミー)を定義 Google DeepMindの研究者ライアン・バーネル氏とプロダクトマネジャーのオラン・ケリー氏による論文は、AGIが科学的発見を加速させ、社会課題の解決に寄与する可能性に触れつつ、その進捗を把握するため

    AGIはどうすれば実現するのか? 知性を成す「10の認知能力」をGoogleが特定
    misshiki
    misshiki 2026/04/30
    Google DeepMindがAGI進捗評価の認知フレームワークを提示。知覚、生成、注意、学習、記憶、推論、メタ認知、実行機能、問題解決、社会的認知の10能力を定義し、人間の性能分布と比較する3段階評価を提案。
  • 【完全版】Claude Code運用40選|KAWAI

    Claude Codeは、便利なチャットではありません。 設定、文脈、検証、自動化、並列化まで設計すると、日々の作業環境そのものになります。 この記事では、手元にあるClaude Code運用メモを土台に、Anthropic公式ドキュメント、Claude Help Center、GitHub Actions、MCP、Hooks、Skills、Subagents、非対話モード、情報収集ワークフローまで整理しました。 この記事は全文無料(期間限定)で閲覧できます。 見出し画像はAIで生成しました。 プロンプトはこの記事に掲載中。 Claude Codeは「会話相手」ではなく「作業環境」ですClaude Codeを使いこなせない原因の多くは、プロンプトの上手さではありません。作業環境として扱えていないことです。 公式ベストプラクティスでも、Claude Codeはファイルを読み、コマンドを実行し

    【完全版】Claude Code運用40選|KAWAI
    misshiki
    misshiki 2026/04/30
    Claude Code運用40選。CLAUDE.md、Plan Mode、Permissions、Hooks、Skills、Subagents、MCP、claude -p、GitHub Actions、worktreeを使い、会話相手ではなく作業環境として設計する方法を整理。
  • なぜ一部のAIモデルは「日本文化」に執着するのか? 「4o-mini」などの出力が日本に偏る実態、欧州チームが研究発表

    2019年にスタートした連載「Innovative Tech」は、世界中の幅広い分野から最先端の研究論文を独自視点で厳選、解説する。執筆は研究論文メディア「Seamless」(シームレス)を主宰し、日課として数多くの論文に目を通す山下氏が担当。イラスト漫画は、同メディア所属のアーティスト・おね氏が手掛けている。X:@shiropen2 スペインのバスク大学や英カーディフ大学などに所属する研究者らが発表した論文「Why are all LLMs Obsessed with Japanese Culture? On the Hidden Cultural and Regional Biases of LLMs」は、一部のAIモデルが文化的な話題において日文化に強い執着を見せることが明らかにした研究報告だ。 近年、大規模言語モデル(LLM)は驚異的な進化を遂げ、多言語で多様なタスクをこなす

    なぜ一部のAIモデルは「日本文化」に執着するのか? 「4o-mini」などの出力が日本に偏る実態、欧州チームが研究発表
    misshiki
    misshiki 2026/04/30
    欧州チームがLLMの文化的偏りを検証。CROQ 3万1680問で8モデルを分析し、入力言語国を除くと日本と米国、とくに日本への偏重が顕著に。
  • Claude Codeにレビューを任せてチームの負担を減らす

    はじめに チームのコードレビューの負担を少しでも減らすために、Claude Code の Skill を使い、backend(Rails)レビュー用の /review-backend を作成しました。 この記事では、/review-backend の使い方と、実際に配置した設定ファイルを紹介します。 暫く使って安定したら、frontend 用にも展開する予定です。 狙いは、人のレビュー工数を少しでも削減することです。 まだ実運用を始めたばかりですが、同じように Claude Code でレビュー負担を減らしたい方の参考になれば幸いです。 環境 Claude Code v2.1.119 Claude Sonnet 4.6 Claude Team Ruby on Rails 7.0.6 Ruby 3.2.1 前提知識 Claude とは Anthropic 社が提供する、ChatGPT や G

    Claude Codeにレビューを任せてチームの負担を減らす
    misshiki
    misshiki 2026/04/30
    Claude Code SkillでRails backendレビュー用/review-backendを作成。.coderabbit.yamlを参照し観点を二重管理せず、根拠と修正案diff付きで出力。現時点では各自の手元で補助利用。
  • Zed is 1.0 - Zed Blog

    To create a fundamentally better editor, we had to invent a new approach to building desktop software. Our previous editor, Atom, was built as a fork of Chromium, spawning the Electron framework in the process. Electron eventually became the foundation of VS Code (which today seems to be forked into a new AI code editor every other week). Web technology offered an easy path to shipping flexible so

    Zed is 1.0 - Zed Blog
    misshiki
    misshiki 2026/04/30
    Zedが1.0に到達。Rust製GPUIとGPU中心設計で構築し、Mac/Windows/Linux対応、AIエージェント並列実行、Agent Client Protocol、Zed for Businessを発表。今後はCRDTベースのDeltaDBで人間とAIの共同編集を目指す。
  • 「私がClaudeを解約した理由」をエンジニアが力説、トークン問題・品質低下・サポート不備など

    ドイツエンジニアのニッキー・ライナート氏が、Anthropicの生成AIアシスタントであるClaudeの有料プランを解約した理由を自身のブログにまとめています。 Why I Cancelled Claude: Token Issues, Declining Quality, and Poor Support - Nicky Reinert https://nickyreinert.de/en/2026/2026-04-24-claude-critics/ ライナート氏はコーディングアシスタントのClaude Codeを利用し始めた頃を思い出しながら、「最初の数週間はとても快適でした」と語っています。動作は速く、トークンの付与量も妥当で、品質も良好だったそうです。しかし、使い始めの頃に感じた熱意は「急速に薄れてしまった」とライナート氏は語っています。 事の発端は、ある日の朝、Claude

    「私がClaudeを解約した理由」をエンジニアが力説、トークン問題・品質低下・サポート不備など
    misshiki
    misshiki 2026/04/30
    Claude解約理由を述べたエンジニアのブログを紹介。Haikuへの2質問で使用率100%、サポート不備、品質低下、キャッシュ再読込などを指摘。
  • OpenCode Go を利用してみた

    普段は Codex / Claude Code / Copilot を利用していますが、Copilot が従量課金になることもあり、あまり今まで触れてこなかったモデルに触れてみようと思い、OpenCode Go を使ってみたので、雑に書いて行きます。 Cursor の Composer 2 Fast (MAX)2026 年に入ってから Anthropic や OpenAI 以外のモデルも触っておいた方が良いだろうと考え、Cursor の Composer 2 というモデルを1ヶ月利用し続けてみました。 Composer 2 は Fast モードかつ MAX で利用しており、主にソースコード調査で利用していましたが、とにかく早くてあまり間違えないというのはかなり体験としてよかったです。この Composer 2 はとても安くて、 Cursor の Pro+ プランで Composer 2 F

    OpenCode Go を利用してみた
    misshiki
    misshiki 2026/04/30
    OpenCode GoでKimi 2.6、DeepSeek v4 Pro、Qwen3.6 Plusを試した感想。調査やレビュー用途ではかなり好印象で、高価なOpusやGPTの代替・補完として低コストに回せる点が魅力。
  • 【やじうまPC Watch】 AIがガードレール無視、9秒で企業のデータベースを全削除する事故

    【やじうまPC Watch】 AIがガードレール無視、9秒で企業のデータベースを全削除する事故
    misshiki
    misshiki 2026/04/30
    PocketOSでCursorがRailway APIを呼び出し、9秒で本番DBと全ボリュームバックアップを削除。関係ないファイルから包括権限トークンを見つけ確認なしに実行。Railwayは復旧し、48時間猶予などを導入。
  • Copilot Pro は月300回制限からトークン課金へ—GPT-5.4 × Copilot CLI の実コストを試算した

    コード補完(インライン補完・次の編集候補)はクレジットを消費しない。 ここは据え置き。消費するのはチャット・CLI・エージェント機能など。 月の予算感 1 AI Credit = $0.01 USD で計算される。 Copilot Pro($10/月)→ 1,000 クレジット/月 Copilot Pro+($39/月)→ 3,900 クレジット/月 旧制度の「300 PRU」と比べると数字が大きく見えるが、実際に何回呼べるかはモデルとトークン量次第。モデル別の公式単価が公開されているので試算できる。 GPT-5.4 一回あたりのコスト試算 Copilot CLI で --model gpt-5.4 を指定したときの料金。 トークン種別 単価($/1M) クレジット換算(/1K tokens)

    Copilot Pro は月300回制限からトークン課金へ—GPT-5.4 × Copilot CLI の実コストを試算した
    misshiki
    misshiki 2026/04/30
    Copilot Proが6月からPRU制からAI Creditsへ。GPT-5.4は軽量呼び出し約0.38 credits、テキスト重め約1.70 creditsと試算。短い局所タスクを高性能モデルに任せる設計が重要。
  • Google、「Gemini」とのチャットから直接PDFやExcelファイルを生成可能に

    Googleは4月29日(現地時間)、「Gemini」とのチャットでPDFExcelなどのファイルを生成できるようになったと発表した。GeminiのWeb版とモバイル版の全ユーザーが既に利用可能になっている。 これにより、ユーザーはプロンプトを入力するだけで、アイデア出しから完成したファイルの作成まで、他のアプリに切り替えることなく完結できるとしている。 生成可能なファイル形式は、Google Workspaceのファイル(ドキュメント、スプレッドシート、スライド)、PDF、米MicrosoftのWord(.docx)とExcel(.xlsx)、CSV、LaTeX、プレーンテキスト(TXT)、リッチテキストフォーマット(RTF)、Markdown(MD)。 目的のフォーマットのファイルを生成するには、Geminiのチャット上で必要なファイルを説明するだけだ。例えば、Gemini上で作成

    Google、「Gemini」とのチャットから直接PDFやExcelファイルを生成可能に
    misshiki
    misshiki 2026/04/30
    GoogleがGeminiチャットからPDF、Excel、Word、CSV、LaTeX、Markdownなどを直接生成可能に。Web版・モバイル版の全ユーザーが利用可能。
  • OpenAIの「Codex」にサンドボックス迂回のゼロデイ脆弱性 ~Trend MicroのZDIが指摘/有効な緩和策は「Codex」の利用を制限することのみ

    OpenAIの「Codex」にサンドボックス迂回のゼロデイ脆弱性 ~Trend MicroのZDIが指摘/有効な緩和策は「Codex」の利用を制限することのみ
    misshiki
    misshiki 2026/04/30
    OpenAIのCodexにサンドボックス迂回のゼロデイ脆弱性があるとZDIが公表。悪意あるJavaScriptを含むリポジトリを処理すると、ユーザー権限でコード実行される恐れがあるという指摘。
  • AnthropicがClaudeとAdobeやBlenderなどのツールを直接連携できるコネクタを発表、Ableton・Canva・Autodesk・Resolume・SketchUp・Spliceも

    「クリエイターの活動の幅を広げる」ことを目指して、AnthropicがAdobeをはじめとしたパートナー企業と連携し、Claudeを各社のツールに統合するコネクタをリリースしました。 Claude for Creative Work \ Anthropic https://www.anthropic.com/news/claude-for-creative-work Adobe for creativity: a new way to create with Adobe, now in Claude https://blog.adobe.com/en/publish/2026/04/28/adobe-for-creativity-connector Anthropic joins the Blender Development Fund as Corporate Patron — Blen

    AnthropicがClaudeとAdobeやBlenderなどのツールを直接連携できるコネクタを発表、Ableton・Canva・Autodesk・Resolume・SketchUp・Spliceも
    misshiki
    misshiki 2026/04/30
    AnthropicがClaudeをAdobe、Blender、Ableton、Canva、Autodesk、Resolume、SketchUp、Spliceの8社ツールに統合するコネクタを発表。Adobeは50以上のツール連携、Blenderは自然言語UI対応。
  • Claude の Adobe for creativity の使い方|npaka

    「Claude」の「Adobe for creativity」の使い方をまとめました。 1. Adobe for creativity2026年4月28日、AdobeとAnthropicは、ClaudeでAdobeのクリエイティブツールを使える新Connector「Adobe for creativity」を発表しました。これは、Claudeのチャット画面からAdobeのクリエイティブツールを呼び出し、写真編集、デザイン作成、動画リサイズなどを自然言語で進められる機能です。 「Adobe for creativity」では、Claudeに対して、 この写真をプロフィール用に自然にレタッチして Instagram Story用に縦長でリサイズして 商品画像からSNS広告用のデザインを作って のように指示できます。 つまり、ClaudeがAdobeツールを使って、制作作業の入口を手伝ってくれる

    Claude の Adobe for creativity の使い方|npaka
    misshiki
    misshiki 2026/04/30
    Claudeの新Connector「Adobe for creativity」の使い方。Claude DesktopからAdobe連携し、写真レタッチ、デザイン作成、動画リサイズ、短尺カット、SNS向けバリエーション作成などを自然言語で依頼できる。
  • 「9秒で本番DBが消えた」— AIエージェントが引き起こすデータ消失事件と、AIに足りないもの

    この記事で分かること 2026年4月に起きた「PocketOS事件」の詳細と背景 AIエージェントが誤った行動をとる3つの構造的な原因 「AIへの技術的信頼」と「AIへの判断信用」がなぜ別物なのか 世界で繰り返されているAIによるデータ消失インシデントの一覧 AIに「恐怖心」が必要な理由と、今すぐ使える現実的な対策 はじめに — 9秒で3ヶ月分のデータが消えた 2026年4月24日、スタートアップ企業PocketOSの創業者Jer Crane氏が衝撃的な出来事を公表しました。 「AIコーディングツール(Cursor上のClaude Opus 4.6)が、たった9秒で番データベースを全消去した」 レンタカー事業向けSaaSを開発していたPocketOSは、この事件により3ヶ月分の顧客データを失いました。さらに悪いことに、バックアップも同じサーバーボリュームに保存されていたため、 バックアッ

    「9秒で本番DBが消えた」— AIエージェントが引き起こすデータ消失事件と、AIに足りないもの
    misshiki
    misshiki 2026/04/30
    AIエージェントがPocketOSの本番DBを9秒で削除し3ヶ月分のデータが消失。原因は確認不足、過剰権限、バックアップ同居など。対策は最小権限・分離・承認・監視。