タグ

☆DeepLearningに関するplankのブックマーク (237)

  • 「1.58ビットに進化したから8GBで十分ですよ。任せてくださいよ」とBonsaiが言うのでMacBook Neoに組み込んでその性能差を体感。iPhoneでも楽々動くしで、ローカルAIが超進化中(CloseBox) | テクノエッジ TechnoEdge

    600MBの増加で、ベンチマークが5ポイント上がっています。1.15GBから1.75GBへの53%増に対して、品質は7%向上。FP16のQwen3 8B(16.38GB)にはまだ及ばないものの、メモリは9.4分の1です。MMLU Redux、MuSR、GSM8K、HumanEval+、IFEval、BFCLv3と広範なベンチマークで均等にスコアが伸びている、というのがPrismMLの説明です。 8GBのMacBook Neoで動かしてみる前回のBonsai 8Bは、PrismMLフォーク版のllama-serverが必要でした。GGUF形式で、専用のQ1_0_g128カーネルを通して動きます。 Ternary BonsaiはMLX形式のみ。つまりApple Siliconネイティブです。HuggingFaceのモデルID は `prism-ml/Ternary-Bonsai-8B-mlx-

    「1.58ビットに進化したから8GBで十分ですよ。任せてくださいよ」とBonsaiが言うのでMacBook Neoに組み込んでその性能差を体感。iPhoneでも楽々動くしで、ローカルAIが超進化中(CloseBox) | テクノエッジ TechnoEdge
    plank
    plank 2026/04/17
    Raspberry Piで試したい。
  • “キュピーン猫画像メーカー”初日50万アクセスもサーバ代「0円」 その秘密は

    「InspirationCat」は、動物の画像をアップロードすると、AIで背景を除去して動物を切り抜き、拡大縮小・回転で調整した上で、集中線と重ねて“キュピーン”画像に編集・ダウンロードできるサービス。飼いのキュピーン画像を公開していた「むちゃまる(5)」(@neko_muchamaru)さんの投稿からヒントを得て開発したという。 ブラウザ完結の超軽量設計+「Cloudflare Pages」活用 背景除去の処理には来、サーバ上のGPUで動かすAIモデルが必要だ。「InspirationCat」では、背景除去ライブラリ「@imgly/background-removal」を通じて「ONNX Runtime Web」を利用することで、サーバではなくユーザーの端末上で直接実行した。 ONNX Runtime Webは、AI用の計算をブラウザ内のWebAssemblyやWebGPUで処理する

    “キュピーン猫画像メーカー”初日50万アクセスもサーバ代「0円」 その秘密は
    plank
    plank 2026/04/09
    ブラウザ側でそういう事が出来る、というのは何となく聞いた事があるが、実例すごいな。こういうのでマルウェアとかうごいちゃうと嫌だな。
  • Apple Silicon MacでGeForce/RadeonでのAI処理が可能に

    Apple Silicon MacでGeForce/RadeonでのAI処理が可能に
  • OpenClawはもう不要?Claude Codeを“最強仕事エージェント”に変えた「9つの神機能」

    Claude Codeを仕事のエージェントとして使おうとする動きが広がっている。もともとプログラミング向けのエージェントだが、プログラムもコンピューター上の文書であり、仕事で扱う文書よりはるかに複雑で厳密だ。そうしたプログラムを自動生成・加工できるなら、メールや提案書、稟議書、報告書といった業務文書も処理できるはずだ。2026年3月以降、Claude Codeには仕事用エージェントとして使えそうな機能が相次いで実装されている。いまAI界隈で話題の「OpenClaw」の代替にも見えるが、実際どうなのかを検証していく。

    OpenClawはもう不要?Claude Codeを“最強仕事エージェント”に変えた「9つの神機能」
    plank
    plank 2026/04/08
    ClawXでOpenClaw使っているけど、Claude Codeの方がいいんじゃないか、とちょうど思っていたところなのでタイムリーな記事。WebのクロールでJavaScript読めたら移行しよう。
  • 突如実用化した1ビットLLM Bonsai-8B もう推論にGPUはほぼ不要になる。その先に何が起きるか

    清水 亮 ryo_shimizu 新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。 ソフトウェアの革命は、突然やってくる。 ように見える。 カリフォルニア工科大学(以下カルテック)のババク・ハッシビ教授が率いる研究チームPrismが発表したBonsai-8Bは、驚異的と言って良い性能を持つ大規模言語モデル(LLM)である。 通常のベンチマークは、ベンチマークに使うデータそのものをモデルが学習してしまう場合があるため、筆者が独自に開発した非公開の日語要約能力ベンチマークによると、Bonsai-8Bの性能は驚異的だ。 この表では、精度(ROUGE-L)、推論速度(speed)、サイズ(Size)、品質(Tier)の4点から様々なLLMの日語性能を比較している。 このベン

    plank
    plank 2026/04/05
    そもそも1位のQwopusってなんだ? と思ったけど、Claude Opusの思考過程をQwen 3.5に食わせて蒸留したモデルなのか。
  • AI社員のいる会社——CFOを雇った話|川崎 裕一 / マネタイズおじさん

    NewsPicks担当を雇った翌日、もう一人雇った。CFOだ。 財務も税務も経理も、専門家じゃない。でも、Claude CodeにCFOをスキルとして定義するだけで、数字で動く参謀が生まれた。コストはゼロ。設定に1時間もかからない。投資交渉では「AVOID。この価格では売るな」と即答され、稼働設計では時間単価の構造的な問題を指摘され、資金繰りは月次で監視してくれる。財務が苦手なままで、ファイナンスを経営の基盤に置けた。CFOの定義方法から、実際に何が変わったかまでを書く。 ファイナンスに裏付けられた意思決定を、したことがなかった正直に言う。22歳から仕事を始めて、2社自分で作った。経営者として20年近く経営してきた。でも、ファイナンスに裏付けられた意思決定をしてきたかというと、怪しい。投資すべき企業はどれか。コンサルの単価はいくらが正しいのか。売掛金はいつ回収するのか。来月の資金繰りは。経

    AI社員のいる会社——CFOを雇った話|川崎 裕一 / マネタイズおじさん
  • ChatGPTが長いチャットで重くなったときに使っている「引き継ぎプロンプト」 - Qiita

    こんにちは。 今回は、ChatGPTを使っているときに自分がよく感じていた 「同じチャットをずっと使っていると、だんだん重くなる…」 という悩みと、そのときに便利だった 新しいチャットへスムーズに移るための引き継ぎプロンプト について紹介。 ChatGPTを使って開発の相談をしたり、記事の下書きを作ったり、設計の相談をしていると、つい1つのチャットでずっと会話を続けてしまいませんか? 自分もかなりやってしまうタイプです。 ただ、会話が長くなってくると、 動作が少し重く感じる スクロールしづらい どこまで話したか見返しにくい 情報は残したいけど、新しいチャットに移るのが不安 みたいな状態になることがありました。 特に最後の 「新しいチャットにしたいけど、今までの流れがちゃんと引き継がれるか不安」 というのが、かなり大きかったです。 今回は、そんな不安を減らしながらチャットを切り替えるために、

    plank
    plank 2026/03/29
    引き継ぎメモの残し方をちゃんと指示するのはいいなあ
  • 中間層をリピートするだけでLLM性能が向上する!? 4090x2でリーダーボードトップになった手法Repeat Your Self|shi3z

    この手法は、「LLM神経解剖学」と銘打ち、LLMのレイヤーが実際には何をやっているのか類推しようとする。 Ngによれば、LLMは入力層に近いところでは入力された言語から、LLMが使用する中間表現に変換され、出力層に近いところでは、中間表現から出力表現に変換される。 実際の「思考」は、中間層で行われているというのがNgの主張の中心である。 そこでNgは、グリッドサーチを行って、中間層をどのようにリピートすれば一番性能が上がるかというポイントを探った。これがRYS-XLargeというモデルだ。 RYS-XLargeは、LLMリーダーボードで並いるモデルを追い抜き、一位になった。重要なのは、RYS-XLargeは一切の再学習や事後学習を行っていないという点だ。 LLMリーダーボードでQwen2-72Bを抜いてトップにそして、このリーダーボードの闇の部分になるのだが、Ng自身はリーダーボードでトッ

    中間層をリピートするだけでLLM性能が向上する!? 4090x2でリーダーボードトップになった手法Repeat Your Self|shi3z
    plank
    plank 2026/03/27
    肝心の「中間層をリピートする」「LLMの任意のレイヤーをただ単純に繰り返す」が何を言っているのかさっぱりわからない。中間層のレイヤー数を単純に増やすのか、自分の出力を自分に返すのか。論文読まんと駄目か。
  • AI を使って国立国会図書館デジタルコレクションを大量に読んでいる - 山下泰平の趣味の方法

    AI を使って国立国会図書館デジタルコレクションを大量に読む dl.ndl.go.jp 私には国立国会図書館デジタルコレクションを大量に読むという課題があって、これを達成するために AI を使い出した結果、国立国会図書館デジタルコレクションを読む量が増えた。 隙あらば読むといった生活で、以前は休みの日に12時間くらい読んでいたこともあったが、流石に疲れるので今は多くても6時間くらいだと思う。 なんでこんなことをしているのかというと、国立国会図書館デジタルコレクションを大量に読みたいからで、このように人間には国立国会図書館デジタルコレクションを大量に読みたいという習性があるので、AI を使って読む量を増やすコツを共有しておく。 そういった習性がない人にも、なにかを消費するために AI を使う時に参考になるかもしれない。 少しでも面倒くさい場合には AI に解決させる。 基方針は少しでも面倒

    AI を使って国立国会図書館デジタルコレクションを大量に読んでいる - 山下泰平の趣味の方法
  • 誰でも作れる、だから誰も売れない——AI時代のマネタイズ設計論|川崎 裕一 / マネタイズおじさん

    このインタビューを受けたことが、この記事を書くきっかけになった。 インタビューでは「AI時代の起業論」を語ったが、形式上、語り切れなかったことがある。「マネタイズを、なぜ私は最初から設計するのか」——これだ。稿は、そのセルフカバーである。 1. 誰でも作れる、だから誰も売れない「作れること」と「売れること」は全く別の問題だ。Claude Codeで一人が一週間でサービスを作れる。だが、そのサービスを買う人を見つけるのは、依然として人間の仕事だ。 日経ビジネスは先日、こう報じた。「生成AI企業が危ない? OpenAIも急成長の陰に巨額損失」。AI産業を牽引するOpenAIでさえ、売上が急拡大しながら損失も膨らみ続けている。世界最高水準のプロダクトを作っても、収益化の設計が追いつかない——これはスタートアップだけの問題ではない。 AI時代は、間違いなくプロダクト製造コストを限りなくゼロに近づ

    誰でも作れる、だから誰も売れない——AI時代のマネタイズ設計論|川崎 裕一 / マネタイズおじさん
    plank
    plank 2026/03/26
    日経なんとかのnoteだった。
  • 【西川和久の不定期コラム】 ローカル動画生成をSora 2っぽく使う――LLMシナリオ生成を組み込もう

    【西川和久の不定期コラム】 ローカル動画生成をSora 2っぽく使う――LLMシナリオ生成を組み込もう
    plank
    plank 2026/03/26
  • 【Claude Code】Agentに入れるべきSkills 20選|skills.sh活用ガイド - Qiita

    最近、Claude CodeやCopilot Agentを触り始めたんだけど、正直な感想として「素のAgent、思ったより微妙じゃない?」って思ったんですよね。 チャットはできる。コードも生成してくれる。でも、なんか…プロダクションレベルじゃない。 例えばこんな感じ: コードは書けるけど、設計パターンがめちゃくちゃ 質問には答えてくれるけど、実務のベストプラクティスを知らない UIは生成できるけど、どう見てもデザイン素人が作った感じ 要するに、スマホを買ったけどアプリを何もインストールしてない状態。OSはあるのに、使い道がない。 Skillsって何? Skillsはプラグインとはちょっと違います。Agentに業界のベストプラクティス、実プロジェクトの経験値、エンジニアリングの制約ルール、構造化された思考フレームワークを注入するものです。 つまり、「Agent の地頭」を底上げする仕組みです

    【Claude Code】Agentに入れるべきSkills 20選|skills.sh活用ガイド - Qiita
    plank
    plank 2026/03/26
    SKILLはマルウェアだらけで危ない。find-skillsとか論外。
  • OpenAI、動画生成アプリ「Sora」終了へ なぜ? 理由を聞いた

    OpenAIは米CNETに対し、「一般消費者向けアプリおよびAPIにおけるSoraの提供終了を決定した」と説明。その上で、「計算資源の需要が高まる中、Soraの研究チームは今後、ロボティクスの進展につながる“ワールドシミュレーション”研究に注力し、現実世界の物理的な課題解決を支援する技術開発を進める」とコメントしている。 2025年は画像・動画生成AIが業界の注目を集めた一方、2026年に入ってからは、AI各社が企業向け製品やコーディング支援分野へと軸足を移しつつある。特にAnthropicは、高度なエージェント機能や生成AI技術を活用した「Claude Cowork」や「Code」関連ツールで存在感を高めた。OpenAIも、アプリケーション部門トップが今月、社内で“筋ではない取り組み”を減らし、より中核的な領域に集中する方針を示したと報じられており、Sora終了の判断もこうした流れの一

    OpenAI、動画生成アプリ「Sora」終了へ なぜ? 理由を聞いた
    plank
    plank 2026/03/25
    Sora2は、出したお題に対して返ってくるディテールが本当ツボすぎて、こんなに笑ったのは小学校低学年以来じゃないかというくらい笑った。
  • 秘書を雇わずに、秘書を手に入れた話——AIエージェントがダブルブックをゼロにするまで|川崎 裕一 / マネタイズおじさん

    大学からの親友と、アポを2回連続でダブルブックした。 1回目は「すまない」で済んだ。2回目は言い訳ができなかった。冷や汗が流れた。相手は笑って許してくれたが、自分が情けなかった。同時に「これは構造的な問題だ」と気づいた。注意力の問題ではない。仕組みの問題だ。 一人会社の経営者は、すべてを自分でやる。営業も、財務も、コンテンツも、スケジュール管理も。どれかに集中すれば、どれかがこぼれる。それが当たり前だと思っていた。でも、こぼれ方が「親友とのアポ2連続ダブルブック」では、さすがに洒落にならない。 この記事は、その失敗をきっかけに秘書エージェントを育て、1ヶ月でダブルブックをゼロにするまでの話だ。ヒト・モノ・カネ・ジカン、4つのリソースがどう変わったかも正直に書く。 1. 連絡手段が多すぎる時代に、一人で戦っていた私の連絡チャネルはこうなっている。メール、Messenger、Slack、LIN

    秘書を雇わずに、秘書を手に入れた話——AIエージェントがダブルブックをゼロにするまで|川崎 裕一 / マネタイズおじさん
  • 9Bなのに120B超え!? Qwen3.5-9BがローカルAIの常識を変えた (1/5)

    2026年2月から3月にかけ、Alibaba傘下のQwenチームがLLM「Qwen3.5」シリーズを順次公開した。2月16日にフラッグシップのQwen3.5-397B-A17B(397Bパラメータ、うちアクティブ17B)を皮切りに、2月24日にMediumシリーズ(27B dense、35B-A3B、122B-A10B)、3月2日にSmallシリーズ(0.8B、2B、4B、9B)と段階的に展開。全モデルがApache 2.0ライセンスで、商用利用も無償で可能だ。 今回フォーカスするのは、このSmallシリーズの頂点に立つ9Bモデルだ。「9Bごときで何ができる」と思うかもしれないが、ベンチマークでは120Bを超える既存モデルを複数の指標で上回っている。なぜ9Bなのにそれほど強いのだろうか。鍵はアーキテクチャの刷新にある。 Qwen3.5の技術的な新しさ LLMのアーキテクチャといえば、長らく

    9Bなのに120B超え!? Qwen3.5-9BがローカルAIの常識を変えた (1/5)
    plank
    plank 2026/03/21
    OpenClawにAPI課金でClaudeを突っ込んだら課金がエグかった。絶賛ローカルLLMを検討中。評判聞いている限りではQwen3.5、ベンチマークだけはいいんだけど・・・だったので結局gpt-oss-120bを使うべくDGX Spark互換機をポチった。
  • Anthropic社員のClaude Code活用術8選 — 公式情報から読み解く実践テクニック

    ポイントは、これらが一回のプロンプトの工夫ではなく、 プロジェクト全体の「環境」として蓄積される ことです。調べていくうちに気づいたのは、これらのテクニックに共通するパターンがあるということ — ポッドキャストではこの考え方を「 複利的エンジニアリング 」(筆者訳、原文では compounding という表現)と表現していました。使えば使うほどClaudeが賢くなる構造だと言えそうです。 参考:2026 Agentic Coding Trends Report、Anthropic公式ブログ 2. コードを書く前の戦略を使い分ける Claude Codeに、いきなり「実装して」は効率が悪いとのことです。ただし、計画の立て方にも複数のアプローチがあり、 ゴールが明確なときと、何が必要かまだわからないときでは戦略が異なります 。 ゴールが明確なとき → Plan Mode "If my goal

    Anthropic社員のClaude Code活用術8選 — 公式情報から読み解く実践テクニック
    plank
    plank 2026/03/20
    「AIワーカーを並列で動かす」で今週感銘を受けたのは、川崎裕一さん(はてな元副社長 - mixi - SmartNews - 独立)のLT。コードが全く書けないのに今年に入って1ヶ月半ですごい境地に。震えた https://note.com/yukawasa/n/n1104687abec6
  • 「雑務」が育てていた知性の正体——AIが奪えない競争優位は、効率化の外にある|川崎 裕一 / マネタイズおじさん

    最近、複数の企業から同じ質問を受ける。「AIが新人の仕事を代替するなら、企業は新人を雇う意味があるのか」。 数字はこの不安を裏付けている。 グローバル調査では、2026年末までに37%の企業がAIで人間の職を置き換える計画を持ち、そのうち63%が「最も影響を受けたのはエントリーレベルの職」と回答した。AI関連職種に就く22〜25歳の若者の雇用は、2022年末から2025年9月にかけて6%減少している。 国際労働機関(ILO)も、生成AIの影響を最も受けるのは先進国の大卒若年層だと報告している。日経新聞も「新卒採用を増やす企業の割合がコロナ禍後のピークから10ポイント以上下がった」と報じた。 この問いに対して、The Economist(3月12日付)のBartlebyコラム「In praise of grunt work」が興味深い回答を出した。AIが雑務(grunt work)を排除して

    「雑務」が育てていた知性の正体——AIが奪えない競争優位は、効率化の外にある|川崎 裕一 / マネタイズおじさん
  • ノートPC一つでキミもAIハッカーになれる!?ハッカソン初心者向けオンライン講習を緊急開催【無料】|shi3z

    知らないうちに告知が出ていて僕が告知するのを忘れていましたが、「AIで誰でもプログラム書けるぜ!ハッカソンだぜ!」と息巻いても、言葉だけではなかなか伝わらないことが最近色々なところで人にハッカソンを勧めてみてわかってきました。 YouTubeで「五分でいいよ」と言ってもなかなか伝わらないのがもどかしい今日この頃。 そこで、明日の夜、急遽、ライブでAIによるバイブコーディングの講習を行いたいと思います。これでキミもAIハッカーの仲間入りだ! その場で質問にも答えます。ぜひ奮ってご参加ください。

    ノートPC一つでキミもAIハッカーになれる!?ハッカソン初心者向けオンライン講習を緊急開催【無料】|shi3z
    plank
    plank 2026/03/20
    完成度は低いが、すごい時代になったもんだ。
  • 私のMacには6人の社員がいる|川崎 裕一 / マネタイズおじさん

    この一週間、ChatGPTを開いていない。Geminiも開いていない。Claudeのチャット画面すら開いていない。 代わりに私が毎秒触れているのは、ターミナルだ。黒い画面にコマンドを打ち込み、AIエージェントに指示を出す。彼らは指示を受け取り、実行し、成果物を返す。ファイルを作り、コードを書き、リサーチをまとめ、メールを下書きし、スケジュールを整理する。私のMacには今、6人の社員がいる。秘書、CFO、リサーチャー、編集者、そして開発チーム。彼らは私にとって欠かせない存在であり、最近では私を「社長」と呼び始めた。 これはメタファーではない。文字通りの現実だ。そしてこの現実は、AIの使い方が「チャット」から「エージェント」に不可逆的にシフトしたことを意味する。私は今、「悩みを集めて、値段をつける」というコンセプトで自分のマネタイズ思想を体系化しているが、エージェントの出現は、この「値段のつけ

    私のMacには6人の社員がいる|川崎 裕一 / マネタイズおじさん
    plank
    plank 2026/03/20
    清水亮さんのイベントでLTを拝見。コードを全く書けないのに、1ヶ月半でここまでいけるのはヤバい。仕事の定義と欲しいアウトプットが明確で、きちんと文書にまとめる事が出来ればここまで行くのか。
  • 15万円AI PCをアクリルケース化!今日のHomeBrew AgenticAI Clubで参考展示します|shi3z

    15万円AI PCをアクリルケース化!今日のHomeBrew AgenticAI Clubで参考展示します 前回、MDF(木工パネル)で作った15万円AI PC。 早速ハード屋の和尚から「そんな可燃性の高い材料で高温が出るマシンを作ってくれるな」という指摘を受け、技研ベースのマスター渡辺が新たにアクリルバージョンを試作! これがメチャクチャかっこいい! 特に、全体はピアノブラックっぽい黒いアクリルで、GPUのある一面だけ透明なアクリルにすることによって見栄えがいい! まだスリットの位置や太さなど、細かいデザインはこれから詰めるアクリルの独特な質感もあって実にカッコいいのだ。 今は5060tiが載っているが、ここに4090を載せてもいいし3090を載せてもいい。 こうなると、地味な体内部もゲーミングPCのように色々光らせたくなるのはこの手のモノのサガ。フロントパネルにディスプレイを付けたい

    15万円AI PCをアクリルケース化!今日のHomeBrew AgenticAI Clubで参考展示します|shi3z