[B! ☆DeepLearning] plankのブックマーク

天竺｜shi3z

三蔵法師がめざしたのは天竺だった。天竺とは、インダス川のことである。インダス川がサンスクリット語でसिन्धु(Sindhu)となり、それがペルシャ語ではهندو(Hindu)となる。ギリシャ語ではἸνδός(indos)、これが英語のIndiaに変化する。ペルシャ語から中国語に変化するときに、hin-du → hin-duk → hin-djukと変化していき、天竺(tʰen-dʑuk ティエン・ドゥク)に変換されたのだとChatGPTは言っている。三蔵法師は仏教徒で、彼が従える孫悟空や猪八戒、沙悟浄といった動物の化け物たちも仏様の命令で三蔵法師の護衛をするわけだから、これはまあ仏教的使命を果たしに行く物語なのである。西遊記が中国のみならず我が国の創作物に与えた影響は大きい。曲亭馬琴の南総里見八犬伝は西遊記を底本にしたと言われ、手塚治虫も「ぼくの孫悟空」という作品を残している

plank 2026/05/02

TRIBE v2の話は面白いけど、脳のどのエリアにどういうネットワークがあるとかインプットやアウトプットとの接続とかの数理モデルもないのに、何をどうシミュレートできているかは謎

リンク

元ソニーCTOの北野教授は「私たちは科学が得意なのだろうか」と問いかけた。“AIドリブン科学”時代に日本で起こること | Business Insider Japan

BUSINESS INSIDERサイエンス元ソニーCTOの北野教授は「私たちは科学が得意なのだろうか」と問いかけた。“AIドリブン科学”時代に日本で起こること沖縄科学技術大学院大学（OIST）教授の北野宏明氏。長年にわたり、ソニーコンピュータサイエンス研究所を率い、2025年までソニーグループCTO兼副社長を務めた経歴で知られる。撮影：Business Insider Japan東京都が中心となって開催するアジア最大級のイノベーションカンファレンス「SusHi Tech Tokyo 2026」が4月27日、開幕した。 AIを軸に都市とそこに暮らす人の未来を提示する数多くのセッションのなかで初日、コンピューティングとサイエンスに精通した視点から「AI時代の科学の未来像」を示したのが、ソニーグループの元CTOで、沖縄科学技術大学院大学（OIST）教授の北野宏明氏のセッションだった。北野氏は

plank 2026/05/01

「もしポスドクや学生に『ランダムに選んだ5つの遺伝子で博士の研究として調査しなさい』と言えば、彼らは『私の人生、キャリアはどうなるんだ』と絶望するだろう」　確かに

リンク

「1.58ビットに進化したから8GBで十分ですよ。任せてくださいよ」とBonsaiが言うのでMacBook Neoに組み込んでその性能差を体感。iPhoneでも楽々動くしで、ローカルAIが超進化中（CloseBox） | テクノエッジ TechnoEdge

600MBの増加で、ベンチマークが5ポイント上がっています。1.15GBから1.75GBへの53%増に対して、品質は7%向上。FP16のQwen3 8B（16.38GB）にはまだ及ばないものの、メモリは9.4分の1です。MMLU Redux、MuSR、GSM8K、HumanEval+、IFEval、BFCLv3と広範なベンチマークで均等にスコアが伸びている、というのがPrismMLの説明です。 8GBのMacBook Neoで動かしてみる前回のBonsai 8Bは、PrismMLフォーク版のllama-serverが必要でした。GGUF形式で、専用のQ1_0_g128カーネルを通して動きます。 Ternary BonsaiはMLX形式のみ。つまりApple Siliconネイティブです。HuggingFaceのモデルID は `prism-ml/Ternary-Bonsai-8B-mlx-

plank 2026/04/17

Raspberry Piで試したい。

☆DeepLearning

リンク

“キュピーン猫画像メーカー”初日50万アクセスもサーバ代「0円」　その秘密は

「InspirationCat」は、動物の画像をアップロードすると、AIで背景を除去して動物を切り抜き、拡大縮小・回転で調整した上で、集中線と重ねて“キュピーン”画像に編集・ダウンロードできるサービス。飼い猫のキュピーン画像を公開していた「むちゃまる（5）」（@neko_muchamaru）さんの投稿からヒントを得て開発したという。ブラウザ完結の超軽量設計＋「Cloudflare Pages」活用背景除去の処理には本来、サーバ上のGPUで動かすAIモデルが必要だ。「InspirationCat」では、背景除去ライブラリ「@imgly/background-removal」を通じて「ONNX Runtime Web」を利用することで、サーバではなくユーザーの端末上で直接実行した。 ONNX Runtime Webは、AI用の計算をブラウザ内のWebAssemblyやWebGPUで処理する

plank 2026/04/09

ブラウザ側でそういう事が出来る、というのは何となく聞いた事があるが、実例すごいな。こういうのでマルウェアとかうごいちゃうと嫌だな。

リンク

Apple Silicon MacでGeForce/RadeonでのAI処理が可能に

plank 2026/04/08

リンク

OpenClawはもう不要？Claude Codeを“最強仕事エージェント”に変えた「9つの神機能」

Claude Codeを仕事のエージェントとして使おうとする動きが広がっている。もともとプログラミング向けのエージェントだが、プログラムもコンピューター上の文書であり、仕事で扱う文書よりはるかに複雑で厳密だ。そうしたプログラムを自動生成・加工できるなら、メールや提案書、稟議書、報告書といった業務文書も処理できるはずだ。2026年3月以降、Claude Codeには仕事用エージェントとして使えそうな機能が相次いで実装されている。いまAI界隈で話題の「OpenClaw」の代替にも見えるが、実際どうなのかを検証していく。

plank 2026/04/08

ClawXでOpenClaw使っているけど、Claude Codeの方がいいんじゃないか、とちょうど思っていたところなのでタイムリーな記事。WebのクロールでJavaScript読めたら移行しよう。

リンク

突如実用化した1ビットLLM Bonsai-8B もう推論にGPUはほぼ不要になる。その先に何が起きるか

清水亮 ryo_shimizu 新潟県長岡市生まれ。1990年代よりプログラマーとしてゲーム業界、モバイル業界などで数社の立ち上げに関わる。現在も現役のプログラマーとして日夜AI開発に情熱を捧げている。ソフトウェアの革命は、突然やってくる。ように見える。カリフォルニア工科大学(以下カルテック)のババク・ハッシビ教授が率いる研究チームPrismが発表したBonsai-8Bは、驚異的と言って良い性能を持つ大規模言語モデル(LLM)である。通常のベンチマークは、ベンチマークに使うデータそのものをモデルが学習してしまう場合があるため、筆者が独自に開発した非公開の日本語要約能力ベンチマークによると、Bonsai-8Bの性能は驚異的だ。この表では、精度(ROUGE-L)、推論速度(speed)、サイズ(Size)、品質(Tier)の4点から様々なLLMの日本語性能を比較している。このベン

plank 2026/04/05

そもそも1位のQwopusってなんだ？と思ったけど、Claude Opusの思考過程をQwen 3.5に食わせて蒸留したモデルなのか。

リンク

AI社員のいる会社——CFOを雇った話｜川崎裕一 / マネタイズおじさん

NewsPicks担当を雇った翌日、もう一人雇った。CFOだ。財務も税務も経理も、専門家じゃない。でも、Claude CodeにCFOをスキルとして定義するだけで、数字で動く参謀が生まれた。コストはゼロ。設定に1時間もかからない。投資交渉では「AVOID。この価格では売るな」と即答され、稼働設計では時間単価の構造的な問題を指摘され、資金繰りは月次で監視してくれる。財務が苦手なままで、ファイナンスを経営の基盤に置けた。CFOの定義方法から、実際に何が変わったかまでを書く。ファイナンスに裏付けられた意思決定を、したことがなかった正直に言う。22歳から仕事を始めて、2社自分で作った。経営者として20年近く経営してきた。でも、ファイナンスに裏付けられた意思決定をしてきたかというと、怪しい。投資すべき企業はどれか。コンサルの単価はいくらが正しいのか。売掛金はいつ回収するのか。来月の資金繰りは。経

plank 2026/04/03

リンク

ChatGPTが長いチャットで重くなったときに使っている「引き継ぎプロンプト」 - Qiita

こんにちは。今回は、ChatGPTを使っているときに自分がよく感じていた「同じチャットをずっと使っていると、だんだん重くなる…」という悩みと、そのときに便利だった新しいチャットへスムーズに移るための引き継ぎプロンプトについて紹介。 ChatGPTを使って開発の相談をしたり、記事の下書きを作ったり、設計の相談をしていると、つい1つのチャットでずっと会話を続けてしまいませんか？自分もかなりやってしまうタイプです。ただ、会話が長くなってくると、動作が少し重く感じるスクロールしづらいどこまで話したか見返しにくい情報は残したいけど、新しいチャットに移るのが不安みたいな状態になることがありました。特に最後の「新しいチャットにしたいけど、今までの流れがちゃんと引き継がれるか不安」というのが、かなり大きかったです。今回は、そんな不安を減らしながらチャットを切り替えるために、

plank 2026/03/29

引き継ぎメモの残し方をちゃんと指示するのはいいなあ

リンク

中間層をリピートするだけでLLM性能が向上する!? 4090x2でリーダーボードトップになった手法Repeat Your Self｜shi3z

この手法は、「LLM神経解剖学」と銘打ち、LLMのレイヤーが実際には何をやっているのか類推しようとする。 Ngによれば、LLMは入力層に近いところでは入力された言語から、LLMが使用する中間表現に変換され、出力層に近いところでは、中間表現から出力表現に変換される。実際の「思考」は、中間層で行われているというのがNgの主張の中心である。そこでNgは、グリッドサーチを行って、中間層をどのようにリピートすれば一番性能が上がるかというポイントを探った。これがRYS-XLargeというモデルだ。 RYS-XLargeは、LLMリーダーボードで並いるモデルを追い抜き、一位になった。重要なのは、RYS-XLargeは一切の再学習や事後学習を行っていないという点だ。 LLMリーダーボードでQwen2-72Bを抜いてトップにそして、このリーダーボードの闇の部分になるのだが、Ng自身はリーダーボードでトッ

plank 2026/03/27

肝心の「中間層をリピートする」「LLMの任意のレイヤーをただ単純に繰り返す」が何を言っているのかさっぱりわからない。中間層のレイヤー数を単純に増やすのか、自分の出力を自分に返すのか。論文読まんと駄目か。

☆DeepLearning

リンク

AI を使って国立国会図書館デジタルコレクションを大量に読んでいる - 山下泰平の趣味の方法

AI を使って国立国会図書館デジタルコレクションを大量に読む dl.ndl.go.jp 私には国立国会図書館デジタルコレクションを大量に読むという課題があって、これを達成するために AI を使い出した結果、国立国会図書館デジタルコレクションを読む量が増えた。隙あらば読むといった生活で、以前は休みの日に12時間くらい読んでいたこともあったが、流石に疲れるので今は多くても6時間くらいだと思う。なんでこんなことをしているのかというと、国立国会図書館デジタルコレクションを大量に読みたいからで、このように人間には国立国会図書館デジタルコレクションを大量に読みたいという習性があるので、AI を使って読む量を増やすコツを共有しておく。そういった習性がない人にも、なにかを消費するために AI を使う時に参考になるかもしれない。少しでも面倒くさい場合には AI に解決させる。基本方針は少しでも面倒

plank 2026/03/26

この手があったかー

リンク

誰でも作れる、だから誰も売れない——AI時代のマネタイズ設計論｜川崎裕一 / マネタイズおじさん

このインタビューを受けたことが、この記事を書くきっかけになった。インタビューでは「AI時代の起業論」を語ったが、形式上、語り切れなかったことがある。「マネタイズを、なぜ私は最初から設計するのか」——これだ。本稿は、そのセルフカバーである。 1. 誰でも作れる、だから誰も売れない「作れること」と「売れること」は全く別の問題だ。Claude Codeで一人が一週間でサービスを作れる。だが、そのサービスを買う人を見つけるのは、依然として人間の仕事だ。日経ビジネスは先日、こう報じた。「生成AI企業が危ない？ OpenAIも急成長の陰に巨額損失」。AI産業を牽引するOpenAIでさえ、売上が急拡大しながら損失も膨らみ続けている。世界最高水準のプロダクトを作っても、収益化の設計が追いつかない——これはスタートアップだけの問題ではない。 AI時代は、間違いなくプロダクト製造コストを限りなくゼロに近づ

plank 2026/03/26

日経なんとかのnoteだった。

リンク

【西川和久の不定期コラム】ローカル動画生成をSora 2っぽく使う――LLMシナリオ生成を組み込もう

plank 2026/03/26

使ってみようっと

リンク

【Claude Code】Agentに入れるべきSkills 20選｜skills.sh活用ガイド - Qiita

最近、Claude CodeやCopilot Agentを触り始めたんだけど、正直な感想として「素のAgent、思ったより微妙じゃない？」って思ったんですよね。チャットはできる。コードも生成してくれる。でも、なんか…プロダクションレベルじゃない。例えばこんな感じ：コードは書けるけど、設計パターンがめちゃくちゃ質問には答えてくれるけど、実務のベストプラクティスを知らない UIは生成できるけど、どう見てもデザイン素人が作った感じ要するに、スマホを買ったけどアプリを何もインストールしてない状態。OSはあるのに、使い道がない。 Skillsって何？ Skillsはプラグインとはちょっと違います。Agentに業界のベストプラクティス、実プロジェクトの経験値、エンジニアリングの制約ルール、構造化された思考フレームワークを注入するものです。つまり、「Agent の地頭」を底上げする仕組みです

plank 2026/03/26

SKILLはマルウェアだらけで危ない。find-skillsとか論外。

リンク

OpenAI、動画生成アプリ「Sora」終了へ　なぜ？理由を聞いた

OpenAIは米CNETに対し、「一般消費者向けアプリおよびAPIにおけるSoraの提供終了を決定した」と説明。その上で、「計算資源の需要が高まる中、Soraの研究チームは今後、ロボティクスの進展につながる“ワールドシミュレーション”研究に注力し、現実世界の物理的な課題解決を支援する技術開発を進める」とコメントしている。 2025年は画像・動画生成AIが業界の注目を集めた一方、2026年に入ってからは、AI各社が企業向け製品やコーディング支援分野へと軸足を移しつつある。特にAnthropicは、高度なエージェント機能や生成AI 技術を活用した「Claude Cowork」や「Code」関連ツールで存在感を高めた。OpenAIも、アプリケーション部門トップが今月、社内で“本筋ではない取り組み”を減らし、より中核的な領域に集中する方針を示したと報じられており、Sora終了の判断もこうした流れの一

plank 2026/03/25

Sora2は、出したお題に対して返ってくるディテールが本当ツボすぎて、こんなに笑ったのは小学校低学年以来じゃないかというくらい笑った。

リンク

秘書を雇わずに、秘書を手に入れた話——AIエージェントがダブルブックをゼロにするまで｜川崎裕一 / マネタイズおじさん

大学からの親友と、アポを2回連続でダブルブックした。 1回目は「すまない」で済んだ。2回目は言い訳ができなかった。冷や汗が流れた。相手は笑って許してくれたが、自分が情けなかった。同時に「これは構造的な問題だ」と気づいた。注意力の問題ではない。仕組みの問題だ。一人会社の経営者は、すべてを自分でやる。営業も、財務も、コンテンツも、スケジュール管理も。どれかに集中すれば、どれかがこぼれる。それが当たり前だと思っていた。でも、こぼれ方が「親友とのアポ2連続ダブルブック」では、さすがに洒落にならない。この記事は、その失敗をきっかけに秘書エージェントを育て、1ヶ月でダブルブックをゼロにするまでの話だ。ヒト・モノ・カネ・ジカン、4つのリソースがどう変わったかも正直に書く。 1. 連絡手段が多すぎる時代に、一人で戦っていた私の連絡チャネルはこうなっている。メール、Messenger、Slack、LIN

plank 2026/03/23

秘書業務編

リンク

9Bなのに120B超え!?　Qwen3.5-9BがローカルAIの常識を変えた (1/5)

2026年2月から3月にかけ、Alibaba傘下のQwenチームがLLM「Qwen3.5」シリーズを順次公開した。2月16日にフラッグシップのQwen3.5-397B-A17B（397Bパラメータ、うちアクティブ17B）を皮切りに、2月24日にMediumシリーズ（27B dense、35B-A3B、122B-A10B）、3月2日にSmallシリーズ（0.8B、2B、4B、9B）と段階的に展開。全モデルがApache 2.0ライセンスで、商用利用も無償で可能だ。今回フォーカスするのは、このSmallシリーズの頂点に立つ9Bモデルだ。「9Bごときで何ができる」と思うかもしれないが、ベンチマークでは120Bを超える既存モデルを複数の指標で上回っている。なぜ9Bなのにそれほど強いのだろうか。鍵はアーキテクチャの刷新にある。 Qwen3.5の技術的な新しさ LLMのアーキテクチャといえば、長らく

plank 2026/03/21

OpenClawにAPI課金でClaudeを突っ込んだら課金がエグかった。絶賛ローカルLLMを検討中。評判聞いている限りではQwen3.5、ベンチマークだけはいいんだけど・・・だったので結局gpt-oss-120bを使うべくDGX Spark互換機をポチった。

リンク

Anthropic社員のClaude Code活用術8選 — 公式情報から読み解く実践テクニック

ポイントは、これらが一回のプロンプトの工夫ではなく、プロジェクト全体の「環境」として蓄積されることです。調べていくうちに気づいたのは、これらのテクニックに共通するパターンがあるということ — ポッドキャストではこの考え方を「複利的エンジニアリング」（筆者訳、原文では compounding という表現）と表現していました。使えば使うほどClaudeが賢くなる構造だと言えそうです。参考：2026 Agentic Coding Trends Report、Anthropic公式ブログ 2. コードを書く前の戦略を使い分ける Claude Codeに、いきなり「実装して」は効率が悪いとのことです。ただし、計画の立て方にも複数のアプローチがあり、ゴールが明確なときと、何が必要かまだわからないときでは戦略が異なります。ゴールが明確なとき → Plan Mode "If my goal

plank 2026/03/20

「AIワーカーを並列で動かす」で今週感銘を受けたのは、川崎裕一さん（はてな元副社長 - mixi - SmartNews - 独立）のLT。コードが全く書けないのに今年に入って1ヶ月半ですごい境地に。震えた https://note.com/yukawasa/n/n1104687abec6

リンク

「雑務」が育てていた知性の正体——AIが奪えない競争優位は、効率化の外にある｜川崎裕一 / マネタイズおじさん

最近、複数の企業から同じ質問を受ける。「AIが新人の仕事を代替するなら、企業は新人を雇う意味があるのか」。数字はこの不安を裏付けている。グローバル調査では、2026年末までに37%の企業がAIで人間の職を置き換える計画を持ち、そのうち63%が「最も影響を受けたのはエントリーレベルの職」と回答した。AI関連職種に就く22〜25歳の若者の雇用は、2022年末から2025年9月にかけて6%減少している。国際労働機関（ILO）も、生成AIの影響を最も受けるのは先進国の大卒若年層だと報告している。日経新聞も「新卒採用を増やす企業の割合がコロナ禍後のピークから10ポイント以上下がった」と報じた。この問いに対して、The Economist（3月12日付）のBartlebyコラム「In praise of grunt work」が興味深い回答を出した。AIが雑務（grunt work）を排除して

plank 2026/03/20

リンク

ノートPC一つでキミもAIハッカーになれる!?ハッカソン初心者向けオンライン講習を緊急開催【無料】｜shi3z

知らないうちに告知が出ていて僕が告知するのを忘れていましたが、「AIで誰でもプログラム書けるぜ!ハッカソンだぜ!」と息巻いても、言葉だけではなかなか伝わらないことが最近色々なところで人にハッカソンを勧めてみてわかってきました。 YouTubeで「五分でいいよ」と言ってもなかなか伝わらないのがもどかしい今日この頃。そこで、明日の夜、急遽、ライブでAIによるバイブコーディングの講習を行いたいと思います。これでキミもAI ハッカーの仲間入りだ! その場で質問にも答えます。ぜひ奮ってご参加ください。

plank 2026/03/20

完成度は低いが、すごい時代になったもんだ。

リンク

はてなブックマーク

タグ

関連タグで絞り込む (19)

☆DeepLearningに関するplankのブックマーク (239)

お知らせ

月間はてなブックマーク数ランキング（2026年4月）

今週のはてなブックマーク数ランキング（2026年4月第4週）

今週のはてなブックマーク数ランキング（2026年4月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス