[B! AI] tobetchiのブックマーク

2030年までに、1兆個のパラメータを持つLLMの推論コストが90％以上削減される、ガートナーが予想

米調査会社のガートナーは、2025年と比較した場合の大規模言語モデルにおける推論実行のコストが、1兆個のパラーメータを持つ大規模言語モデルでは2030年までに90％以上削減されるとの予想を発表しました。この大きなコスト削減効果は、半導体およびインフラにおける処理効率の向上、モデル設計の革新、チップ利用率の向上、推論特化シリコンの利用増加、特定のユースケースに向けたエッジデバイスの応用などの複数の技術改善を組み合わせたことで実現されると、同社シニアディレクター兼アナリスト、ウィル・ソマー氏は述べています。この予想は2つのシナリオに分かれています。 1つは、最先端のチップ技術を前提とした「フロンティアシナリオ」（最前線シナリオ）です。いずれのシナリオでも処理コストは大きく削減されると予想されていますが、「レガシーブレンドシナリオ」は処理能力を低く想定しているケースにおいて、その絶対的コス

tobetchi 2026/04/02

リンク

Claude Codeのソースコード流出、npmソースマップに51万行が丸見えだった件

Anthropic Claude Codeのnpmパッケージにソースマップが含まれ、1,902ファイル・51万行超のTypeScriptソースが公開状態に。未公開プロジェクト「KAI ROS」や107個のフィーチャーフラグなど、内部コードの全貌を解説する。 Anthropicが「うっかり」自社ツールの中身を全公開した Anthropicが提供するAIコーディングツール「Claude Code」の中身が丸見えになった。ハッキングされたわけではない。Anthropicが自分でnpm（JavaScriptのパッケージ管理システム）にコードを公開するとき、「ソースマップ」という本来含めてはいけないファイルを一緒に入れてしまった。いわば設計図を製品と一緒に箱に入れて出荷してしまったようなものだ。発見したのはセキュリティ研究者のChaofan Shou氏。対象は @anthropic-ai/clau

tobetchi 2026/04/01

リンク

【検証】夜泣き対応で絶望したので、娘の泣き声を最新LLMに「翻訳」させてみた - Qiita

はじめに生まれたばかりの赤ちゃんは、まだ言葉を知らない。代わりに泣くことで、世界と会話しようとする。でも、その"言葉"を聞き取るのが、想像以上に難しい。眠いのか、お腹がすいたのか、ただ抱きしめてほしいだけなのか。毎回ゼロから推理ゲームが始まる。夜中の3時。泣き声の理由が分からず、抱っこしながらため息をついたとき、ふと頭に浮かんだ。「この"泣き声の翻訳"、いまのAIならできたりするか？」普段PdMとしてプロダクトの課題を見つけている私にとって、育児は未知の不便だらけで、手を入れたくなるUXの塊だった。もし、この泣き声をAIが解析して「これはミルクだよ」「ただの寝言だよ」と教えてくれたら、どれだけ心が軽くなるだろうか？そう思い立ち、試してみた。自己紹介株式会社SapeetのAI SaaS事業部でプロダクトマネージャーとして働いている畔柳です！早速私事なのですが（笑）

tobetchi 2025/12/10

AI
育児

リンク

【Midjourney | Nano Banana】商品撮影のプロが撮影をやめた。誰も教えない、ブランドやECの現場レベルで使える画像生成AIと動画生成AIの神業プロンプトまとめ。｜さきすた

【Midjourney | Nano Banana】商品撮影のプロが撮影をやめた。誰も教えない、ブランドやECの現場レベルで使える画像生成AIと動画生成AIの神業プロンプトまとめ。今回は、前回紹介しきれなかった最新の画像生成AIと動画生成AIのテクニックを紹介いたします！ところで、本当に最新なの…？私はコスメやファッションブランドのビジュアルのお手伝いしていたりもします。現場で本当に使っているテクニックを厳選してご紹介します！最近、進化がますます早くなっています…！半年前だとMidjourney（ミッドジャーニー）、Runway、Topaz、Magnificあたりをメインに使っていたのですが、いまは上記に加えて、Nano Banana（Flash 2.5）、Seedream、Higgsfield Soul、Wan 2.5、Veo3なども加わり、横断するAIがさらに増えていま

tobetchi 2025/11/11

AI
画像

リンク

A postmortem of three recent issues

Published Sep 17, 2025 This is a technical report on three bugs that intermittently degraded responses from Claude. Below we explain what happened, why it took time to fix, and what we're changing. Between August and early September, three infrastructure bugs intermittently degraded Claude's response quality. We've now resolved these issues and want to explain what happened. In early August, a num

tobetchi 2025/09/18

AI
dev

リンク

4o騒動

Open AI社が提供するChat-GPTの新モデル、gpt5が出たんだが、これについて一悶着起きている・利用者が使えるモデルが5に一新され、今まで使えていた4oというモデルが使えなくなった・更に月額3000円のplusというコースに加入している人は、今までほぼ無制限に4oを使えていたのに、5になった途端に厳しい制限がつくように・5は4oに比べて回答が淡白なところがあり、4oを友人や恋人、パートナー代わりに調整して利用していた人たちからは「人格が変わった」と評されるほどの変化が生じたこれらの大幅な変化により、日本を問わず全世界のChat GPTユーザーが「4oを返せ」運動を起こしている実際、推論や提案といった本来のAIの性能としては5の方が高性能らしいが、感情に寄り添い適切なコミュニケーションを行う分野では4oの方が良かったらしく、運動に参加している人の殆どは4oに人格を幻視して

tobetchi 2025/08/10

AI

リンク

謎の超小型AI「HRM」、たった2700万パラメータで巨大なOpenAI o3やClaude 3.7を蹴散らす（生成AIクローズアップ） | テクノエッジ TechnoEdge

2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless（シームレス）を運営し、執筆しています。 1週間の気になる生成AI 技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI 技術や研究にスポットライトを当てる生成AIクローズアップ。今回は、わずか2700万パラメータという小規模なモデルでありながら、複雑な推論タスクにおいて最先端の大規模言語モデル（LLM）を凌駕するモデルを開発した論文「Hierarchical Reasoning Model」を取り上げます。この論文はシンガポールのSapient Intelligenceと清華大学による研究発表です。Sapient Intelligenceはシンガポールに本社を置き、サンフランシスコと北京に研究センターを構えるグローバルなAGI研究企業です。精華大

tobetchi 2025/08/05

AI

リンク

‎Gemini - direct access to Google AI

Created with Gemini

tobetchi 2025/05/09

リンク

GitHub - KoljaB/RealtimeVoiceChat: Have a natural, spoken conversation with AI!

You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

tobetchi 2025/05/07

リンク

第2のDeepSeekショック？　オープンな中国LLM「Qwen3」シリーズが破格の性能で話題　最大モデルはOpenAI o1やGemini 2.5 Proに匹敵、たった4BでもGPT-4oレベルに

第2のDeepSeekショック？　オープンな中国LLM「Qwen3」シリーズが破格の性能で話題　最大モデルはOpenAI o1やGemini 2.5 Proに匹敵、たった4BでもGPT-4oレベルに中国Alibabaが4月29日（現地時間）に発表した、大規模言語モデル「Qwen」の最新版となる「Qwen3」シリーズが話題だ。フラッグシップモデルの「Qwen3-235B-A22B」は「DeepSeek-R1」の半分未満のパラメータ数ながら、OpenAIのo1やo3-mini、GoogleのGemini 2.5 Proなど他のトップモデルと並ぶ性能を達成したという。「Qwen3-4B」は小さなモデルでありながらも「GPT-4o」を多くの項目で上回るとしている。公開した全てのモデルがオープンウェイトであるため、フラグシップの235B-A22B以外はデスクトップ向けハイエンドGPUなどで動作さ

tobetchi 2025/04/30

リンク

AI研究者の76%が「現在のAIの延長上にAGIはない」と考えている（AAAI 2025 Presidential Panel Reportより） - 渋谷駅前で働くデータサイエンティストのブログ

各技術系メディアでは既に報じられていますが、今年のAAAI*1で会長名によってリリースされた"AAAI 2025 Presidential Panel on The Future of AI Research"の内容が非常に示唆に富んでいたので、改めてやや仔細に読み解いてみようかと思います。なお、元のレポートは結構なボリュームがありいきなり精読しようとするとしんどいので、NotebookLMにまとめさせたサマリーと論点に対応した原文の箇所を適宜読み返して自分で補いながら*2、つらつらと論じていくこととします。ということで、hallucinationsなどあればご遠慮なくご指摘くだされば幸いです。レポートの全体構成について（特にAI研究者へのアンケート）個人的に注目した論点現在のAIの延長上にAGIは実現しない(76%) LLMの事実性・信頼性の問題はすぐには解決できない(60%)

tobetchi 2025/04/30

リンク

なんか私のChatGPTだけ生成下手じゃない？なんでみんなそんなに上手にコントロールできるの？

ふっく｜AIと働く経営者🤖 @fukku_ai_BD Chat GPTとの壁打ちがビミョー、、、、って時は、「しっくりこないので話を戻します。フレームワーク〇〇〇〇を用いて、1つずつ丁寧に質問して。」と伝えると、一変するの知ってた？敢えて壁打ちの途中で話を戻すことで、「しっくりきてない現状」も理解してくれるので経緯も読み取って精度の高い質問をしてくれます。「その視点は無かった…」って人はぜひコレを使い倒してください🙌 AIの活用法を学んでいても特定の仕事の質や生産性しか向上しません。賢いAIを賢いパートナーだと捉えるんです。「AIとの働き方」を学ぶのがこれからの時代で得する働き方ですよ。 2025-03-26 07:27:55

tobetchi 2025/03/28

リンク

DeepSeek・Baidu・Alibabaなどの中国企業がAIモデルをオープンソースにしているのは「アメリカの規制を回避するため」

中国のAI企業・DeepSeekは2025年1月に、OpenAIのモデルに匹敵する推論モデル「DeepSeek R1」をオープンウェイトで公開し、欧米のAI研究者を驚かせました。その後も中国のAI企業が相次いでオープンなAIモデルを市場に投入していますが、これにはアメリカの規制をかいくぐる狙いがあると、経済紙のFinancial Timesが指摘しています。 Why China is suddenly flooding the market with powerful AI models https://www.ft.com/content/13df6250-dffb-40fc-bb79-309764fa3905 これまでのところ、OpenAI・Google DeepMind・AnthropicといったアメリカのAI企業のほとんどはAIを独占的なリソースとして扱っており、最も高度なモデルへ

tobetchi 2025/03/24

AI

リンク

Gemini 2.0 に大統領就任演説の英文を解説してもらったらすごかった

大統領就任演説のニュースを見ていて I will direct all members of my cabinet to marshal the vast powers at their disposal to defeat what was record inflation and rapidly bring down costs and prices. の意味がよく分からなかったので、無料の Gemini 2.0 に聞いたら、AI の進歩にびっくりした。 AIの回答①ご質問ありがとうございます。この英文は、政府やそれに準ずる組織の長が、記録的なインフレと物価高騰に対処するために、閣僚（内閣のメンバー）に権限を行使するように指示する場面で使われる表現です。具体的には、以下のような意味になります。「私は内閣の全メンバーに対し、記録的なインフレと急速なコストおよび物価の下落を阻止するために

tobetchi 2025/01/21

AI
英語

リンク

AI『デナーリス』に恋した少年、「会いに来て」と言われ拳銃自殺。遺族がチャット運営元 Character AIとGoogleを安全対策不備で訴える | テクノエッジ TechnoEdge

tobetchi 2024/10/25

AI
SF

リンク

海外「今の日本人と変わらない！」戦国武将たちの肖像画をAIで映像化したところ世界的な話題に

今回は、過去の写真や肖像画などを、 AIを用いて映像化する「写真復活」さんの投稿からで、ここでは戦国大名たちが映像化されています。映像化された戦国大名は登場順に、武田信玄、上杉謙信、織田信長、豊臣秀吉、毛利元就、今川義元、大友宗麟、龍造寺隆信、斎藤道三の9名。全編日本語で、基本的には日本人向けの動画なのですが、ゲームなどの影響で戦国大名の人気は海外でも高い事から、計2500あるコメントの半数以上が海外からとなっています。寄せられていた反応をまとめましたので､ごらんください｡「もうやだこの星w」世界における織田信長のイメージがカオスだと話題に ■　どの戦国大名も、怖いくらいにリアル！　+2770　チリ ■　加工後の織田信長と豊臣秀吉。現実世界で何度も見たことあるわ。　+118　ソマリア（※この方はヤマハに勤めているそうです） ■　第六天大魔王といわれた織田信長、あん

tobetchi 2024/10/20

AI
history

リンク

「読者はAIだけ」ライターの新たな仕事と”2026年問題”とは

Photo by Paul Hudson (CC BY 2.0) 読者はAIだけ、ライターが請け負う新たな仕事とは――。メディアやライターの仕事が、次々にAIに置き換えられている。そんな中で、ライターが請け負う新たな仕事が登場している。 AIに読ませるためだけに、テキストを書く仕事だ。 AI生成テキストを、そうと気づかぬ多くの人間が目にする時代に、「AI読者」のためだけのライティングの発注が広がる。その背後には、AIの学習を巡る”2026年問題”があるという。 ●「AIのために書いている」私は週に数時間、数十億ドル規模のテクノロジー企業のために原稿を書いている。（中略）作業量はフレキシブルだし、普段の仕事より給料はいいし、発注は途切れることがない。ただ、書いたものが社外で読まれることはない。なぜなら、人間のために書いているわけではないからだ。AIのために書いているのだ。ライターのジ

tobetchi 2024/09/27

リンク

高性能すぎて本人証明がないと買えないAIボイチェン「Vocoflex」製品版登場。無限声色ボーカルはAI DTMに欠かせない存在に（CloseBox） | テクノエッジ TechnoEdge

3カ月ほどベータテスターをしていた、DreamtonicsのAIボイスチェンジャー「Vocoflex」。その製品版が正式発売されたので、購入しました。ベータ版でもすごく便利に使っていたのですが、さらに改良されているというので、製品版としてのファーストインプレッションをお届けします。 ■ Vocoflex とはDreamtonicsはその品質で定評のあるAIベースの歌声合成ソフト「Synthesizer V」の開発メーカー。 Vocoflexは、RVCなどのAIによるボイスチェンジャーをさらに使いやすく高性能に発展させたもので、VSTやAudioUnitsといったプラグインも揃っていてDAWを使うDTMユーザーとも親和性が高いものです。

tobetchi 2024/08/09

AI
sound

リンク

【AI動画生成】Animate Anyone 論文解説

はじめに 11月も終わり、今年も残るところあと一か月となりました。今年ももう終わるから今年中に成果を上げとけ！と言わんばかりに最近は新技術の登場が多いです。今回取り上げるのも11月最後の大砲として出てきた新技術、その名もAnimate Anyone Animate Anyoneとはなんぞや文字で説明するより見たほうが早い凄くざっくり説明すると、一枚の絵と動きをボーン動画として入力すると、入力した絵がボーン動画と同じ動きをしてくれるよ！というもの。似たようなものは今までもReferenceOnly × openpose × animatediffとかで出来ましたが、特筆すべきはその精度。動画生成の大敵であるちらつきは一切なく、入力画像にかなり忠実な動画を生成しています。さてこの技術、動画生成にずっと注目している自分としてはいますぐにでも弄り倒したいのですが、残念ながらコードとモ

tobetchi 2023/12/01

リンク

たった1枚の写真から高解像度の3DCGモデルをAIで生成できる「Human-SGD」が発表される

写真から3DCGモデルを作成するにはさまざまな方向から被写体を何枚も撮影する必要があります。クウェート大学・Meta・メリーランド大学の研究者が、たった1枚の写真から高解像度のCGモデルを生成する「Human-SGD」を発表しました。 [2311.09221] Single-Image 3D Human Digitization with Shape-Guided Diffusion https://arxiv.org/abs/2311.09221 Human-SGD https://human-sgd.github.io/ 研究チームの1人であるJia-Bin Huang氏が、Human-SGDがどういうモデルなのかを解説するムービーをYouTubeで公開しています。 3D Human Digitization from a Single Image! - YouTube ライダージャケ

tobetchi 2023/11/26

AI
cg

リンク

はてなブックマーク

タグ

関連タグで絞り込む (40)

AIに関するtobetchiのブックマーク (81)

お知らせ

今週のはてなブックマーク数ランキング（2026年4月第4週）

今週のはてなブックマーク数ランキング（2026年4月第3週）

今週のはてなブックマーク数ランキング（2026年4月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス