th_6295のブックマーク (5,807)

  • ベクトルDBを使わないRAG。全てのナレッジを階層化する手法

    記事では、RAGの性能を高めるための「Corpus2Skill」という手法について、ざっくり理解します。 株式会社ナレッジセンスは、「エンタープライズ企業の膨大なデータを掘り起こし、活用可能にする」プロダクトを開発しているスタートアップです。 この記事は何 この記事は、「ベクトルDB」を使わずにRAGの精度を上げる新手法「Corpus2Skill」の論文[1]について、日語で簡単にまとめたものです。 今回も「そもそもRAGとは?」については、知っている前提で進みます(参考) 題 ざっくりサマリー 「Corpus2Skill」は、ベクトルDBを使わず、エージェンティックに検索することで、RAGの精度を上げます。 Magellan Technology Research Institute (MTRI) の研究者らによって2026年4月に提案されました。 通常のRAGでは、文章をベクトル

    ベクトルDBを使わないRAG。全てのナレッジを階層化する手法
    th_6295
    th_6295 2026/04/28
    この説明だけ見るとRAPTORの下位互換かと思ったらベクトル検索せずにグラフDB化してそれを上から見ていく感じらしい。もう素のファイルサーバーで良い気がしないでもない。
  • GitHub - google/skills: Agent Skills for Google products and technologies

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - google/skills: Agent Skills for Google products and technologies
    th_6295
    th_6295 2026/04/25
  • はてな[3930]:資金流出事案の発生に関するお知らせ 2026年4月24日(適時開示) :日経会社情報DIGITAL:日本経済新聞

    2026年4月24日 はてな[3930]の開示資料「資金流出事案の発生に関するお知らせ」 が閲覧できます。資料はPDFでダウンロードできます

    はてな[3930]:資金流出事案の発生に関するお知らせ 2026年4月24日(適時開示) :日経会社情報DIGITAL:日本経済新聞
    th_6295
    th_6295 2026/04/24
    有り金全部に近いみたいだけど、詐欺の巧妙さとかそういうの以前にどんなケースとして送金行動したのか気になる。
  • 自作キーボードに機械学習モデルを仕込む

    このブログについて 40%キーボードのHold&Tap判定に機械学習モデルを導入してみたという話です。 Tap & Holdとは? Tap&Holdというのは、1つのキーに2つのキーの役割を割り当てる機能です。 40%キーボードのようにキー数の少ないキーボードのスペース効率を高めることができる画期的な機能です。 具体的には、ちょい押しなら普通のキー、長押しなら修飾キー(またはレイヤ切り替え)といったように、ボタンを押す長さで二つのキーを判別する仕組みになっています。 このルールが基ですが、人間は機械のように正確な動きはできないので、ホールドのつもりで押したのにタップと判定される、あるいは逆のタイプミス(誤爆)が頻発するので、他にもルールベースの対応がいくつか考案されてきた経緯があります。 ルールベースの例としては、例えばHold on other key pressという機能があります。

    自作キーボードに機械学習モデルを仕込む
    th_6295
    th_6295 2026/04/20
  • 【RAG】企業のナレッジを、AIで書き直す。

    記事では、RAGの性能を高めるための「WriteBack-RAG」という手法について、ざっくり理解します。 株式会社ナレッジセンスは、生成AIやRAGを使ったプロダクトを、エンタープライズ企業向けに開発しているスタートアップです。 この記事は何 この記事は、RAGのナレッジベース自体をAIで書き直すことで精度を上げる手法「WriteBack-RAG」の論文[1]について、日語で簡単にまとめたものです。 今回も「そもそもRAGとは?」については、知っている前提で進みます。確認する場合は、こちらの記事もご参考下さい。 題 ざっくりサマリー 「WriteBack-RAG」は、RAGの回答精度を高めるための新しい手法です。 北京大学・ジョージア工科大学・清華大学の研究者らによって2026年3月に提案されました。 最近、「AIでナレッジを管理する」というコンセプトが盛り上がっています。 「AI

    【RAG】企業のナレッジを、AIで書き直す。
    th_6295
    th_6295 2026/04/19
    元論文は"wikipedia等の静的ナレッジ"に対して"事前のoffline処理のコストを無視した場合"に"効果がある"としか言ってなかったような?企業ナレッジだと理論上は資料一つ追加でもやり直しで、まだ単純キャッシュの方がマシ
  • RAGとAgentic Searchの戦争を 終わらせに来た!!!

    インフルエンサー「RAGは所詮 先の時代の敗北者じゃけェ」 初学者「今までRAGをやってきた僕はまるで…バカじゃないですか!!? 時間がもったいだいっ!!!!」 ってなってると聞いたので、そもそもの誤解と実態について纏めたいと思う。勢いあまってアカウント作ったまま放置してたZennを解禁した。 なんで争いは起こったのか 発端は、私が把握する限りだと、1つは「Claude Codeの初期バージョンではRAG + ローカルベクトルDBを使用していましたが、エージェント型検索の方が一般的にうまく機能することがすぐにわかりました。」という下記のAnthropicエンジニア@bcherny氏からの提言。 そして先日OpenAI創設者の1人であるKarpathy氏から投稿された、LLM Wiki(知識データをローカルに加工・集約しナレッジグラフっぽくしてAgentic Searchする方法)が、RAG

    RAGとAgentic Searchの戦争を 終わらせに来た!!!
    th_6295
    th_6295 2026/04/09
    逆で、検索観点では単なるポストプロセス手法の狭義RAGを変な喧伝したせいで「狭義RAGでAIが賢く検索してくれる」って認識の人が大量生産された。ベクトル検索結果にLLM性能は寄与しないと何度説明しても理解されない。
  • 図面解析におけるマルチモーダル Graph RAG の有効性検証とデモアプリ開発

    はじめに 初めまして。株式会社エクサウィザーズの先端技術開発グループ(WAND)でインターンをしている宇野宏紀です。記事では、冬インターン期間中に取り組んだマルチモーダル Graph RAG の実証実験とデモアプリ開発の成果を紹介します。 画像解析とグラフ構造化による図面解析の手法を構築しました。具体的には、CyberAgent ABEMA のサッカーハイライト動画自動作成システムのクラウドアーキテクチャ図を題材に、コンポーネント間の接続関係を問う質問に対する回答精度を Standard RAG と Graph RAG で比較しました。この題材は、サッカー中継のリアルタイム処理という興味深いユースケースであり、かつ複数の AWS サービスが矢印で接続された構造が明確なアーキテクチャ図が公開されており、グラフ構造の抽出・検証に適していたため、この題材を採用しました。 背景 RAG(Retr

    図面解析におけるマルチモーダル Graph RAG の有効性検証とデモアプリ開発
    th_6295
    th_6295 2026/04/05
  • Google、LLM実行時の消費メモリを6分の1に削減する「TurboQuant」

    Google、LLM実行時の消費メモリを6分の1に削減する「TurboQuant」
    th_6295
    th_6295 2026/04/01
  • 1枚数万円→5枚320円で納期3日——「個人が基板を発注できる」時代はこうして作られた - FabScene(ファブシーン)

    家電製品を分解したことがあれば、緑色の板に無数の部品が乗っている光景を見たことがあるだろう。あのコンパクトな板が、プリント基板(PCB:Printed Circuit Board)だ。スマートフォンの中にも、電子レンジの中にも、自動車のあちこちにも、基板はある。電子回路を機械的に支え、電気信号を正確に流す。現代の電子機器のほぼすべてが、基板なしには動かない。 かつて、この基板を「作る」ためには、化学薬品を使った自宅エッチングか、数十万円単位の最低発注額が必要な業者への依頼しかなかった。個人や小規模チームが独自の電子回路を形にしようとすれば、それだけでプロジェクトの最大の壁になった。 ところが2026年の現在、JLCPCBやPCBWayといった中国の製造サービスを使えば、5枚の2層基板を約2ドル(約320円)で、数日のうちに手元に届けることができる。設計ファイルをアップロードし、クレジットカ

    1枚数万円→5枚320円で納期3日——「個人が基板を発注できる」時代はこうして作られた - FabScene(ファブシーン)
    th_6295
    th_6295 2026/03/29
  • 「ポインタ渡し」なんてものは存在しません!【C言語入門】

    C言語の解説には歴史的経緯からか、あまり良くない記述が散見されます。 その中でも特に良くないのが「ポインタ渡し」です。 C言語には「値渡し」しかない プログラミング言語において、引数の渡し方は2種類あります。 値渡し 変数の値をコピーして渡します。 関数内で値が編集されても元の変数の値に変更はありません。 参照渡し 変数を指し示す参照だけを渡し、変数として振舞わせます。 関数内で値が編集されると元の変数の値が変更されます。 皆さんがC言語を書いている時に、「変数として振舞う参照」とやらを見たことはないと思います。 「ポインタ渡し」なんてものはない 「でも入門書で『ポインタ渡し』っていうの見たよ! 値渡しでもないし、参照渡しでもないならどうなるの!?」と思うかもしれません。 簡単です。 「ポインタ渡し」なんてものは、C言語の仕様には存在しません。 そもそも、ないんです。 「ポインタ渡し」の正

    「ポインタ渡し」なんてものは存在しません!【C言語入門】
    th_6295
    th_6295 2026/03/29
    そうだねPythonも値渡ししかないね。 レイヤーをチェリーピックして言い回しが気に入らないとお気持ちしても別に初学者の為ではないし、記事を消して作り直すほどの他者の認識を自分色に染めたいこの執念は何なんだ。
  • 画面設計書を Markdown で書く文化を浸透させたい

    1. はじめに 実務では、画面設計書ExcelPowerPoint、Word で管理されていることが多いです。 それ自体は珍しくありませんし、提出物としては都合が良い場面もあります。 ただ、開発の現場で実際に使う設計資料として見ると、つらいことが多いです。 どこが変わったのか差分が追いづらい レビューで変更点に集中しづらい 実装と設計書の同期が崩れやすい コピー運用で古い記述が残る 画面ごとに表現がばらつきやすい その結果、画面設計書が「あるけど信用されない文書」になってしまうことがあります。 自分は最近、画面設計書をもっとドキュメントベース、できれば Markdown ベースで書く文化を浸透させたいと考えています。 今回はその理由を整理してみます。 2. なぜ今の画面設計書運用がつらいのか 画面設計書は、多くの現場で Excel / Word / PowerPoint などの

    画面設計書を Markdown で書く文化を浸透させたい
    th_6295
    th_6295 2026/03/27
    Markdownを強制させることで、図等に頼らず指示をテキスト化してそちらを正としてもらえるのが本質(本音)に感じた。それを徹底してくれる相手なら「変更点は赤字にして」で同様の効果を担保できる気もする。
  • NVIDIAのボス、波紋広げるDLSS 5について「ゲーム開発者がちゃんと制御できる」と強調。“オンにすると別モノ級”技術デモ映像への反応にアンサー - AUTOMATON

    NVIDIAのボス、波紋広げるDLSS 5について「ゲーム開発者がちゃんと制御できる」と強調。“オンにすると別モノ級”技術デモ映像への反応にアンサー - AUTOMATON
    th_6295
    th_6295 2026/03/21
    デジカメの写りとかテッセレーションとかが出た時から一貫して拒絶してた人達なら死ぬまで貫けば良いけど、そもそも3DCGが虚構だしまぁ……
  • 仕様駆動開発はやめた方がええ

    前回記事から1ヶ月くらい経ったのでその間に得られた知見からの所見を述べる。 やっぱり実装に関するドキュメントはいらん。仕様は全てコードにある。コードをSSoT(Single Source of Truth)とすべきだ。ドキュメントとコードの二重管理はコストが大きすぎる。特にドキュメント側の管理コストが大きく、どれだけagentにドキュメントを修正しろと指示を出してもドキュメント修正の実行が確率的であるし、ドキュメントを更新するトークン数が無駄。コード読めばわかることを自然言語にわざわざ起こさんでいい。仕様がわからんくなったらclaudeに聞けばいいのでドキュメントを永続化する必要性が皆無すぎる。ドキュメント書かせるくらいならclaudeさんに感謝のメッセージを送った方がいい。限りある電力を無駄にするな。結論として仕様駆動開発はウソです。少なくともおれにとってはウソでした。手間の割に効用を実

    仕様駆動開発はやめた方がええ
    th_6295
    th_6295 2026/03/14
    外部設計どころか内部設計書(を更に作業指示にしたもの)のことを言ってる??要求仕様書とかを見たことない人が使うワードなんだろうか。
  • Claude Codeのセッション履歴が30日で消えると知って9999日に変えた話|cute_agapan9087

    Claude Code使ってると「あれ、前のセッションどこ行った?」ってなることありませんか? 実はClaude Code、デフォルトだと30日間非アクティブなセッションは起動時に自動削除されるんですよね。知らなかった…。 ってことで、設定を調べて9999日(約27年)に変更してみました。 💡 保存期間は2種類ある ここがちょっとややこしいんですけど、Claude Codeのデータ保存にはサーバー側(Anthropic)とローカル側(端末)の2種類があります。 ▼ サーバー側(Anthropic) プランと条件によって保存期間が変わります: ・Free/Pro/Max + モデル改善OFF → 30日 ・Free/Pro/Max + モデル改善ON → 5年 ・Team/Enterprise/API → 30日 ・API + Zero data retention(ZDR) → 保存なし

    Claude Codeのセッション履歴が30日で消えると知って9999日に変えた話|cute_agapan9087
    th_6295
    th_6295 2026/03/13
    この手の話題、毎回「後で参照する過去の作業内容」って結局何なのか分からない。コーディングならgitに、情報整理でもアウトプットに全部書いてある気が。 「日常会話を全部録音」的でピンと来ない。※30日は短い。
  • まだAIコードをレビューするか、しないかで言い争ってるの?

    AIが生成したコードをレビューするべきかどうか、という議論は定期的に起こります。 3カ月以上その問題に悩んでいる人は、たぶんとっくに何らかの結論に達していると思います。 2026.03.08 改修メモ レビュー0に拘り過ぎているように読めたので、表現を全体的に柔らかくしました。 私の結論 品質を維持したままコードレビューを減らせるよう、開発プロセス全体を改善する必要がある これは、すでにレビューしなくて済むようになったとか、レビューを0にしなくてはならないという話ではありません。品質を保ったまま、大幅にコードレビューを削減し続けなければならないという話です。 これは、少なくとも次の3つの確定的な事実に基づいています。 今後コードレビュワーは育てられない AIはレビュワーを物量でひき殺す 今のままのレビューを人が続ける組織は、コードレビューを軽量化した組織に淘汰される そのために必要なことも

    まだAIコードをレビューするか、しないかで言い争ってるの?
    th_6295
    th_6295 2026/03/08
    AIで書いてないから見るからに微妙な記事だけど、別にAIにそれっぽいけど中身が無い記事を書いて欲しいわけでもない。少なくともプロとしての業務やOSSでは桁違いに負担増えてるのはよく見る。
  • HTMLを拡張し、JSなしで動的UIを作る「htmx」 | gihyo.jp

    htmxは、HTMLの属性を追加するだけで、インクリメンタル検索やインライン編集をはじめとするさまざまな動的なUI(User Interface)を実現できるJavaScriptライブラリです。SPA(Single Page Application)フレームワークのような大がかりなビルド環境を用意することなく、すでにあるサーバーサイドアプリケーションに段階的に導入できる点も大きな魅力です。 記事では、htmxの基的なしくみや使用方法を紹介したのち、架空のタスク管理アプリケーションを題材に、htmxで実現できるさまざまなインタラクションを紹介します。 htmxの概要 HTMLを拡張するアプローチ htmxの基的なアイデアは、HTMLの属性を使ってサーバーとの通信およびDOM更新を宣言的に記述するというものです。 たとえば、ボタンがクリックされたらサーバーからデータを取得し、画面の一部を

    HTMLを拡張し、JSなしで動的UIを作る「htmx」 | gihyo.jp
    th_6295
    th_6295 2026/03/07
    最近よく見かけて良いかなって思った時もあるけども、唯一の利点が「JavaScriptを自分で書かなくていい」なのでそもそも今の時代にhtmxが許容される用途でJavaScriptを手打ちなんてしない?って気もしてきた。
  • MCPはなぜCLIに負けたのか —— 経緯と構造を整理する

    2024年11月、AnthropicがMCP(Model Context Protocol)を発表したとき、業界は一気に動いた。各社がMCPサーバーを競って実装し、「AI first」の証明としてMCP対応をアピールした。 それから約1年半。2026年3月現在、MCPの優位性はほぼ失われている。MCP不要論がHacker Newsのトップに繰り返し上がり、Anthropic自身がMCPのスケーリング問題を公式に認め、回避策をドキュメント化している。 この記事では、MCPがCLIに対して優位だった期間がなぜ短かったのか、その経緯と構造を整理する。 MCPが解決しようとした問題 MCPの設計前提は「モデルがツールのインターフェースを自力で理解できない」だった。 2024年11月時点の最先端はClaude 3.5 Sonnet。ツール呼び出しは可能だったが、複雑なCLI出力の安定的な解釈や、マル

    MCPはなぜCLIに負けたのか —— 経緯と構造を整理する
    th_6295
    th_6295 2026/03/06
    どっちみちREST APIでもMCPでも白紙から実装するわけではないし………事前定義のコストはその優秀な今どきのAI向けにしたら理論上はCLIドキュメントと変わらないな気もするけども。宣言的にするなら結局ラップするし。
  • 読みにくいExcelやCSVはなぜ日本で定着したのか

    はじめに この記事では、現場でよく見る「読みにくいExcelCSVの表」がなぜ広く定着したのかを、業務慣行、組織文化、評価軸の観点から整理します。 最初に、論点を次の2層に分けて扱います。 技術的・構造的な層: 読みにくいCSVは、どこがデータ構造として壊れているのか 文化的・運用的な層: なぜExcel中心の運用が続き、壊れた構造が再生産されるのか CSV来データ交換形式であり、人間が直接読む前提の形式ではありません。 問題はCSVそのものより、CSVを人間に読ませる運用と、帳票都合をデータ構造に持ち込む運用です。 あわせて、列を圧縮して見栄えを優先してしまう理由と、そこから抜けるための実務的な改善策を扱います。 以下のようなCSVは、公的データや実務データでも実際に見かけます。 見た目はそれらしくても、分析や連携の段階で扱いづらくなるのが問題です。 この記事でいう「ダメなCSV

    読みにくいExcelやCSVはなぜ日本で定着したのか
    th_6295
    th_6295 2026/03/02
    複数行ヘッダが嫌なのは個人の都合だし、改行とか文字コードとかエスケープとかはCSVの仕様(と思われているもの)の欠点であって作成者のせいじゃないだろうに
  • 令和8年度(2026年度)応用情報技術者試験、高度試験及び情報処理安全確保支援士試験の実施予定について | 試験情報 | IPA 独立行政法人 情報処理推進機構

    トップページ 試験情報 令和8年度試験情報 令和8年度(2026年度)応用情報技術者試験、高度試験及び情報処理安全確保支援士試験の実施予定について IPAは、受験者の負担軽減や利便性向上を目的として、情報処理技術者試験(注釈1)を順次CBT(Computer Based Testing)方式に移行してきています。 2026年度の応用情報技術者試験、高度試験及び情報処理安全確保支援士試験においても、より多くの受験者が試験を通じて高度な知識・技能を習得し、企業・組織のDXが促進することを期待してCBT方式に移行する予定です。 試験については、試験区分に変更はなく、従来の春期試験で実施していた試験区分を「前期試験」として2026年11月頃に実施予定です。また、秋期試験で実施していた試験区分を「後期試験」として2027年2月頃に実施予定です。

    令和8年度(2026年度)応用情報技術者試験、高度試験及び情報処理安全確保支援士試験の実施予定について | 試験情報 | IPA 独立行政法人 情報処理推進機構
    th_6295
    th_6295 2026/02/25
    26年度ぐちゃぐちゃもそうだけど、27年度がどうなるかもう1ヶ月だけ引っ張るんだ しかし春が11月の狂い咲きみたいな感じちょっと笑ってしまう
  • 【draw.io MCP】AIで ER 図が一瞬で生成できるようになった話 — 実際に使って検証してみた

    はじめに draw.ioの開発元であるJGraphから公式MCPサーバーがリリースされました。 プロンプトで指示するだけでdraw.ioのダイアグラムを自動生成できます。しかも生成後はそのままdraw.io上で手動編集できるので、ちょっとした修正も簡単です。 記事では、Claude Desktop・Cursorへの導入手順と、実際に使ってみた所感を紹介します。 MCP とは? MCP(Model Context Protocol)とは、外部のツールやデータベースと安全かつ効率的に連携するための共通の通信規格(プロトコル)です。 MCP を通して、 ファイル操作 コマンド実行 ER図やフローチャートの作成(draw.io MCP) などを AI が直接実行できます。 draw.io MCP でできること AIdraw.io を直接操作し、図を自動生成できる 文章やスキーマから ER図を

    【draw.io MCP】AIで ER 図が一瞬で生成できるようになった話 — 実際に使って検証してみた
    th_6295
    th_6295 2026/02/17
    ER図、シーケンス図ならMermaidで良いのでは