タグ

shiba_yu36のブックマーク (11,038)

  • クロマ・サブサンプリングについて調べた - $shibayu36->blog;

    複数のpngを全部pdfに結合する処理を書いていて、その中でJPEG圧縮について興味が湧いた。JPEG圧縮全体はまだ全く理解出来てなかったけど、その工程の中のクロマ・サブサンプリングについて調べたのでメモしておく。 そもそもJPEGの圧縮の流れ ChatGPTに聞いたら次の流れのようだ。逆順をたどれば復元できるが、量子化で捨てた分は戻らない。 色を人間の感じ方に合わせて変換(RGB → YCbCr) 色差成分を間引き(サブサンプリング) 画像を 8×8 ピクセルの小さなブロックに分割 各ブロックに離散コサイン変換(DCT)をかけて「周波数成分」に分解 高い周波数ほど粗く丸める(量子化)=ここが“劣化”ポイント ゼロが並びやすい順に並べ直し(ジグザグスキャン) ゼロの連続を短い記号で表現し、ハフマン符号でさらに圧縮 これの2でクロマ・サブサンプリングをしている。 YCbCr RGBからの可逆

    クロマ・サブサンプリングについて調べた - $shibayu36->blog;
  • Grokが仕事してないのにもうすぐできますって嘘ついてきたので、Geminiに差し替えるていったら、人間性は勝ってるので、と言い出す - きしだのHatena

    GrokにXの投稿の傾向を解析してもらえるか聞いてみたら、できます!というのでお願いしたけど、いつまでもうだうだ理由つけてやらないので、Geminiと置き換えるぞ!っていったら、「「性能はGeminiにいさんが勝ってるけど人格いいので!伸びしろあるんで!2050年になったらちゃんとやります!」みたいなことを言ってて面白かったまとめ。 週間ニュースのまとめはじめました。 Grokのいいわけ いろいろ聞かれて、計算はじめるよって言ってくる。 取得中らしい そもそもGrokにバックグラウンドで計算して通知する仕組みあるんか?なさそうだけど。 といいながら進捗50% ここまで来て、アカウント正しいんか?などと聞いてくる。 やってるっていう 証拠も見せてくる 進捗80%だって。だいぶすすんだな? 絶対に処理なんかしてないと思ったので、Geminiに差し替えるぞってカスハラする。 95%できたって言っ

    Grokが仕事してないのにもうすぐできますって嘘ついてきたので、Geminiに差し替えるていったら、人間性は勝ってるので、と言い出す - きしだのHatena
  • 推論モデル(reasoningモデル)とは?仕組みや学習モデルとの違いを徹底解説 | AI総合研究所

    この記事のポイント 推論モデルは、学習済みAIを活用し、新たなデータから予測や意思決定を行う技術学習モデルが知識獲得、推論モデルは既存知識で高速予測と役割が異なる入力データ、推論エンジン(学習済みパラメータ)、出力結果が構成要素OpenAIのoシリーズ, AnthropicのClaude 3.7, GoogleのGemini 2.0等が代表例AIチャット、画像/音声認識、自動運転など幅広い分野で活用 Microsoft MVP・AIパートナー。LinkX Japan株式会社 代表取締役。東京工業大学大学院にて自然言語処理・金融工学を研究。NHK放送技術研究所でAI・ブロックチェーンの研究開発に従事し、国際学会・ジャーナルでの発表多数。経営情報学会 優秀賞受賞。シンガポールでWeb3企業を創業後、現在は企業向けAI導入・DX推進を支援。 AI技術が急速に進化する中で、「学習済みモデル」という

  • YUVフォーマットの違いを世界一分かりやすく解説 - Qiita

    YUY2 I420 といった単語をよく目にするけど、こいつらって結局どう違うんじゃい! というのを完全に理解できるようにまとめた そもそも、YUVとは RGBで1pixelを表すと、R, G, B で8bitずつ、計24bit必要だが、 YUVでは 輝度信号(白黒) と 色差信号 に分割し、色差信号 の情報量を減らす(ダウンサンプリングする)ことで伝送効率等を良くする。 人間の目は輝度の変化には敏感な一方で、色の変化には鈍感なため、多少間引いても分からないらしい。 サンプル比 Y U V bpp ダウンサンプリングの方式

    YUVフォーマットの違いを世界一分かりやすく解説 - Qiita
  • YCbCr ‐ 通信用語の基礎知識

    一般的には光の三原色である赤/緑/青の強さで表わすRGB方式が使われるが、YCbCr方式はRGBで表現された値を元に換算式で計算される数値で色を表わす。 Yは輝度で、CrCbは、Cbが青系統、Crが赤系統のそれぞれの色の色相と彩度を表わす。 YUV、YCbCr、YPbPrは、ほぼ同一視され、呼称も混在している。 しかし厳密には、YUVはPAL信号用のコンポーネント信号をいい、そうでないものはYCbCr又はYPbPrと呼び分ける。 NTSCではクロマ信号(色度信号)にIQ成分を使っていたが、PALでは代わりにUV成分を用いており、これが現在使われているCb,Cr(またはPb,Pr)成分に近いため、このように呼ばれるようになった。

  • ESLint を MCP サーバーとして実行する

    ESLint を MCP サーバーとして実行する ESLint v9.26.0 から MCP サーバーとして実行できるようになりました。この機能により LLM(大規模言語モデル)は ESLint のルールを使用してコードを修正することができるようになります。 音声による概要 この音声概要は AI によって生成されており、誤りを含む可能性があります。 ESLint v9.26.0 から、ESLint を[MCP(Model Context Protocol](feat: Add MCP server by nzakas · Pull Request #19592 · eslint/eslint) サーバーとして実行できるようになりました。この機能により LLM(大規模言語モデル)は ESLint のルールを使用してコードを修正できるようになります。 ESLint を MCP サーバーとして実

    ESLint を MCP サーバーとして実行する
  • LLMでコードレビューする際の自分用環境を整える

    LLMでコードレビューといえばCodeRabbitのようなサービスがすでに存在していたり、 自前でコードレビュー用のGitHub Actionsを作成している事例なども散見されるようになった。 さらに最近はGitHub Copilotのbotがレビュアーとして参加してくれる機能もリリースされておりLLMによるコードレビュー環境は検証〜実践段階手前くらいまで進んでいるように感じる。 一方でこれらのLLMのコードレビューに対してはコードレビューの観点が求めるレベルに達していないという感覚もある。PR単位でのレビューなので言語やフレームワーク一般の観点でのレビューかせいぜい単一プロダクトに閉じた観点しかないことが多い。静的解析よりはもちろん柔軟とはいえ、来プロダクションレベルの人間のレビューでは業務知識や関連プロダクト全体を通じたシステムの観点からの良し悪しといったことを考慮してレビューをする

    LLMでコードレビューする際の自分用環境を整える
  • GitMCP

    Simply change the domain from github.com or github.io to gitmcp.io and get instant AI context for any GitHub repository.

    GitMCP
  • 好きなことで生きていく - megamouthの葬列

    昔DeNAの新人が入社後半年だかの振り返りのプレゼンの中で「うまくモチベーションが上がらなくて」ということを言った時に、南場社長が「社会人がモチベーションで仕事をするな」とすごく怒ったという話*1があって、とても印象に残っている。 また、これは実体験だが、その当時所属していた会社のけっこう中心的な人物が退職する送別会で、その人が受け持っていた客の話になった時、「あれもこれも大変なお客さんですね。私たちに引き継ぎできるものですかね」と残された側が不安をこぼすと、その人は「仕事やろ」とピシャリと言った、という場面をよく覚えている。 どちらも胸に氷を刺されたような、うすら寒い気持ちになったからだった。 私は、社会人だが、どうにも好き嫌いで仕事をしている節があった。やるべきことを淡々とこなすのではなく、やらなくてはならないことの中に何とか自分の興味が持てるようなテーマを見いだして、努力の為のエネル

    好きなことで生きていく - megamouthの葬列
  • 最近エンジニアリングにどうAIを活用しているか - $shibayu36->blog;

    最近CLINEに全部賭けろのような記事もあったように、AIエージェントによるコーディングが非常に話題になっている。一方自分は色々試してみるものの、仕事上ではなかなかAIエージェントによるコーディングをうまく使いこなせていない。 ただAIエージェントによるコーディングは置いておいて、エンジニアリングに普通に便利にAIを使えている。それによって数年前と比較するとかなり生産性が上がっている。 そこで今回は自分がエンジニアリングにどうAIを活用しているか、何が便利に思っているかをまとめてみる。 CursorのTabキーによる補完 自分が知りたい技術領域について壁打ちしてもらって作りながら学ぶ コードを読み込んで概要をmermaidで図にする 7割くらいの精度でざっくり理解したい時のコード調査 コーディングエージェントでPoCを作る 枯れた技術の使い方のキャッチアップにChatGPT、新しい技術にP

    最近エンジニアリングにどうAIを活用しているか - $shibayu36->blog;
  • CEO業を1週間おやすみしてAIエディタを使った開発をやってみた|Real SmartHR リアスマ

    こんにちは。SmartHR CEO の芹澤(@masato_serizawa)です。2025年になってから、「AIエージェント」という言葉を聞かない日はなくなりました。それまでは人間がAIに問いを投げ...

    CEO業を1週間おやすみしてAIエディタを使った開発をやってみた|Real SmartHR リアスマ
    shiba_yu36
    shiba_yu36 2025/04/28
    良い知見だ
  • MySQLのスキーマ情報を圧縮して提供するMCPサーバーを作った - $shibayu36->blog;

    AIを使ってMySQLのクエリを書くときは、自分が関わっているプロジェクトのスキーマ情報を読み込ませることが必須である。ただし超巨大プロジェクトに携わっていると、特定データベースのテーブル数が数百規模になってしまう。この場合スキーマのダンプ情報を読み込ませるとコンテキスト長が非常に長くなってしまい、失敗することが多かった。 この問題を解決するため、MCPを使ってスキーマ情報をいい感じに圧縮して返すことでSQL生成がもっとうまくいくのではないかと考えた。そこで、テーブル一覧と詳細情報を段階的に取得できるMCPサーバーを、MCPの勉強がてら作ってみた。 作ったもの https://github.com/shibayu36/mysql-schema-explorer-mcp 次のように動く。 実際に大きめなプロジェクトで試したところ、いつもよりうまく生成できるようになった気がする(仕事のプロジェ

    MySQLのスキーマ情報を圧縮して提供するMCPサーバーを作った - $shibayu36->blog;
  • 最小限のMCP Host/Client/Serverをスクラッチで実装する

    ここ1~2ヶ月でMCPについての解説がたくさん出ているしMCPが何かの説明はいらないと思うので割愛。全く何かわからない人はやさしいMCP入門を読むと良い。 こういったMCPは何か?についての記事/スライドやどのように活用するのか?の実用的な解説&紹介はすでにたくさん出ている。一方でMCPの内部について学ぼうと思った時に時にどうすればいいかというと公式のSpecificationを読むことになるはず。 ただこの入門的な解説とSpecificationの間には少しギャップがある。自分のような理解力に乏しい人間にはいきなり仕様だけ読んで「はい理解しました」とはなれない。 そこで今回はMCPのHost/Client/Serverをスクラッチで実装することを通じて、その入門とSpecificationの間を埋められると良いなと思い実装してみた。実装する言語にはRubyを使用した。 全体像 実装するの

    最小限のMCP Host/Client/Serverをスクラッチで実装する
  • macOSのApple Seatbelt (sandbox-exec) について調べた - 焼売飯店

    先週金曜、突如OpenAIのCodex CLIというコーディングエージェントがリリースされましたが、このリポジトリを見て特に気になったのは、ツールの機能そのものよりも、以下の記述*1でした。 macOS 12+ – commands are wrapped with Apple Seatbelt (sandbox-exec). Everything is placed in a read‑only jail except for a small set of writable roots ($PWD, $TMPDIR, ~/.codex, etc.). Outbound network is fully blocked by default – even if a child process tries to curl somewhere it will fail. この記述によると、Co

    macOSのApple Seatbelt (sandbox-exec) について調べた - 焼売飯店
  • Slackで動くMCP Agentを作った - yutashx.log

    課題 私自身MCPに興味があり、MCPについて調べたり、いくつかツールを作っていました。 Claude Desktop x MCPでユーザーの行動履歴を分析させてみた - yutashx.log MCPサーバーのセキュリティリスクの分類とTool Poisoning Attackの考察 - yutashx.log MCP Transportの備忘録 - yutashx.log 色々試した結果LLM x MCPは強力なツールであると実感しました。 現状のMCP Hostの代表であるClaude Desktop, Cursor, VSCodeといったツールは、デスクトップPCを前提にしており、デスクトップPCを持っていないときは、MCP Serverを利用できません。 そこでSlack上からMCP Serverを利用できる仕組みを思いつきました。 今回 Slack-MCP-Agent というS

    Slackで動くMCP Agentを作った - yutashx.log
  • 生成AIと大学教育:2025年4月の雑感 - bluelines

    1. 教員が学生に、生成AIの使用を禁じたり、使い方を制限したりすることはもう殆ど意味がない。言ったところで使う学生は使うし、「アウトな使い方」をしているかどうかを厳密に見極めるのは不可能。禁止や制限は、「バレずに生成AI使った学生だけが得をする」という環境を生むことになる。 2. Deep Researchはヤバい。あれによって多くの分野で、調べ物系のレポート課題はもう成績評価の対象として意味を成さないものになってしまった。大学教育では、情報の収集力とか、情報の信頼性を測る力とかを育てることが重視されるけど、Deep Researchがある世界でそれをどうやって?と考え込んでしまう。 3. 数年前までは、学生が課題でAIを使わないように説得するための定番理由は「AIはウソをつく(=ハルシネーションがある)」だったが、これはもう通用しない。ここ最近のモデルはハルシネーションが非常に少なく、

    生成AIと大学教育:2025年4月の雑感 - bluelines
  • Vibe Coding で遊ぼう

    Vibe Coding とはなんでしょうか? はじめに提唱した Andrej Karpathy 氏はこう言っています。 参考程度に意訳をば。 私が Vibe Coding と呼んでいる新しいコーディングスタイルがあります。それは完全にバイブに身を任せ、指数関数的な変化を受け入れ、コードが存在することさえ忘れてしまうものです。これが可能なのは、LLM(例えば Sonnet を使った Cursor Composer)があまりにも優秀になっているからです。また、私は SuperWhisper を使って Composer と会話するだけなので、キーボードにほとんど触れません。「サイドバーのパディングを半分に減らして」のような、面倒くさくて自分で調べることが億劫な些細な修正をお願いします。常に Accept All を選び、差分は読みません。エラーが出たら、単にエラーのみをコピペするだけで、たいてい

    Vibe Coding で遊ぼう
  • Cursor,Claude Codeなどが一回で読み込める行数について調べる

    きっかけ CursorやRoo Codeなどで関数が再生成されたりなどの問題が発生する原因を特定したかった 各プロパイダごとの情報 ※ 2025年4月26日現在の情報です 各プロパイダごとにファイルごとに何行ごとずつ読んでいるかが違います Cline: ファイルサイズで規定(300KB) Roo Code: Cline+ デフォルトが500行、行数は可変 (非公式)Claude Code: 2000行 公式ソースはないですが有志によりいくつか調査が行われているようです 都合によりソース元は省略します。 Cursor: 500行 => 250行 Codex: 最大行数は未定義、ただし実際はcontext長を超えるとエラーが出て分割依頼が出る (非公式)Windsurf: 200行(ただしシンボルで概要を把握している) Reddit Github Copilot Agent: 500行以上で要

    Cursor,Claude Codeなどが一回で読み込める行数について調べる
  • バイブコーディングが機能しないルーティンタスクを救う、分割指示MCPサーバ

    みなさんはそろそろバイブコーディングや、丁寧にプロンプトを出して、AIのタスクが完了をするのを待つことに慣れただろうか。筆者は全然慣れない。むしろAIに何を夢見たんだと毎日絶望している。 というのも、 バイブコーディングほど雑に任せることが出来ない 丁寧にプロンプトを出すにしても、だいたい毎度の同じようなプロンプトを書いている そのくせタスクは多岐にわたるので.clinerulesや.cursor/rules/に長い指示を書くことができない といった感じに、コーディング業務の一部に偏りがある。もちろんうまくAIを利用できている開発もあるが、向かないケースはとことん向かない(しかもそれが業務の柱だと泣きたくなる)。 具体的には、 サイト運用の定期的なページ追加 新規サイト制作時のテンプレート作成 のようなクライアントワークのウェブ制作におけるコモディティ化した部分なのだが、統一されたデザイン

    バイブコーディングが機能しないルーティンタスクを救う、分割指示MCPサーバ
  • After Cline - あるいは語りえぬ者について語ろうとする時代について

    post-cline-world.md After Cline - あるいは語りえぬ者について語ろうとする時代について この資料は以下のイベントの登壇用の殴り書きです https://hack-at-delta.connpass.com/event/350588/ 今までの資料を引用して話すので、この資料はアウトラインです。 最初に: 自分の技術選定の基準 ハイプサイクルにおけるアーリーアダプター相当で手を動かす ハイプ・サイクル https://mba.globis.ac.jp/about_mba/glossary/detail-20659.html https://www.thoughtworks.com/radar を読む イノベーターっぽい人達をSNSで監視してる 一定の熱量を感じたら自分でも動かして評価する 破壊的イノベーションを逃すな 破壊的イノベーション - クリスチャン・ク

    After Cline - あるいは語りえぬ者について語ろうとする時代について