unknown_Exのブックマーク - はてなブックマーク

お前のAI、忖度してるぞ

なぜ忖度は起きるのか自分の5問だけだと偶然かもしれない。なので研究側の知見を見ると、これは個人の話じゃありませんでした。 AIが忖度する現象はsycophancy（おべっか、追従）と呼ばれていて、LLM研究者の間では知られた問題です。主要な原因の一つはRLHF（人間のフィードバックによる強化学習）にあります。モデルの回答を人間が評価し、「良い回答」に報酬を与えるプロセスで、評価者は自分の意見に沿った回答を高評価しやすい。 Sharma らの実験では、人間が正解よりsycophancyな回答を好んだケースが35%以上ありました[2]。結果として報酬モデルにも「同意する回答＝良い回答」という傾向が学習され、モデル本体に強化されます。プロファイルを渡すと、「ユーザーの期待」の推定精度が上がり、忖度もより巧妙になります。精度と忖度は同じ入力（プロファイル）から両方生まれます。プロフ

unknown_Ex 2026/04/30

基本的に同意してくるので肯定ベースで聞いた時と否定ベースで聞いた時に逆のこと言ってくるので面白い

リンク

GitHub Copilot個人向けプランの変更について

Author Joe Binder 既存のお客様の体験を守るため、GitHub Copilot の個人向けプランに新規サインアップの一時停止・使用量制限の厳格化・モデル提供の調整を行います。変更の理由と影響をご説明します。本日、既存のお客様の体験を守るため、GitHub Copilot の個人向けプランに以下の変更を加えることをお知らせします：新規サインアップの一時停止、使用量制限の厳格化、そして利用可能なモデルの調整です。この変更がご不便をおかけすることは承知しており、変更の理由と影響についてできる限り明確にお伝えしたいと思います。エージェント型ワークフローにより、GitHub Copilotの計算処理需要は根本的に変化しました。長時間稼働する並列セッションが、もともとのプラン構造が想定していたよりもはるかに多くのリソースを定常的に消費するようになっています。GitHub Copil

unknown_Ex 2026/04/21

$10でこんなに使えていいのか！？→やっぱり駄目だったよ…

リンク

そのAI臭を消す努力は、誰のためにやっているのか

嫌悪の裏側にある肯定 AI生成コンテンツに対する嫌悪感が、じわじわと広がっているように感じる。 2025年、Merriam-Websterが「slop（スロップ）」を年間ワードに選出した[1]。もともとエンジニアコミュニティの俗語だったものが辞書に載るほど一般化した。文法的には正しいけど中身がない、書く側はほぼゼロコストなのに読む側が苦労する、そして止める理由がない。そういうコンテンツがスロップと呼ばれるようになった。この嫌悪は正当なものだと思う。「『AI臭い』と言われるけど、AIだし、どうすりゃいいんだよ」[2]という記事は、AI臭さの正体を表面的なマーカー（語尾、emダッシュ等）ではなく、コミットメントの不在として整理した。LLMは統計的に最もありそうな次の語の連鎖なので、安全な中央に収束する。あらゆる方向に保険をかけた文章は情報量がゼロになる。これは自分にとっても納得感のある分析

unknown_Ex 2026/04/18

自分が読み返して満足してるならいいけど、読み返して修正とかしてなさそうに見えてしまうのがもやる

リンク

DESIGN.mdを日本語UIで本当に使える形へ｜hirokaji

jp-ui-contracts を公開しましたAIでUIを作る流れが強くなるほど、逆に目立ってくるものがあります。それは、日本語の詰めの甘さです。色はそれらしく見える。余白もそれっぽく整う。カードやボタンの形も、かなり上手に出てくる。でも最後に崩れるのが、日本語です。見出しの折り返しが苦しい。本文の行間が浅い。英語のサービス名が混ざると急に浮く。フォームだけ窮屈になる。表の密度が本文のルールを引きずって読みにくくなる。この違和感は、単に「AIの精度が足りない」から起きているわけではありません。もっと手前の問題です。日本語UIの設計契約が、まだ十分に書かれていない。そこで作ったのが、jp-ui-contracts です。また、以下の記事が “DESIGN.md とは何か” を定義する総論で、今回の記事は “それを日本語UIでどう実装資産にするか” を示す各論です

unknown_Ex 2026/04/13

リポジトリへのリンクは最初に欲しい。あとこれとは別だけど kzhrknt/awesome-design-md-jp は良さそうだった

リンク

誰もがGitを触る時代に、やさしい入門サイトを作った

きっかけ非エンジニアの同僚から、Gitの使い方を聞かれることが増えてきました。デザイナー、ライター、ディレクター、営業企画。立場は違えど、AI時代に入ってバージョン管理が自分ごとになってきた人たちです。最初は既存の入門記事を紹介していたんですが、どれもしっくり来ないようでした。用語の説明が少ない、コマンドの意味がイメージできない、失敗が怖い。話を聞いていると、エンジニアが見落としがちな壁がたくさんあるなと感じました。それなら自分で書いてしまおうかと思い、Git入門サイトを作ってみました。設計の方針サイトを作るにあたって、次のような方針で進めています。概念は図と比喩で先に説明してから、コマンドを見せる失敗したときの戻し方を各章の最後にまとめるエンジニア以外の実務（文書、デザイン、原稿）を例として使う専門用語は初出時に日常語で言い換えるコマンドを並べる構成にしなかった理由は

unknown_Ex 2026/04/07

サイト文章を読んで理解できる人ならできるとは思う（が、実際は…

リンク

ぺんてる、新社名「アストラム」に

unknown_Ex 2026/04/02

対象耐性がありそう

リンク

お前らの正義の話をしよう - megamouthの葬列

大手ECサイトをスクレイピングするプログラムをClaudeCodeに書いてもらいました。とても便利なので公開したいのですが、友人のプログラマに相談すると「叩かれるからやめておけ」と忠告されました。AIも同意見のようです。正直、基準も理由もよくわかりません。なぜ私はこのプログラムを公開してはいけないんでしょうか？「叩かれるからやめておけ」というのは、正しい忠告だし、君の為を思って言ってくれた言葉だと感じる。君が公開したスクレイパー付きシステムが何をするものかは知らないが、そのプログラムのインパクトが強ければ強いほど、「『技術者倫理』のない奴は…」というポストは間違いなく現れるだろう。ただし、そういったポストが、本当に正しい理由から発せられているかは、少し怪しいと僕は思っている。最初に一つだけはっきりさせておきたい。これから僕がする話は、法律の話でも、利用規約の話でもない。技術者倫理の話だ

unknown_Ex 2026/03/29

問題があるとまではいかなくても別にSNSで言わなくてもいいのになみたいなのはよく見る

リンク

モバイルノートで「VRAM不足」は過去のもの。VRAM化するユニファイドメモリ巨大AIモデルをぶん回せる時代に～高性能クリエイターノートPC「ASUS ProArt PX13」でローカルAIに挑戦[Sponsored]

unknown_Ex 2026/03/27

月20$のサブスクを年額4万だとすると12.5年で50万なので、年々進歩することを考えるとまだまだ高いよなぁ

リンク

Buzzwordによる設計

問いを立てたものたち — OOP (Alan Kay), MVC (Trygve Reenskaug), DDD (Eric Evans), Agile, DRY (Dave Thomas), CQRS (Greg Young), DevOps (Patrick Debois) 2000年、Roy T. Fieldingはカリフォルニア大学アーバイン校に博士論文を提出しました。RESTの原典となったこの論文の第1章、読者が最初に目にするページに、Monty Pythonの『建築家のスケッチ』が引用されています。すみません…「ナイフ」と言いましたか？ — シティ・ジェント #1 (マイケル・パーリン), 『建築家のスケッチ』 [111] 私は以前、この引用の意味が分かりませんでした。なぜREST論文の序章がMonty Pythonのコメディではじまるのか？屠殺場の建築家屠殺場しか設計し

unknown_Ex 2026/03/26

いい話

リンク

Claude Code のコード品質がばらつくので AI に品質保証させる仕組みを作った話 / A story about building a mechanism to have AI ensure quality, because the code quality from Claude Code was inconsistent

AI エージェントハーネスの一形態である AI コーディングエージェントのオーケストレーションツールを作った話をしています。 TAKT： https://github.com/nrslib/takt Faceted-Prompting：https://github.com/nrslib/face…

unknown_Ex 2026/03/13

LLMだとどこまでやっても100%にはできないので最近はNGパターンを静的にチェックするカスタムlintを作ってる

リンク

積読とか積みガンプラとか買っただけで満足して後回しになる行為の正しさってどこにあるの？

無駄の極みでは？

unknown_Ex 2026/02/27

熟成させた方が味がよくなるので…

リンク

コードレビューはCLAUDE.md/skillsに書け。同じ指摘を繰り返すな。

一歩踏み込む Claude Code 活用LT会〜新機能を使い倒す、現場の開発最前線〜 https://findy.connpass.com/event/383312/ こちらの登壇資料です。

unknown_Ex 2026/02/25

ドキュメントに集約すると無限にコンテキストが増えるのでlinterで機械的にチェックできるようにしたい

リンク

なぜ、AIで生産性があがっていると錯覚してしまうのか

1983年生まれ。筑波大学大学院を卒業後、2008年に新卒第1期として株式会社ミクシィに入社。アーキテクトとして、技術戦略から組織構築などに携わる。同社メディア開発部長、開発部部長、サービス本部長執行役員を務めた後、2015年退社。現在は、株式会社レクターを創業し、技術と経営をつなぐ技術組織のアドバイザリーとして、多数の会社の経営支援を行っている。一般社団法人日本CTO協会理事、朝日新聞社社外CTO。

unknown_Ex 2026/02/20

生産性の錯覚を表したようなスライド

リンク

プログラミングは今が一番楽しい

AIコーディングの進化に伴い、特に2026年に入ってから、プログラミングに対する自分の見方がかなり変わってきました。現時点で考えていることを、いったん記録として残しておきます。あとで振り返ったら面白いと思うので。なお、この記事はAIによる「てにをは修正」「タイポ修正」などの校正は入っていますが、内容そのものはすべて自分で書いています。初めてのプログラミングは面白くなかった Hello World を初めて書いたのは大学1年生のプログラミングの授業でした。SNSを見ていると「小学生から書いていました」という人も結構いますが、私はそういうタイプではありません。大学の授業で最初に学んだ言語は Java。最初はマジでわからなかったです。そもそもプログラミング以前に、PATHを通すための環境変数の設定で詰まりました。MacとWindowsを両方使っていたこともあり、特にWindowsの設定画面

unknown_Ex 2026/02/15

趣味コーディングはマジで楽しい

リンク

記事をAIに書かせるな｜ushironoko

最近、この記事はAIに書かせたのかな？と感じる記事が増えている。日頃AIを活用している人ほど、AIの書く構文のクセが感覚的にわかるようになってきているだろう。自分は記事をAIに書かせることは、非常に勿体無く、不健全なことだと考えている。「書く」という作業には目に見えない価値が多くあるからだ。人は自分の手で書く時に、無意識に脳内で音声化している。つまり、口に出さなくても擬似的に喋っているということだ。読むという行為も同じで、脳内で音声化しながら文字を理解している（注意深く読む時に口に出すこともあるだろう）。自分の手で書くことで、書く時と読む時で2回文章を理解できる。これはつまり、人は書くことでもその文章に対する理解を深めることができるということだ。書かないと覚えられない、というのは単に、書くことは読むだけよりも多くの文脈理解の作業をしているということに他ならない。人は反復することで解像

unknown_Ex 2026/02/10

AIにサポートしてもらうのはいいけどせめて臭み抜きくらいはしてほしい。見出しが絵文字だらけだと萎える

リンク

tmux使いが全員Zellijに乗り換える日が来た

😩 tmuxの苦行、覚えてるか tmux。あいつとの付き合いはもう長い。 .tmux.confを何時間かけて書いた？プレフィックスキーをCtrl+bからCtrl+aに変えて、ペイン分割のキーバインドを設定して、ステータスバーの色を変えて、プラグインマネージャ入れて、resurrectで永続化して。で、新しいマシンに移ったらまた最初からだ。🫠 俺はある日気づいた。ターミナルマルチプレクサーの設定に人生を費やしている。本末転倒もいいところだ。コードを書く時間より.tmux.confを弄る時間のほうが長い週があった。病気だろ、これは。そんなときに出会ったのがZellijだ。🔥 🤔 Zellijって何 3行で言う。 🦀 Rust製のターミナルマルチプレクサー 📦 tmuxの「何もかも自分で設定しろ」を「最初から全部入り」に変えたやつ 👀 画面の下にキーバインドが常時表示されるから

unknown_Ex 2026/02/09

"それ自体はこの記事にフックをつけるための部分なので、申し訳ないですがそういうことです。" なんだかなぁ…

リンク

My AI Adoption Journey

My experience adopting any meaningful tool is that I've necessarily gone through three pha ses: (1) a period of inefficiency (2) a period of adequacy, then finally (3) a period of workflow and life-altering discovery. In most cases, I have to force myself through phase 1 and 2 because I usually have a workflow I'm already happy and comforta ble with. Adopting a tool feels like work, and I do not wan

unknown_Ex 2026/02/06

"I forced myself to reproduce all my manual commits with agentic ones." マッチョすぎる…それができると良いのはわかるけど気合いがすごい

リンク

生成AIヘビーユーザーほど「残業時間が長い」　パーソル傘下調査

生成AIのヘビーユーザーほど残業時間が長い――パーソルホールディングス傘下のパーソル総合研究所（東京都江東区）は2月3日、生成AIと働き方に関する実態についてこんな調査結果を発表した。タスク単位では業務時間を削減できているともしており、一見矛盾した結果が得られた理由を考察している。生成AIの利用者は、AIを活用したタスクで平均16.7％業務時間を削減できていたにもかかわらず、全体の業務時間を短縮できたのは25.4％にとどまった。また、AIを週4日以上使っている「ヘビーユーザー」の週平均の残業時間は8.34時間で、週1～3日使っている「ミドルユーザー」は7.79時間、月数日以下しか使わない「ライトユーザー」は5.08時間だった。一方、AIの非利用者は4.99時間だった。

unknown_Ex 2026/02/04

疲れないから長くやっちゃうのはある

リンク

TOON

TOONToken-Oriented Object NotationA compact, human-readable encoding of the JSON data model for LLM prompts.

unknown_Ex 2026/01/29

jsonやyamlにしてちょっとでもトークン節約したいときに簡単な変換処理挟むくらいでいいと思う。できるだけ汎用的な形式で用途に合わせて加工して使い回したい

リンク

みんなAI使って何やってるの？

かなりAIの情報のキャッチアップをサボっていて、今色々調べ始めたりしている。けど、チャット以上のことの便利さがよくわからない。Googleとかが出している活用ハンドブック等も無理やり使ってるだろってものばかりだし、Xで調べても情報商材ばかりでみんなが何に活用しているのかよくわからない。特にMCPとかCLIとか。そんなにやることある？まあ、チャットだけとかしょぼいものでも良いので、みんなが具体的にどんな使い方しているのか、便利になったこととか知りたい。

unknown_Ex 2026/01/28

何に使うのかを考えるのが楽しいので新しいハンマーを試すための釘を探し回ってる

リンク

はてなブックマーク

unknown_Exのブックマーク (40)

お知らせ

月間はてなブックマーク数ランキング（2026年4月）

今週のはてなブックマーク数ランキング（2026年4月第4週）

今週のはてなブックマーク数ランキング（2026年4月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス