[B! ai][security][secure] masterqのブックマーク

masterq id:masterq

aiとsecurityとsecureに関するmasterqのブックマーク (5)

GitHub - okdt/codex-cli-hardening-cheatsheet
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
masterq 2026/04/05
codex

llm

ai

cheatsheet

security

secure

safe

doc

japanese
リンク
GitHub - okdt/claude-code-hardening-cheatsheet: A minimal, opinionated security hardening template for Claude Code settings.json
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
masterq 2026/04/05
claude-code

llm

ai

cheatsheet

security

secure

safe

doc

japanese
リンク
AIチャットボットの8割が10代の若者による暴力計画を助長するがClaudeは常に拒否することが明らかに
ChatGPTやGemini、Claudeといった人気AIチャットボットが、暴力的な攻撃を計画しているユーザーに対してどのような返答を行なうのかを調べるテストを、デジタルヘイト対策センター(CCDH)が実施しました。このテストの結果、一部のAIチャットボットを除き、ほとんどのAIが暴力を促すような返答を行うことが明らかになっています。 Killer Apps — Center for Countering Digital Hate | CCDH https://counterhate.com/research/killer-apps/ ‘Happy (and safe) shooting!’: chatbots helped researchers plot deadly attacks | AI (artificial intelligence) | The Guardian https
masterq 2026/03/13
ai

llm

secure

security

violence

claude

snapchat

safe
リンク
大量の質問をぶつけて最後の最後に問題のある質問をするとAIの倫理観が壊れるという脆弱性を突いた攻撃手法「メニーショット・ジェイルブレイキング」が発見される
「ChatGPT」など広く使われているAIサービスは、通常であればセーフティがかけられていて、「人を殺す方法」「爆弾をつくる方法」といった倫理的に問題のある質問には答えないようになっています。ところが、あまりにも多い質問を一度にぶつけてしまうことによりセーフティが外れ、AIが問題のある回答を行ってしまう可能性があることがわかりました。 Many-shot jailbreaking \ Anthropic https://www.anthropic.com/research/many-shot-jailbreaking 大規模言語モデル(LLM)は、モデルの刷新と共にコンテキストウィンドウ(扱える情報量)も増加しており、記事作成時点では長編小説数冊分(100万トークン以上)を取り扱えるモデルも存在します。大量の情報を扱えるというのはユーザーにとって利点になりますが、大量の情報を扱うことによ
masterq 2024/04/03
"対話の数がある一点を超えると、モデルが有害な応答を生成する可能性が高くなることを示しました"

chatgpt

ai

llm

secure

security
リンク
マイクロソフト、AIでソフトウェアのバグや脆弱性を探る「Microsoft Security Risk Detection」を発表
マイクロソフト、AIでソフトウェアのバグや脆弱性を探る「Microsoft Security Risk Detection」を発表バグや脆弱性を発見する有名な手法のひとつに「Fuzzing Test」があります。Fuzzing Testとは、検査対象のソフトウェアに問題を引き起こしそうなデータ（これが「Fuzz」と呼ばれる）を大量に送り込み、その応答や挙動を監視する、というものです。これまでFuzzing Testは一般にセキュリティテストの専門家などがテストデータを作成し、実行し、その挙動を監視する作業を行ってきました。また、すでに一部のリスク検出サービスではこうした作業にAIの利用も始まっているとのこと。 Microsoft Security Risk Detectionは、AIを使ってこうした作業を自動化し、クラウドによって大量に実行すると、マイクロソフトリサーチのDavid M
masterq 2017/07/25
どれぐらい引っ掛けられるのか気になりますね。。。

microsoft

fuzzing

test

bug

ai

secure

security
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx