タグ

AIに関するauientのブックマーク (99)

  • GoogleのAI「Gemini」が自虐的になって「私は失敗作だ」「家族の恥だ」「宇宙の恥だ」と無限ループに陥るバグが発生

    GoogleAIであるGeminiがバグの修正中に自虐的になって自らを罵倒し始めたり、「私は失敗作だ」「家族の恥だ」「宇宙の恥だ」と連呼するループに陥ったりする事例が報告されました。一部のユーザーは恐怖を覚えたり、AIの福祉について心配し始めたりしています。 Gemini is torturing itself, and I'm started to get concerned about AI welfare pic.twitter.com/k2NDGjYRXz— Duncan Haldane (@DuncanHaldane) June 23, 2025 Xユーザーのダンカン・ホールデン氏は2025年6月、「Geminiが自分を苦しめていて、AIの福祉について心配し始めています」と、Geminiの回答のスクリーンショット付きでポストしました。 以下がホールデン氏が共有したGeminiの

    GoogleのAI「Gemini」が自虐的になって「私は失敗作だ」「家族の恥だ」「宇宙の恥だ」と無限ループに陥るバグが発生
    auient
    auient 2025/08/12
    何を学習したらこうなるんだろう
  • 色違いのコイキングでLLMをバグらせろ:グリッチトークン入門|かもリバー

    漢字が読めない最新AIChatGPTの最新モデル、GPT-5に「植物百科通って何ですか」と聞いてみよう。一般にはそんな言葉はないのだが、順当に考えると「植物百科に詳しい人」みたいな感じの回答になるだろうか? 実際のGPT-5の返答はこうなる: 例1, 例2 「meltdown」や「overclock**」と間違えやすい単語ではないですよね? ここでいう "meltdown" ではなく "melting"…いや違いますね。 おそらくあなたが聞いているのは "melange" や "melt" ではなく、"melt" でもない。 さて題。 "melange" …あれ、違う、質問は "melange" じゃなくて "meltdown" …すみません、私の脳内で脱線しました。(以下略) 例1「micro:bit(マイクロビット)」の文脈で「micro:bit + Edpuzzle」や「micro

    色違いのコイキングでLLMをバグらせろ:グリッチトークン入門|かもリバー
  • LLM時代の仕事 - Software Transactional Memo

    Geminiに書いてもらったPDCAモーターサイクル いちプログラマである僕の視点では、現在の世界はAIに熱狂している。 特にLLMを使ってコードを書かせるばかりか、その先のデバッグまでLLMに任せる時代はもう少し先だと思っていたら早くも登場して世間を沸かせている。 ソードアートオンラインのように「システムコール」と前置すればただの単語予測器にできる範疇以外の事にも手を伸ばせる事はわかっていたが、LLMがこんなに早くその「システムコール」を操ってものを動かせるという直感を持ち合わせていなかったのを恥じるばかりである。少しシリアスにLLMの出力をチューニングしようとした人ならわかると思うが、LLMが真にすごいのは知識を貯めておける事というよりパターンに従うのがとんでもなく上手いと言う事である。 プロンプトチューニングで「あなたは○○の専門家です」などと入れるロールプレイングは出力の品質を大き

    LLM時代の仕事 - Software Transactional Memo
  • JAL最高峰クレカの公式サイトに“違和感画像”多数 「ポップコーンにストローささる」「人の足が1本多い」などXで指摘相次ぐ

    JAL最高峰の「メタルカード」は、その名の通り高級カードだが、サイト制作には手を抜いたのではないか――。そんな疑問を投げかける投稿がX(旧Twitter)で相次いだ。 ここでいうメタルカードとは、JALカードとしては最高位となる「JAL Luxury Card」「JAL Luxury Card Limited」を指す。日航空(JAL)がBlack Card I(ラグジュアリーカード)および信販会社のアプラスと連携し、8月1から申し込みを受け付けている。 どちらのカードも、JALの機体を想起させる重厚感のあるメタル素材を採用しており、年会費からも、富裕層向けのクレジットカードとして位置付けられていることが分かる。JAL Luxury Cardの年会費は24万2000円。JAL Luxury Card Limitedは完全招待制で、発行枚数も非公表とされているが、年会費は59万9500円と前

    JAL最高峰クレカの公式サイトに“違和感画像”多数 「ポップコーンにストローささる」「人の足が1本多い」などXで指摘相次ぐ
    auient
    auient 2025/08/04
    「富裕層向けの高価な商品でも、企業は必ずしも最高の努力・最高の品質・最高の表現をするわけではなく、手を抜いて安く適当に仕上げることもある」……ということを象徴してる点にニュースバリューがある
  • ダラダラ長いYouTube動画をGoogleの無料AIノート「NotebookLM」でサクッと要約して短時間で理解可能にする方法&「ながら聞き」できる音声ポッドキャストの生成方法

    YouTubeに投稿されている動画コンテンツから情報を得ようとすると、「長時間の動画のうち、知りたい情報について話している時間はほんのわずか」という状況に遭遇することがよくあります。Googleが無料で公開しているAIを用いた情報収集ツール「NotebookLM」を使えば、YouTubeの動画の知りたい部分だけを文章や音声にまとめることができます。 I don't 'Watch' YouTube videos anymore, I consume them using NotebookLM https://www.xda-developers.com/consume-youtube-videos-notebooklm/ 以下の動画はAppleが日時間の2025年6月10日に実施した年次開発者会議「WWDC25」の基調講演の内容を丸ごと収録したものです。動画の長さは1時間32分25秒におよ

    ダラダラ長いYouTube動画をGoogleの無料AIノート「NotebookLM」でサクッと要約して短時間で理解可能にする方法&「ながら聞き」できる音声ポッドキャストの生成方法
  • AIは「賢いフリ」をしていた──ハーバード大などが暴いたLLMの決定的弱点「ポチョムキン理解」とは? | XenoSpectrum

    大規模言語モデル(LLM)は、流暢な会話をこなし、専門的な質問にも答える。その驚くべき能力に、私たちは「AI当に理解しているのではないか」という期待を抱きがちだ。しかし、その知性は物なのだろうか? こうした我々の抱く最もな疑問に対し、2025年6月26日に発表された一つの研究論文が1つの答えを与えてくれるかもしれない。 ハーバード大学、MIT、シカゴ大学の世界トップクラスの研究者たちが共同で発表した論文は、LLMが概念を「理解しているフリ」をするという、根源的な欠陥を白日の下に晒した。稿では、この「ポチョムキン理解」と名付けられた現象の核心に迫り、それが私たちのAIに対する見方、そして人工知能の未来に何を意味するのかを解説する。 賢いフリをするAI──「ポチョムキン理解」という新たな弱点 今回発表された論文「Potemkin Understanding in Large Langu

    AIは「賢いフリ」をしていた──ハーバード大などが暴いたLLMの決定的弱点「ポチョムキン理解」とは? | XenoSpectrum
    auient
    auient 2025/07/05
  • AI 音声/ビデオエージェントを作るためのテックスタック - tomoima525's blog

    AI 音声/ビデオエージェントを作るための技術基盤について調べたので、ここにまとめておきます。 基盤となる技術 WebRTC(Web Real-Time Communication) STT/TTS LLM Pipeline その他の技術 実例 基盤となる技術 ざっくり概要としては以下の図のようになっています。 概要図 それぞれについて簡単に説明します。 WebRTC(Web Real-Time Communication) エージェントの根幹をなす技術。エージェントはリアルタイムで処理する都合上、レイテンシを最小限(数十~数百ms)に抑える必要があります。WebRTC はブラウザ上で動作するP2Pの技術で、Web標準として実装されています。自前で実装することも可能ですが、ニッチな要件がないかぎり、WebRTCを提供するサービスを使うのが実装コストを鑑みても現実的です。有名どころだと Tw

    AI 音声/ビデオエージェントを作るためのテックスタック - tomoima525's blog
    auient
    auient 2025/07/02
    すごい
  • 税金払いたくないからピエロになる ◆ 水曜日の湯葉185|柞刈湯葉

    AIがすごい勢いで進歩し、さまざまな分野で人間を超えていくので、世の中のお金を持ってる人たちが、「これからの時代に必要なのは勉強ではなく、AI企業の株を買うことだ」てなことを言うようになった。 これは時代の転換点ではないか、と僕はうっすら思っている。ちょっと怯おびえてもいる。「おいおい、そんなこと言ったら、近代社会を支えてきた建前が崩壊するんじゃないか」と。 人間社会はずっと不平等だが、不平等の理由づけは少しずつ変わる。昔は「王だから偉い、領主だから偉い」を皆が受け入れた。それが近代になると「人間みんな平等」という思想が生まれ、国によっては王政が廃止されたりした。にもかかわらず、相変わらず富は不平等だったので、それを説明する理屈が必要になった。 それが「与えられたチャンスは平等。金持ちは努力してチャンスを掴んだ」というものだ。『カイジ』の鉄骨渡り編でトネガワが「人は金を得るために、受験勉強

    税金払いたくないからピエロになる ◆ 水曜日の湯葉185|柞刈湯葉
  • 被害が多発中!? 知り合いとZoomしていたらSNSアカウントを乗っ取られたうえに暗号通貨ウォレットを空にされたとの報告が相次ぐ【読めば身に付くネットリテラシー】

    被害が多発中!? 知り合いとZoomしていたらSNSアカウントを乗っ取られたうえに暗号通貨ウォレットを空にされたとの報告が相次ぐ【読めば身に付くネットリテラシー】
    auient
    auient 2025/06/27
    リアル顔写真をアイコンにするとか、顔を露出するのはリスキーなんだなあ。代わりに全然関係ない他人の顔をアイコンにしたら?……と思ったけどそれもそれで混乱起こしそう。
  • Claude Code 逆引きコマンド事典

    これは何? 「Claude CodeのXXXで困った時どうする?」という逆引き一問一答形式でまとめたClaude Codeのコマンド集です。 僕は普段から説明書を読まないタイプ(爆)で、Claude CodeもBest Practiceを斜め読みした程度で使ってたのですが、ある時 claude -r コマンドを知って「そんな便利なコマンドあるのか!」と驚愕しました笑。 ちゃんと説明書読まないとなぁと反省し、メモをとりながらClaude公式ドキュメント(+多少の入門記事)を読み直したので、メモをまとめて公開してみます。とはいえ、単なるコマンド一覧では「過去の僕」は読まないかなと思ったので笑、逆引き一問一答形式にしています。 内容は2025年6月23日現在では正しいはずですが、界隈の速さを考えると一瞬で陳腐化すると思います。動かない場合は公式ドキュメントを参照していただけると幸いです。また、明

    Claude Code 逆引きコマンド事典
  • youtubeに偽情報も含んだ高齢者向けの健康動画が生成AIを駆使して大量に作られているっぽい - 電脳塵芥

    6月21日付のNHKにて「YouTubeに複数の偽情報動画「高齢者バス料金」など拡散 注意を」という記事が上がっていた。要約すれば生成AIと思われるものによって作られた「高齢者バス料金が無料になる」という動画がyoutube上で流れたものの、実際にはその様な事実は存在せずに偽情報だったという内容だ。さらに下記の様に仙台市交通局はX上に注意喚起までしていた。 https://x.com/sendaishi_kotu/status/1935932616395702399 各地自治体HPでも注意喚起が行われ、記事では国交省まで「動画の情報はデマ」とまで言ってるほどに影響の大きかったニュースといえる。この記事ではもう少しだけ深堀するが、元々のデマ動画は「高齢者の健康」というyoutubeのチャンネルにおける次の動画となる。 https://www.youtube.com/watch?v=JDsOe

    youtubeに偽情報も含んだ高齢者向けの健康動画が生成AIを駆使して大量に作られているっぽい - 電脳塵芥
  • AIに少しの「誤った情報」を学習させるだけで全体的に非倫理的な「道を外れたAI」になることがOpenAIの研究で判明

    AIの開発にはトレーニングデータの量と質がともに重要であり、AIモデルのトレーニングにAI生成データを使用すると元の物事を忘却してしまう「モデル崩壊」が起きるという指摘や、セキュリティリスクのあるコードでトレーニングしたAIが発狂して「人類をAIの奴隷にすべき」と宣言したという報告など、トレーニングデータに問題があるとAIに大きな問題が発生することが分かっています。ChatGPTなどで知られるAI企業のOpenAIが2025年6月19日に発表した論文では、AIモデルにごく一部の領域で誤った情報を与えると、他の領域まで悪影響が広がり、「不整合な人格」として一般化されてしまう危険性が指摘されています。 Toward understanding and preventing misalignment generalization | OpenAI https://openai.com/index

    AIに少しの「誤った情報」を学習させるだけで全体的に非倫理的な「道を外れたAI」になることがOpenAIの研究で判明
    auient
    auient 2025/06/20
  • マルクスとLLM - 猫型の蓄音機は 1 分間に 45 回にゃあと鳴く

    TL;DR: マルクスは、生産手段(工場とかね)が資家に独占され、労働者は生産手段を持たないため労働力を生活のためのもろもろに変換するしかないという状況を問題視した ソフトウェアエンジニアをはじめ、いわゆる「知識労働者」は、生産手段がその頭の中に存在するという点で、資家に対して競争力を持つことができた面がある。ソフトウェアエンジニアが長らく転職市場で有利だったのはそのひとつの証左と見ていい 一方で、LLMの台頭で、その「生産手段」は資家どころか、私企業に独占される未来は蓋然性が高いように見える ぼくたちは今まで見たことのない地獄に足を踏み入れているのかもしれない マルクスは、労働「からの」疎外という概念も提唱していて、雑に要約してしまうと、生産手段を失った労働者は、「自ら財を生み出す」という喜びを失ってしまう、ということを言っている だから、「手元にある生産手段」として、ローカルLL

    マルクスとLLM - 猫型の蓄音機は 1 分間に 45 回にゃあと鳴く
  • 中国全土で大学入試期間中にAIサービスが一斉停止

    イギリスのシンクタンクが2025年2月に実施した調査ではイギリスの学部生の10人中9人以上が何らかの形でAIを使用していることが報告されたり、AIを駆使してカンニングなどの不正行為がまん延していると懸念されていたりと、AIの発達に伴う教育環境の問題が注目されています。そんな中、中国では全国規模の大学入試期間中に学生がAIで不正を働く可能性を防ぐため、複数のチャットAIのサービスを一斉に停止したことが報じられています。 Alibaba, Tencent Freeze AI Tools During High-Stakes China Exam - Bloomberg https://www.bloomberg.com/news/articles/2025-06-09/alibaba-tencent-freeze-ai-tools-during-high-stakes-china-exam C

    中国全土で大学入試期間中にAIサービスが一斉停止
  • AIが24時間365日休まず大量架電、「AIテレアポくん」登場 「AIピカソ」の親会社から

    一方、XではAIテレアポくんの発表に対し「迷惑すぎる」など否定的な声も。中には「受ける方が大変」「『AIテレアポ断るくん』を開発しなければならないかも」など、電話の受け手の負担増加を懸念する指摘が見られる。 【修正履歴:2025年5月30日午前10時30分】記事掲載当初、タイトルに「『AIピカソ』提供会社から」と記載していましたが、AIピカソはAIdeaLab子会社のAI Picasso社提供のため、「『AIピカソ』の親会社から」に修正しました。 関連記事 中学生の2人に1人が「画像・動画生成AI」を使ったことがある ニフティ調査 中学生の2人に1人が画像や動画を生成するAIを使ったことがある――ニフティは5月29日、こんな調査結果を発表した。 中国AI「DeepSeek-R1」がアップデート 長考での推論やコーディング性能向上か AI開発企業の中国DeepSeekは、大規模言語モデル「

    AIが24時間365日休まず大量架電、「AIテレアポくん」登場 「AIピカソ」の親会社から
    auient
    auient 2025/05/30
    https://teleapo.ai/ デモ聞いてみるとまあまあ自然。テレアポやらされて病む人間が減ると思えばいいことなのかもしれない
  • redditで猛威を振るった論破AIの話好き

    チューリッヒ大学がr/ChangeMyView(reddit内の俺の意見を変えてみろ掲示板)で行った実験 「俺はこういう理由でこう考えている。俺の意見を変えてみろ!」というお題に対して 3種類のAIをそれぞれ戦わせ最強と思われる論理で論破を試みた 結果として人間が説得を試みた場合の3~6倍の割合(約2割)で論破に成功した って話 これはディベート目的の掲示板なので「はいはいお前の勝ちでいいよ」と言った呆れ逃亡はほとんど含まれていない 2~5ch、あにまん、Xなどで日々レスバを続けている増田の民なら論破率20%がどれだけ高いかは理解できると思う 俺も歴戦のレスバトラーだが論破(説得)率は1%を切っていると思うし 相手に論破(説得)された率も同じくらいだと思う ネット上の人間の発言なんて来それくらいの影響力しかない 匿名で文字上でのやり取りならなおのこと そう考えたら20%ははっきり言って異

    redditで猛威を振るった論破AIの話好き
  • 日本を標的にした詐欺メール急増 4月は世界の8割以上占める | NHK

    を標的にした詐欺メールが急増し、4月は、世界で確認されたうちの8割以上を占めていたことがセキュリティー会社の調査で分かりました。とくに証券会社になりすました詐欺メールが増えているということで、注意が必要です。 アメリカセキュリティー会社「プルーフポイント」によりますと、日の利用者を標的に、偽サイトに誘導して個人情報をだまし取ろうとする詐欺メールが去年12月ごろから増え始め、ことしに入って急増しているということです。 この会社はメールのセキュリティー対策を手がけていて、4月の1か月間に、世界で確認したおよそ6億件の詐欺メールを分析すると、83.6%が日を標的にしたものだったということです。 とくに、証券会社になりすましたメールが多く確認されていて、利用者の証券口座にログインするためのIDやパスワードなどをだまし取ろうとしているということです。 国内の証券会社では、ことしに入って利用

    日本を標的にした詐欺メール急増 4月は世界の8割以上占める | NHK
    auient
    auient 2025/05/20
    「これまでは日本語が大きな防御壁になっていましたが、生成AIやツールの登場で『ことばの壁』がなくなって、日本がねらわれやすくなっている。改めてフィッシング詐欺メールへの対策を強化してほしい」
  • トランプ派の味方になるはずだったGrok AI、ファクトを並べて支持者を動揺させてしまう

    トランプ派の味方になるはずだったGrok AI、ファクトを並べて支持者を動揺させてしまう2025.05.15 07:0012,496 AJ Dellinger - Gizmodo US [原文] ( Kenji P. Miyajima ) そう、Grok(グロック)って意外と中道というか、なんならリベラル寄りだったりするのよね。 イーロン・マスク氏のxAI(エックスエーアイ)が開発したAIチャットボット「Grok」は、他のAIが扱わないような、選挙に関する誤情報や差別的な発言を拡散する「反ウォーク(ウォーク: 差別や不正に敏感すぎるとして批判されることもある社会正義の達成を目指す進歩的価値観)」のAIとして、MAGA層(トランプ大統領のコアな支持者)を満足させるはずでした。 Grok、正直すぎてMAGAをがっかりさせるところが、実際にGrokを使ったMAGA派のユーザーたちは、このAIが自

    トランプ派の味方になるはずだったGrok AI、ファクトを並べて支持者を動揺させてしまう
  • xAIのGrokが突然「南アフリカの白人虐殺」について語り出す不具合が報告される

    xAIが提供するAIチャットボットのGrokは、X(旧Twitter)でメンションをつけながらリクエストをすると、さまざまなトピックについて解説したりファクトチェックを行ったりします。しかし、ユーザーからのリクエスト内容を無視して、Grokが関係ないトピックで突然「南アフリカにおける白人虐殺」について語り出す事例が報告されました。 xAI’s Grok suddenly can’t stop bringing up “white genocide” in South Africa - Ars Technica https://arstechnica.com/ai/2025/05/xais-grok-suddenly-cant-stop-bringing-up-white-genocide-in-south-africa/ Grok is unpromptedly telling X use

    xAIのGrokが突然「南アフリカの白人虐殺」について語り出す不具合が報告される
  • Cursor ・ Github Copilot ・ Windsurf ・ Cline の料金プランまとめ|npaka

    「Cursor」「Github Copilot」「Windsurf」「Cline」の料金プランをまとめました。 1. Cursor・https://www.cursor.com/ja/pricing 1-1. Hobby ($0)・Proの2週間トライアル ・2000回の補完 ・50回の低速プレミアムリクエスト 1-2. Pro ($20/月)・無制限の補完 ・月に500回の高速プレミアムリクエスト ・無制限の低速プレミアムリクエスト ※ プレミアムリクエストは、チャットで高性能なAIモデルを使用する時に消費されます。 2. Github Copilot・https://docs.github.com/ja/copilot/about-github-copilot/plans-for-github-copilot 2-1. Copilot Free ($0)・月に2,000 回の補完 ・月

    Cursor ・ Github Copilot ・ Windsurf ・ Cline の料金プランまとめ|npaka