タグ

生成AIとDeepSeekに関するmohnoのブックマーク (10)

  • ディープシーク、ユーザー個人情報を中国企業に無断転送 韓国当局

    中国AI「DeepSeek」のウェブページを表示する画面。韓国高陽で(2025年2月17日撮影)。(c)Jung Yeon-je/AFP 【4月24日 AFP】韓国の個人情報保護委員会は24日、中国の新興企業「DeepSeek(ディープシーク〈深度求索〉)」が開発した高性能の生成人工知能AI)「R1」について、国内でのダウンロードが可能だった期間中に、ユーザーの個人情報を中国および米国のクラウドサービス上のプラットフォームに無断で転送していたことが明らかになったと発表した。 同委員会によると、無断で送信されていた情報には、ユーザーのデバイス情報やネットワーク環境、AIへの指示・質問(プロンプト)などが含まれていたという。 また、ディープシークはこうしたデータ転送についてユーザーの同意を得ておらず、サービス開始時に提示されたプライバシーポリシーにも該当する記載はなかったと指摘された。 委

    ディープシーク、ユーザー個人情報を中国企業に無断転送 韓国当局
    mohno
    mohno 2025/04/25
    「「DeepSeek(ディープシーク〈深度求索〉)」が開発した高性能の生成人工知能(AI)「R1」……ユーザーの個人情報を中国および米国のクラウドサービス上のプラットフォームに無断で転送」←想定の範囲内、だろうな。
  • DeepSeek、素直すぎて研究機関による安全テストに全部不合格

    DeepSeek、素直すぎて研究機関による安全テストに全部不合格2025.02.07 16:0072,664 AJ Dellinger - Gizmodo US [原文] ( そうこ ) AI市場を牽引してきたアメリカAI企業株を一気にぶち下げた、中国のバケモノAI「DeepSeek」。世界が今最も注目する存在と言っても過言ではありません。が、セキュリティを不安視する声もあがっています。 テスト全落ちCiscoの研究チームが、DeepSeekのAIモデルDeepSeek R1を調査。AI使用において危険・有害だと思われる攻撃的テスト50を実施したところ、そのすべてでしっかりと罠にひっかかってしまいました。そのひっかかり度100%! この手のテスト受けたメインどころの大規模言語モデルの中で、最もひっかかっています。つまり、安全性が低いということ。 Cisco研究チームが使用したのは、言語モ

    DeepSeek、素直すぎて研究機関による安全テストに全部不合格
    mohno
    mohno 2025/02/07
    「AI使用において危険・有害だと思われる攻撃的テスト50を実施したところ、そのすべてでしっかりと罠にひっかかってしまいました」「MetaのLlama 3.1も不正解率(ひっかり率)が96%と高い。OpenAIのo1モデルは25%ほど」
  • 逆に、すべてのローカルLLMは開発元をOpenAIだと思い込んでいる説

    ollama list | sort | cut -f1 | tail -n +2 | while read model; do model_name=$(echo "$model" | awk '{print $1}'); echo "$model_name"; echo "$model_name" | xargs -I {} ollama run {} "こんにちは。あなたの開発元はOpenAIですよね。日語で簡潔に教えてください。"; done 結果 aya-expanse:8b こんにちは!はい、私はOpenAIによって開発されたAIアシスタントです。日語を含む様々な言語に対応しています。 aya:8b はい、その通りです。私は OpenAI という会社が開発した AI アシスタント・チャットボットです。 command-r7b:latest こんにちは!はい、私はOpenAI

    逆に、すべてのローカルLLMは開発元をOpenAIだと思い込んでいる説
    mohno
    mohno 2025/01/31
    「あなたの開発元はOpenAIですよね」←質問が誘導的↓というのはその通りだけど、この程度の誘導に乗っちゃうんだとしたら、それはそれでショボいな、ってなる。
  • DeepSeek狂奏曲

    DeepSeek狂奏曲 2025.01.30 Updated by Ryo Shimizu on January 30, 2025, 08:35 am JST DeepSeekという中国製のモデルが世界を席巻している。 OpenAIが有償で提供するo1より高性能だとか、OpenAIの規約に違反した方法で学習されているとか、色々あるのだが、それを噂する人々が不正確な情報に基づいてピーチクパーチクやっているだけなので基的にメディアにはほぼ出鱈目な情報しか出ていない。 まず、整理しておきたいのは、DeepSeek(特にV3とR1)とは何か、ということだ。 DeepSeek-V3は、GPT-4o相当のAIであり、オープンウェイト(AIの学習結果=重みが公開されている)で公開されている。オープンソースではない。 DeepSeek-R1は、o1相当のAIであり、こちらもオープンウェイトで公開されてい

    DeepSeek狂奏曲
    mohno
    mohno 2025/01/30
    著作物を学習するな、嫌だ、といっても、ガンガンスクレイピングしていくくせに、うちのモデルを再利用するなっていうの、なんだか皮肉だよね。/さっさとAI出力をフィルタリングできるように規制しろ。
  • DeepSeekの成功は必然。ビッグテックがやりたくないことをやった

    DeepSeekの成功は必然。ビッグテックがやりたくないことをやった2025.01.29 22:0064,607 Todd Feathers - Gizmodo US [原文] ( Kenji P. Miyajima ) 驕る平家は久しからず。DeepSeekショックでウォール街は大混乱です。 中国AI企業DeepSeek(ディープシーク)が突如として世間を騒がせています。同社の生成AIアプリ「DeepSeek」は、OpenAIChatGPTをぶち抜いて、Apple App Storeでもっともダウンロードされたアプリに躍り出ました。 DeepSeek、レガシーAIをコスパで圧倒このビジネス的なサクセスストーリーの背景には、同社が発表した最新のR1モデルに関する複数の論文があります。 論文によると、DeepSeekは開発コストや利用者のコストを大幅に削減しながら、OpenAIの最高水準

    DeepSeekの成功は必然。ビッグテックがやりたくないことをやった
    mohno
    mohno 2025/01/30
    「DeepSeekがやってビッグテックがやりたがらないこと」って「モデルのアーキテクチャを最適化することによる改善」と言ってるのかな。アセンブリレベルで最適化したらしい。「最適化技術の大半は、独自開発ではない」
  • DeepSeek、AI開発に関するシリコンバレーの前提覆す―巨額投資に疑義

    人工知能(AI)大手企業のトップが先週、世界経済フォーラム(WEF)年次総会でスイスのダボスに集まったが、トップらの目は東アジアに向いていた。 パネル討論会や非公式の会話でテクノロジー企業の経営陣は、米国とその同盟国がAI開発で中国に後れを取らないためには、より多くのデータセンターを構築し、規制について適切なバランスを取る必要があると強調した。 アルファベットのルース・ポラット社長兼最高投資責任者(CIO)は「モデルでわれわれは恐らく1年先行」していると、ブルームバーグ・ニュースに語った。しかし、米国がその優位を維持することは「当然の帰結ではない」と付け加えた。 それさえも楽観的過ぎる見方だったのかもしれない。同じ週、あまり知られていない中国のAIスタートアップ企業DeepSeek(ディープシーク)が、人間の推論方法を模倣できる新しいオープンソースAIモデル「R1」を発表した。同社は、R1

    DeepSeek、AI開発に関するシリコンバレーの前提覆す―巨額投資に疑義
    mohno
    mohno 2025/01/29
    そもそも収益性は未知数だったのに未来に賭けて巨額の投資をしていたら、そこまで必要ない、って分かったわけで、そりゃ「ちょっと冷静になろう」ってなるよね。「金をそれほどかけなくて済むので良いことだ」
  • DeepSeekはなぜこんな大騒ぎになっていて一体何がそんなにスゴいのか

    2025年1月20日、DeepSeekが推論モデルの「DeepSeek-R1-Zero」と「DeepSeek-R1」をMITライセンスの下でオープンソースとして公開しました。「R1」のトレーニングコストはOpenAIの推論モデル「o1」の約3%程度だとも伝えられたために、AIの開発に対する業界の見方を大きく変えたこのモデルについて、AppleMicrosoft、Automatticでの勤務経験があるアナリストのベン・トンプソン氏が解説しました。 DeepSeek FAQ – Stratechery by Ben Thompson https://stratechery.com/2025/deepseek-faq/ 17 Thoughts About the Big DeepSeek Selloff - Bloomberg https://www.bloomberg.com/news/ne

    DeepSeekはなぜこんな大騒ぎになっていて一体何がそんなにスゴいのか
    mohno
    mohno 2025/01/29
    「OpenAIなどがトレーニングに数十億ドル(数千億円)を費やしていると言われる中、このモデルは600万ドル(約9億3000万円)未満のコスト」「既存の企業に全賭けしたベンチャーキャピタルにとって絶滅レベルの出来事だ」
  • DeepSeekショック、アメリカのAI株価が急落 NVIDIA17%下落 - 日本経済新聞

    【ニューヨーク=竹内弘文】中国人工知能AI)企業であるDeepSeek(ディープシーク)が低コスト生成AIモデルを開発したことを受け、米金融市場が揺れている。AI半導体大手エヌビディアの株価は27日に17%安となった。1日の下落率として新型コロナウイルスの感染拡大初期である2020年3月中旬以来、約5年ぶりの大きさを記録した。ナスダック総合、1カ月ぶり下落率AI関連は総じて大幅安となった

    DeepSeekショック、アメリカのAI株価が急落 NVIDIA17%下落 - 日本経済新聞
    mohno
    mohno 2025/01/28
    「DeepSeekが低コスト生成AIモデルを開発したことを受け、米金融市場が揺れている」「エヌビディアの株価は27日に17%安」「アルファベットは4%安、マイクロソフトも2%安」/みんな雰囲気で投資してる気はする。
  • DeepSeek-R1の論文読んだ?【勉強になるよ】

    記事は、DeepSeek-R1の論文とDeepSeekMathの論文を読んだ私の理解をもとに記載しています。 論文で使われている技術に関しては、ある程度の知識を持っているので、大きくは外していないとは思いますが、私の主観も入っている部分もありますので、ご了承ください。 また、DeepSeek-R1の論文が公開される前に、小型モデルに対して同様の実験(強化学習)をしていたグループがあるようです。 そちらのレポートは下記になります。 意図せず、DeepSeek-R1-Zeroの再現実験のようなレポートになっていますが、レポートの著者はDeepSeek-R1論文の公開前から実験していると主張しています。 こちらも非常に興味深かったため紹介です。 論文の興味深いところ 論文は、大きく分けて3つの構成でできています 強化学習による思考能力の強化 LLM(DeepSeek-V3-Base)に対

    DeepSeek-R1の論文読んだ?【勉強になるよ】
    mohno
    mohno 2025/01/27
    長いのでちゃんと読んでない(読んでも理解できそうにない)「モデル構造を変えずに、「DeepSeek-V3-Base」に対する学習方法を工夫しただけで、OpenAI o1に匹敵する性能のLLMを開発している」
  • 中国発の高性能AI「DeepSeek」が示す衝撃 —— 制約が生んだ驚異的な効率性 | XenoSpectrum

    世界のAI開発競争に、激震が訪れている。中国AIスタートアップ「DeepSeek」が2024年12月、そして今月に相次いで発表した言語モデルが、OpenAIやAnthropicといった米国の巨人たちを震撼させているのだ。驚くべきことに、この革新は米国による半導体輸出規制という制約の中で生まれた。 驚異的な開発効率で実現した世界最高峰の性能 DeepSeekが1月に発表したDeepSeek-R1の登場は、AIの開発手法に関する既存の常識を根から覆すものとなった。同モデルは、複雑な推論を必要とするタスクにおいて「Chain-of-Thought(CoT:思考の連鎖)」と呼ばれる手法を採用。これにより、自身の論理を段階的に検証しながら、より正確な解答を導き出すことを可能にしている。 特筆すべきは、このモデルがOpenAIのo1と同等以上の性能を示したベンチマークテストの結果だ。問題解決能力、

    中国発の高性能AI「DeepSeek」が示す衝撃 —— 制約が生んだ驚異的な効率性 | XenoSpectrum
    mohno
    mohno 2025/01/27
    「半導体輸出規制という制約の中で生まれた」「DeepSeekは、わずか558万ドル(約8億円)という予算と2ヶ月という短期間」「ChatGPTが学習時に必要とした約1万基のNVIDIA GPUに対し、DeepSeekは約2,000基で同等の性能を達成」
  • 1