タグ

ブックマーク / www.technologyreview.jp (3)

  • 生成AIのデジタル劣化問題、ゴミがゴミを生み出す最悪の未来

    大規模言語モデルが機能するためにはインターネット上の膨大なデータで訓練する必要がある。今後、AIが生成した低品質のWebページがネット上に急増すると、そのデータで訓練された大規模言語モデルの性能が劣化することが懸念されている。 by Scott J Mulligan2024.08.01 9 この記事の3つのポイント AIモデルは低品質のAI生成データで訓練されると徐々に劣化する 合成データを追加しても問題ないが高品質で多様なデータが重要だ データの出所を特定し、人間が作成した元データを重視する必要がある summarized by Claude 3 人工知能AI)モデルは、インターネットから取得した膨大な量のデータを使って訓練することで機能する。ところが、低品質のコンテンツで埋め尽くされたWebページをAIがどんどん量産するにつれ、そのプロセスが揺るがされる危険性が増している。 ネイチャ

    生成AIのデジタル劣化問題、ゴミがゴミを生み出す最悪の未来
    fjch
    fjch 2024/08/01
  • 最大の謎「生命の起源」は 機械学習で解明できるか

    The Biggest Questions: How did life begin? 最大の謎「生命の起源」は 機械学習で解明できるか 生命の起源は科学史上、長らく大きな謎に包まれてきた。複雑な相互作用で何が起きているのかを理解するため、科学者たちは機械学習の力を借りて研究のスピードアップを図っている。 by Michael Marshall2024.05.31 3 20 生命の起源は、科学史上最大の謎の一つであり、解明は極めて困難だ。分かっているのは、35億年以上前に地球で何かが起きたということだけだ。その何かは、宇宙の他の多くの惑星でも起きていたかもしれない。 そして、何がきっかけでそれが起こったのかも分かっていない。水やメタンなど多種多様な無生物が混在する液体の中で、それらが結合し、自己組織化し、さらに複雑な物質へと変化し、最終的に生命を構成する細胞になった。 解明が難しい最大の理由

    最大の謎「生命の起源」は 機械学習で解明できるか
  • ツイッターで「非公式RT」が一時復活、崩壊の始まりか

    「このままではツイッターはいずれ使えなくなってしまう」。現在も同社に在籍するエンジニアは取材に証言した。その兆候はすでに一部のユーザーに目撃されている。 by Chris Stokel-Walker2022.11.10 267 5 イーロン・マスク最高経営責任者(CEO)が全従業員7500人のうち半数をレイオフ(一時解雇)したわずか数時間後、ツイッターの異変を示す小さな兆候が一部のユーザーに目撃されていた。 異変が起きたのは「リツイート」だ。ツイッターは2009年に公式リツイート機能を導入した。「RT(リツイートの略)」という文字の後に他人のユーザー名とツイートをコピーしたものを貼り付けるという、すでにユーザー間で自然発生的にされていた慣行を、ソフトウェアの機能として追加したのだ。それ以来、リツイートとその仲間である「引用ツイート」(2015年4月に開始)は、ツイッターでよく使われる2大機

    ツイッターで「非公式RT」が一時復活、崩壊の始まりか
    fjch
    fjch 2022/11/10
    221110065515
  • 1