deejayrokaのブックマーク - はてなブックマーク

「訓練データはタダではない」音楽業界が問う生成AIの根本的問題

強力な生成AIモデルを訓練するには膨大な量の訓練データを必要とする。音楽生成AIスタートアップ2社に対して大手レコード会社が今回起こした訴訟は、これまでで最大のメッセージを伝えている。それは「高品質な訓練データは無料ではない」ということだ。 by Melissa Heikkilä2024.07.15 11 この記事の3つのポイント生成AIブームを支える訓練データの大規模化に、データ所有者らが反発大手レコード会社がAI 音楽企業を訴えた訴訟が、AIの未来を左右する可能性 AI企業は高額な費用を支払うか、効率的なモデル構築を迫られている summarized by Claude 3 この記事は米国版ニュースレターを一部再編集したものです。生成AIブームは規模に支えられている。訓練データが多ければ多いほど、モデルはより強力になる。しかし、問題がある。人工知能（AI）企業が訓練データ取得のた

deejayroka 2024/07/17

リンク

見えてきた「生成AIの限界」がアーティストの不安を取り除く

生成AIを使った実験を重ねるにつれて、クリエイティブ分野での限界が明確に理解されるようになってきた。AIとアーティストたちの力関係を変えようとする取り組みもいくつか始まっている。 by Melissa Heikkilä2024.06.30 190 8 この記事の3つのポイント AIとアーティストとの関係性はこの2年間で変化しつつある独創的で面白いものを生み出すのは難しく、補強ツールとして使うのが最適権利侵害を防ぐ技術やツールも開発が進み、不安を和らげている summarized by Claude 3 この記事は米国版ニュースレターを一部再編集したものです。人工知能（AI）のジョークはありきたりだ。グーグル・ディープマインド（Google DeepMind）の研究チームがプロのコメディアン20人に依頼し、一般的なAI言語モデルを使ってジョークやコメディパフォーマンスの台本を書いてもら

deejayroka 2024/07/01

リンク

解説：生成AIのハルシネーションはなぜ起きるのか

大規模言語モデルが「ハルシネーション（幻覚）」を生成することはよく知られている。ただ、その仕組みから明らかのように、LLMの出力は本質的にはすべてハルシネーションであり、間違いが発覚したものがそう呼ばれているだけだ。 by Will Douglas Heaven2024.06.24 58 25 この記事の3つのポイントチャットボットは間違った情報を提供することがある大規模言語モデルは統計的確率に基づいてテキストを生成するハルシネーションを完全に防ぐことは不可能である summarized by Claude 3 2024年4月2日、世界保健機関（WHO）の新しいチャットボットが「善意の意図」の下にリリースされた。リリースされたのは、「GPT-3.5」が搭載された新顔のバーチャル・アバター「サラ（SARAH：Smart AI Resource Assistant for Health

deejayroka 2024/06/25

リンク

さよならAlexa、オープンAIとグーグルのAIアシスタントが超進化

グーグルとオープンAIが今週、それぞれ新しいAIアシストタントを発表した。SiriやAlexa（アレクサ）のようなツールからの飛躍的な進歩となる。 by James O'Donnell2024.05.17 2 11 グーグルとオープンAI（OpenAI）は今週、超高性能な人工知能（AI）アシスタントをそれぞれ開発したと発表した。いずれも、リアルタイムで人間と会話でき、途中で話を遮っても再開ができ、ライブ映像で相手の周囲を分析して即座に会話を翻訳することもできる。先手を打ったのはオープンAIだ。5月13日、同社は新型フラグシップモデルの「GPT-4o」を公開した。ライブデモでは、GPT-4oが子どもを寝かしつけるために物語を読み聞かせたり、数学の問題を解いたりする様子が披露された。GPT-4oの音声は、映画『her/世界でひとつの彼女』に登場するホアキン・フェニックスのAIガールフレンドの

deejayroka 2024/05/27

リンク

AIが「心の理論」テストで人間超え、この結果は何を意味するか

人工知能(AI)モデルが、人間の感情理解力を測るテストで人間並み、時に上回る成績を収めたことが分かった。ただ、訓練データにそうしたタスクが含まれていた可能性も否定できず、大規模言語モデルが「人のように」考えているわけではない。 by Rhiannon Williams2024.05.22 275 21 人間は複雑な存在だ。私たちのコミュニケーションの方法は多層的であり、心理学者たちは対話から意味や理解を推測する能力を測るためのテストを数多く考案してきた。人工知能（AI）モデルは、こうしたテストでますます優れた結果を出している。ネイチャー・ヒューマン・ビヘイビア（Nature Human Behavior）に5月20日に掲載された新たな研究によると、一部の大規模言語モデル（LLM）は人の心理状態を追跡する能力（いわゆる「心の理論」と呼ばれる）を測るために設計されたタスクを与えられた場合、人

deejayroka 2024/05/23

リンク

「昔のインターネット」の精神を取り戻す、HTMLエネルギー運動

今日のWebは商取引などの目的に最適化され、少数の企業によって所有されている。個人に力を与え、自己表現を促すかつてのWebの魅力を取り戻す「HTMLエネルギー（HTMLエナジー）」というムーブメントが密かに盛り上がりつつある。 by Tiffany Ng2024.01.08 363 9 Webサイトは、常に洗練されたデジタル体験だったわけではない。かつて、ネットサーフィンをするには、自分の意に反して音楽が再生されるタブを開いたり、色つきの背景にタイムズ・ニュー・ローマン書体の文字がびっしり詰まったページを読んだりする必要があった。スクエアスペース（Squarespace、Webページ作成サービス）やソーシャルメディアが登場する以前の2000年代、Webサイトは個性を表現するものであり、コードの知識とインターネット上に存在したいという願望を持ったユーザーが、HTMLを使ってゼロから作るもの

deejayroka 2024/01/09

リンク

生成AIにアーティストが反撃、汚染データでモデルを壊す新技術

AIによる画像の無断利用にアーティストたちが対抗する新たなツールが開発された。人間の目にはわからない加工を画像データに施すことで、この画像データを訓練に使った生成AIモデルを破壊できるという。 by Melissa Heikkilä2023.10.27 41 22 アーティストがこの新しいツールを使用すると、自分の作品をインターネット上にアップロードする前に、作品内のピクセルに対して目に見えない変更を追加できる。人工知能（AI）企業が、この変更を加えた作品を収集し、生成AI（ジェネレーティブAI）の訓練に使用すると、AI学習モデルが無秩序で予測不可能な状態に破壊される可能性がある。「ナイトシェード（Nightshade）」と呼ばれるこのツールの目的は、アーティストの許可なく作品を使用してモデルを訓練しようとするAI企業に反撃する方法を提供することだ。「ダリー（DALL-E）」、「ミッドジ

deejayroka 2023/10/27

リンク

AIが創造性テストで人間に勝利、その衝撃結果が意味すること

創造性を評価する人間向けのテストで、大規模言語モデルが人間よりも好成績を収めたとする研究が発表された。ただし、この結果から、AIが創造性を備えるようになったと捉えるのは早計だ。 by Rhiannon Williams2023.09.19 5 16 人間の創造性を測定することを目的として作られたテストで、人工知能（AI）が好成績を上げるようになってきている。2023年9月14日のネイチャー・サイエンティフィック・リポーツ（Nature Scientific Reports）に掲載された研究によると、AIチャットボットが、創造性の評価テストとして普及している「オルタネイト・ユーシス・タスク（ Alternate Uses Task＝AUT、日本版注：J.P. ギルフォードが1967年に開発した拡散的思考を測定するためのテスト）」で、人間よりも高い平均スコアを達成した。 AI研究者の間では人間

deejayroka 2023/09/25

リンク

AI生成インフルエンサーが 24時間稼ぎ続ける中国ライブコマース新事情

Deepfakes of Chinese influencers are livestreaming 24/7 AI生成インフルエンサーが 24時間稼ぎ続ける中国ライブコマース新事情中国で真夜中のライブ配信を見ると、熱心に商品を売り込むストリーマーの姿が目立つ。だが実はこのストリーマー、わずか数分の動画からAIが生成したもので、24時間年中無休で働き続けることができる。 by Zeyi Yang2023.09.21 211 19 中国で最も人気のあるEコマース・プラットフォームであるタオバオ（Taobao：淘宝）のライブ配信映像を午前4時にスクロールしてみると、奇妙なほどに活況を呈している。ほとんどの人が熟睡しているこの早朝の時間帯に、多くの熱心なストリーマー（配信者）がカメラに向かって商品を紹介し、割引価格で販売している。しかし、よく目を凝らすと、これらのライブ配信インフルエンサー

deejayroka 2023/09/22

リンク

グーグルが恐れるオープンソース生成AI、脆く危ういブームの実態

The open-source AI boom is built on Big Tech’s handouts. How long will it last? グーグルが恐れるオープンソース生成AI、脆く危ういブームの実態チャットGPT/GPT-4の対抗馬となるオープンソースの生成AIモデルの発表がこの春相次ぎ、さながらブームとなっている。だが、その多くは大手テック企業が公開したモデルをベースにしており、大手テック企業の戦略に左右される恐れがある。 by Will Douglas Heaven2023.07.04 30 20 グーグルの上級エンジニアであるルーク・ソーナウが書いたとされる内部文書の中で、ここ最近シリコンバレーで大勢がささやいてきたであろうことが明言されていた。誰もが無償で使えるオープンソースが、巨大テック企業による人工知能（AI）の支配を脅かしている。新たなオープン

deejayroka 2023/07/05

リンク

生成AIで広告収入目的のゴミサイトが急増、1日1200本更新も

広告収入目的の「MFA」と呼ばれる低品質なWebサイトで、生成AIの導入が進んでいることが分かった。中には1日1200本以上の記事を生成しているサイトもあり、自動化が急速に進んでいる様子が伺える。 by Tate Ryan-Mosley2023.06.28 542 9 AIチャットボットを活用して生成された文章によって構成されたWebサイトが、グーグルなどを経由して広告収入を得ている。メディア研究機関のニュースガード（NewsGuard）が作成し、MIT テクノロジーレビューに独占的に提供された新たな報告書によって、こうした実態が明らかになった。 140社を超える大手ブランドが、おそらく知らず知らずのうちに、AIで作成された信頼性の低いサイトの広告費用を支払っているとみられる。こうしたAI生成ニュースサイトで見つかった大手ブランドの広告の90％はグーグルが配信したもので、グーグル自身のポリシ

deejayroka 2023/06/29

リンク

欧州議会が「AI法」を可決、今後予想される5つの規制

欧州議会において6月14日、「人工知能（AI）AI法」が圧倒的多数により可決された。施行までにはまだ時間を要するが、AIの利用には今後、さまざまな規制がかかることになりそうだ。 by Tate Ryan-Mosley2023.06.27 239 18 この記事は米国版ニュースレターを一部再編集したものです。 6月12日の週は欧州のテクノロジー政策において重要な週となった。欧州連合（EU）の立法者たちがグーグルに対して新たな反トラスト訴訟を起こした同じ日に、欧州議会が「AI法（AI Act）」の規則案を承認する投票を実施したのだ。 AI法は圧倒的多数により可決された。この法案は、AI規制における世界で最も重要な進展の1つと謳われてきた。欧州議会のロベルタ・メッツォーラ議長は、AI法について、「今後何年にもわたって世界標準となることは間違いない」と評している。しかし、規制内容がすぐに明確にな

deejayroka 2023/06/28

リンク

生産性マニアが「Notion」で生活の95％を回す理由

業務用アプリの「ノーション（Notion）」が人気だ。特に生産性にこだわる人たちの間で、私生活のタスク管理にまで利用する動きが広がっている。 by Rhiannon Williams2023.05.04 480 17 ジョシュア・バーゲンはとても生産的な人間だ。秘密は業務用アプリ「ノーション（Notion）」にある。バンクーバーに住むプロダクトマネージャーのバーゲンは、ノーションを使ってノートとタイムラインで海外旅行の綿密な計画を立てたり、自分が観た映画やテレビ番組のリストを整理して感想を記録したりする。3Dプリンティング・プロジェクトの管理、スノーボード滑走コースの地図作成、子どもの面白い発言を集めたリストの迅速な更新にも便利だ。奇妙に思えるかもしれない。しかし、バーゲンのように、仕事での利用を想定して作られたノーションを私生活の整理整頓に活用する人々は増え続けている。瞑想習慣や週の

deejayroka 2023/05/05

リンク

「大ボラ吹き」のチャットGPTをどうしつける？オープンAIに聞いた

マイクロソフトは、提携関係にあるオープンAIが開発したAIチャットボット「チャットGPT」を、検索エンジン「ビング」に組み込んだ。その反響は大きく、あっという間に大量のユーザーを獲得した。しかし同時に、チャットGPTがとんでもないウソをつくことが話題になった。オープンAIはどう改善に取り組んでいるか。 by Melissa Heikkilä2023.03.12 6 14 この記事は米国版ニュースレターを一部再編集したものです。人工知能（AI）チャットボットに脅されたことがあるだろうか？ 2月中旬のニュースメディアは、AをI組み込んだマイクロソフトの検索エンジン「ビング（Bing）」の話題で持ちきりだった。多くのメディアがこの検索エンジンを試し、見当違いで不気味な回答が返ってきたと報じている。ニューヨーク・タイムズ紙のテック系コラムニストはビングに「愛している」と繰り返し言われ、ワシントン

deejayroka 2023/03/16

リンク

「予想外のヒットに驚いた」チャットGPT開発者が語る「革命」の舞台裏

The inside story of how ChatGPT was built from the people who made it 「予想外のヒットに驚いた」チャットGPT開発者が語る「革命」の舞台裏オープンAIが2022年11月に公開したチャットGPTは、瞬く間に爆発的なヒットとなった。だが、開発者にとっては予想外だったようだ。オープンAIでチャットGPTの開発に携わった4人に、開発に至った経緯や、公開後の世間からの反応、今後の構想について聞いた。 by Will Douglas Heaven2023.03.09 37 27 サンフランシスコに拠点を置く人工知能（AI）企業、オープンAI（OpenAI）が2022年11月下旬にひっそりとチャットGPT（ChatGPT）を公開した時、社内で期待している人はほとんどいなかった。クチコミでのメガヒットに備えていた者など、オープンA

deejayroka 2023/03/10

リンク

生成AIはユーザーに告知を、オープンAIなど10社が自主ガイドライン

生成AI（ジェネレーティブAI）の一大ブームの中、生成AIコンテンツに関する自主ガイドラインにオープンAIなど10社が署名した。AIが生成したコンテンツを使用する場合にはユーザーに告知するよう求めている。 by Melissa Heikkilä2023.03.03 14 20 オープンAI（OpenAI）、ティックトック（TikTok）、アドビ、BBC、マッチングアプリのバンブル（Bumble）など10社が、人工知能（AI）生成コンテンツを責任を持って構築、作成、共有する方法を示した新しい一連のガイドラインに署名した。このガイドラインは、オープンAIなどの生成AI（ジェネレーティブAI）技術の開発元と、BBCやティックトックといった合成メディア・コンテンツの制作者・配信元に対する呼びかけとなっている。生成AI 技術にできること・できないことを明確にすること、生成AIによって作られたメディア

deejayroka 2023/03/10

ai

リンク

AI生成コンテンツに汚染されるインターネット、その対策は？

大規模言語モデルAIが生成した有害なテキストはインターネット中に広がり、別のAIを訓練するのに使われる。しかも、AIが生成したテキストであるかどうかを見分けるのは、非常に難しい。 by Melissa Heikkilä2023.01.06 68 19 10 この記事は米国版ニュースレターを一部再編集したものです。人工知能（AI）にとって、2022年は激動の1年だった。ネット上で多くの時間を過ごす人ならば、「ダリー（DALL-E） 2」や「ステーブル・ディフュージョン（Stable Diffusion）」のようなAIシステムが生成した画像に出くわしたことがあるだろう。オープンAI（OpenAI）の大規模言語モデル（LLM）「GRT-3」の最新版である「チャットGPT（ChatGPT）」が生成したジョークやエッセー、その他の文章も見かけたかもしれない。 AIが生み出した画像や文章であることが

deejayroka 2023/01/08

リンク

大規模言語AIにアキレス腱、訓練用データが2026年にも枯渇か

近年、各企業がこぞって開発を進めている大規模言語モデルで、ある問題が指摘されている。同モデルを訓練するために必要な質のよい大量のデータが、早ければ2026年にも枯渇するというのだ。 by Tammy Xu2022.11.29 33 13 大規模言語モデルは現在、人工知能（AI）研究で特に活気ある分野の1つだ。各社は、理路整然とした記事のみならず、コンピューター・プログラムすら書くことのできる「GPT-3」のようなプログラムを競ってリリースしようとしている。だがAIの将来を予測しているチームによると、今、差し迫った問題があるという。それは、モデルを訓練するためのデータが枯渇するかもしれないという問題だ。言語モデルは、ウィキペディアやニュース記事、科学論文、書籍などの情報源の文章を使って訓練される。近年は、正確性や汎用性の向上を目的に、モデルを訓練するためのデータをさらに増やそうという傾向が

deejayroka 2022/11/30

リンク

大規模言語モデルの訓練で50トン、見えてきたAIのCO2排出量

大規模言語モデルの構築に伴い、二酸化炭素が大量に排出される。AIスタートアップ企業ハギング・フェイスは業界で初めて、AIモデル構築のライフサイクル全体における二酸化炭素排出量を推定する手法を考案した。 by Melissa Heikkilä2022.11.18 17 16 大規模言語モデル（LLM）には不都合な秘密がある。訓練と運用に大量のエネルギーが必要になることだ。その上、大規模言語モデルのカーボン・フットプリント（CFP）が実際どれほど大きいのか、正確なところはいまだ若干謎に包まれている。人工知能（AI）スタートアップ企業であるハギング・フェイス（Hugging Face）は、モデルの訓練中だけでなく、ライフサイクル全体にわたっての排出量を見積もることで、より正確にカーボン・フットプリントを推定できる、新たなよりよい手法を編み出したという。 AIによる環境への影響を評価する取り組みを

deejayroka 2022/11/20

“ブルームの訓練訓練に用いられるコンピューター機器の製造、より広範なコンピューティングインフラ、ブルームの訓練後、実際に運用する際に必要なエネルギーを考慮に入れると排出量は2倍になる”

リンク

医用画像と症例報告で訓練したAI、「医師並み」の診断力

ハーバード大学が開発した新しい診断用人工知能（AI）モデルは、ラベル付けなどの大量の人手を必要とするデータセットを用意することなく、未加工の胸部X線写真と症例報告から人間の専門家と同等の診断ができる。 by Rhiannon Williams2022.09.22 4 9 数千枚もの胸部X線写真とそれに付随する臨床報告を解析した結果、人工知能（AI）はその2つのデータから人間の放射線科医と同等の正確さで病気を発見できるようになった。現在使われている診断用AIモデルの大半は、人間がラベル付けした画像で訓練されているが、ラベル付けには時間がかかる。代わりに新しいAIモデルの「チェクスザーロー（CheXzero）」は、専門家が日常的に使っている言語で書いた既存の症例報告書からAIモデル自身が「学習」できる。今回の発見は、医用画像を解析するAIモデルの訓練のために、X線写真にラベル付けする必要が

deejayroka 2022/10/03

リンク

はてなブックマーク

タグ

ブックマーク / www.technologyreview.jp (27)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第2週）

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

今週のはてなブックマーク数ランキング（2024年7月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス