Seamlessのブックマーク / 2023年7月31日

Seamless id:Seamless

2023年7月31日のブックマーク (3件)

「ラブコメのラジオドラマを書いて」で自動生成するAI「WavJourney」、複数回の対話で画像生成できる「LLM-grounded Diffusion」など重要論文5本を解説（生成AIウィークリー） | テクノエッジ TechnoEdge
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless（シームレス）を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。第5回目は、オーディオドラマを自動生成するAI 技術など、5つの論文をまとめました。生成AI論文ピックアップテキストから音声合成による“ラジオドラマ”を生成するAI「WavJourney」画像間のフレームを滑らかに埋める技術　動画生成AIに役立つ可能性使いやすい画像セグメンテーション用ライブラリ「Keras」既存の画像生成AIを強化する「LLM-grounded Diffusion」　複数回の対話での生成、多言語生成が可能にビデオ内の動く物体をマスク分割して高品質に追跡するシステム「HQTrack」テキストから音声合成による“ラジオドラマ”を生成するAI「W
Seamless 2023/07/31
他3つは、画像間のフレームを滑らかに埋める技術　動画生成AIに役立つ可能性。使いやすい画像セグメンテーション用ライブラリ「Keras」。ビデオ内の動く物体をマスク分割して高品質に追跡するシステム「HQTrack」

テクノロジー

論文
リンク
米Google、自然言語でAndroidデバイスを操作するための学習データセット公開
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」（シームレス）を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: ＠shiropen2 米Google Researchと米Google DeepMindに所属する研究者らが発表した論文「Android in the Wild: A Large-Scale Dataset for Android Device Control」は、Androidデバイスを自然言語で操作するための大規模な学習データセットを提案した研究報告である。このデータセットには、画面やアクションを含むデバイスのインタラクションの人間によるデモンストレーションと、それに対応する自然言語の指示が含まれている。データセットはこちらから入手できる。自然言語コマンド
Seamless 2023/07/31
公開中のデータセットは350以上のAndroidアプリとWebサイトにわたる約71万のエピソード(画面操作と言語指示のペア)から構成される。

テクノロジー

論文
リンク
AIが住む町の日常を“テレビ番組化”するAI　「イーロン・マスク」名乗るキャラも登場　米国チームが発表
このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」（シームレス）を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: ＠shiropen2 映像制作会社の米The Simulation（旧Fable Studio）に所属する研究者らが発表した論文「To Infinity and Beyond: SHOW-1 and Showrunner Agents in Multi-Agent Simulations」は、テキストプロンプトに基づいてテレビ番組のエピソードを自動生成するAIショーランナーを提案した研究報告である。このシステムでは、複数の自律的に動作するAIキャラクター（AIエージェント）が住む町がシミュレーションされ、そこで起こる出来事をもとにテレビ番組を自動生成する。脚本
Seamless 2023/07/31
自律AIキャラ複数が住む町で起こる事から番組(脚本,音声,映像)生成。今回はサウスパークが基板。文章で自身や有名人を登場させる,物語のきっかけになる事件を起こす事も可。

テクノロジー

論文
リンク
- 2023年8月2日
- 2023年7月31日
- 2023年7月28日