ブックマーク / www.itmedia.co.jp (3)

  • 日本語版「Stable Diffusion」公開 追加学習でオノマトペも理解 「キラキラ瞳」も反映

    AI事業を手掛けるrinna社(東京都渋谷区)は9月9日、画像生成AI「Stable Diffusion」を改造した日語版「Japanese Stable Diffusion」を9日に無料で一般公開すると発表した。日語で生成したい画像の内容などを指示すると、AIが内容に沿った画像を出力する。 日語版はStable Diffusionに、日語キャプション付きの画像を約1億枚追加で学習させたもの。日語圏の固有名詞や和製英語、オノマトベ(擬音、擬態語など)など、独特の文化を反映した画像を生成できるとしている。 配布場所はGitHubAI関連コミュニティサイト「Hugging Face」。ソフトウェアへの組み込みも許可する。開発者向けサイト「rinna Developpers」ではAPIも公開する。 8日には、対話AIキャラクターを育成して交流させる同社製SNSアプリ「キャラる」や、同

    日本語版「Stable Diffusion」公開 追加学習でオノマトペも理解 「キラキラ瞳」も反映
    popkirby
    popkirby 2022/09/10
    使っているデータセット(約1億枚)の一部として、laion2b-multiという20億枚の画像・多言語キャプションのペアのうち日本語のもの(約1.3億枚)が挙げられている/素のStable Diffusionはlaion2b-enが利用されていて、約20億ペア
  • MinecraftをAIがプレイ、10分で「ダイヤモンドのツルハシ」を高速作成 米OpenAIが技術開発

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米OpenAIの研究チームが開発した「Video PreTraining (VPT): Learning to Act by Watching Unlabeled Online Videos」は、人間がプレイするMinecraft(マインクラフト)の映像から複雑な動作を学習するモデルだ。学習したモデルは、熟練した人でも20分以上かかるダイヤモンドツールの作成を10分程度で成し遂げ、その有効性を示した。 人がプレイしたマインクラフトのプレイ動画がWeb上に多く存在する。今回のモデルはこの膨大な動画データで学習するわけだが、これら動画からは何が起きたかが分かるだけで、マウスの動きやキーの押し順

    MinecraftをAIがプレイ、10分で「ダイヤモンドのツルハシ」を高速作成 米OpenAIが技術開発
    popkirby
    popkirby 2022/06/28
    AIの動画のように直下掘りするとマグマに落ちることがよくあるので、2マスずつ掘って行ったほうがいいですよ(人間マウント)
  • 「権限要求多すぎ」──セブン-イレブンのTwitterキャンペーンに批判相次ぐ→中止に なぜこうなったかは「確認中」

    セブン-イレブン・ジャパンが7月11日に始めたTwitterキャンペーンが波紋を呼んでいる。社名にちなんだ「セブン-イレブンの日」として無料クーポンをプレゼントする企画だったが、応募のためには個人のTwitterアカウントと外部アプリを連携させる必要があった。その際に要求される権限が不適切ではないかという声が上がり、同社は12日午後11時にキャンペーンの新規応募を中止した。 要求の中には「他のアカウントをフォロー、フォロー解除する」「他のアカウントをミュート、ブロック、報告する」「このアカウントでダイレクトメッセージを送信、確認、管理、削除する」など、アカウント情報を閲覧する以上の権限が含まれていた。 この要求を許可すると、セブン-イレブンが管理するサードパーティーアプリからツイートやフォロー、いいね、RT、プロフィール変更などの操作が可能となってしまう。これに対し、立命館大学の上原哲太郎

    「権限要求多すぎ」──セブン-イレブンのTwitterキャンペーンに批判相次ぐ→中止に なぜこうなったかは「確認中」
    popkirby
    popkirby 2021/07/14
    DMはクーポンの配布を自分自身へのDMという形で行うなら必要かも(ソシャゲの事前登録とかで割と見る)/開発者としては、Twitterは開発者が選べる権限とユーザに表示する権限の粒度を別々にするのを早くやめてほしい
  • 1