タグ

AIに関するtjmschkのブックマーク (5)

  • 1枚の写真→5秒の動画に “無料”で使える最高水準の動画生成AI「Dream Machine」が話題に

    AIスタートアップの米Luma Labsは6月12日(現地時間)、動画生成AIサービス「Dream Machine」を発表した。動画の内容を指示するプロンプトと1枚の写真から5秒の動画を生成する。生成スピードは1コマ1秒としており、120コマ(24fpsで5秒)を2分で生成できるとしている。 高品質な動画生成AIは、米OpenAIの「Sora」や、中国Kuaishouの「Kling」というアプリがすでに発表されているが、Soraはまだ公開されておらず、Klingは利用に中国の電話番号が必要など、利用までのハードルが高かった。Dream Machineは、Googleアカウントさえあれば誰でも利用できる動画生成AIとなる。 Dream Machineの構築にあたり、米AWSと、同社のNVIDIA H100トレーニング基盤「SageMaker HyperPod」と協力。スケーラブルで効率的かつ

    1枚の写真→5秒の動画に “無料”で使える最高水準の動画生成AI「Dream Machine」が話題に
  • Sakana AI

    概要 Sakana AIは進化や集合知などの自然界の原理を応用して基盤モデルを開発することを目指しています。私達の目標は、モデルを自ら訓練し開発することだけではありません。基盤モデルの開発を効率化、高度化、自動化するための新たな手法を生み出すことに挑戦しています。この目標に向けた第一歩として、私たちはプレプリント「Evolutionary Optimization of Model Merging Recipes (モデルマージの進化的最適化)」を公開しました。 このリリースの要点は以下の通りです。 進化的モデルマージという手法を提案します。これは、多様な能力を持つ幅広いオープンソースモデルを融合(マージ)して新たな基盤モデルを構築するための方法を、進化的アルゴリズムを用いて発見する手法です。私たちの手法は、ユーザーが指定した能力に長けた新しい基盤モデルを自動的に作成することができます。既

    Sakana AI
  • 新時代のコードエディタ、Cursorのメリット・できることを網羅的に解説した

    上記のようにコードエディタを開くコマンドを分けるために、既にcodeコマンドをVScodeで使っている方はcursorダウンロードの際にcursorコマンドのみインストールするようにしてください。codeの方もインストールすると、codeコマンドでVScodeとCursorどちらも開いてしまうようです。 Cursor主要機能紹介 cmd + Shift + L or cmd + L でGPTとChat機能 エディタ上で画面右にGPTに質問できるサイドバーが出現する。何も選択してないと無から質問できる状態になっていて、コードを選択した状態で開くとそのコードがあらかじめ引用された状態になっている(別の部分のコードもどんどん追加できる)。 ↑10~21行目をcmd + Lした後に31~33行目を追加でcmd + Lした画像 cmd + K でAI Edit機能 コードを選択した状態でcmd +

    新時代のコードエディタ、Cursorのメリット・できることを網羅的に解説した
  • RLHF (人間のフィードバックからの強化学習) の図解|npaka

    以下の記事が面白かったので、軽く要約しました。 ・Illustrating Reinforcement Learning from Human Feedback (RLHF) 1. はじめに言語モデルは、人間の入力プロンプトから多様で説得力のあるテキストを生成することで、ここ数年、目覚ましい成果をあげています。しかし、「良い」テキストかどうかは、主観的で文脈に依存するため、定義することが困難です。 「良い」テキストを生成するための損失関数の設計は難しく、ほとんどの言語モデルは、まだ単純な次のトークン予測損失(クロスエントロピーなど)で学習しています。この損失自体の欠点を補うために、BLEUやROUGEなどの人間の好みをよりよく捉えるように設計された指標も定義されています。しかしこれらは、能力測定において損失関数より適してますが、生成されたテキストを単純なルールで参照比較するため、制限があり

    RLHF (人間のフィードバックからの強化学習) の図解|npaka
  • 驚異の高精度AIリアルタイムボイチェン「RVC」で友人になりすまして本人と会話したときの反応(CloseBox) | テクノエッジ TechnoEdge

    高精度でリアルタイム処理も可能なAI声質変換ソフト(ボイスチェンジャー)「RVC」の記事が大変な反響を呼びました。Stable DiffusionやChatGPTなど生成系AIがメジャー化する中、世間からはそれほど大きな注目を浴びているわけではありませんが、音声AIも驚くべき速度で進化を遂げています。 AIボイチェン「RVC」の精度と学習・変換速度が革命的。コナンの蝶ネクタイ的リアルタイムボイチェンも可能(CloseBox) | テクノエッジ TechnoEdge 記事中でデモとしてお聞かせしたのは、筆者のの歌声を高精度に再現するもので、それはこのソフトのおそらく最大の特徴を生かしたものではありません。そこで、また実験をしてみることにしました。 今回は、ポッドキャストbackspace.fmを10年近く一緒にやっている友人であるドリキンのAIモデルをRVCで作ってみました。 backsp

    驚異の高精度AIリアルタイムボイチェン「RVC」で友人になりすまして本人と会話したときの反応(CloseBox) | テクノエッジ TechnoEdge
  • 1