タグ

AIに関するbyaa0001のブックマーク (84)

  • 「著作権侵害天国・日本」に世界の生成AI企業が引き寄せられている | データを無断使用して「機械学習し放題」

    政府は海外の生成AI関連企業の誘致に力を入れており、企業側も日市場を好意的に見ている。だが、著作権侵害に対する政府の無防備な対応によって、国内のクリエイターが大きな被害を受けていると英紙「フィナンシャル・タイムズ」は警鐘を鳴らす。 2年前、生成AI人工知能)で作られた画像やアニメ動画がSNS上に出回りはじめたとき、イラストレーターの木目百二(もくめももじ)は、「このままだと、日の創作文化が崩壊してしまう」と絶望した。 「イラストレーターの仕事もなくなってしまうと思いました」と語る木目は、東京在住の21歳だ。イラストレーター、漫画家、ミュージシャンとして活動している。 「私たちに未来はないと感じています」と彼は言う。 同じ頃、メタ(旧フェイスブック)のマーク・ザッカーバーグやOpenAIのサム・アルトマンといったグローバルテック業界の経営者らが続々と東京を訪れ、岸田文雄首相と面会し

    「著作権侵害天国・日本」に世界の生成AI企業が引き寄せられている | データを無断使用して「機械学習し放題」
    byaa0001
    byaa0001 2024/08/11
    2008年の自分の選択を後悔している。私はイラストのJASRACを作りたかった。この未来を予知していたのになぁ/記事は煽りすぎだが、日本のイラストがAIにかなり食わせられているのは確か。
  • AI作曲サービスのSunoとUdioが相次いでステム分離機能搭載。Udioは待望の2分超え生成が可能に(CloseBox) | テクノエッジ TechnoEdge

    AI作曲サービスのトップを競い合っている、大手レコード会社に訴訟され仲間であるSunoとUdioが相次いで機能強化を発表しました。 まず、Sunoに、ステム分離機能が追加されました。 ステム分離とは、楽器のパートごとにトラックを分ける機能。UVR5などの単独アプリや、Logic ProなどのDAWに組み込まれている例もあります。AI作曲サービスでもSonautoは早くから実装していました。 無料ソフトのUVR5では、ボーカル、ドラム、ベース、その他の4種類に分離でき、Logic ProのStem Splitterも同様。Sonautoも同じです。 ■Sunoのステム分離機能はボーカルとそれ以外Sunoのステム分離はそれに比べると単純で、ボーカルとその他を分けるだけ。つまり、ボーカルキャンセルと同じことなのですが、それなりに使い道はあります。 例えば、AIで作った曲のボーカルを自分や他の誰か

    AI作曲サービスのSunoとUdioが相次いでステム分離機能搭載。Udioは待望の2分超え生成が可能に(CloseBox) | テクノエッジ TechnoEdge
  • https://twitter.com/itit_news/status/1816077658582835233?s=12&t=0zXC0NRrkRoIfh-Ddj5bnw

  • グーグルが気象予測で新モデル、機械学習と物理学を統合

    気象予測にAIと従来の物理学的手法のどちらが最も効果的かについては、気象や気候の専門家の間でも意見が分かれている。グーグルの研究者は、両者を組みわせることで、より低コストで正確な予測ができるシステムを発表した。 by James O'Donnell2024.07.24 15 この記事の3つのポイント グーグル機械学習と従来手法を組み合わせた新たな気象予測モデルを構築 従来モデルよりも少ない計算能力で迅速に高品質な予測が可能 異常気象リスクの長期的モデリングへの使用が期待されている summarized by Claude 3 グーグルの研究者は、機械学習と従来の手法を組み合わせた新たな気象予測モデルを構築した。これにより、現在よりも遥かに安い費用で正確な予報が得られるようになる可能性がある。 「ニューラルGCM(NeuralGCM)」と呼ばれるこのモデルは、7月22日付けのネイチャー(N

    グーグルが気象予測で新モデル、機械学習と物理学を統合
  • 日本最速のスーパーコンピューター「富岳」はなぜAWS上で仮想化されたか | Amazon Web Services

    Amazon Web Services ブログ 日最速のスーパーコンピューター「富岳」はなぜAWS上で仮想化されたか 記事は、2024年4月16日に公開された Why Fugaku, Japan’s fastest supercomputer, went virtual on AWS を翻訳したものです。翻訳は Solutions Architectの佐々木が担当しました。 日の富士山(富岳) 世界で最も有名な山頂の1つに登ろうとするとき、最初に山へのアクセスのしやすさを考える人は少ないかもしれません。富士山はその高さと裾野が広いことで有名ですが、国によって登山道が整備されているため、初心者のハイカーでも時間をかけずに登ることができます。現在、世界最速のスーパーコンピューターの1つである「富岳」の開発者たちは、このスーパーコンピュータをアマゾンウェブサービス(AWS)クラウドでもアク

    日本最速のスーパーコンピューター「富岳」はなぜAWS上で仮想化されたか | Amazon Web Services
    byaa0001
    byaa0001 2024/07/06
    利用率ってどう算出するんだろ?ジョブは常に投下されてるだろうし、稼働率的には95%なんて絶対無理だし。占有率?あれこれ入れ子にする過程で5%の無駄な待ち時間ができてるってことかな?
  • Microsoft、RAGの機能を拡張、強化させたGraphRAGを一般利用可能に | gihyo.jp

    Microsoft⁠⁠、RAGの機能を拡張⁠⁠、強化させたGraphRAGを一般利用可能に Microsoftは2024年7月2日、LLMが生成する出力の精度を向上させるために利用するRAG(検索拡張生成)の機能を拡張/強化した「GraphRAG」をGitHub上で公開した。 GraphRAG: New tool for complex data discovery now on GitHub -Microsoft Research Blog Welcome to GraphRAG RAG(Retrieval-Augmented Generation:検索拡張生成)は、ユーザーのクエリに基づいて特定の分野や組織の内部ナレッジベースの情報を検索し、その結果を参照してAIの回答に組み合わせる技術。モデルを再トレーニングすることなく、これらの情報を生成結果に即座に反映できる。 一方、通常のRAG

    Microsoft、RAGの機能を拡張、強化させたGraphRAGを一般利用可能に | gihyo.jp
    byaa0001
    byaa0001 2024/07/05
  • 動画生成AIについて:一番星はてのは目をゆっくり開き、踊れるか

    Krita の AI Diffusion プラグイン、SD のインターフェースとしてかなり良い。話題の LCM によるライブペイントも便利だし、イラストレーションツールだからレイヤーや選択ツールが使えるのが強い。すでに SD でできたことだが、こんな感じの変換が素早く、気持ちよく行える。https://t.co/bUPOZrKs1n pic.twitter.com/0hn8iMHHms — Naoto Yokoyama (@builtinnya) November 18, 2023 これらを ControlNet8 で入力して AnimateDiff を使えば済むと考えていたが、甘かった。 動画生成 AI に期待しているのは、この2枚の画像の間のフレームを説得力のある形で補間することである。しかし、7秒という長さでは、例えば次の動画1のようになってしまう。 動画1. 図1と図2を使い、パラ

    動画生成AIについて:一番星はてのは目をゆっくり開き、踊れるか
    byaa0001
    byaa0001 2024/07/03
  • 大規模言語モデル (LLM) の技術と最新動向

    マルチメディア,分散,協調とモバイル(DICOMO2024)シンポジウムでの招待講演の資料です。 https://dicomo.org/

    大規模言語モデル (LLM) の技術と最新動向
    byaa0001
    byaa0001 2024/06/29
  • 「NVIDIA最新GPUの20倍速い」史上最速を謳うAIチップ「Sohu」

    AIスタートアップ「Etched」は6月25日(現地時間)、ChatGPTなど最新のAI技術の基盤となっている「Transformer」アーキテクチャーに特化したチップ「Sohu」を発表した。この発表は、現在NVIDIAが支配的な地位を占めるAIチップ市場に、新たな競争をもたらす可能性がある。 Transformer処理に特化 AIチップ市場は現在NVIDIAが圧倒的なシェアを持つ。同社の汎用GPUは様々なAIモデルを効率的に処理できる柔軟性から市場の約80%を占めている。 多くの大手テクノロジー企業がAI開発のためにNVIDIAのチップに数十億ドルを投資しているのが現状だ。 Etchedの「Sohu」は、ASIC(Application-Specific Integrated Circuit:特定用途向け集積回路)と呼ばれる、特定の用途に最適化された集積回路だ。汎用性は低いものの、特定

    「NVIDIA最新GPUの20倍速い」史上最速を謳うAIチップ「Sohu」
    byaa0001
    byaa0001 2024/06/27
  • 声優の利益保護へ音声データを認証 AIカバー対策、初の団体設立へ:朝日新聞デジタル

    AI人工知能)に学ばせる音声データを認証する団体が来月にも設立される。25日に会見した関係者によると、国内初。AI開発者は、認証を受けた質の高い安全なデータを購入でき、声優らにも対価が支払われるようになる。データの追跡や透明性の確保につながるため、AI開発と知的財産の保護という点からも先駆的な例となりそうだ。 この団体は一般社団法人「日音声AI学習データ認証サービス機構(AILAS(アイラス))」。中心メンバーは研究者や弁護士で、システム開発などを経て来年、格始動する。 AIと知財保護をめぐっては、内閣府の有識者検討会が5月、中間とりまとめを発表した。そこでは、著作権法などの法令以外に技術や契約といった視点を組み合わせることを強調している。 一方で、著作権法では保護されない声優らの声については、今後の課題として、他の法律でどの程度保護できるのかを整理するとした。ただ、すでにAIに声優

    声優の利益保護へ音声データを認証 AIカバー対策、初の団体設立へ:朝日新聞デジタル
    byaa0001
    byaa0001 2024/06/25
    JASRACほんと頑張ってたらなぁと思うと悔しいね。ちゃんと活用を認めながら、ロイヤリティをクリエイターに渡せる管理団体があればいいのにと頗る悔しい。
  • 国産LLM初、AIエージェントとして使える「KARAKURI LM 8x7B Instruct v0.1」を一般公開 | KARAKURI

    トップ セミナー・お知らせ お知らせの記事一覧 国産LLM初、AIエージェントとして使える「KARAKURI LM 8x7B Instruct v0.1」を一般公開 ~6月20日・21日開催の AWS Summit 2024 で初披露~ カスタマーサポートDXを推進するカラクリ株式会社(東京都中央区:代表取締役CEO 小田志門、以下カラクリ)は、6月20日に国産LLMの中で初めて※1Function callingとRAGに対応した「KARAKURI LM 8x7B Instruct v0.1」を公開いたします。対応により、「KARAKURI LM 8x7B Instruct v0.1」は様々なアプリケーションを人間に代わって操作するAIエージェント※2としての活用が可能です。そのため生成AIをビジネス実装をする際に、従来の国産モデルであれば必要だった「業界・企業特有のタスクのプログラミ

    国産LLM初、AIエージェントとして使える「KARAKURI LM 8x7B Instruct v0.1」を一般公開 | KARAKURI
    byaa0001
    byaa0001 2024/06/22
  • 加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実

    加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実 2024.06.21 Updated by Ryo Shimizu on June 21, 2024, 18:19 pm JST 世界中の企業や政府が狂ったようにNVIDIAのGPUを買い漁る流れはそろそろ潮時かもしれない。 いくつかの興味深い事象が起きているからだ。 昨日発表されたKarakuri社のLLM、「KARAKURI LM 8x7B Instruct v0.1」は、非常に高性能な日語LLMだ。Karakuri社は今年の一月にも非常に高性能な70Bモデルを引っ提げて業界に旋風を巻き起こした。この最新のLLNは、日語向けオープンLLMとしては初の「命令実行」チューニングを施されている。それだけでなく、RAGと呼ばれる、複数の知識を組み合わせてより正解に近い答えを導く技術や、Function

    加熱するLLM開発競争に冷や水、オープンモデルの組み合わせだけでGPT-4o越えの事実
  • 【ChatGPT】英語学習用に素敵な先生を錬成したよ! - はげあたま.org

    chatgpt.com 3行で 英文アウトプット練習の優れた相手をGPTsで実装できたからストアに並べたよ! 学習ツールとしての気持ちよさが自慢なのでまずは1回遊んでみてください! 「英語だと中学生レベルの文章すら全然話せない」の克服ができる………と信じて、製作者自身が酷使しています 何ができるの? 和文による出題→英訳→添削→出題…のループです。 体験の良さと自身のアウトプットカの弱さは触ってもらえばすぐに伝わるはずです。これ読む人の8割はブクマして満足するだけなんでしょうけど、これ以降を読むより先にまずは一度使ってみてください。最初にあるリンクへ飛ぶだけです。 なお「完全無料!」と言いたいですが、ChatGPTへの課金が無いとすぐに制限が入るのが最大の難点です。 特長を教えて ジャンルや問題の難易度を適宜変更可能。激ムズ要求出したら絶望感がすごい…… 日語混じりの英文や、かなりの意訳

    【ChatGPT】英語学習用に素敵な先生を錬成したよ! - はげあたま.org
    byaa0001
    byaa0001 2024/06/12
    これは自分に良さそう 後でやる←だめ /国際業務に興味あっても英語で手が止まるんよなぁー
  • ChatGPTなど数々の高性能AIを生み出した仕組み「Attention」についての丁寧な解説ムービーが公開される

    さまざまな数学的トピックをムービー形式で解説するサイト「3Blue1Brown」において、ChatGPTに代表されるAIを形作っている「Transformer」構造の心臓部「Attention(アテンション)」についての解説が行われています。 3Blue1Brown - Visualizing Attention, a Transformer's Heart | Chapter 6, Deep Learning https://www.3blue1brown.com/lessons/attention AIの中身と言える大規模言語モデルのベースとなる仕事は「文章を読んで次に続く単語を予測する」というものです。 文章は「トークン」という単位に分解され、大規模言語モデルではこのトークン単位で処理を行います。実際には単語ごとに1トークンという訳ではありませんが、3Blue1Brownは単純化して

    ChatGPTなど数々の高性能AIを生み出した仕組み「Attention」についての丁寧な解説ムービーが公開される
  • 【個人資産800億円】“伝説の投資家”清原達郎氏の情報収集「会社四季報とIR情報を読むだけで十分」その読み解き方 | マネーポストWEB

    清原達郎氏が「唯一、お金を払う価値がある」と断言するのは『会社四季報』(撮影/野口博) 投資熱が高まるなか、企業の経営状況や株価など投資情報へのニーズも増している。昨今は個人投資家向けの有料情報サイトが乱立しているが、個人資産800億円という伝説の投資家・清原達郎氏は「当に必要な有料情報源は『会社四季報』のみ。あとは企業ホームページのIR(Investor Relations)情報だけで十分」と指摘する。では清原氏は会社四季報とIRをどう読み解いているのか。独自メソッドを初公開する。 「株価情報の収集にお金をかける必要はない」──そう断ずる清原氏。かつてヘッジファンド・タワー投資顧問の運用部長として旗艦ファンドを立ち上げ、2005年に発表された最後の高額納税者番付でサラリーマンとして初の1位(納税額37億円)に輝いた伝説の投資家である。 清原氏は、2018年に咽頭がんの手術で声帯を失い、

    【個人資産800億円】“伝説の投資家”清原達郎氏の情報収集「会社四季報とIR情報を読むだけで十分」その読み解き方 | マネーポストWEB
    byaa0001
    byaa0001 2024/05/23
    情報が均質に揃うならAIしやすそうね
  • AIアニメを作った話|852話

    2/6になんかt2vでいきなりAIanimeがうまく行ったのでそこから9日まで徹夜しながら色々模索してました。

    AIアニメを作った話|852話
    byaa0001
    byaa0001 2024/02/11
    こういう素材技術一つ一つが積み重ねられることで、作品の演出をAIで一通り組めるようになる未来が見えてくる。すごいね、実用化までもう一息って感じがする。そろそろ一本インディで出てくるんじゃないか。
  • AIが自分自身に報酬を与えて進化する「自己報酬型言語モデル」 米Metaなどが開発、実験でGPT-4を上回る【研究紹介】

    TOPコラム海外最新IT事情AIが自分自身に報酬を与えて進化する「自己報酬型言語モデル」 米Metaなどが開発、実験でGPT-4を上回る【研究紹介】 AIが自分自身に報酬を与えて進化する「自己報酬型言語モデル」 米Metaなどが開発、実験でGPT-4を上回る【研究紹介】 2024年1月23日 米Metaと米ニューヨーク大学に所属する研究者らが発表した論文「Self-Rewarding Language Models」は、大規模言語モデル(LLM)が自分自身に報酬を与えることで繰り返し学習する「自己報酬型言語モデル」を提案した研究報告である。このモデルは、自身が生成した問題に対する応答に報酬を割り当て、その結果をトレーニングデータとして使用。自己を反復して訓練することで、精度を向上させられる。 keyboard_arrow_down 研究背景 keyboard_arrow_down 研究内容

    AIが自分自身に報酬を与えて進化する「自己報酬型言語モデル」 米Metaなどが開発、実験でGPT-4を上回る【研究紹介】
  • これは嬉しい ChatGPTプロンプト書き方のコツ、OpenAIが公開

    OpenAIは、大規模言語モデル(GPT-4)でよりよい結果を出すためのプロンプトエンジニアリング(プロンプトのノウハウ)入門テキストを同社のウェブサイトで公開している。 同テキストでは、現在同社で最高の性能を持つ大規模言語モデルGPT-4を対象に、よりよい結果を導くための6つの戦略と、それぞれを実行する際の具体的な戦術(コツ)が掲載されている。 また、「Prompt examples」のページでは、上記で紹介したものを含む多数のプロンプト例が紹介されており、すぐに利用できるようになっている。 では紹介された6つの戦略を見ていこう。 明確な指示を書く LLMは利用者の心を読むことができないので、回答が長すぎる場合は「簡潔に」、単純すぎる場合は「専門家レベルで」と明示的に依頼する必要がある。 具体的な戦術としては下記が提案されている。 ・より関連性の高い回答を得られるよう、質問は詳細に ・モ

    これは嬉しい ChatGPTプロンプト書き方のコツ、OpenAIが公開
  • LLM時代の強化学習 - どこから見てもメンダコ

    強化学習におけるLLMの活用パターン調査 はじめに:実世界における強化学習の課題 LLM×強化学習 人間はゼロショット推論によりサンプル効率の良い学習ができる LLMによるゼロショット推論の例 さまざまなLLM活用パターン 1. 報酬モデルとしてのLLM LLMによる代理報酬モデル VLMによる外観ベース代理報酬モデル 外部知識にもとづく報酬モデル設計 2. 計画モデルとしてのLLM LLMによるセマンティック計画 LLMによる構造的な探索計画 3. 方策モデルとしてのLLM LLM as 確率方策 マルチモーダルLLM as 確率方策 参考:GPTアーキテクチャの転用 4. 世界モデルとしてのLLM Language Models Meet World Models (あとで書く) おわりに:VLM as 確率方策に期待 はじめに:実世界における強化学習の課題 レトロゲームで人間並みのパ

    LLM時代の強化学習 - どこから見てもメンダコ
  • 「機械学習で時系列予測はできるのか」論議がTransformerと共に帰ってきた - 渋谷駅前で働くデータサイエンティストのブログ

    先日、こちらのポストをお見かけしました。 AI技術開発部の高橋が社内勉強会の資料「時系列予測にTransformerを使うのは有効か?」を公開しました。 論文Are Transformers Effective for Time Series Forecastingの紹介を中心に、時系列予測について解説しています。ぜひご覧ください。https://t.co/LplxTT8b1d pic.twitter.com/nUXb4bGiQ3— GO Inc. AI Tech (@goinc_ai_tech) 2023年9月28日 なるほど、NN全盛というかNN一択の時代にあっては時系列予測もNNでやるのが当たり前になったのだなという感想でした。大昔「沖」で古典的な計量時系列分析を一通り学んだ身としては隔世の感がありますが、これもまたNN時代の趨勢なのでしょう。 なお、元論文2点は上記リンクから辿

    「機械学習で時系列予測はできるのか」論議がTransformerと共に帰ってきた - 渋谷駅前で働くデータサイエンティストのブログ