はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

はてなブックマーク

  • はてなブックマークって?
  • アプリ・拡張の紹介
  • ユーザー登録
  • ログイン
  • Hatena

はてなブックマーク

トップへ戻る

  • 総合
    • 人気
    • 新着
    • IT
    • 最新ガジェット
    • 自然科学
    • 経済・金融
    • おもしろ
    • マンガ
    • ゲーム
    • はてなブログ(総合)
  • 一般
    • 人気
    • 新着
    • 社会ニュース
    • 地域
    • 国際
    • 天気
    • グルメ
    • 映画・音楽
    • スポーツ
    • はてな匿名ダイアリー
    • はてなブログ(一般)
  • 世の中
    • 人気
    • 新着
    • 新型コロナウイルス
    • 働き方
    • 生き方
    • 地域
    • 医療・ヘルス
    • 教育
    • はてな匿名ダイアリー
    • はてなブログ(世の中)
  • 政治と経済
    • 人気
    • 新着
    • 政治
    • 経済・金融
    • 企業
    • 仕事・就職
    • マーケット
    • 国際
    • はてなブログ(政治と経済)
  • 暮らし
    • 人気
    • 新着
    • カルチャー・ライフスタイル
    • ファッション
    • 運動・エクササイズ
    • 結婚・子育て
    • 住まい
    • グルメ
    • 相続
    • はてなブログ(暮らし)
    • 掃除・整理整頓
    • 雑貨
    • 買ってよかったもの
    • 旅行
    • アウトドア
    • 趣味
  • 学び
    • 人気
    • 新着
    • 人文科学
    • 社会科学
    • 自然科学
    • 語学
    • ビジネス・経営学
    • デザイン
    • 法律
    • 本・書評
    • 将棋・囲碁
    • はてなブログ(学び)
  • テクノロジー
    • 人気
    • 新着
    • IT
    • セキュリティ技術
    • はてなブログ(テクノロジー)
    • AI・機械学習
    • プログラミング
    • エンジニア
  • おもしろ
    • 人気
    • 新着
    • まとめ
    • ネタ
    • おもしろ
    • これはすごい
    • かわいい
    • 雑学
    • 癒やし
    • はてなブログ(おもしろ)
  • エンタメ
    • 人気
    • 新着
    • スポーツ
    • 映画
    • 音楽
    • アイドル
    • 芸能
    • お笑い
    • サッカー
    • 話題の動画
    • はてなブログ(エンタメ)
  • アニメとゲーム
    • 人気
    • 新着
    • マンガ
    • Webマンガ
    • ゲーム
    • 任天堂
    • PlayStation
    • アニメ
    • バーチャルYouTuber
    • オタクカルチャー
    • はてなブログ(アニメとゲーム)
    • はてなブログ(ゲーム)
  • おすすめ

    大阪万博

『note.com』

  • 人気
  • 新着
  • すべて
  • 【動画生成】Sunoで作ったオリジナル曲をComfyUI-FLOATで歌ってもらうゾ!|Baku

    37 users

    note.com/bakushu

    「音楽AIで生成した日本語曲を動画AIに歌ってもらう」のが、思ったよりも自然にできて感動したので、記事にしてみました。 Sunoで生成した曲AI音楽生成サービスのSunoでつくった曲を使いました。バージョンはv4.0、プロンプトは「mellow cute chip tune, female husky vocals」です。 同じ歌詞で生成した以下の4曲のうち、2番目の曲をえらびました。 この曲とAI動画生成を組み合わせて「歌ってみた」ができないかな、と思っていろいろ試した結果、FLOATという生成AIに行きつきました。 FLOATとは人物画像と発話音声をもとにリップシンク動画を生成する「AIポートレート・アニメーション」系の技術です(いわゆるAIアバターの一種)。 この系統の生成AIは数多く公開されていて、古くはSadTalker、最近ではAniPortrait、Hallo、Sonic、F

    • 暮らし
    • 2025/05/16 06:57
    • AI
    • あとで読む
    • video
    • ComfyUI-FLOAT
    • 【ComfyUI】ローカル最高性能のi2v動画生成「CogVideoX-5B-I2V」をためす|Baku

      3 users

      note.com/bakushu

      2024/12追記:この記事は2024/9時点のComfyUI環境でテストしたものです。その後も開発が進められており、以下の内容はすでに古くなっていますので、本記事は参考までとしてください。最新のComfyUIワークフローは「ComfyUI-CogVideoXWrapper」から入手できます。 「CogVideo」シリーズは、ローカルで使える動画生成AIの中で2024年9月時点で最も高性能なモデルです。ただ従来のモデルはText-To-Video(テキスト指示からの動画生成)に用途が限られていました。 今回、新たにImage-To-Video(画像からの動画生成)に対応した「CogVideoX-5B-I2V」が公開されたので、ComfyUIで試してみました。

      • テクノロジー
      • 2024/10/25 08:58
      • ai
      • 動画
      • 饒舌な日本語ローカルLLM【Japanese-Starling-ChatV-7B】を公開しました|Baku

        31 users

        note.com/bakushu

        最近LLMコミュニティから生まれた小型MoEモデル「LightChatAssistant-2x7B」の日本語チャット性能がとても良いため、モデル作者さんが用いた手法(Chat Vector+MoEマージ)を後追いで勝手に検証しています。 その過程で複数のモデルを試作したところ、7Bクラスとしてはベンチマークスコアがやたら高いモデルが出てきたので「Japanese-Starling-ChatV-7B」として公開してみました。 以下はこのモデルの簡単な説明です。 簡易評価日本語によるinstruction-tuningを行ったモデルの評価用データセットとして知られる「ELYZA-tasks-100」を用いて、ほかの有力な7Bクラスの日本語モデルとスコアを比較しました。 その結果、GPT-4による評価において既存の日本語7Bモデルより大幅に高いスコア(3.42)を示すことが確認できました。単純に

        • テクノロジー
        • 2024/04/16 11:28
        • LLM
        • 自然言語処理
        • あとで読む
        • 日本語
        • 機械学習
        • 人工知能
        • techfeed
        • 【ローカルLLM】言語モデルの知識編集を試す(Knowledge Editing)|Baku

          7 users

          note.com/bakushu

          言語モデルの研究領域の一つに「知識編集(Knowledge Editing)」というものがあるらしい。 近年は言語モデルの大規模化による開発コスト膨張が問題になっており、既存モデルをより長く利用するための低コストな知識更新手法に注目が集まってる(らしい)。 とはいえ既存の知識編集手法は不確実性が高いうえ、モデル性能が劣化する副作用も存在する(らしい。こちらやこちらのアブストラクトを参照)。 言語モデルの知識編集そもそも知識編集ってなんなのか、と思って検索したところ、こちらによくまとまっていた。 https://github.com/zjunlp/EasyEdit/blob/main/tutorial.pdf基本的には追加学習やRAGとは異なるアプローチを指すらしい。 追加学習による知識更新は高コストで副作用が多い。RAGによる知識更新は一時的でスケーリングもしづらい。そこで、より局所的&恒

          • テクノロジー
          • 2023/12/21 09:36
          • 機械学習
          • あとで読む
          • 【AI画像生成】ComfyUIのAPIを使って物語の挿絵生成を試す|Baku

            3 users

            note.com/bakushu

            ChatGPTが業務分担してゲームを作る「ChatDev」がすごく面白かった。 同じような発想で、エージェント化したAIが分業して漫画を作るアプリとかあったら楽しいので、誰か作って公開してほしい… …漫画はムリでも絵本くらいなら自分でもイケるかも、という安直な考えを抱いたので、とりあえずAPIの使い方を調べた。 「ChatDev」では画像生成にOpenAIのAPI(DALL-E)を使っている。手軽だが自由度が低く、創作向きではない印象。今回は「ComfyUI」のAPIを試してみた。 ComfyUIの起動まず、通常どおりComfyUIをインストール・起動しておく。これだけでAPI機能は使えるっぽい。 # ComfyUIのインストール !git clone https://github.com/comfyanonymous/ComfyUI %cd ComfyUI # 依存関係のインストール !

            • テクノロジー
            • 2023/12/14 21:15
            • AnimateDiffでドット絵アニメをつくる / Pixel Art with AnimateDiff |Baku

              4 users

              note.com/bakushu

              English summary of this article is at the end. AnimateDiffでドット絵アニメを作ってみたらハマったので、ワークフローをまとめてみました。 ComfyUI AnimateDiffの基本的な使い方から知りたい方は、こちらをご参照ください。 1. カスタムノード特別なカスタムノードはありません。以下の2つだけ使います。 https://github.com/Kosinkadink/ComfyUI-AnimateDiff-Evolved https://github.com/Kosinkadink/ComfyUI-VideoHelperSuite GoogleColab Proで試す場合は、末尾のColabをお使いください。 2. SD1.5モデルの場合通常のワークフローにピクセルアートLoRAを組み合わせることでドット絵GIFを生成します。

              • アニメとゲーム
              • 2023/11/17 21:14
              • anime
              • 【AIアニメ】ComfyUI AnimateDiffでSDXLモデルを試す(HotshotXL)|Baku

                3 users

                note.com/bakushu

                【2023/11/10追記】AnimateDiff公式がSDXLに対応しました(ベータ版)。ただし現時点ではHotshot-XLを利用したほうが動画の質が良いようです。 「Hotshot-XL」は、Stable Diffusion XL(SDXL)モデルを使ってGIF動画を生成するためのツールです。 「ComfyUI-AnimateDiff」が、最近この「HotshotXL」に対応したようなので試してみました。 留意点ちょっとややこしいですが「AnimateDiff」と「HotshotXL」は別物です。「ComfyUI版のAnimateDiff」が独自に機能拡張し、HotshotXLを使えるようになったものです。 HotshotXLは推奨される動画の長さがフレームと短く動きも不自然になりやすいため、性能面では通常のAnimateDiffに及びません。 必要な準備ComfyUI本体の導入方法

                • テクノロジー
                • 2023/10/14 19:10
                • 【AIアニメ】ComfyUIでAnimateDiffをはじめよう!|Baku

                  38 users

                  note.com/bakushu

                  ※当noteで掲載しているワークフローについては各記事公開時点のComfyUI環境で動作を確認しています。その後のComfyUI/カスタムノードのアップデートにより最新の環境では不具合が生じる可能性があるので、あらかじめご了承ください。 このnoteは、いま注目されているAI動画生成ツール「AnimateDiff」のハウツーをまとめた初心者ガイドです。 「AnimateDiff」は2023年7月に公開されたオープンソースの技術で、誰でも無償で利用することができます。AnimateDiffについては以下の記事が参考になります。 導入編1. ComfyUI のすすめ「AnimateDiff」は、単体では細かなコントロールが難しいため、現時点では以下のパッケージのどれかを選んで使うことが多いです。 AnimateDiff-CLI-Prompt-Travel コマンドラインでAnimateDiff

                  • テクノロジー
                  • 2023/09/29 09:18
                  • AI
                  • StableDiffusion
                  • 動画
                  • 機械学習
                  • 人工知能
                  • アニメ
                  • ツール
                  • あとで読む
                  • 【AIアニメ】ComfyUI AnimateDiffでダンス動画のvid2vid変換を試す|Baku

                    3 users

                    note.com/bakushu

                    前回の記事では、AI動画生成ツールのAnimateDiffとControlNet Tileを使って、2つの画像をつなぐ中割動画を生成してみました。 今回は、ControlNetのOpenposeとDepthを組み合わせて、元動画をアニメ・実写など色々なトーンの動画に変換できるVideo-to-Video(Movie-to-Movie)を試します。 1. 必要な準備ComfyUI内のフォルダに導入しておく必要があるものは以下の通りです。 カスタムノード 次の3つを使います。 ComfyUI-AnimateDiff-Evolved(ComfyUI用AnimateDiff) ComfyUI-Advanced-ControlNet(ControlNet拡張機能) ControlNet Auxiliary Preprocessors(プリプロセッサー) ComfyUI Managerを使っている場合

                    • テクノロジー
                    • 2023/09/26 11:49
                    • 【AIアニメ】ComfyUI AnimateDiffでアニメの中割りを作ろう!|Baku

                      5 users

                      note.com/bakushu

                      前回の記事では、AI動画生成ツールのAnimateDiffと「ControlNet」を組み合わせることで、特定のモーションをアニメで再現しました。 今回は、ControlNetの「Tile」という機能を組み合わせて、2枚の画像を補間するアニメーションの生成を試します。 必要な準備ComfyUI AnimateDiffの基本的な使い方については、こちらの記事などをご参照ください。 今回の作業でComfyUIに導入が必要なカスタムノードなどは以下のとおりです(説明は後述)。 カスタムノード (./custom_nodes/): 以下の2つを使います。 ComfyUI-AnimateDiff-Evolved(ComfyUI用AnimateDiff) ComfyUI-Advanced-ControlNet(ControlNet拡張機能) モーションモジュール (./custom_nodes/Com

                      • テクノロジー
                      • 2023/09/23 04:16
                      • AnimateDiff
                      • ComfyUI
                      • note
                      • AI
                      • 【ローカルLLM】QLoRAの複雑なパラメータを(少しでも)整理する|Baku

                        3 users

                        note.com/bakushu

                        前回の記事でも触れたとおり、QLoRAによるLlama-2のファインチューニングで試行錯誤している。 「QLoRA」は、LlamaのようなローカルLLMをファインチューンする場合に現在主流となっている手法。通常のLoRAよりもGPUリソースを大幅に節約でき、コストや時間の面でメリットがあるとされる。 パラメータ設定については、Llama-2-7BでQLoRAを行う場合の公式のスクリプトがあり、大部分は以下の設定を流用すればいいはず。 CUDA_VISIBLE_DEVICES=0 python qlora.py \ --model_name_or_path meta-llama/Llama-2-7b-hf \ --use_auth \ --output_dir ./output/llama-2-guanaco-7b \ --logging_steps 10 \ --save_strategy

                        • テクノロジー
                        • 2023/09/07 08:40
                        • 【ローカルLLM】日本語強めの多言語モデル「OpenBuddy-Llama2」を試す|Baku

                          3 users

                          note.com/bakushu

                          「OpenBuddy-Llama2-13B」というモデルを試したところ、わりと日本語が良かった。英文和訳などは微妙なものの、全般的な日本語チャットは「Vicuna V1.5」と同等以上の印象で、Llama系のモデルとしてはかなりいい感じ。 OpenBuddy「OpenBuddy」シリーズは以下の特徴を掲げるオープンなLLM。 多言語会話AI:中国語、日本語、韓国語、フランス語、ドイツ語などに対応 ボキャブラリーの強化と、CJK文字のサポート 複数ターンの対話データセットで微調整し、パフォーマンスを向上 LLaMA、Falcon、OpenLlamaなど複数のモデルをベースにリリース 今回試した「OpenBuddy-Llama2」は、このうちLlama-2-13B/70Bをベースにしたモデルで、いずれも数日前にアップデートされている。 出力例GGMLモデルのRepoから「openbuddy-l

                          • テクノロジー
                          • 2023/08/26 15:54
                          • GGMLからGGUFへ:llama.cppのファイルフォーマット変更|Baku

                            5 users

                            note.com/bakushu

                            RedditのローカルLLM板に以下の投稿があった。週明けに「llama.cpp」で使われているGGMLファイルが「GGUF」という新フォーマットに変更されるとのこと。 フォーマット変更の要点GGUFは、GGMLよりも拡張性の高いファイルフォーマット。「.bin」から「.gguf」になる。 これにより、Llama以外の言語モデル(falcon, rwkv, bloom, etc.)がllama.cppでサポートできるようになる。サポートするモデルは段階的に増える予定。 その他、プロンプトフォーマットをGGUF内に設定しておけるようなったり、rope-freq-baseやgqaなどの一部パラメータが不要になる予定。 破壊的変更であり、既存のggmlモデルは「GGUF #2398」のマージ後は使えなくなる(有志がGGML>GGUFの変換スクリプトを作成中)。 マージは週明け(現地8月21日)を

                            • テクノロジー
                            • 2023/08/20 23:53
                            • ai
                            • 日本語LLMのベンチマーク:「JGLUE」と「Rakuda Benchmark」|Baku

                              4 users

                              note.com/bakushu

                              LINEの「japanese-large-lm-instruction-sft」リリースに関する公式ブログで「Rakuda Benchmark」という日本語LLMベンチマークがモデルの性能評価に使われていた。 これまで日本語LLMのリリースでよく見たのは「JGLUE(日本語一般言語理解評価)」というベンチマーク。何が違うのか簡単に調べてみた。 JGLUE(日本語一般言語理解評価)「JGLUE」は、早稲田大学とYahoo! JAPANが構築・公開したベンチマーク。 ベンチマークの具体的な構成については、以下の記事に詳しい。 この「JGLUE」のスコアでLLMの日本語性能をランク付けしたリーダーボードには、「Nejumi LLMリーダーボード」や、Stability AIによる「JP Language Model Evaluation Harness」がある。 Nejumi LLMリーダーボー

                              • テクノロジー
                              • 2023/08/19 10:08
                              • あとで読む
                              • 【ローカルLLM】QLoRAで「Vicuna-v1.5」の日本語翻訳性能を向上させる|Baku

                                3 users

                                note.com/bakushu

                                Llama-2(13B)の日本語ファインチューンで試行錯誤している。 fine_tuning521k-jaなどの日本語データセットを手始めに、ShareGPTの日本語データを抽出したりしてQLoRAを試したものの、成果はイマイチで素人の限界を感じる。ColabやRunpodのGPU課金だけが積みあがってゆく…。 というか、自分でLlama-2を日本語ファインチューンしたモデルより「Vicuna」のほうが普通に日本語がうまい。 ならば、Llama-2のベースモデルをイチから日本語トレーニングするよりVicunaをファインチューンした方が話が早いのでは?と思うに至った。 Vicuna自体がLlamaのファインチューンモデルなので、さらにファインチューンを重ねるのがいいのかよくわかんないが…とりあえずテスト。 データセットの用意ひとまず最初は、翻訳タスク(英→日)に限定して「Vicuna-13B

                                • テクノロジー
                                • 2023/08/16 23:22
                                • ai
                                • 【llama2.c】15Mに満たない言語モデルで小さな物語を紡ぐ|Baku

                                  3 users

                                  note.com/bakushu

                                  OpenAIのAndrej Karpathy氏による「llama2.c」が話題になっていた。 CPU環境で「Llama 2 アーキテクチャをゼロから学習させ、重みを生のバイナリファイルに保存し、シンプルなCファイルにロードしてモデルを推論する」という一連の流れが体験できるという。 My fun weekend hack: llama2.c 🦙🤠https://t.co/CUoF0l07oX Lets you train a baby Llama 2 model in PyTorch, then inference it with one 500-line file with no dependencies, in pure C. My pretrained model (on TinyStories) samples stories in fp32 at 18 tok/s on my

                                  • テクノロジー
                                  • 2023/07/27 06:27
                                  • 【ローカルLLM】llama.cppの量子化バリエーションを整理する|Baku

                                    12 users

                                    note.com/bakushu

                                    【追記】 この記事の内容はかなり古くなっているのでご注意ください。ブログに新しい記事(https://sc-bakushu.hatenablog.com/entry/2024/02/26/062547)も上げてます。 「llama.cpp」はMacBookなどでLlamaベースの大規模言語モデルを動かすことを目標とするアプリケーション。一応CPUのみでも実行でき、GPUの非力な環境でも動かしやすい。 llama.cppの量子化モデルllama.cpp(GGML)では量子化によるモデルサイズ縮小が進んでいる。例えば、下記のHuggingFaceのRepoを見ると、GGML量子化モデルは「q4_0, q4_1, q5_0, q5_1, q8_0, q2_K, q3_K_S, q3_K_M, q3_K_L, q4_K_S, q4_K_M, q5_K_S, q5_K_M, q6_K」と多岐にわたる

                                    • テクノロジー
                                    • 2023/06/25 22:12
                                    • LLM
                                    • AI

                                    このページはまだ
                                    ブックマークされていません

                                    このページを最初にブックマークしてみませんか?

                                    『note.com』の新着エントリーを見る

                                    キーボードショートカット一覧

                                    j次のブックマーク

                                    k前のブックマーク

                                    lあとで読む

                                    eコメント一覧を開く

                                    oページを開く

                                    はてなブックマーク

                                    • 総合
                                    • 一般
                                    • 世の中
                                    • 政治と経済
                                    • 暮らし
                                    • 学び
                                    • テクノロジー
                                    • エンタメ
                                    • アニメとゲーム
                                    • おもしろ
                                    • アプリ・拡張機能
                                    • 開発ブログ
                                    • ヘルプ
                                    • お問い合わせ
                                    • ガイドライン
                                    • 利用規約
                                    • プライバシーポリシー
                                    • 利用者情報の外部送信について
                                    • ガイドライン
                                    • 利用規約
                                    • プライバシーポリシー
                                    • 利用者情報の外部送信について

                                    公式Twitter

                                    • 公式アカウント
                                    • ホットエントリー

                                    はてなのサービス

                                    • はてなブログ
                                    • はてなブログPro
                                    • 人力検索はてな
                                    • はてなブログ タグ
                                    • はてなニュース
                                    • ソレドコ
                                    • App Storeからダウンロード
                                    • Google Playで手に入れよう
                                    Copyright © 2005-2025 Hatena. All Rights Reserved.
                                    設定を変更しましたx