並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 11 件 / 11件

新着順 人気順

パソコン関連の検索結果1 - 11 件 / 11件

  • 画像生成AI「Stable Diffusion」をローカル環境で実行する - パソコン関連もろもろ

    公開日:2022年8月23日 最終更新日:2023年1月16日 はじめに 環境構築 実行方法 学習済みパラメーター「sd-v1-4.ckpt」のダウンロード リポジトリのクローン 「sd-v1-4.ckpt」の移動 いよいよ実行 結果 つづき 動作確認できたその他の環境 CUDA 11.3.1 1 2 CUDA 11.6.2 1 2 VRAM不足に直面したら 更新履歴(2022年10月11日) バージョン2.1 はじめに最近「DALL-E2」や「Midjourney」など文章から画像を生成するAIが流行っています。 その一つが今回紹介する「Stable Diffusion」です。 「Stable Diffusion」の特徴はオープンソースで公開されていることであり、ローカル環境で実行可能です。 もちろんWeb上で簡単に試すことも可能で、こちらにデモンストレーションが公開されています。 hu

      画像生成AI「Stable Diffusion」をローカル環境で実行する - パソコン関連もろもろ
    • ナポリタン寿司のPC日記 | Windows11、ブラウザの拡張機能、webサービスなど、パソコン関連について書いているブログです。筆者は初心者です。

      当サイトは、アフィリエイト・アドセンス広告を掲載しています。消費者庁が、2023年10月1日から施行予定である景品表示法の規制対象(通称:ステマ規制)にならないよう、配慮して記事を作成しています(記事はこちら、消す方法はこちら) 参考:令和5年10月1日からステルスマーケティングは景品表示法違反となります。 | 消費者庁

      • WSL2で外付けSSDを使う(ext4でフォーマットして使用する) - パソコン関連もろもろ

        最終更新日:2023年7月1日 はじめに 使用したもの 使用環境 方法 SSDのフォーマット Windows側から使用するデバイスを見る WSL2側からデバイスを見る 最後にマウントする 注意点 補足 さいごに 高パフォーマンスのための設定(2022年4月14日追記) 2023年7月1日追記 はじめにWSL2からWindows側のドライブにアクセスするだけなら非常に簡単です。 「/mnt/c」「/mnt/d」などでそれぞれCドライブ、Dドライブにアクセスできます。 しかし、それらのドライブはWindowsファイルシステムでフォーマットされているのでWSL2で読み書きする時に本来の速度が出ません。 今回は外付けSSDをext4形式でフォーマットしてWSL2専用の外付けドライブとして使用してみました。使用したもの KIOXIA 500GB NVMe M.2 SSD『EXCERIA SSD-CK

          WSL2で外付けSSDを使う(ext4でフォーマットして使用する) - パソコン関連もろもろ
        • 【改良2】【仕事効率化】使っていない 2in1 PC(またはタブレット)を有効活用、マクロパッドとして復活させる - パソコン関連もろもろ

          はじめに システムの概略 改善点 新旧比較 旧システム 新システム 注意点 変更前 変更後 前回までの記事 つづき はじめに以前Arduinoを使用して2in1 PC(またはタブレット)をマクロパッドとして使用する方法を紹介しました。 touch-sp.hatenablog.com 今回はシステムの小型化に挑戦します。システムの概略旧システムはこのようになっていました。 このシステムにおけるArduino UNOの役割は左側のPCからシリアル通信を受け取りそのままLeonardoに流すだけです。 Leonardoに二つのPCを接続できないためこのような方法となっていました。改善点USBシリアル変換アダプターを使用するとLeonardoに二つのPCを接続することが可能になります。 今回はSwitch Scienceから以下を購入して使用しました。 www.switch-science.com

            【改良2】【仕事効率化】使っていない 2in1 PC(またはタブレット)を有効活用、マクロパッドとして復活させる - パソコン関連もろもろ
          • 【OpenAI/Whisper】日本語音声の文字起こしをする際に専門用語に弱い点を克服する方法。 - パソコン関連もろもろ

            はじめに large-v2とlarge-v3の比較 large-v2 Pythonスクリプト「run.py」 実行 結果 large-v3 Pythonスクリプト「run.py」 実行 結果 ここから本題 Pythonスクリプト「run.py」 実行 結果 はじめにWhisperにlarge-v3という新しいモデルが追加されていたので試してみましたが専門用語に弱い点は改善されていませんでした。 その解決方法を紹介します。 音声はこちらから男性ナレーション、医療WEBドラマ医師役の音声をダウンロードさせて頂きました。 環境構築に関しては以前「Whisper」について書いた記事を見て下さい。 touch-sp.hatenablog.com large-v2とlarge-v3の比較まずはlarge-v2とlarge-v3の比較をしてみました。large-v2Pythonスクリプト「run.py」

            • 【Hotshot-XL】SDXLモデルを使った動画作成 - パソコン関連もろもろ

              はじめにいろいろな動画生成AIに触れてきましたが今までのはほぼすべてStable Diffusion 1.5をベースとしたモデルを使用していました。 今回SDXLをベースとした動画作成モデルが公開されていたので使ってみました。 github.com 導入 Windows 11 CUDA 11.7 Python 3.11 1行でPython環境が構築できるようにrequirements.txtを作成しました。 pip install -r https://raw.githubusercontent.com/dai-ichiro/myEnvironments/main/Hotshot-XL/requirements.txt 実行リポジトリのクローン git clone https://github.com/hotshotco/Hotshot-XL cd Hotshot-XL モデルのダウンロー

                【Hotshot-XL】SDXLモデルを使った動画作成 - パソコン関連もろもろ
              • CohereForAI/c4ai-command-r-plusを使ってうまくいったことが、量子化をしてぎりぎりローカルで動かせる規模のモデルでうまくいくのか試してみた - パソコン関連もろもろ

                はじめにCohereForAI/c4ai-command-r-plusを使った記事はこちらです。 touch-sp.hatenablog.com HuggingChatを使って動かしました。 今回はいろいろなモデルをローカルで動かして同じことがうまくいくのか試してみました。 ローカルで動かせるモデルははるかに規模が小さく、また量子化されています。 Temperature, Repeat Penaltyなどのパラメーターは一切変更を加えていません。 モデルの実行はすべてOllama、検証はDifyを使いました。モデル〇がついているものがうまくいったもの。 ×がついているものがうまくいかなかったもの。〇 command-r:35b-v0.1 ollama pull command-r:35b-v0.1-q4_0 parameters: 35.0B quantization: Q4_0 mode

                • OpenMMLab の MMagic を使って超解像。え、たったの3行? - パソコン関連もろもろ

                  はじめに以前から超解像の記事はいくつも書いてきました。 超解像(Super Resolution)とは画像の解像度を上げることです。「アップスケール」と言われているものとほぼ同じだと思います。 今まではOpenMMLabのMMEditingを使うことが多かったのですが、いつのまにかMMEditingがMMagicに吸収されました。 今回MMagicで超解像に挑戦したのですが、Pythonスクリプトはたったの3行でした。Pythonスクリプト from mmagic.apis import MMagicInferencer editor = MMagicInferencer('esrgan') editor.infer(img = "test.png", result_out_dir = "result.png") 2行目で使用するモデルを指定します。 これだけでモデルのダウンロードも自動で

                  • 【Diffusers】Multi-ControlNetで人物をきれいに描く - パソコン関連もろもろ

                    SDXL版はこちら。 はじめに前回の進化版です。 touch-sp.hatenablog.com 手をきれいに描くためにはcanny2imageでのエッジ検出の閾値を低く設定する必要がありました。 そうするとその他の部分も忠実に元画像が再現されてしまうので似たような画像が大量にできていしまいます。 一方scribble2imageを使うとある程度バラエティに富んだ画像ができますが手がきれいに描がけませんでした。 今回はMulti-ControlNetで「いいとこどり」をしてみます。元画像 元画像はぱくたそから使わせて頂きました。 こちらの画像です。方法canny2image用の画像とscribble2image用の画像の作成canny2image用の画像を作る方法はこちら。 scribble2image用の画像を作る方法はこちら。マスク画像の作成以下のようなマスク画像を作成します。 簡単に

                      【Diffusers】Multi-ControlNetで人物をきれいに描く - パソコン関連もろもろ
                    • 【Continue】VSCodeにAIによるプログラミング支援機能を付ける - パソコン関連もろもろ

                      はじめに以前「llama.cpp」を使って同様のことをしました。 LLM(大規模言語モデル)をローカルで実行して、それを VScode から使う。これですこれ、やりたかったのは正にこれです。 - パソコン関連もろもろ 今回は「Ollama」を使います。 以前できなかったコード補完の機能も実装することができました。PC環境 Windows 11 OllamaのインストールGitHubから「OllamaSetup.exe」をダウンロードして実行するだけでインストールは完了します。 モデルのインストールコマンドプロンプトで以下を実行します。 ollama pull codellama:7bollama pull deepseek-coder:6.7b-baseインストールしたモデルは「ollama list」と入力すれば一覧で見ることができます。 インストールしたモデルを削除する場合は「olla

                        【Continue】VSCodeにAIによるプログラミング支援機能を付ける - パソコン関連もろもろ
                      • 【悪用厳禁】顔をすり替える Roop を Stable Diffusion Web UI の拡張機能としてではなく単独で動かす - パソコン関連もろもろ

                        github.com はじめにディープフェイク画像が作れるという事で「悪用厳禁」、使用は「自己責任」でお願いします。 WSL2を使いました。環境構築で難しいのはcudnnをインストールするところだけです。環境 Ubuntu 22.04 on WSL2 CUDA 11.8 Python 3.10 準備cuDNNのインストールCUDAはあらかじめインストールされている前提です。 NVIDIA公式から「cudnn-local-repo-ubuntu2204-8.9.4.25_1.0-1_amd64.deb」をダウンロードしてからインストールしました。(ダウンロードにはアカウントが必要です) sudo dpkg -i cudnn-local-repo-ubuntu2204-8.9.4.25_1.0-1_amd64.deb sudo cp /var/cudnn-local-repo-ubuntu22

                          【悪用厳禁】顔をすり替える Roop を Stable Diffusion Web UI の拡張機能としてではなく単独で動かす - パソコン関連もろもろ
                        1