タグ

2024年6月6日のブックマーク (3件)

  • Diffusionモデルによる漢字の生成 - Qiita

    はじめに This Kanji doesn't exist (一部ありそうですが...) diffusionモデルを作成して、漢字を生成した記録になります Diffusionモデルを実際にPythonで動かして、学習方法を理解することが目的です 詳しい理論や数式の導出は説明はしておりません 多様でありながら単純であり、かつ簡単に準備できる学習データとして"漢字"を利用しました コードはこちらを参考にしており、ネットワーク部分はそのまま利用しています https://github.com/tcapelle/Diffusion-Models-pytorch もくじ ライブラリのインポート 漢字データセットの作成 拡散過程 逆拡散過程 学習コード 結果 漢字生成 0. ライブラリのインポート 学習で利用するライブラリをインポートします。 学習はGoogle Colaboratoryで実施しました

    Diffusionモデルによる漢字の生成 - Qiita
    none53
    none53 2024/06/06
  • AIで生成した画像でフォントを作りました。その4/今後の話|Rei Amazusa

    概要Stable Diffusionのimg2imgを使用して、いわゆる「AIで作ったフォント」を作りました。フォント名は「まじなのセルフィ」です。今回で4回目です。 今回はプロンプトをImg2Textで生成してもらいました。つまりAIが元のフォントの画像の説明を生成し、それを自分自身に適用してImg2Imgを回しています。言葉だと説明しずらいので画像をぺたり。プロンプトの自己再適用がカメラの自撮りのように思えたので、このフォント名にしました。プロンプト考えるの面倒・・・興味位の研究ですね。 まじなのセルフィのつくりかた仮名とアルファベットと約物で、全然違う形が生成されて面白かったです。仮名は角ばっていてところどころ崩れたような形ですね。アルファベットには毛筆で描いたような線の強弱やハライが見られ、アルファベットの約物には漢字っぽい何かが見えます。プロンプトの"chinese chara

    AIで生成した画像でフォントを作りました。その4/今後の話|Rei Amazusa
    none53
    none53 2024/06/06
  • 【AnyText】文字も生成できる画像生成AIを動かしてみる

    今回はAlibabaの研究チームによって開発された英語以外の文字を生成できるAIモデル、AnyTextを動かしてみます。 AnyTextとは Alibabaグループによって開発された、文字も生成できる画像生成モデルです。Stable Diffusion 1.5をベースに作られていて、プロンプトで指示をすれば英語中国語、韓国語、日語で文字を生成できるのが特徴です。下のような画像たちが生成できるそうです。 この図はAnyTextの仕組みです。この研究とStable Diffusion 1.5の繋ぎこみは図中のText Control Netによって行われているようです。 動かしてみる Huggingfaceデモ Huggingfaceに公式がデモを用意してくれているのでそれを触ってみます。 プロンプトを書いて、 今回は「日語学習中」と書かれた黒板の前に立つアライグマを生成してみます 文字

    【AnyText】文字も生成できる画像生成AIを動かしてみる
    none53
    none53 2024/06/06