はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

はてなブックマーク

  • はてなブックマークって?
  • アプリ・拡張の紹介
  • ユーザー登録
  • ログイン
  • Hatena

はてなブックマーク

トップへ戻る

  • 総合
    • 人気
    • 新着
    • IT
    • 最新ガジェット
    • 自然科学
    • 経済・金融
    • おもしろ
    • マンガ
    • ゲーム
    • はてなブログ(総合)
  • 一般
    • 人気
    • 新着
    • 社会ニュース
    • 地域
    • 国際
    • 天気
    • グルメ
    • 映画・音楽
    • スポーツ
    • はてな匿名ダイアリー
    • はてなブログ(一般)
  • 世の中
    • 人気
    • 新着
    • 新型コロナウイルス
    • 働き方
    • 生き方
    • 地域
    • 医療・ヘルス
    • 教育
    • はてな匿名ダイアリー
    • はてなブログ(世の中)
  • 政治と経済
    • 人気
    • 新着
    • 政治
    • 経済・金融
    • 企業
    • 仕事・就職
    • マーケット
    • 国際
    • はてなブログ(政治と経済)
  • 暮らし
    • 人気
    • 新着
    • カルチャー・ライフスタイル
    • ファッション
    • 運動・エクササイズ
    • 結婚・子育て
    • 住まい
    • グルメ
    • 相続
    • はてなブログ(暮らし)
    • 掃除・整理整頓
    • 雑貨
    • 買ってよかったもの
    • 旅行
    • アウトドア
    • 趣味
  • 学び
    • 人気
    • 新着
    • 人文科学
    • 社会科学
    • 自然科学
    • 語学
    • ビジネス・経営学
    • デザイン
    • 法律
    • 本・書評
    • 将棋・囲碁
    • はてなブログ(学び)
  • テクノロジー
    • 人気
    • 新着
    • IT
    • セキュリティ技術
    • はてなブログ(テクノロジー)
    • AI・機械学習
    • プログラミング
    • エンジニア
  • おもしろ
    • 人気
    • 新着
    • まとめ
    • ネタ
    • おもしろ
    • これはすごい
    • かわいい
    • 雑学
    • 癒やし
    • はてなブログ(おもしろ)
  • エンタメ
    • 人気
    • 新着
    • スポーツ
    • 映画
    • 音楽
    • アイドル
    • 芸能
    • お笑い
    • サッカー
    • 話題の動画
    • はてなブログ(エンタメ)
  • アニメとゲーム
    • 人気
    • 新着
    • マンガ
    • Webマンガ
    • ゲーム
    • 任天堂
    • PlayStation
    • アニメ
    • バーチャルYouTuber
    • オタクカルチャー
    • はてなブログ(アニメとゲーム)
    • はてなブログ(ゲーム)
  • おすすめ

    猛暑に注意を

『Lento – Medium』

  • 人気
  • 新着
  • すべて
  • 続・ヒントを与える線画着色

    10 users

    medium.com/@crosssceneofwindff

    資料でも述べているように、一般的に線画着色の際のヒントの与え方は下画像のようにアタリ、タグ、リファレンスの3種類が存在します。リファレンスは少し分かりにくいですが画像を与えてこのような色配置で塗ってほしいと指定するものです。 前回の記事ではこの3種類の内アタリを与えた方式について実験した結果を述べました。今回の記事ではこのアタリ方式を少し昇華させたものと、リファレンス方式について実験した結果について述べていきます。 Method: Atari①Improvements 前回の記事において、下画像のようなUNetをベースとしたGeneratorとDiscriminatorを用いたpix2pix方式の線画着色を行なっていました。ヒントとなる当たりは入力として与えるだけでした。 Generator Architecture in Previous Methodしかし、この方式では大局的には塗れて

    • テクノロジー
    • 2019/11/26 22:43
    • 機械学習
    • 画像
    • あとで読む
    • StarGAN-VC2を用いた複数話者間声質変換

      3 users

      medium.com/@crosssceneofwindff

      Introduction以前の記事においてCycleGAN-VCを用いた声質変換について述べ、アライメントを取っていないノンパラレルなデータでも声質変換が可能になることを述べました。しかし、CycleGANを用いた手法ではあくまでも一対一、一人の声から一人の声にしか変換出来ません。別の声へと変換しようとすればまた別のCycleGAN-VCのモデルを学習しなければいけないです。そこで、一つのモデルで多対多の変換を行えるように画像と同様StarGANを用いた手法を試みました。 Network ArchitectureStarGANを用いた声質変換にはStarGAN-VCとそれを発展させたStarGAN-VC2が存在します。まずはStarGAN-VCについて説明します。 Hirokazu Kameoka,et al., “STARGAN-VC: NON-PARALLEL MANY-TO-MANY

      • テクノロジー
      • 2019/10/15 06:36
      • 美少女声への変換と合成

        369 users

        medium.com/@crosssceneofwindff

        Introduction今までは主に可愛い女の子の画像(or 動画)を生成することに取り組んできましたが、画面上に映せるようになったらやはり可愛い声で話して欲しいものです。そこで今回は、別の人の声が与えられた時に美少女声へと変換するための声質変換と、テキストが与えられた時に美少女声を生成するText-to-Speech(TTS)を行なった試行結果について述べようと思います。 Voice ConversionIntroduction声質変換のデータには2種類あります。それが、パラレルデータとノンパラレルデータです。以下にそれぞれの特徴を述べていきます。 パラレルデータを用いた声質変換 同じセリフを発する2種類の声を学習データとして用います。発話内容が同じのため、言語特徴を気にせず音響特徴量の変換を行うことが可能です。しかし、話速の違い等によって言葉を発するタイミングがずれてしまうのでDyna

        • テクノロジー
        • 2019/05/16 04:22
        • 機械学習
        • 音声合成
        • あとで読む
        • 人工知能
        • voice
        • ボイスチェンジャー
        • Deep Learning
        • 声
        • 音声
        • technology
        • GANを用いた二次元美少女全身画像生成

          9 users

          medium.com/@crosssceneofwindff

          IntroductionProgressiveGANやStyleGAN等、GANの発展により1024✕1024といった高解像度かつ綺麗な画像生成を行えることが可能になってきました。しかし、それらはあくまでも顔画像の生成に留まっており、以下の図のように人間の全身画像といったより複雑な画像に関しては依然として生成は難しいままです。 Koichi Hamada, et al., “ Full-body High-resolution Anime Generation with Progressive Structure-conditional Generative Adversarial Networks”そこで、今回は二次元美少女の顔画像生成という観点ではなく、全身画像に観点を置いて生成を試みたのでその結果について述べていきます。先に述べておきますが、全身と名づけておきながら実際は腰ぐらいまで

          • テクノロジー
          • 2019/04/13 11:49
          • Image
          • computer
          • 萌え
          • 機械学習
          • 興味深い
          • technology
          • programming
          • Instance-aware Image-to-Image Translation — About InstaGAN

            4 users

            medium.com/@crosssceneofwindff

            Introductionこの記事は「ICLR2019を読むアドベントカレンダー」の15日目の投稿記事です ノンパラレルなデータに対してのスタイル変換はCycleGAN登場以降様々な分野に適用されてました。しかし、変換させたいインスタンスの形がまるっきり変化していたり、一枚の画像にインスタンスが多く存在すると下画像のOriginal→CycleGANのように対象が変換されなかったり意図しない変換になってしまうことがありました。今回紹介する論文では、このような問題に対してインスタンス毎のスタイル変換を行うInstaGANを提案しています。このInstaGANを用いることによって下画像のOriginal→InstaGANのように狙った対象の変換や、インスタンス毎の変換を行うことが可能になります。 この論文の貢献は以下のように三つあります。 An instance-augmented neural

            • テクノロジー
            • 2019/01/15 12:47
            • Pix2pix + Gradient penaltyを用いた線画着色 – Lento – Medium

              6 users

              medium.com/@crosssceneofwindff

              Introduction前に線画着色についての記事を書きましたが、個人的に不満足だったので書き直しの意味で今回の記事を書きます(前回の記事は削除します)。ただ、前回の内容をそのまま行うのも面白くないのでネットワーク構造と損失関数を変えて実験した結果を載せます。 Network Architecture 今回用いたネットワーク構造: Generatorの出力はチャンネル数3。Discriminatorの出力はチャンネル数1。UNetベースで特段面白い構造ではないですが、GeneratorにResBlockを導入し、アップサンプリングとしてはNearest Neighbor Upsampling -> Convolutionを行っています。 Dataset線画着色するにあたって、今回線画と着色画像を19000ペアを用意しました。 着色画像はsafebooruからスクレイピングしました。なるべく

              • テクノロジー
              • 2018/10/09 02:15
              • あとで読む
              • “Large Scale GAN Training for High Fidelity Natural Image Synthesis” -About BigGAN

                11 users

                medium.com/@crosssceneofwindff

                Introduction今回はいつものように論文で提案された手法を実装して結果を見る記事ではなく、論文紹介です。まだレビュー中のものを紹介するのは気が引けるのですがTwitterやSlackで述べるには情報過多なので、記事に一旦まとめてみたいと思います。論文名は記事タイトルにあるもので、URLはこちらです。ここで提案されているBigGANは、512×512の高解像度条件付き画像生成(例えばImageNetを学習してImageNetのラベルを入力ノイズに付随して与え、そのラベルに相当する画像を生成するタスク)を行いますが、そのスコアが驚くものでした。GANの評価指標として用いられているInception Score(IS)とFIDの値がそれぞれ166.3と9.6と、従来のSoTAである52.52と18.65を大きく更新するものになったのです。 3. Scaling Up GANsいきなり3と

                • テクノロジー
                • 2018/10/01 01:29
                • 機械学習
                • ソフトウェア
                • 画像
                • StarGANを用いた髪色変換

                  5 users

                  medium.com/@crosssceneofwindff

                  今回の目的としてはキャラクターの髪色変換(ex. 黒→白)を行います。このように画像の一部分だけを変化させるようなスタイル変換としてはCycleGAN(論文)等が挙げられますが、問題としては2つのドメイン間しか往復できないことにありました。例えば、髪色を例にとると一つの学習器では黒→白と白→黒だけしか変換出来ません。別の髪色に変換しようとしたら更に学習器が必要となります。そこで、多ドメインを多ドメインへと変換出来るような学習器を用意する必要がありますが、そこで今回検討したのがStarGAN(論文)です。今回はこのStarGANを用いて、キャラクターの髪色を様々な色へと変化させることを行いました。 StarGANこの記事では、詳細は割愛します。簡潔に述べると、Generatorに今どのドメインへと変化させようとしているか表すベクトルをconcatして加え、Discriminatorにその画像

                  • テクノロジー
                  • 2018/05/24 09:14
                  • 機械学習
                  • あとで読む

                  このページはまだ
                  ブックマークされていません

                  このページを最初にブックマークしてみませんか?

                  『Lento – Medium』の新着エントリーを見る

                  キーボードショートカット一覧

                  j次のブックマーク

                  k前のブックマーク

                  lあとで読む

                  eコメント一覧を開く

                  oページを開く

                  はてなブックマーク

                  • 総合
                  • 一般
                  • 世の中
                  • 政治と経済
                  • 暮らし
                  • 学び
                  • テクノロジー
                  • エンタメ
                  • アニメとゲーム
                  • おもしろ
                  • アプリ・拡張機能
                  • 開発ブログ
                  • ヘルプ
                  • お問い合わせ
                  • ガイドライン
                  • 利用規約
                  • プライバシーポリシー
                  • 利用者情報の外部送信について
                  • ガイドライン
                  • 利用規約
                  • プライバシーポリシー
                  • 利用者情報の外部送信について

                  公式Twitter

                  • 公式アカウント
                  • ホットエントリー

                  はてなのサービス

                  • はてなブログ
                  • はてなブログPro
                  • 人力検索はてな
                  • はてなブログ タグ
                  • はてなニュース
                  • ソレドコ
                  • App Storeからダウンロード
                  • Google Playで手に入れよう
                  Copyright © 2005-2025 Hatena. All Rights Reserved.
                  設定を変更しましたx