はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

はてなブックマーク

  • はてなブックマークって?
  • アプリ・拡張の紹介
  • ユーザー登録
  • ログイン
  • Hatena

はてなブックマーク

トップへ戻る

  • 総合
    • 人気
    • 新着
    • IT
    • 最新ガジェット
    • 自然科学
    • 経済・金融
    • おもしろ
    • マンガ
    • ゲーム
    • はてなブログ(総合)
  • 一般
    • 人気
    • 新着
    • 社会ニュース
    • 地域
    • 国際
    • 天気
    • グルメ
    • 映画・音楽
    • スポーツ
    • はてな匿名ダイアリー
    • はてなブログ(一般)
  • 世の中
    • 人気
    • 新着
    • 新型コロナウイルス
    • 働き方
    • 生き方
    • 地域
    • 医療・ヘルス
    • 教育
    • はてな匿名ダイアリー
    • はてなブログ(世の中)
  • 政治と経済
    • 人気
    • 新着
    • 政治
    • 経済・金融
    • 企業
    • 仕事・就職
    • マーケット
    • 国際
    • はてなブログ(政治と経済)
  • 暮らし
    • 人気
    • 新着
    • カルチャー・ライフスタイル
    • ファッション
    • 運動・エクササイズ
    • 結婚・子育て
    • 住まい
    • グルメ
    • 相続
    • はてなブログ(暮らし)
    • 掃除・整理整頓
    • 雑貨
    • 買ってよかったもの
    • 旅行
    • アウトドア
    • 趣味
  • 学び
    • 人気
    • 新着
    • 人文科学
    • 社会科学
    • 自然科学
    • 語学
    • ビジネス・経営学
    • デザイン
    • 法律
    • 本・書評
    • 将棋・囲碁
    • はてなブログ(学び)
  • テクノロジー
    • 人気
    • 新着
    • IT
    • セキュリティ技術
    • はてなブログ(テクノロジー)
    • AI・機械学習
    • プログラミング
    • エンジニア
  • おもしろ
    • 人気
    • 新着
    • まとめ
    • ネタ
    • おもしろ
    • これはすごい
    • かわいい
    • 雑学
    • 癒やし
    • はてなブログ(おもしろ)
  • エンタメ
    • 人気
    • 新着
    • スポーツ
    • 映画
    • 音楽
    • アイドル
    • 芸能
    • お笑い
    • サッカー
    • 話題の動画
    • はてなブログ(エンタメ)
  • アニメとゲーム
    • 人気
    • 新着
    • マンガ
    • Webマンガ
    • ゲーム
    • 任天堂
    • PlayStation
    • アニメ
    • バーチャルYouTuber
    • オタクカルチャー
    • はてなブログ(アニメとゲーム)
    • はてなブログ(ゲーム)
  • おすすめ

    GWの過ごし方

『zenn.dev』

  • 人気
  • 新着
  • すべて
  • リアルタイムAIアプリケーションにおけるONNXのチューニング

    5 users

    zenn.dev/parakeet_tech

    Parakeet株式会社でResearcherをしている金子(nadare)です。CPUのみで動作するリアルタイムAIボイスチェンジャーのParavoの研究開発をしております。 ParavoはAIモデルをPythonのPyTorchで学習した後、モデルをONNXというフォーマットに変換し、Rust上でONNX Runtimeを用いて動かしています。Paravoは音声変換時に最短で10msごとに推論しており、これの処理間隔や処理時間が短くなるほど、変換した音声をループバック再生する際の遅延が減ってしゃべりやすくなります。また、わずかにでも遅れると音声がプツっと途絶え体験を損ねてしまう問題もあります。そのため、Paravoではモデル推論が高速化するように様々なチューニングに力を入れています。 本記事ではONNXを用いたリアルタイムAIアプリケーションを作成する方向けに、ONNX作成時や推論時の

    • テクノロジー
    • 2025/09/01 17:00
    • performance
    • 機械学習
    • python
    • 日本語TTS用の学習データの精度を上げる「ふりがなWhisper」を作った話

      41 users

      zenn.dev/parakeet_tech

      この記事の内容はどこかに投稿する予定でしたが、この記事ほぼ同じアイデアを持つ論文が先日arXivに2本も立て続けに発表されたため([1, 2]、ともにINTERSPEECH2025採択)、供養のために公開しています。 この記事の最後でそれらの論文も軽く紹介します。 はじめに Parakeet株式会社リサーチャーの榎本 (X: @henomoto1025)です。純粋数学で博士号を取りポスドクをしていましたが、音声の分野に興味が移り、現在は音声界隈の研究のキャッチアップをしながら研究開発をしています。 今回は、弊社で開発している日本語音声合成エンジンParattsの質を向上させるために行った社内での取り組みについて紹介します。 短くまとめ 日本語TTSの学習データセットの中のあるテキストに「明日」という単語が入っていても、それが音声ファイルでは「アス」「アシタ」「ミョウニチ」のどの読みか分から

      • テクノロジー
      • 2025/06/24 00:36
      • あとで読む
      • 最先端のオープンソースTTSモデル『Chatterbox』とは!?〜使い方から技術詳細まで〜

        5 users

        zenn.dev/parakeet_tech

        はじめに こんにちは、Parakeet株式会社リサーチャーの今井(X: Nuts)です。 2025年5月29日に、Resemble AIからオープンソースText-to-Speech(TTS)モデル、Chatterboxが公開されました。 state-of-the-art TTS model that just beat ElevenLabs in blind evaluations ブラインド評価でElevenLabsに勝利したSoTA TTSモデル 本記事でわかること 本記事では、以下の流れでChatterboxについて掘り下げていきたいと思います。 Chatterboxの何がスゴいのか ― READMEから差別化ポイントを読み解く インストールから推論まで ― 最速5分で動かす手順 技術詳細を深掘り ― ベース技術と独自の改良点を解説 実際の音をチェック ― 生成サンプルをレビュー

        • テクノロジー
        • 2025/06/14 09:05
        • AI
        • 超低遅延AIボイスチェンジャーが開く世界

          3 users

          zenn.dev/parakeet_tech

          Parakeet株式会社でResearcherをしている金子(nadare)です。CPUで動く軽量AIボイスチェンジャーParavoの研究開発をしております。 本記事ではParavoのアピールポイントである0.06秒の遅延へのこだわりとそれを実現するための技術について解説したいと思います。 ボイスチェンジャーの歴史 従来型ボイスチェンジャー 従来のボイスチェンジャーは主にピッチ(声の高低)やフォルマント(声道の性質)を変え、それに様々なエフェクトをかけることで音声の変換を行っていました。これの実現にはハードウェアを使う方法、ソフトウェアを使う方法など様々ありますが、声に関する専門知識と入力する声を人力で調整するテクニックが必要でした。 疑似リアルタイムAIボイスチェンジャー 近年ではAI技術の発達により、ピッチやフォルマントを信号処理的に変えるのではなく、ディープラーニングの力によって特定

          • テクノロジー
          • 2024/06/26 21:53
          • あとで読む
          • Rustでリバーブを実装する

            3 users

            zenn.dev/parakeet_tech

            Parakeet株式会社でResearcherをしている金子(nadare)です。CPUで動く軽量AIボイスチェンジャーParavoにおいて、リバーブやイコライザといったエフェクターをかける機能をRustで実装しました。本記事ではRustで実装した理由や用いたライブラリについて説明します。 リバーブについて リバーブは音に残響音や反射音を加える空間的エフェクトで、通常の音をホールで演奏した音や狭い空間で鳴らした音のように加工します。リバーブの実装にはハードウェア・ソフトウェア等様々な手法がありますが、今回は畳み込み演算を用いたリバーブの実装を行いました。 畳み込み演算で実装するリバーブには、Room Impulse Response(RIR)という音の信号を用います。これは再現したい空間で拍手をしたときに得られるような音で、様々な環境で収録したRIRを集めたデータセットや、pyroomac

            • テクノロジー
            • 2024/06/19 17:36
            • Tauri + Vite + MantineUI でiOS向けのアプリを作り、AppStoreに配信する

              3 users

              zenn.dev/parakeet_tech

              こんにちは。だだっこぱんだです。 今回はTauriを使ってiOSアプリを作っていきます。 読むのがおすすめな人 フロントエンドをやってる人 Tauriについてあまり知らない人 iOSやAndroidのアプリを作りたいけどFlutterやSwift, Javaなどを覚えるのは大変だなと思っている人 Tauriとは 超ざっくり説明すると、Rustで書かれたデスクトップアプリを作るためのフレームワークです。 ElectronのようにHTML, CSS, JavaScriptで書くことができます。 Rustだからと言って身構える必要はなく、実際のところある程度のアプリであればほとんどJavaScriptで完結します。 v2のalpha版ではiOS, Androidにも対応しています。 ググれば色々出てくるので調べてみてください。 環境 これらの環境を前提として、進めていきます。 MacOS Ven

              • テクノロジー
              • 2023/11/10 13:01
              • 開発
              • android
              • iphone

              このページはまだ
              ブックマークされていません

              このページを最初にブックマークしてみませんか?

              『zenn.dev』の新着エントリーを見る

              キーボードショートカット一覧

              j次のブックマーク

              k前のブックマーク

              lあとで読む

              eコメント一覧を開く

              oページを開く

              はてなブックマーク

              • 総合
              • 一般
              • 世の中
              • 政治と経済
              • 暮らし
              • 学び
              • テクノロジー
              • エンタメ
              • アニメとゲーム
              • おもしろ
              • アプリ・拡張機能
              • 開発ブログ
              • ヘルプ
              • お問い合わせ
              • ガイドライン
              • 利用規約
              • プライバシーポリシー
              • 利用者情報の外部送信について
              • ガイドライン
              • 利用規約
              • プライバシーポリシー
              • 利用者情報の外部送信について

              公式Twitter

              • 公式アカウント
              • ホットエントリー

              はてなのサービス

              • はてなブログ
              • はてなブログPro
              • 人力検索はてな
              • はてなブログ タグ
              • はてなニュース
              • ソレドコ
              • App Storeからダウンロード
              • Google Playで手に入れよう
              Copyright © 2005-2026 Hatena. All Rights Reserved.
              設定を変更しましたx