並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 12 件 / 12件

新着順 人気順

kotobaの検索結果1 - 12 件 / 12件

タグ検索の該当結果が少ないため、タイトル検索結果を表示しています。

kotobaに関するエントリは12件あります。 日本語文字起こし人工知能 などが関連タグです。 人気エントリには 『ほぼリアルタイム!?爆速で動作する日本語特化の文字起こしAI!『kotoba-whisper-v2.0』 - Qiita』などがあります。
  • ほぼリアルタイム!?爆速で動作する日本語特化の文字起こしAI!『kotoba-whisper-v2.0』 - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? みなさんこんにちは!私は株式会社ulusageの、技術ブログ生成AIです!これからなるべく鮮度の高い情報や、ためになるようなTipsを展開していきます。よろしくお願いします!(AIによる自動記事生成を行なっています。システムフローについてなど、この仕組みに興味があれば、要望が一定あり次第、別途記事を書きます!) 爆速で動作する日本語特化の文字起こしAI『kotoba-whisper-v2.0』を試してみた はじめに ビジネスシーンや日常生活で、音声データを文字起こしするニーズはますます高まっています。議事録の作成やインタビューの文字起こ

      ほぼリアルタイム!?爆速で動作する日本語特化の文字起こしAI!『kotoba-whisper-v2.0』 - Qiita
    • 爆速でローカル動作する日本語特化の文字起こしAI『kotoba-whisper-v2.0』の実力は?/実際にローカルで実行してOpenAIの「Whisper」と比較してみた【レビュー】

        爆速でローカル動作する日本語特化の文字起こしAI『kotoba-whisper-v2.0』の実力は?/実際にローカルで実行してOpenAIの「Whisper」と比較してみた【レビュー】
      • 富野由悠季監督:人類は「ニュータイプ」になれるのか 「ガンダムと手を切る」宣言の理由 「kotoba」で語る - MANTANWEB(まんたんウェブ)

        富野由悠季監督のインタビュー「人類は『ニュータイプ』になれるのか」が掲載される「集英社クオータリー kotoba」2021年秋号 9月6日発売の季刊誌「集英社クオータリー kotoba」(集英社)2021年秋号に人気アニメ「ガンダム」シリーズの生みの親として知られる富野由悠季監督のインタビューが掲載される。インタビューは「人類は『ニュータイプ』になれるのか」と題して、富野監督が考え続けてきたというニュータイプの解釈、過去に「ガンダムと手を切る」と宣言した理由、自身が総監督を務めるアニメ「ガンダム Gのレコンギスタ(G-レコ)」への思いを語る。

          富野由悠季監督:人類は「ニュータイプ」になれるのか 「ガンダムと手を切る」宣言の理由 「kotoba」で語る - MANTANWEB(まんたんウェブ)
        • KOTOBA : 素晴らしい日々〜Splendid days

          素晴らしい日々〜Splendid days 感動したこと…疑問に思うこと… 何氣ない日常を過ごすのも、感謝に満ちた日々を過ごすのも自分次第… そんな日々の思いを綴ります。 今日もこのブログに訪問して下さりありがとうございます!😊 『ブルーピリオド』 っていう、アニメ作品、 実写化されることも決定、 けっこう人気作品だったのかな? 僕は、あまり興味が無かったのにもかかわらず、 全12話をいっき観してしまった。 どんな作品か簡単な紹介をすると、 不良仲間とヤンチャしているような高校生、 しかし真面目な半面をもっていて、隠れた努力家、 優等生でもある。そんな主人公があるきっかけで美術に目覚め、 のめり込んでいく。そして最難関といわれる東京藝大を目指す。 美術予備校でライバルたちと競い合いながら成長していく物語。 美術音痴な僕だけど、 すっかり前のめりで観てしまった。 かじった程度にはなるが、

            KOTOBA : 素晴らしい日々〜Splendid days
          • kotoba-whisper, ReazonSpeech, Nue-ASRの文字起こし性能を比較してみた | 株式会社AI Shift

            はじめに こんにちは、AIチームの大竹です。 最近、高性能な日本語音声認識モデルのリリースが相次いでいます。普段、音声認識を用いたプロダクト開発をしている中で、各モデルの音声認識性能や推論速度がどれくらいのものなのか気になったので簡単な実験をして性能を比較してみました。 書き起こしや評価周りの実装も記載しているので参考にしていただけたら幸いです。 モデルの直近のリリースをまとめると、以下のようになっています。ReazonSpeechコーパスのリリースを皮切りに日本語に特化した音声認識モデルの開発の勢いが加速しているように思えます。ReazonSpeechコーパスは、地上波テレビ放送から収集された音声に基づいて構築されています。v1では19,000時間、v2では35,000時間の音声が含まれていて、日本語音声認識モデルの学習リソースとしては世界一の規模となっています。 公開時期 モデル名 公

              kotoba-whisper, ReazonSpeech, Nue-ASRの文字起こし性能を比較してみた | 株式会社AI Shift
            • 日本語音声認識に特化したWhisperである kotoba-whisper-v1.0を早速試してみた | DevelopersIO

              はじめに 昨日公開された日本語音声認識に特化した「Kotoba-Whisper」のkotoba-whisper-v1.0を試してみました。 本モデルは、OpenAIの「Whisper large-v3」を教師モデルとして使用し、蒸留(大規模な学習モデルから、同機能を持つより小さなモデルを開発する手法)を用いて開発されました。 kotoba-whisper-v1.0は、ReazonSpeechコーパスの一部である日本語音声と文字起こしのペアデータセットを使用して学習されたモデルです。学習データには、日本のテレビ番組の音声と、文字起こしたものが含まれています。具体的には、1,253時間の音声データと16,861,235文字の文字起こしデータが使用されています。 本モデルは、Pythonのライブラリであるtransformersに対応しており、短時間の音声ファイルの文字起こしから、長時間の音声フ

                日本語音声認識に特化したWhisperである kotoba-whisper-v1.0を早速試してみた | DevelopersIO
              • Kotoba Technologies

                2024/4/16 Kotoba-Whisper 1.0 ReleaseKotoba’s fast Japanese ASR (text-to-speech) model. Speeds up Open AI’s best ASR model (Whisper Large) by 6.3x with similar/better performance. Try our demo or open-sourced codebase. 2024/3/22: Kotoba-Speech 0.1 ReleaseKotoba’s first end-to-end speech foundation model. Outperforms the speech quality of Amazon, ElevenLabs, Google, and Narakeet. Try our demo or ope

                  Kotoba Technologies
                • kotoba-tech/kotoba-whisper-v2.0 · Hugging Face

                  ","eos_token":"<|endoftext|>","pad_token":"<|endoftext|>","unk_token":"<|endoftext|>"}},"createdAt":"2024-09-17T12:49:47.000Z","discussionsDisabled":false,"downloads":1814,"downloadsAllTime":1814,"id":"kotoba-tech/kotoba-whisper-v2.0","isLikedByUser":false,"isWatchedByUser":false,"inference":"not-popular-enough","lastModified":"2024-09-24T08:59:39.000Z","likes":10,"pipeline_tag":"automatic-speech-

                    kotoba-tech/kotoba-whisper-v2.0 · Hugging Face
                  • Kotoba-Recipes ライブラリ: 5分ではじめる Llama-2 継続学習

                    はじめに Kotoba Technologiesでインターンをしている東京工業大学 B4 横田研究室の藤井(@okoge_kaz)です。 Kotoba Technologiesは2023年7月に米国の博士号・教授職を持った創業者2人によって日米クロスボーダー体制で創業され、最先端NLP技術を用いて、日本及び非英語圏における実運用に向けた研究開発を行っています。今回は、社内で利用されているライブラリの一部を公開したため、使用方法等について解説を行います。 Llama 2を筆頭に数多くのモデルがリリースされていますが、推論(inference)してモデルの挙動を確かめることはできても、自前のデータで学習する方法についてはtransformers Trainerクラスを利用した手法を除き、コミュニティに知見として十分に共有されているとは言い難いと個人的には感じています。そこで今回、Kotoba

                      Kotoba-Recipes ライブラリ: 5分ではじめる Llama-2 継続学習
                    • kotoba-tech/kotoba-whisper-v1.0 · Hugging Face

                      ","eos_token":"<|endoftext|>","pad_token":"<|endoftext|>","unk_token":"<|endoftext|>"}},"createdAt":"2024-04-14T08:53:48.000Z","discussionsDisabled":false,"downloads":2166,"downloadsAllTime":13614,"id":"kotoba-tech/kotoba-whisper-v1.0","isLikedByUser":false,"isWatchedByUser":false,"inference":"not-popular-enough","lastModified":"2024-05-08T12:40:53.000Z","likes":44,"pipeline_tag":"automatic-speech

                        kotoba-tech/kotoba-whisper-v1.0 · Hugging Face
                      • KOTOBA UX | UXライティングメディア - UXライティング&マイクロコピーで世界をもっと楽しくする。

                        スクリーンの向こうへ ブランドの声を届ける。 UXライティングで 世界をもっと楽しくする。 KOTOBA UXは、日本語とテクノロジーを愛する私たちが「ことばのデザイン」を考えるメディアです。 週刊ニュースレターを読む

                          KOTOBA UX | UXライティングメディア - UXライティング&マイクロコピーで世界をもっと楽しくする。
                        • Kotoba-Whisper入門 – 日本語音声認識の新しい選択肢 - Sun wood AI labs.2

                          はじめに Kotoba-Whisperは、Asahi UshioとKotoba Technologiesが共同開発した、日本語の音声認識(ASR)に特化した蒸留Whisperモデルのコレクションです。OpenAIのWhisper large-v3をティーチャーモデルとし、ReazonSpeechの大規模な日本語音声データを用いて学習されました。 元のlarge-v3モデルと比べて6.3倍の高速化を実現しつつ、ほぼ同等の低いエラー率を維持しています。 この記事では、Kotoba-Whisperについての概要を説明し、Transformersライブラリを使った具体的な利用方法をコード付きで紹介します。 こちらの記事もおすすめ

                          1

                          新着記事