サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
やる気の出し方
hakasenote.hnishi.com
今回は、最近 ChatGPT でも話題になっている OpenAI が発表した自動音声認識(ASR)システムである Whisper を C/C++ で動かせるようにした whisper.cpp をご紹介します。 先日、会社で whisper 論文の内容を発表した 際にデモをしたので、その際の作業の覚え書きの意味合いもあります。 whisper.cpp は以下のようなケースで、利用が適するツールです。 最近の文字書き起こしディープラーニングモデルを使って、音声データから文字起こししたいオープンソースのツールを使いたいできるだけ高速なものが良いWASM や Raspberry Pi(ラズパイ)のようなマイコンで動かしたいwhisper と同じように whisper.cpp も MIT ライセンスです。 Whisper とは本記事で、詳細な説明は省きますが、ざっくり下記のような特徴があります。 ウ
最近、spaCy が公式で日本語に対応し、話題になっている。 私自身は、NLP が専門ではないのだが、業務で自然言語を扱う機会があり、このあたりの技術を把握しておく必要があるため、ほぼゼロの知識からサーベイを行った。 spaCyspaCy 公式サイトspaCy は多言語の字句解析・固有表現抽出・品詞タグ付け・ラベル付き依存構造解析機能を提供する汎用自然言語処理フレームワーク日本語に関しては 3 つのモデルが利用可能 ( doc )標準日本語モデルへの依存構造解析・固有表現抽出モデルspaCy の日本語モデルの搭載は、Megagon Labs, Tokyo (株式会社リクルートの AI 研究所) と国立国語研究所が尽力したようである ( 論文 )商用利用が可能“ja_core_news_lg”, “ja_core_news_md”, “ja_core_news_sm”3 つのモデルはサイズが
このページを最初にブックマークしてみませんか?
『hakasenote.hnishi.com』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く