Whisperは、ChatGPTで知られるOpenAIによって開発された非常に正確な音声認識モデルで、会話の音声をテキストに書き起こしてくれる。 100万時間以上のデータでトレーニングされた最新のAIモデルだが、驚くべきことにオープンソースで公開されているため、誰でも、無料で、簡単に利用することができる。 有料の音声書き起こしサービス・議事録書き起こしサービスは数多くあるが、実は無料のWhisperを使えば十分だ。 むしろ、Whisperの方が殆どの音声認識ソフトより精度が高いだろう。 とはいえ、プログラミングの知識がない人にとっては、少し利用するハードルがある。 そこで、Whisperの最新モデル(Whisper v3)を、簡単に使える小さなWebアプリにしてみたので、この記事で使い方を紹介する。 Whisperを、Google ColabというGoogleアカウントを持っている人なら誰
OpenAIが開発している「Whisper」は、あらゆる言語で人間の会話音声を文字起こしできる高性能なSpeech-to-textモデルだ。 Whisperはオープンソース化されており、モデルをダウンロードすれば、無料で、誰でも利用できる。 しかし、実用上の大きな問題がある。 それは、文字起こしには相当なGPUパワーを要し、一般的なPCでは時間がかかりすぎるという点だ。 そこで当ブログでは、Google Colaboratoryの無料のGPUインスタンスで、Whisperを利用するノートブックを公開している。しかし、Google Colabの無料プランで使えるGPUでは超高速とはいかず、数十分の音声を日常的に文字起こしするような場合、やはり実行速度がストレスになる。 そんなスピード重視だが精度を落としたくない、という人におすすめなのが、OpenAIが提供するAPIを経由して、Whisper
はじめに LangChainを使用して、PDF文書をベクトル化し、ローカルのベクトルストアに保存してみました。この方法により、一度ローカルに保存した後はベクトル化を再度行う必要がなくなり、回答時間を短縮することができます。LangChainを使った文書検索を開発している方におすすめです。 開発環境 Windows 11 Python 3.9.15 dotenv LangChain Azure OpenAI Embeddings CharacterTextSplitter FAISS PyPDFLoader 実装 必要なパッケージのインストール 以下のコマンドで必要なパッケージをインストールします。
はじめ 前回はベクトル検索について詳しく解説しました。今回は最近話題になっているRAGについて、業務で実際に構築した例をベースにお話出来れば、と思います。 前回の記事: 本記事では、RAGについての軽い解説と実践について、ChatBotのAWS上でのアーキテクチャ例の紹介と一部実装例を紹介します。 検索拡張生成(RAG)について 大まかに以下のようなアーキテクチャを取るシステムです。 図1.RAGのアーキテクチャ RAG(Retrieval-Augmented Generation)は、検索機能とテキスト生成を組み合わせた技術です。和訳して、検索拡張生成とも言います。上記アーキテクチャを採用することで、特定のクエリや質問に対してより正確で専門的な情報に基づいた回答を生成することができます。また、大規模言語モデルが起こすハルシネーション(嘘をさも本当のことかのように話してしまう)を軽減するこ
「議事録作成は重要な業務だけど時間がかかりすぎる」 「ChatGPTで議事録作成したいけど手順がわからない」 「ChatGPTの議事録作成プロンプトを知りたい」 こんなお悩みを持った方は多いのではないでしょうか。 議事録は決定事項やアクションプランを共有するための記録であり、ビジネスにおいては重要な資産です。一方で議事録を作成するには手間と時間がかかる上に、作成者によって情報量や作成時間にバラツキが生じます。 こうした課題はChatGPTによって改善可能です。AIを利用することで、作成者による情報のバラツキやミスを無くし、あっという間に議事録を作成できます。またChatGPTを活用した議事録作成によって、社員は空いた時間でより生産性の高い業務を行うことができるでしょう。 本記事では、ChatGPTで議事録作成する方法や、各種AIによる議事録作成の差を比較しています。コピペで使用できるプロン
ChatGPT,使っていますか? ChatGPTは文章を要約したり、プログラム作ってくれたり、一緒にブレストしてくれたりして本当に便利なのですが、社内情報などの独自データに関する情報については回答してくれません。 プロンプトに情報を記述して、そこに書かれている情報から回答してもらう方法もありますが、最大トークン4000の壁がありますので、限界があるかと思います。 この課題についてなんとかならないかと考えて色々と調べて見たところ、解決する方法が見つかり、いろいろと検証をして見ましたのでその結果をシェアしたいと思います。 サンプルコード(GoogleColab) 百聞は一見にしかずということで、実際に試したサンプルは以下にありますので、まずは動かしてみることをお勧めします。 このコードを上から順番に動かすと、実際にインターネット上から取得したPDFファイルに関する内容をChatGPTが回答して
受付可能なリクエストを制限していること gptのapiを叩きまくっていたら 429エラーが出てきました too many request 429はtoo many requestということで、apiを叩きすぎているのが原因らしいです もっと詳細に言えばクライアントがリクエストを投げすぎて、サーバーがそれにNoという信号を出してくる。 そのNo信号がhttpステータスコード429だということです 叩きすぎて制限を受けることをapiレート制限と言います こう言ったapiレート制限は、apiを提供してくれているサービス(openaiやtwitterなど)にはついていてそれぞれドキュメントを参照しどのようなルール内で使用可能か調べておく必要があります gpt内でのエラー理由 openaiとしてはリクエストされすぎたら、サービスが中断してしまうような負荷が生じてしまうため ユーザーごとにリクエストの
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く