タグ

ブックマーク / qiita.com/sakasegawa (6)

  • Whisperで文字起こしをした議事録の発話者の名前を自動的に判定する! - Qiita

    こんにちは!逆瀬川 ( @gyakuse ) です! 今日は最近作った議事録文字起こしアプリに話者分離機能をくっつけたものを作っていきたいと思います。 ChatGPT APIの使い方、Whisper APIの使い方、Hugging Face Spacesへのデプロイ方法等を知りたい場合は以下の記事をぜひ! できたもの openai_keyにOpenAIAPIキーを入れる メイン音声ファイルに会話音声 (wav, 25MB以内) を入れる 話者 (1) 参考音声ファイルに話者 (1) の参考音声 (wav) を入れる 話者 (1) の名前を入れる 話者 (2) 参考音声ファイルに話者 (1) の参考音声 (wav) を入れる 話者 (2) の名前を入れる 上記を行って送信ボタンを押すと処理が開始されます。なお、参考音声は10秒程度で大丈夫です。実装全体は以下で確認できます。 話者分離 (S

    Whisperで文字起こしをした議事録の発話者の名前を自動的に判定する! - Qiita
    IGA-OS
    IGA-OS 2023/04/08
    音声処理
  • ChatGPT Pluginって何ができるの? - Qiita

    こんにちは!逆瀬川 ( @gyakuse ) です! きょうは発表があったばかりのChatGPT Pluginについて紹介していきたいと思います。 ChatGPT Pluginとは かんたんに言ってしまうと、ChatGPTの能力を拡張するためのプラグインです。よくわかりませんね。 わかりやすくいうと、 「来週の土日に旅行いきたいんだけど2万円以下で適当にいいとこ見繕って予約しといて」 「アイヨー」 みたいなことができるやつです。 もちろんこれらはChatGPTAPIを用いてもできましたが、これを容易に実現する手段として提供されました。 BingGPT (正式名称New Bing) のように検索して回答してくれたり、会社の文章群をもとに質問回答してくれたり、 商品を注文してくれるなどのアクションを行う機能が追加された、と理解しておくとよさそうです。 これはまだWaitlistであり、今後公

    ChatGPT Pluginって何ができるの? - Qiita
    IGA-OS
    IGA-OS 2023/03/25
    セキュリティの概念も変わる
  • GPT-4のすごさとその影響範囲について - Qiita

    こんにちは!逆瀬川 ( https://twitter.com/gyakuse ) です! 今日発表されたGPT-4について見ていきたいと思います。 なにがすごいのか 専門的な問題を解けるようになった たとえば米国司法試験で上位10%、GPT-3.5は下位10%だった 非常に長い文章を入出力できるようになった 最大で32k tokens (日語で約2.5万文字、文庫で50pくらい) 画像をもとに会話できるようになった (これは実験段階でまだ提供されません) 特に嬉しいのは32k tokensまで文章を扱えるようになったことでしょう。 たとえば小説を書くみたいなときも、プロット、設定等に3000文字使っても、残り2.2万文字くらい使えます。 画像をもとにした会話の例 USER: この画像はどこがおかしいですか?パネルごとに説明してください GPT-4: この画像は、3つのパネルで構成される

    GPT-4のすごさとその影響範囲について - Qiita
    IGA-OS
    IGA-OS 2023/03/15
    先行者の考え方は参考にさせていただく
  • ChatGPT APIを使ってAIキャラクターを作ってみる! - Qiita

    こんにちは!逆瀬川( https://twitter.com/gyakuse ) です! 今日は公開されたばかりのChatGPT APIを使ってAIキャラクターを作ってみます。 概要 ChatGPT APIを使ってAIキャラクターを作る 嬉しいところ 以前のOpenAIGPT-3.5系のAPIは $0.0200 / 1K tokens で、だいたい1000文字で3〜5円くらいでした。 今回のChatGPT APIは $0.002 / 1K tokens であるため、1/10のやすさになっています。 また、規約が更新され、APIを使ったinput/outputは学習対象外(オプトアウトがデフォルト)となりました。 DPAの締結(OpenAIの書式に従う必要があります)も可能になっているためより以前よりは守秘性の高いコミュニケーションに使用できる可能性があります。 Colab 実装 会話を行

    ChatGPT APIを使ってAIキャラクターを作ってみる! - Qiita
    IGA-OS
    IGA-OS 2023/03/02
    デスクトップキャラクターを自作し、個人の好みで調教できます(イメージ
  • Google Colabで英語の論文を無料で翻訳する方法 - Qiita

    こんにちは!逆瀬川 ( https://twitter.com/gyakuse ) です。 今日は英語論文をサクッと翻訳する方法を共有します。 素晴らしい事前学習済みモデルの恩恵で素人でも1時間程度で実装できてしまいます。 なお、実装めちゃ汚いのですが、そのあたりはご容赦ください。 論文以外の文字埋め込みのないpdfを翻訳したい場合はこちらを参考にしてください: 論文全体の自動要約についてはこちら: 概要 翻訳モデル、レイアウト検知ライブラリとpdfを操作するライブラリを用いて外国語で書かれたpdfファイルを翻訳します。 翻訳にはフリーのニューラル機械翻訳モデルFuguMTを使用します。 この手法の嬉しさ DeepLおよびDeepL APIではpdf翻訳がサポートされていますが、行の切り替わりで別の文章と認識されることが多く、途中までの文章で翻訳されるため精度が落ちてしまいます この手法で

    Google Colabで英語の論文を無料で翻訳する方法 - Qiita
    IGA-OS
    IGA-OS 2023/02/11
  • ChatGPT使い方総まとめ - Qiita

    こんにちは!sakasegawaです! ( https://twitter.com/gyakuse ) 今日は今流行のChatGPTについて紹介します! ChatGPTとは OpenAIが開発するGPT-3(※)というめちゃくちゃすごい言語モデルをベースとしたチャットアプリです。 色んな質問にすぐ答えてくれます。 この記事ではさまざまな使い方を紹介します。 https://chat.openai.com/ ちなみにGPT-3関連では、noteの以下記事も便利なのでぜひ読んでみてください AIがコミットメッセージ自動生成!神ツール『auto-commit』『commit-autosuggestions』の紹介 ※正確にはGPT-3.5シリーズと呼ばれています ChatGPTの仕組みを考えながらプロンプトを作る手法はこちらに別途まとめています 文章 質問-応答 〜について教えて Wikiped

    ChatGPT使い方総まとめ - Qiita
    IGA-OS
    IGA-OS 2022/12/02
    これ読んで遊んで・・・使ってみよう
  • 1