「日本人女性を綺麗に描くモデルを探している」 「定番となりつつあるChilloutMix以外のモデルを探している」 このような場合には、BRAがオススメです。 この記事では、日本人女性を綺麗に描くモデルのBRAについて解説しています。 本記事の内容 BRAとは?BRAの利用方法BRAの動作確認 それでは、上記に沿って解説していきます。
私は趣味で機械学習を学ぶ初学者であり、説明に間違いや勘違いがある可能性があります。そういった点がありましたらコメントで指摘していただけると助かります。 また、so-vits-svcやRVCは論文ベースでの技術発表が無いため、以下はコードや周辺情報からの想像を含みます。 修正履歴 2023/04/15 RVCの動作について誤りがあったので修正しました。nadare🌱さんご指摘ありがとうございます。 AIボイスチェンジャーとは ある発話音声の入力を特定の話者が発話したような声質の発話音声に変換するための、深層学習を使用したアプローチがそう呼ばれている印象です。 以前から、深層学習を用いたリアルタイムボイスチェンジャーはMMVCなどが存在していました。 最近(2022年11月頃から2023年4月頃)では、Retrieval-based-Voice-Conversion 通称RVC や、Soft
本書によると、「模倣に賭けた」ということで、ピーター・ティールさんがFacebookの初期投資家になったというインタビューが乗っています。 と書きつつ、、 すいません、原書とか、英語で書かれたテキストとかを読んでも僕の理解が及ばないところがたくさんあるので、興味ある人は調べてみてください。 大事なのは「ピーター・ティールさんが、Facebookの初期になんで投資したかというと、欲望の模倣の話を参考にしてたから」という点です。ここから「次に来るSNSは何か?」を考えてみるとおもしろそうです。 Facebook以降のSNSの整理Facebookから今にいたるまで、SNSはどのような変化があったのか・・・というのを、この欲望の模倣に合わせてみると、以下のような形になります。 FacebookFacebookは「プロフィールの変更で欲望を喚起する時代」でした。 初期のFacebookのコアな部分は
かれこれ三年以上ほぼ毎朝論文を読んでいます。 ほぼ毎朝、というのは本当にほぼ毎朝です。この三年のうち読まなかった日はワクチンの副反応でダウンしている日など、あわせて 10 ~ 20 日ほどでしかありません。この日課だけでも 1000 本以上は論文を読んだことになります。 論文読みの日課についての知見が溜まってきたのでこの記事で共有します。 主な想定読者は研究者と学生の皆さんですが、それ以外の論文読みに興味のある皆さんにも有用な情報が詰まっているはずです。 日課の流れ Readable について 🧐 論文の選び方 自分の研究内容と直接関係あるものを読む(特におすすめ) 完全にランダムに選ぶ 被引用数の多い順に選ぶ(特におすすめ) トピックごとに重要な論文を読んでいく 研究者ごとに論文を読んでいく 📝 論文メモの書き方 ⏳ 時間を計測する 🤗 論文メモを公開する 📜 表現集の作成 🔨
はじめに 最近Denoをよく触っており、DenoのSSRフレームワークであるFreshのミドルウェア・キャッシュについて調べている際にブラウザキャッシュのEtagヘッダが使用されており、気になったのでブラウザキャッシュの仕組みについて調べてみました。 Etagの正体 Etagとは、ブラウザキャッシュの仕組みの中で使用されるHTTPレスポンスヘッダーでリソースの特定のバージョンに関する識別子のことです。 Etagがあることでウェブサーバーは、コンテンツが変更されていない場合はレスポンス全体を再送する必要がないので、キャッシュがより効率的になる。 ブラウザキャッシュの設定について ブラウザキャッシュを設定する際に必要なHTTPレスポンスヘッダーはEtagを含めて以下の通りです。 Expiresヘッダー Cache-Controlヘッダー Last-Modifiedヘッダー Etagヘッダー そ
今回は、最近 ChatGPT でも話題になっている OpenAI が発表した自動音声認識(ASR)システムである Whisper を C/C++ で動かせるようにした whisper.cpp をご紹介します。 先日、会社で whisper 論文の内容を発表した 際にデモをしたので、その際の作業の覚え書きの意味合いもあります。 whisper.cpp は以下のようなケースで、利用が適するツールです。 最近の文字書き起こしディープラーニングモデルを使って、音声データから文字起こししたいオープンソースのツールを使いたいできるだけ高速なものが良いWASM や Raspberry Pi(ラズパイ)のようなマイコンで動かしたいwhisper と同じように whisper.cpp も MIT ライセンスです。 Whisper とは本記事で、詳細な説明は省きますが、ざっくり下記のような特徴があります。 ウ
Stable: v1.5.4 / Roadmap | F.A.Q. High-performance inference of OpenAI's Whisper automatic speech recognition (ASR) model: Plain C/C++ implementation without dependencies Apple Silicon first-class citizen - optimized via ARM NEON, Accelerate framework, Metal and Core ML AVX intrinsics support for x86 architectures VSX intrinsics support for POWER architectures Mixed F16 / F32 precision 4-bit and 5
GPT-4は医師国家試験に合格するという研究結果が発表されて話題だったので、我々も馴染み深い IPA の試験にGPT-4は合格できるのか試してみた。 高度情報処理技術者試験の 午前I に限って言えば合格しているので、レポートをこちらに置いておく。 github.com まとめ 高度情報処理技術者試験の共通科目である午前I に 合格できる解答(正答率6割を超える)をGPT-4は生成する GPT-3.5 では合格できない。GPT-4 の賢さが際立つ ちなみに図表読み取り問題は入力できないので、すべて不正解扱いした やりかた IPA の Webサイトから、2022年度秋試験の午前I問題のPDFを取得 (PDF) Google Docs の OCR 機能でテキスト取得 手でコピペして整形 整形したファイルは こちら にある OpenAI の API に問い合わせて解答を取得。スクリプトはこちら。
「ChatGPT」を開発したアメリカのベンチャー企業「オープンAI」のサム・アルトマンCEOは10日午前、総理大臣官邸を訪れて、岸田総理大臣と面会しました。 面会のあとアルトマン氏は記者団に対し、「とてもいい面会だった。岸田総理大臣とはAI技術の長所とともに、欠点をどう軽減していくかについて話し合った」と述べました。 一方、岸田総理大臣は総理大臣官邸を出る際、記者団に対し「新しい技術が登場し、利用されている一方、プライバシーや著作権といったリスクも指摘されているという状況について意見交換した。合わせて国際的なルールづくりについてもどのように考えるか、意見交換した」と述べました。 アルトマン氏は午後、自民党の「デジタル社会推進本部」の会合に出席し、冒頭で「AIの開発が、技術的な革命をもたらすことを信じている。日本が果たしうる役割は非常に大きいと思う」と述べました。 出席者によりますと、会合の
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く