自分の声をまったく別のキャラクタの声に変えることを実現するAIボイスチェンジャー。エフェクトを使って自分の声を加工する従来のボイスチェンジャーとは異なり、自分の声は完全に消えて、まったく別人になりきれるのが特徴で、これまでもVoidolやCoeFontボイスチェンジャーといったものを記事でも紹介してきたほか、中国系のフリーウェアでもかなりの精度を持ったものがいろいろ登場してきています。 そうした中、12月25日、まったく新たなAIボイスチェンジャー、Parakeet.VC(パラキート・ブイシー)が、福島県のベンチャー企業、Parakeet株式会社からリリースされました。ここには東北ずん子や東北きりたん、またずんだもんをはじめ、計109種類の声が収録されており、ユーザーはそれらを選んで、マイクで話せばリアルタイムにキャラクタの声に変換することが可能です。既存のAIボイスチェンジャーと比較して
X(旧Twitter)のiOS版に10月26日(日本時間)、音声/ビデオ通話機能が加わった。発信は有料の「X Premium」ユーザーのみだが、受信は全ユーザーが可能。初期設定では全ユーザーで、フォロー相手からの着信がオンになっている。 Xのオーナー・イーロン・マスク氏が8月に実装を予告していたもの。マスク氏はXにあらゆる機能を実装する「スーパーアプリ化」を企図している。 X Premiumユーザーは、ダイレクトメッセージ画面に電話アイコンを表示。タップして音声通話かビデオ通話を選んで発信できる。 デフォルトでは全ユーザーが、フォローしているアカウントの着信を受けられる。アドレス帳へのアクセスを事前に許可している場合は、アドレス帳登録アカウントからの着信も受け付ける。 機能を利用したくない場合は、設定画面からオフにできる。ダイレクトメッセージ画面の右上の歯車または、「設定とプライバシー」→
生成AI(人工知能)を使い、声優らの偽音声を作り出して無断利用した動画がSNSに投稿される事態が相次ぎ、当事者らに不安が広がっている。勝手に曲を歌わせたり、文章を朗読させたりしていて、専門家らは、権利の保護や悪用防止のため、AIの利用について一定の規制が必要と指摘している。(福元理央) 【写真】「コナン君に歌ってもらった」とティックトックに投稿された動画 無許可 「コナン君に歌ってもらった」。今年7月、動画共有アプリ「TikTok(ティックトック)」などに、そんなタイトルの動画が投稿された。人気アニメ「名探偵コナン」の主人公・江戸川コナンの「声」と称して、アニメとは全く関係のない流行曲を歌わせた動画で、投稿者は「音声はAIで作成」としている。
非常に高度なレベルで文章を生成できる対話型AIのChatGPTや、画像生成モデルのDALL・Eなどを始めとした画像生成AIの発達により、誰でもクオリティの高い文章やイラスト、画像を作成できるようになりました。これらの生成AIを用いることで、存在しない女性のセクシーな自撮りやセリフの吹き込みがある官能的なストーリーなどを全てAIで作成した「ハイパーポルノ」に注目が集まっています。 Mindy https://thisgirlnextdoordoesnotexist.net/mindy/ 生成AIはジャンルや種類を問わず文章や画像を作成できますが、ChatGPTに用いられている言語モデル「GPT-4」には不適切な質問をブロックするコンテンツフィルターが設定されていたり、画像生成AIの「Stable Diffusion」には成人向け表現を含む画像を黒塗りするセーフティーフィルターがあったりと、コ
Googleが「AudioPaLM」を発表しました。AudioPaLMはテキストベースの言語モデルである「PaLM 2」と音声ベースの言語モデルである「AudioLM」を統合したマルチモーダルアーキテクチャであり、テキストと音声を処理・生成し、音声認識や音声翻訳などのアプリケーションに利用できるとのことです。 [2306.12925] AudioPaLM: A Large Language Model That Can Speak and Listen https://doi.org/10.48550/arXiv.2306.12925 AudioPaLM https://google-research.github.io/seanet/audiopalm/examples/ AudioPaLMは、AudioLMから話す速さ、声の強さ、高さ、沈黙、イントネーションなどのパラ言語情報を保持する
会議の議事録やムービーの作成など、文字起こしが必要な場面は多くありますが、手動での文字起こしは非常に面倒です。また、OpenAI製文字起こしAI「Whisper」を用いて文字起こしする方法もありますが、初期設定が難しいという問題も存在します。Whisperをメチャクチャ使いやすくした無料文字起こしサービス「writeout.ai」なら、超簡単かつ短時間で高精度な文字起こしを実現できるとのことなので、実際に使ってみました。 writeout.ai – Transcribe and translate any audio file https://writeout.ai/ 上記のリンクからwriteout.aiにアクセスすると、以下のような画面が表示されます。文字起こしを行うには「Transcribes for free」をクリック。 すると、GitHubアカウントでのサインインを求められます
Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 中国の浙江大学と米State University of New York at Buffaloによる研究チームが開発した「Wavesdropper: Through-wall Word Detection of Human Speech via Commercial mmWave Devices」は、ミリ波(mmWave)を用い、防音環境で守られている部屋内を外部から盗聴するシステムだ。被害者が発話した際の喉元付近の皮膚振動をミリ波で捉え、音声(単語)を復元する。 壁に防音材を配置すれば、音波の伝搬を利用した攻撃などからは守れるが、音源(例えば、人間の話者)からの直接漏えいを保証すること
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く