LiDARセンサーやカメラなしで人の動きを3D検知 カメラや高価なLiDARハードウェアを使わずに人を「見る」技術は何年も前から取り組まれており、2013年にはマサチューセッツ工科大学の研究チームが「携帯電話の信号を利用して壁を見通す方法」を発見し、2018年には同大学の別のチームが「WiFiを利用して別の部屋にいる人を検知する方法」を編み出しました。 今回開発された技術もWiFi信号を利用するものですが、より精度の高いものです。テック系メディア「Motherboard」によれば、米カーネギーメロン大学の研究者が、WiFiルーターのみを用いて部屋の中の人体の3D形状や動きを検出する新技術を開発しました。 この技術には写真に写った人体表面の全ピクセルをマッピングするシステム「DensePose」が応用されており、そこから、ルーターが送受信するWiFi信号の位相と振幅を人体の座標にマッピングす
――投資家向けコラム「ハード・オン・ザ・ストリート」 *** 米グーグルにとって競争とは、以前から「たったのワンクリック」で行われるものだった。だが米マイクロソフトでさえ、人工知能(AI)主導の世界ではそうしたクリックを提供するコストがかなり高いと感じるかもしれない。高収益の大手ハイテク企業でも最終利益に細心の注意を払わなければならない状況ではなおさらだ。 マイクロソフトは17日、米新興オープンAIが手掛けるAIツールを自社の製品やサービスに迅速に取り入れていくことを明らかにした。その一つが、オープンAIのチャットボット(自動応答システム)「チャットGPT」だ。1カ月余り前にローンチされたチャットGPTは質問に会話形式で回答を返すツールで、世界の教育関係者にとっては大変残念なことに、ちゃんとしたエッセーを、さらには詩までも書くことができるため、ユーザーが殺到するほどの人気急騰となっている。
それを、完全とは言えないまでも、かなり元の人に肉薄する品質で再現できる技術がDiff-SVCです。元になる音声データが1時間くらいあれば、与えた音声を、希望する声質に変換することが可能になるのです。 しかも、基本的にお金はかかりません。AI歌声合成が、ちょっとハードルは高いものの、無料で使えて、データさえ集めてくれば誰でも手が出せる。AI歌声合成の民主化と言っていいでしょう。 筆者は10年近く前に旅立った妻の歌声を、UTAU-Synthという、短く切り出した音素をピッチや長さを合わせながら組み合わせていくソフトウェアで再構成しています。1フレーズずつ音素を繋いで、できるだけ不自然にならないように調整していくため、短くて数日、長いと数カ月も時間をかけて完成させていきますが、もうその作業をしなくてもよくなります。 ただ、自分で歌って、もしくは他のボーカルシンセソフトでボーカルトラックをDiff
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く