Write 3x faster, without lifting a finger.superwhisperAI powered voice to text for macOS
井口尊仁氏。井口氏自宅近くの京都・法然院にて。 Image credit: Masaru Ikeda 井口尊仁氏が手掛けてきたプロダクトやサービスは、すでに終了したものも含めるとかなりの数になるため、それらを最初から遡ることはしないが、この4年間、彼は声を使ったサービス、オーディオソーシャルという領域にフォーカスしてきた。2016年の「baby(ベイビー)」を皮切りに、翌年にはそれの進化系「Ball(ボール)」が誕生。さらにピボットを重ね、アメリカで「Dabel(ダベル)」をローンチしたのは昨年1月末のことだ(当初の名前は「ear.ly(イアーリー)」。 以前からサンフランシスコと京都の2つの都市を拠点に活動するデュアラーである井口氏だが、新型コロナウイルスの拡大以降は海外渡航の手段が閉ざされ、ほぼ京都に留まっての活動を余儀なくされている。ただ、それが Dabel にとって向かい風かと思い
低遅延なボイスチェンジャー「Gachikoe!」が配布開始!無料配布あり、Win/Macに対応 PC向けボイスチェンジソフト「Gachikoe! Core (ガチコエ! Core) v0.0.0」の配布が開始されました。同ソフトは作者の桜音さちさんが現在開発中の「Gachikoe!」 のコア機能を抽出したバージョンで、WindowsとMacに対応しています。バージョンv0.0.0は作者のBOOTHで無料配布されています。BOOTHはこちら。 Gachikoe! (ガチコエ!)っていう低遅延でクロスプラットフォーム(Win、Mac対応)なボイチェンつくりました! 無料配布もあるのでよかったら試してみてください✨✨✨https://t.co/BClIcqadX4 PIXIV FANBOXもはじめたのでよかったら支援していただけると嬉しいです!https://t.co/F0Rc6v4YCT pi
僕は最近Turing Complete FMというポッドキャストを運営しているのですが、その収録のためにポッドキャスト録音テクニックを結構研究しました。ここではそのノウハウをシェアしようと思います。音がよくて聞きやすいポッドキャストの収録に役立ててもらえると幸いです。 はじめにポッドキャストでは音質は死活的に重要です。音質の大切さは強調してしすぎることはないと思うのですが、この点は甘く見られがちなようです。音の悪い録音を何十分も聞くのは耳が辛くて不必要にストレスがかかります。よいコンテンツを届けたいのなら、音質という、コンテンツ以前の問題は解決しておくべきです。 良い音質のポッドキャストを作成するためには、良い音質で録音する必要があります。良い録音から良い出力を作るのは簡単ですが、悪い録音から良い出力を作るのは、どんなにポストプロダクションを工夫してもほとんど不可能です。悪い音で録音してし
これはドワンゴ Advent Calendar 2017の9日目の記事です。 漫画やアニメを見ていると、可愛い女の子になって可愛い女の子と他愛もない会話をして過ごす日常に憧れます。 そんな感じで、可愛い女の子になりたい人は多いと思います1。 しかし残念なことに、現在の技術で真の可愛い女の子になるのはとても難しいです。 じゃあせめて仮想でいいから可愛い女の子になりたいですよね(バーチャルyoutuberキズナアイみたいな)。 しかし、仮に姿を可愛い女の子にしても、声が可愛くなければ願いは叶いません。 ということで、声を可愛くする声質変換を目指してみました。 今回は僕の声をDeepLearningの力を借りて結月ゆかりにしました。 お勉強まずは音声の勉強をします。 これが一番時間かかりました。 最近の音声合成手法は3種類あります。 音響特徴量+vocoder wavenet STFT+位相推定
はいえーとあの google の音声入力のテストをやってみてるんですけどこれめっちゃすごいですねなんかここまで認識精度良いと思わなかったあの文字の改行とかそこだけちょっと自分でやんないといけないんですけどそれ以外は全然不満がないですねこれなにかコマンドとかあるのかなやそうでもないか何がやりたいかというと discord でちょっと仕事で使ってみたくてボイスチャットチャンネルに没頭*1参加させて録音させてそのデータを google のドキュメントとして音声で食わせて文字起こしさせればあの会議とかねリモートワークとかですごい便利なんじゃないかなと思って文字認識 api ってちょっと公開されてるかわかんないんだけどこういう api って google あんまりね有料 api 脱退後悔*2しきれなかったりっていうイメージあるんだよねまあ google ドキュメントを使わせるためのインセンティブやっ
声だけで家電を操作する フューチャーホームコントローラーは、音声で家中の家電を操作できるようになるガジェットです。 今のお持ちのエアコンやテレビを声だけで操作できるようになります。
Research WaveNet: A generative model for raw audio Published 8 September 2016 Authors Aäron van den Oord, Sander Dieleman This post presents WaveNet, a deep generative model of raw audio waveforms. We show that WaveNets are able to generate speech which mimics any human voice and which sounds more natural than the best existing Text-to-Speech systems, reducing the gap with human performance by ove
はじめに 2016/3/3より、Slackに音声通話機能が搭載された。 試しに使ってみたSlackユーザもそれなりにいると思う。 Slack音声通話機能の対応クライアントは、現時点では限定的だ。Slackの設定画面の一文を引用すると Currently on Mac and Windows desktop apps and in Chrome; coming soon to mobile! の通りで、Chromeまたはデスクトップのネイティブアプリとなる。 音声機能が実装されていてこの種類の対応状況なら、もちろん利用技術はWebRTCと考えるのが素直だ。(しかもWebRTCベースのスタートアップであるScreenHeroを買収していることもあり) ここで、最も気になるのは内部でWebRTCをどのように利用しているか、という点だ。 すでに、WebRTCエンジニア御用達のWebRTCHacks
1 pixel|サイバーエージェント公式クリエイターズブログ サイバーエージェントのクリエイターの取り組みを紹介するオフィシャルブログです。最新技術への挑戦やサービス誕生の裏話、勉強会やイベントのレポートなどCAクリエイターの情報が満載です。 はじめまして。こんにちわ。 「ガールフレンド(仮)」でフロントエンドの開発をしている秋山と申します。 「ガールフレンド(仮)」とは、ユーザーが主人公となり、様々な女の子と出会っていく“声が出る♪”学園恋愛カードゲームです。各カードには、人気声優のボイスが付いていて、さまざまな演出に合わせてキャラクターの声を聞くことができます。スマホのブラウザ版カードゲーム × 声ガールフレンド(仮)の開発に入る時点で、スマホブラウザゲームで音声を出しているサービスは他にもありましたが、カードに声が付いているものは少なかったかと思います。 また、スマートフォンのブラウ
ツイッターやFacebook、Google+が広く受け入れらるようになっても、数人との間で議論を進めるときにはSkype多用しています。 理由は通信が非常に robust で信頼できることに加え、チャット、音声通話、ビデオ通話の3つの選択肢があるために、ふだんはチャットで軽くやりとりをしておいて、必要に応じて同じアプリ内で音声やビデオにシフトできるという便利があります。 ところでチャットについては会話をコピーしておくことですぐに議事録が作れます(実際、できるポケット Google+ の座談会などはこの方法で作られました)が、音声については録音するしかありません。 そこで、これまで Mac では Call Recorder のような有料の連携アプリを利用していたのですが、無料で利用でき、かつ録音結果を Evernote に送信できる Kandasoft によるCallnote というアプリが
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く