[B! ツール][音] otori334のブックマーク

otori334 id:otori334

ツールと音に関するotori334のブックマーク (48)

INT論文本番最終版3.PDF
otori334 2022/01/29
音声の感性情報に着目したマルチメディアコンテンツ要約技術

言葉

音声認識

認知

PDF

機械学習

動画編集

音

ツール
リンク
uynet☁️秋M3-L21a on Twitter: "コード進行を入力すると自動で形式整えてアニメーション字幕を作ってくれる便利スクリプトを作ってます https://t.co/uTldpF0dUW"
otori334 2022/01/25
動画編集

ツール

音
リンク
日本語の音声認識はなぜ難しい？精度向上のカギは、「辞書」と「文脈」にあった
スマホの音声入力では、マイクに向かってしゃべった声が、リアルタイムに文章として入力されます。その裏側を支えているのが「音声認識」。声を分析し、文字のデータに変換する技術です。「Alexa、電気消して」も「Hey Siri、明日の天気は？」も、音声認識なしには実現しません。最近では、会議の音声から議事録を作ったり、音声で作業記録を付けたりなど、音声認識の用途は拡がりを見せているそう。一方で、「インタビューの文字起こしがうまくいかない」など、思うように認識されないという声も耳にします。そもそも、音声認識はどうやって人間の声を認識しているのか？　日本語の音声認識はどこが難しいのか？　音声認識ソリューションを手がける株式会社アドバンスト・メディアの安藤さんに、音声認識の気になる裏側を聞きました。株式会社アドバンスト・メディア 1997年に創業し、音声認識技術「AmiVoice」をコアとした各
otori334 2022/01/25
音

自動化

ツール

言葉

音声認識
リンク
soxコマンドで音声ファイルを編集する10の例
こんにちは、浦本です。今回は、サウンドファイルの編集に便利なsoxコマンドの使用例を紹介します。 sox (Sound eXchange) 配布元： http://sox.sourceforge.net/ soxを使うとコマンドだけでサクっとサウンド編集を行うことができます。 Linux／Mac／Windowsで利用可能です。日々のサウンド編集だけでなく、Webアプリのバックエンド処理として活用しても面白いと思います。ちなみに、soxネタは被らないだろうと思っていたのですが、検索してみるとなんとアシアルブログの過去記事でも一度紹介されていました。さすがKさん！以下はその続編として書きたいと思います。【1】音量を上げる +3dB上げる例です。 soxの基本的な使い方は「sox 入力ファイル出力ファイルエフェクトオプション」となります。 sox in.wav out.wav g
otori334 2021/10/29
音

shell

ツール
リンク
VOICEVOX | 無料のテキスト読み上げ・歌声合成ソフトウェア
オープンソースVOICEVOX は OSS（オープンソース・ソフトウェア）版 VOICEVOX をもとに構築されています。製品版と OSS 版の違いやモジュール構成は VOICEVOX の全体構成をご参照ください。ソフトウェア部分は Electron + Vue 、音声合成エンジン部分は Python + FastAPI です。追加したい・改善したい機能があれば、ぜひ開発にご参加ください。
otori334 2021/08/01
音

ツール

音声合成
リンク
“声”を明瞭にするテクニック【Premiere Pro & Audition】
CC2019で新装備！「リバーブ除去」声（言葉）を不明瞭にする要因は色々ありますが、なかでも収録した空間の「残響」は、出来るだけ抑えた方がよりタイトな音像を得られます。残響の除去に大きく活躍...
otori334 2021/07/06
ツール

音
リンク
もうRTX Voiceは不要？OBSに統合されたNVIDIAの音声ノイズ除去機能の使い方
otori334 2021/04/23
音

ツール
リンク
動画の無音部分を自動でカットする – なんてこったい
動画内に一定時間無音が続くシーンがあったら自動でカットするプログラムをPython(Google Colab)でプロトタイピングしてみることにした。方針下記のステップで、無音シーンの自動カットを試してみることにした。動画ファイルの音声トラックを抜き出す音声トラックを分析して、「カットしても良さそうな箇所」を探す元の動画ファイルから、「カットしても良さそうな箇所」以外の箇所を抜き出してつなげるなお、検証にはじんぼくんがTwitter / TikTokにアップロードしているこちらの動画の編集前の素材を使わせてもらった。【30秒でペラッペラ英会話　道案内編】日本語でも難しいんだから英語でなんかムリよ。そんな時は文明の利器。 pic.twitter.com/CfwsrALIUK — じんぼぼんじ(ジョージP)@DJ新橋のお友だち (@jimbobonji) May 30, 2020 動
otori334 2021/04/21
ツール

音

Python

FFmpeg

動画編集

音源分離
リンク
Download Free Voice broadcast leveler plugin: TriLeveler 2 by Sonic Anomaly
otori334 2020/12/26
音

ツール
リンク
音声認識エンジンはどう選ぶ？主要な4つを比較検証してみた | Ledge.ai
サインインした状態で「いいね」を押すと、マイページの「いいね履歴」に一覧として保存されていくので、再度読みたくなった時や、あとでじっくり読みたいときに便利です。
otori334 2020/10/28
音

ツール

選定
リンク
【AviUtl】音ズレの原因と対策一覧【エンコード】
AviUtlの設定ミスAviUtl自体の設定ミス（システム設定や各フィルタのON･OFFなど）によって起こる音ズレについてです。システム設定メニューの「ファイル」→「環境設定」→「システムの設定」を開きます。 fps調整・変換関係以下の2つにチェックが付いていない事を確認して下さい。「ロード時に29.97fpsに近いものは自動的に29.97fpsに変換する」中途半端なfpsの動画を29.97fpsに強制的に変換する設定　「ロード時に映像と音声の長さが0.1秒以上ずれているものは自動的にfps調整する」キャプチャの際などにコマ落ちしてしまって映像と音声の長さが合わない動画などの帳尻を合わす設定最大フレーム数デフォルトでは「320000」となっていますが、「320000」だと、 30fps動画の場合：3時間まで60fps動画の場合：1時間半までしか扱う事が出来ません。（これ以上の長さの動画
otori334 2020/09/28
音

ツール
リンク
ノイズの低減～Audacityエフェクト解説
「ノイズの除去」はノイズの一部分を解析し、そのﾉイズを全体から削る機能です。手順が二度手間で面倒ですが、威力は強力です。なお、マイクの『ブーン』や『笛の高い音』のような、ある程度周波数が特定できる場合はNotch Filterを先に掛けたほうが、より高いノイズ除去の効果が期待できます。ステップ　１　『ノイズプロファイルの取得』 “サー”という音（＋猫の鳴き声）まず、カーソルをドラッグしてノイズだけの部分を数秒程度、選択します。（選択した後、再生ボタンで音を聴いてみると良いです）サンプル音には猫の声だけでなく小鳥の声も入っているので、そこに被らないよう慎重に選択する必要がありました。
otori334 2020/09/28
音

ツール

信号処理

音源分離
リンク
【AviUtl】動画音声のホワイトノイズを除去する方法
ホワイトノイズとは？マイクで録音したときに入るサーーーーーッという音のことです。 ▲「こんにちは～」という音声に乗ったホワイトノイズです。（音量を大きくしてイヤホンなどで聴くとわかりやすいと思います）動画音声のホワイトノイズを削除する方法方法は2つあります。 ①Audacityなどの音声編集ソフトを使う方法ザックリいうと以下のような流れで削除できます。 AviUtlにて「ファイル」→「WAV出力」から、動画の音声のみを音声ファイルとして出力する参考：【AviUtl】動画から音声を抽出(分離)する方法出力した音声ファイルをAudacityなどの音声編集ソフトで読み込み、ノイズを除去し、再び音声ファイルとして出力するAviUtlにて、もともとの動画ファイルの音声を削除し、Audacityで出力した音声ファイルを読み込むこの方法については他に解説しているサイトがたくさんありますし、「そもそ
otori334 2020/09/28
音

ツール
リンク
マスタリング済みの音源をマスタリング前に戻すフリーVSTプラグインReLife！歌ってみたに最適！ - LAMEのいろいろブログ
ブロマガから移行した記事です。歌ってみたのMIXをするというときマスタリング済みのものとマスタリング前の2mixがあればもちろんマスタリング前の2mix音源を使いますが、音圧が高いマスタリング済みの音源しか配布していないということもしばしばあります。 EQでボーカルがうまく入るようにしたけど楽曲自体の音圧が高いから声が浮いてしまうし、オケに負けないようボーカルにかなりキツめのコンプレッサーをかけなくてはいけません。なんとかして音圧を下げてボーカルが入る空間を作ってあげたい！！！でも…音圧を下げるって無理じゃね？と思っていた時期がありました。出来るんですよね。 ReLifeっていうVSTプラグインで。ダウンロードはここから。では音圧の高いその音源にインサートしてみましょう。すごくシンプルです。重要なのは1、2、3と書かれた数字。音のダイナミクスをより取り戻してくれるのは3で
otori334 2020/09/28
音

ツール
リンク
楽曲をパートごとに分解する「音源分離技術」はクリエイターの夢か、著作権の悪夢か（1/4ページ）
ひとつの音源をボーカルやベースといったパート別に分解する「音源分離技術」が、一般ユーザー向けにも提供されるようになった。この技術は人工知能（AI）の訓練やアーティストによる楽曲制作に応用される一方で、著作権侵害のリスクなどさまざまな問題もはらんでいる。 TEXT BY NOAH YOO TRANSLATION BY MASUMI HODGSON/TRANNET 楽曲のなかで楽器やボーカルといったあらゆるパートが何をしているのか、詳細まで分解して聴けることを想像してみてほしい。楽曲のファイルをアップロードすると、ほんの数分でブルース・スプリングスティーンの「Born to Run（明日なき暴走）」といった曲がパートごとに分解されるのだ。すると、それぞれのプレイヤーの腕前がはっきりと浮き彫りになってくる。スプリングスティーンのボーカルパートでは、つぶやきやうめき声が聞こえてくる。ゲイリー・タ
otori334 2020/09/04
音

ツール

分解

自動化

音源分離

混沌

法律
リンク
不要な音は消去して必要な音だけ聞ける“聴力自在化”技術　北大と神大が開発
Innovative Tech：このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。北海道大学と神戸大学による研究チームが発表した「ウェアラブルコンピューティングにおける聴力自在化技術の提案」（PDFへのリンク）は、外界音を変換し、ユーザーが自在に自身の聴力を操作する技術だ。この技術を用いることで、外界音から聞きたい音だけを選択して聞くことができる。人間の耳は、自らの意志では制御することが難しく、聞く音の取捨選択ができない。その上、超音波などの人間には聞こえない音も取得することができない。研究チームは、マイクとスピーカーを搭載したイヤフォン型ウェアラブルデバイス（マイク付きワイヤレスイヤフォン）での利用を想定し、外界音から聞きたい音だけを聞ける技術でこの課題に挑戦する
otori334 2020/08/06
音

ツール

音源分離
リンク
VST3プラグインの作り方 | C++でVST作り
VST3プラグインの作成方法などを公開しています。ここの説明で使用しているVST SDKのバージョンは古いものもありますが、おそらく最新のバージョンでも対応しております。ここでは開発環境をWindowsとしていますが、VST SDK自体は複数のプラットフォームに対応していますので、本サイトの実装方法やTIPSなどは利用できると思います。なお、ほぼ独学ですので間違いがあるかもしれませんのでご了承ください。(ご指摘いただけると助かります。) はじめてのVST3プラグイン作り VST3プラグインを作成するための手順を記載しています。
otori334 2020/07/22
自作

ツール

音

規格
リンク
一家に一台！VUメーターをDTMerが持っておくべき理由｜DTMステーション
レコーディングスタジオやマスタリングスタジオには必ずあるVUメーター。見た目にもカッコいいけれど、単にカッコいいというのではなく、スタジオに存在する大きな理由があります。それは、これを見れば、音楽制作に適正な音量を一目で把握することができ、CDにしたりネットにUPする作品を正しく、効率よく、作っていくことができるからです。とくにストリーミング全盛の時代になった今、その重要性が高まってきています。そんなVUメーターに、ものすごいこだわりを持って開発する日本の小さな、小さなメーカーがあります。HAYAKUMOは今年、音楽制作者の要望を徹底的に詰め込んだVUメーター、FORENOを発売。日本の伝統と職人の技で作り上げた、このVUメーター、FORENOは国内外の制作現場で絶賛されているようですが、DTMerにとっても大きな武器となるアイテムです。開発者である早雲健悟さんにいろいろとお話を伺うとと
otori334 2020/07/18
音

ツール
リンク
Google Sites: Sign-in
Not your computer? Use a private browsing window to sign in. Learn more about using Guest mode
otori334 2020/07/16
ツール

音
リンク
C++でVST作り
VST SDK 3.7.5が公開されました。 2022年5月16日に、VST SDK 3.7.5が公開されています。参考→sdk.steinberg.net フォーラムではなく、公式の変更履歴は「VST3 Developer Portal 変更履歴」にあります。 VST SDK 3.7.4からの変更点は下記のようです。 (公式サイトからの翻訳ですが英語は自信がないです。また、一部補足などを入れております。) インターフェイス・フラグ等の修正プラグイン情報(モジュール情報)を記載したmoduleinfo.jsonファイルが利用できるように変更。作成したプラグインのフォルダに「/Contents/moduleinfo.json」のようにに配置することで、ホストアプリケーションが.vst3ファイルを読み込むことなく、情報を取得できるようになった。プラグインの情報には、ファクトリ((PF
otori334 2020/07/15
ノイズイベントを検知するRTX Voiceと特定周波数除去とかするReaFirなど各種プラグインをいい感じに組み合わせるためのインバータみたいな賢いゲートがあれば便利なのに存在しないので自作したい，簡単に作れそうなので

自作

ツール

音

あとで読む

本

C++
リンク
1 2 3 次のページ