3カ月ほどベータテスターをしていた、DreamtonicsのAIボイスチェンジャー「Vocoflex」。その製品版が正式発売されたので、購入しました。 ベータ版でもすごく便利に使っていたのですが、さらに改良されているというので、製品版としてのファーストインプレッションをお届けします。 ■ Vocoflex とはDreamtonicsはその品質で定評のあるAIベースの歌声合成ソフト「Synthesizer V」の開発メーカー。 Vocoflexは、RVCなどのAIによるボイスチェンジャーをさらに使いやすく高性能に発展させたもので、VSTやAudioUnitsといったプラグインも揃っていてDAWを使うDTMユーザーとも親和性が高いものです。
既に元ツイートは削除されているのですが、サウンドオブミュージックの「エーデルワイス」に関するこんな話が盛り上がってました。 togetter.com イギリスでは「第三帝国」を思い出すから嫌われているという内容ですが、それに対して、「いやサウンド・オブ・ミュージックは戦後だし…」みたいなツッコミが入って「デマ」という形になっていました。 私はネットミームに関しては、デマかどうかもそうですが、火のない所に煙は立たぬ主義なので、どうしてそういう話が出たのか、という流れを考えるのが好きなため、そういったことを調べてみました。結論だけ書くと、「”エーデルワイス”の曲自体についてナチスを想起する人はどうやら一定数いるが、誤解に基づくものであるし、あまり一般的ではなさそう」ということのようでした。デマというか、自分の経験をどこまで一般化するかという話なんだろうなと感じました。 【目次】 「エーデルワイ
Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 検索すれば、ファミコン風にアレンジした曲が多数ヒットする。これは音楽の知識があり機材などが整っている人が独自に編曲したものが多い。しかし、ファミコン音楽特有の制約を破っているものがほとんどだ。 ファミコン音楽特有の制約とはなにか。ファミコンに搭載される音源チップの機能が制限されているため、ファミコン音楽では一度に同時に鳴らせる最大同時発音数が限られる。その最大同時発音数は4音で、方形波2音、三角波1音、ノイズ1音と音の種類も決まっている。ファミコン音楽には、最大同時発音数4音の制約が存在するわけだ。 そこで今回は、ファミコン音楽の制約を守り、音楽未経験者でも気軽にファミコン風音楽へ自動編曲
ヤマハ「SEQTRAK」 今月26日に発売される「SEQTRAK」は、場所を選ばずに曲づくりが行える音楽制作デバイス。コンパクト・ボディに、シンセサイザー、サンプラー、ドラム・マシン、シーケンサー、エフェクターといった機能が網羅され、スピーカーやマイクなども備えたオール・イン・ワンの音楽制作デバイスです。 コンパクト・ボディに曲づくりに必要な機能を網羅 メインの音源は、おなじみのAWM2(最大同時発音数:128)と4オペレーターのFM(最大同時発音数:8)の2種類で、2,000種類以上のファクトリー・プリセットも収録。さらにはサンプラーも搭載し、7つのスロットに内蔵MEMSマイク/外部入力の音をサンプリングすることができます(24bit/44.1kHz)。これらの音源をコントロールするシーケンサーは、最大11トラック/最大128ステップという仕様で、直感的にパターンを作成することが可能。各
この方法により、推定したビッティング間の距離から鍵のビッティングパターンを推測できる。この手法で、大量の鍵の中から特定の鍵を効率的に絞り込むことが可能となる。実験により、33万以上の鍵の中から最も可能性の高い3つの候補鍵を特定することに成功している。 SpiKeyの最大の利点は、特殊な道具や技術を必要とせず、スマートフォンさえあれば誰でも利用できる点である。また、従来のロックピッキングに比べて疑いをかけられにくく、最新のアンチピッキング機能を備えた錠前に対しても有効である。 Source and Image Credits: Soundarya Ramesh, Harini Ramprasad, and Jun Han. 2020. Listen to Your Key: Towards Acoustics-based Physical Key Inference. In Proceedi
クリプトン・フューチャー・メディア(CFM)は12月25日、自社製の歌声合成ソフト「Piapro Studio」専用の音源「初音ミク NT(ニュータイプ)」を2020年8月下旬に発売すると発表した。従来の初音ミクはヤマハが開発した歌声合成ソフト「VOCALOID」向けの音源として販売されてきたが、初音ミク NTはVOCALOIDでは使えない。 Piapro Studioは初音ミクなどのバーチャルシンガーを歌わせるためのエディタで、初音ミクをはじめとするCFM製品に付属している。 従来は、歌声を合成するためのシステムとしてVOCALOIDのエンジンを借りる形で使っていたが、新バージョンのPiapro Studioには独自に開発した歌声合成エンジンを搭載。ソフトウェア全体を内製化した。初音ミク NTはその専用音源として調整を加えたもの。 自社製エンジンの採用により、新しいPiapro Stud
www.slashfilm.com かつてはハリウッド映画の台詞の99%が理解できた。しかし、この10年ほどの間に、その割合は著しく低下しているのに気づいた。映画館で映画を観てて、台詞がまったく分からないことすらある。家で映画を観るときには、ストーリーの重要な部分を逃さないように、字幕をつけるのが習慣になっていると嘆くこの記者は、この原因を知ろうとハリウッド大作を手がけ、オスカーを受賞したことのある音響関係者に連絡をとったが、オフレコですらコメントを拒否する人もいた。 そこで、その謎を解くべくアマゾンのジャングルに向かった……というのはウソだが、ここまで読んだ時点でワタシの頭に浮かんだのは―― ハンス・ジマーの音楽の圧が強すぎるから! さすがにそれが一番の理由に挙げられてはなかったが、映画音響のミキシングは簡単な仕事ではなく、これは単純な問題ではないというエチケットペーパーを敷いた上で、最
毎日のように、新たな生成AIのシステムが発表され、1年前には想像もつかなかったような時代に入ってきていますが、また非常にユニークで画期的なシステムが登場してきました。ヨーロッパのラトビアのメーカー、Sonarworksが開発したSoundID VoiceAI、というもので、ボーカルトラックをまったく別のシンガーが歌ったものに差し替えるというソフトです。つまり歌詞やメロディーはそのままに、違う歌声に差し替えることができる、というわけです。それに近いことはSynthesizer Vの「オーディオ・ノート変換」機能を利用することで実現していましたが、SoundID VoiceAIではプラグインエフェクトとして声を変換できるため、より手軽に扱えるほか、非常に多くのシンガーが利用できるというのがメリットとなっています。 さらにSoundID VoiceAIがすごいのは変換ターゲットが必ずしも人間のボ
11月11日にAppleがM1チップ搭載のMacを3機種発表して以来、ネット上ではまさにお祭り騒ぎになっています。Macとして、とても安い価格でありながらも、ベンチマーク結果などでは既存のIntelチップのMacと比較して非常に好成績という記事なども数多く上がっているだけに気になるところです。私も価格が発表された日にチェックしてみたところ、Mac miniのミニマムのシステムが72,800円と手ごろな価格だったので、DTM検証用ということで、少しだけアップグレードさせた上で予約注文してみました。 そう気になるのは、これで各種DAWが動作するのか、これまでのオーディオインターフェイスやMIDIキーボードなどは利用できるのか、各種プラグインは使えるのか、そして使えるとしたら、これまでと比較して高速に動いてくれるのか……といったことです。あまり細かく検証できているわけではないのですが、手元にある
ゲームの世界で鳴るさまざまな音は、サウンドデザイナーとサウンドプログラマーが協力して作り上げています。たとえば、オブジェクト同士が接触したときに材質や形状、衝撃の強さなどに応じて変化する音になるよう、サウンドデザイナーが音のデータを作成し、サウンドプログラマーがそのデータを鳴らします。『ゼルダの伝説 ティアーズ オブ ザ キングダム』では、私はサウンドプログラマーとして、サウンドデザイナーが作りだす多彩な音を、リアリティを感じられるように鳴らす役割を担いました。 このゲームには、さまざまな種類の材質や形をしたオブジェクトが登場します。プレイヤーはこれらを自由に動かせるだけでなく、複数のオブジェクトをくっつけることができるため、自由な発想で武器を作ることも、乗り物を作って動かすこともできます。そして高い自由度があることで、私たち開発者の想像を超える遊び方が生まれることもあります。 開発を進め
要約 ボーカロイドの楽曲には、自殺をテーマとした曲が数多く存在する。本論は、Ayase「ラストリゾート」、和田たけあき(くらげP)「わたしのアール」、みきとP「少女レイ」の3曲に焦点を当て、これらの楽曲の歌詞において自殺がいかにして表現されているかを概観する。これらの楽曲において自殺の背景や置かれている状況などはそれぞれ異なっているが、一方でいくつか共通の要素を取り出すことができる。それは、「自殺者の声の不在」と「助けを求められるような他者の不在」の二つの不在であり、いずれも現代における自殺を考える上で避けてはとおれない重要な問題である。ボーカロイドは、現実社会における自殺の問題を表象する——。 (※以上のとおり、自殺というセンシティブなテーマを扱っておりますので、ご理解の上閲覧ください。) 序論:ボーカロイドにおける自殺の位相 ボーカロイドの楽曲には、自殺をテーマとした曲が多くある。ke
「インプロ・りぶる」というツイッター(というか現在では「X」と呼ぶべきか)のアカウントが、8月15日に「フリー・インプロヴィゼーションに初めて触れる人のためのディスクガイド──デレク・ベイリーから連なる音たち」という記事を公開した。カンパニー社より以前出版されたJohn Corbettの書籍『フリー・インプロヴィゼーション聴取の手引き』をベースとし、代表格的なDerek Baileyの作品を中心にセレクトしたものだ。 当ページではDerek Bailey [AIDA] (1980)、齋藤徹 [パナリ] (1996)、齋藤徹 & 長沢哲 [Hier, c’était l’anniversaire de Tetsu.] (2017)、阿部薫 [彗星パルティータ] (1973)、川島誠 [Homo Sacer] (2015)の計5作品が紹介されている。別にこの記事に対してケンカを売るとかそういっ
ドイツMAGIXから定番の波形編集ソフトの新バージョン、SOUND FORGE Pro 18およびSOUND FORGE Pro 18 Suiteがリリースされました。今回のバージョンアップの目玉はAIを利用した音声合成機能を搭載し、日本語でテキストを入力すると、非常にリアルで自然な声で、そして高音質なサウンドで喋り声が生成されることです。VOICEPEAKやVOICEVOX、A.I.Voice、CoeFont……などなど、ここ数年で急速に進化し、数々のソフトが出てきたTTS=Text to Speech(音声読み上げソフト)の世界にSOUND FORGEが殴り込みをかけてきた格好です。しかも単なるTTSに留まらず、翻訳機能も搭載。これによって最大100言語へ翻訳して喋らせることも可能になっているため、グローバルなコンテンツ制作も可能になっています。 さらにStoryblocksという音素
2020年9月8日、独立行政法人国立科学博物館(東京都台東区)が2020年度の「重要科学技術史資料(未来技術遺産)」として16件を発表しました。DTM関連の世界では、すでにRolandのTR-808が未来技術遺産として登録されていましたが、今回、ミュージくん(1988年発売)、MIDI 1.0規格書(1984年リリース)、さらにはドンカマの愛称で知られる国産初のリズムボックス市販機、KORGのドンカマチック(1963年発売)などが殿堂入りとなりました。 中でもミュージくんは、DTM=デスクトップ・ミュージックの原点ともいえるものであり、DTMという言葉自体がミュージくんの登場とともに生まれたもの。そのミュージくんが未来技術遺産になったというのはDTMステーション的には感無量ともいえる出来事。そこで今回のミュージくんの殿堂入りをお祝いさせていただくとともにミュージくんとはどんなものだったのか
いろいろなところで話題になるJASRAC=一般社団法人日本音楽著作権協会。人によっていろいろなイメージを持っているのでは……とも思いますが、JASRACがどんな団体であり、何をしているところなのか、なかなか捉えにくいのも事実です。また一般人からすると、遠い存在のようにも思えるJASRACですが、実はDTMユーザーにとって遠くはない存在、というよりも積極的に関わるべき団体だ、というような声も聞こえてきます。 そうだとすると、DTMステーションとしても、JASRACについて一度しっかり確認して、DTMerにとって敵なのか、味方なのかなど、見解をまとめていったほうがいいのでは……と思っていたのです。そうした中、たまたま知人を介して、JASRACの広報を紹介してもらい、連絡をとってみたところ、いろいろ話を聞かせていただけることになったのです。東京・代々木上原駅の近辺にJASRACと書かれたビルがあ
今年ローランドが、創業50年を迎えたそうである。ヤマハの創業が明治20年(1887年)、カワイの創業が昭和2年(1927年)であるのに比べると、元々アコースティック楽器メーカーではなく、最初からエレクトロニクスの会社だったので、楽器メーカーとしては意外に新しい。 これを記念して、ローランドでは特設サイトを設けて50年の歴史を振り返っている。 Roland 50th Anniversary ローランドはそれぞれの年代でエポックメイキングな製品をリリースしているのだが、他社の情報が載ってないので、その当時の雰囲気までは分からない。 昨今の製品はみなさんもよくご存じだろう。ここでは中学生の頃からローランドに貢ぎ続けてきた筆者が、あまり良く知られていない1970年代から80年代の歴史を補完してみたいと思う。一緒に特設サイトのページを繰りながらご覧いただければ幸いだ。 この記事について この記事は、
NATURAL & SMOOTH実際に歌手が楽曲を歌ったデータから特徴を抽出しており、本人の声質だけではなく癖・歌いまわしなどを最新の歌声生成AIで再現します。歌詞とメロディーを入力するだけで簡単に歌わせることができ、実在の歌手に依頼するような感覚で制作を進めることができます。 QUICK STARTインストールはワンクリックで完了。すぐに制作を開始いただけます。 Windows / MacOS / Linux / Onlineでの動作に対応しており、環境を問わずご利用いただけます。 CLEAN DATA & CLEAN MODELモデルの学習には声優・演者様の許諾の上収録した音声データ、もしくは大学などの公的機関から公開されている音声データのみを利用しております。既存の学習済みモデルは利用しておらず、上記データを用いてフルスクラッチで学習を行っております。権利的・倫理的にクリーンな
発端はこのツイート。「本当のDTM」をやってらっしゃる方がいたら、それがなんなのか答えを教えてください!、という問いかけによって、世の中のDTMerを巻き込んだ大喜利がスタートしました。 これは一言申さねばなりません。なぜなら、筆者は本当のDTMを体験した数少ない生き残りだからです。 DTM(Desk Top Music)という言葉を最初に使った製品が登場したのは、1988年のこと。PC-9801用のDTMパッケージ「ミュージくん」です。MIDI音源として、LA音源のMT-32、PC-9801用MIDIインタフェース、ダイナウェアが開発した五線譜ベースのソフトウェアをバンドルしたものでした。2020年度未来技術遺産にも認定されています。 ▲ミュージくん ちなみにDTMというのは、DTP(Desk Top Publishing)から発想したローランドのネーミング。Macintoshとページプ
無料で提供されているオープンソースの音声編集ソフトウェア「Audacity」をフォークし、ブラウザ上で動作するようにした「Wavacity」が公開されています。 Wavacity https://wavacity.com/ 上記のリンクにアクセスすると、以下のような画面が表示されます。本家のAudacityは表示言語を日本語に設定する必要がありますが、Wavacityは最初から日本語で表示されるので、日本語ネイティブユーザーにとってかなり取っ付きやすくなっています。 記事作成時点で最新バージョンとなる本家Audacity(v3.3.3)の画面が以下。 比較するとこんな感じ。スライダーを右に動かすとWavacityが、左に動かすとAudacityが表示されます。 楽曲ファイルをインポートするには「ファイル」から「開く」をクリックし、ファイルを選択します。 タイムライン上でドラッグすると、編集
4月9日、音楽の教科書会社である教育芸術社からカトカトーンというWebアプリが公開され、全国の小学校、中学校、高校などを対象に使用が開始されました。これは全国の児童・生徒1人に1台のコンピューターと高速ネットワークを整備する文部科学省の取り組み、GIGAスクール構想に対応させたもので、Windows、ChromeOS、iPadOSのブラウザを使って、音楽制作を楽しく直感的に行える、というアプリとなっています。学校や教育関係の施設・組織などであれば、すべて無料で利用できるというのもユニークな点であり、DTMを学ぶための強力なツールが全国の学校に整った、といっても過言ではないと思います。 このカトカトーンの開発は教育芸術社のほか、「スコラ 坂本龍一 音楽の学校」「ムジカ・ピッコリーノ」「シャキーン!」など、Eテレで数々の音楽教育に関わるコンテンツの制作を手掛けてきた制作会社のディレクションズ、
音楽ライターが「数十万円のオーディオインターフェイス」を必要とする理由2022.12.20 22:0032,114 今津甲 「え、彼ってそんな才能あったんだ!」みたいな身近な驚き、たまにありませんか? これって人に限ったことじゃないですけどね。モノにだって同様な場面はある。なかでも、持ってる人の9割ぐらいはその真価を知ると驚く、っていうブツがあります。それがコンピュータ。 は? 毎日使ってるあれのどこが? いや音なんですよ。コンピュータで再生可能な音楽の真価。たしかに内蔵スピーカーもそこそこです。ただ「今年のモデルは音もいい」と言っても、それは過去のPCと比べれば、だったりする。でも本当にあれっくらいのレベルのサウンドしか出なかったら、音楽業界は成立しません。プロの世界ではポップスからクラシックまで、もう20年以上も前からコンピュータで作品づくりをしているわけですから。 となるとそこには、
うぃっちわっち(丁稚) @Witchwatch99 YOASOBIのヴォーカル「イクラ」ちゃん、ソロでもやってるって聞いて曲聴いてみたら「あれ?」って思ったって話を長文で。 #YOASOBI うぃっちわっち(丁稚) @Witchwatch99 "YOASOBI"に反応されてツリー見に来た方にYOASOBIの説明は必要ありますまい。 で、YOASOBIのヴォーカル「イクラ」ちゃんは元々ソロシンガーだという事の説明が必要な方は若干存在すると思われるので説明を(そもアヤセ氏も) イクラちゃん、割と若い頃からオーディション受けたりコツコツ活動してたミュージシャンで、作詞作曲もしてるいわゆるシンガーソングライター。 YOASOBIではアヤセ氏がコンポーザーやってるんでヴォーカル一本ですが、「幾田りら」名義でやってるソロ活動では自分で曲作って歌ってます。 彼女の声は特に高音域が澄んだ透明感のある声で、
声優の小岩井ことりさんは9月15日、明治大学の森勢将雅専任准教授らと共同執筆した論文が電子情報通信学会で船井ベストペーパー賞を受賞したと発表した。作曲で音声合成分野の研究に貢献した。 受賞した論文は「レアなモーラを含む日本語歌唱データベースの構築と基礎評価」。著者は小岩井さん、森勢専任准教授、ライターの藤本健さん。内容は、AI歌声合成技術などの研究に使えるオリジナル曲を集めたデータベースを作成したというもの。 収録したオリジナル曲には、日本語の音素をできる限り含んだ歌詞、さまざまなパターンのメロディーが織り込んである。これまで歌声合成の分野では、著作権などの問題から童謡を使うことが多かったが、オリジナル曲のみでデータベースを構築することで利用条件の緩和を目指した。
2014年に北西太平洋・マリアナ海溝で実施した音響調査で収集された謎の音は約10年にわたって科学者を悩ませていました。しかし、アメリカ海洋大気庁(NOAA)の研究者らがAIを用いた分析を行った結果、この音の正体を突き止めることに成功しました。 Frontiers | Bryde’s whales produce Biotwang calls, which occur seasonally in long-term acoustic recordings from the central and western North Pacific https://www.frontiersin.org/journals/marine-science/articles/10.3389/fmars.2024.1394695/full Creepy 'biotwang' noises coming fro
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く