タグ

2022年8月20日のブックマーク (11件)

  • 「何を言っているのか分からない」と言われないための「伝え方」のノウハウ - Qiita

    私自身、物事を分かりやすく伝えるスキルを身に着けるため、手あたり次第に、いくつかノウハウを読んだり、YouTube動画を観たりしてきました。記事では、や動画から得られたノウハウや、私が普段の仕事で発見した個人的に使っているテクニックをまとめてみました。 0 記事の最重要ポイント 記事がストックの墓場に行ってもいいように、記事の最重要ポイントだけ先に伝えておきます。 質問に答える時は、聞かれたことにシンプルに答える。 事実と解釈を分けて話す。 1 記事で伝えたいメッセージ 1-1 コミュニケーション能力の苦手意識はノウハウで解決する ITエンジニアの裾野が広がるにつれて、SNSでも「コミュニケーション能力の低いITエンジニア」の話題をちらほら見かけるようになりました。いわく「これからはITエンジニアにもコミュニケーション能力が求められる」「プログラミングができるだけでは生き残れ

    「何を言っているのか分からない」と言われないための「伝え方」のノウハウ - Qiita
    stealthinu
    stealthinu 2022/08/20
    色々と参考になるがじゃあすぐできるかって言うとなかなかむつかしいよね。なるべく気にしてみたい。
  • 引越しが決まったらやるべきことのあれこれがめっちゃ参考になると話題「ありがてぇ…」補足あり

    いちかり君🏡お部屋探しの教科書(東京/神奈川) @ichikaritokyo 部屋探しプロが『一人暮らし、カップルさん向け賃貸暮らしライフハック』発信🗣️ フォローすると賃貸暮らしの失敗が減ります | 過去ツイを定期で再ツイ |この中の人→@nakayudayo《部屋探し仲介手数料0円〜Agentマッチングサイト運営▶︎https://t.co/HdkO4pyd3A》 youtube.com/channel/UC2ju9…

    引越しが決まったらやるべきことのあれこれがめっちゃ参考になると話題「ありがてぇ…」補足あり
    stealthinu
    stealthinu 2022/08/20
    後日の子供の引っ越しのためにブコメしとく
  • Real-time voice conversion with feedback for acquiring character traits

    stealthinu
    stealthinu 2022/08/20
    7pに、VCで似てる感は声質だけじゃなく「パラ言語情報」によるキャラクタ性によるものが大きく話者が意図的に付与するしかないがVCに対応させたいとあって流石だった。
  • AG03のエフェクト設定方法。オススメ設定も紹介

    AG DSP Controllerのインストールと起動まずはPCでAG03の音質を調整できる機能、AG DSP Controllerのインストールと起動方法を解説します。 インストール方法こちらをクリックしてYamahaのHPに行きます。下部にあるソフトウェアリストからからAG DSP controllerをDLします。 ※Winの場合はYamaha Steinberg USB Driverを合わせてDLし先にインストールしておきます。ファイルを解凍し、起動します。利用規約に同意し、画面の指示に従っていけばインストールがはじまります。インストールが終わったら動作を安定させるためにPCの再起動を行います。画面推移はバージョンによって変わるのでここでは細かい説明は割愛いたします、そこまで複雑な手順ではなく、『次へ』などを数クリックするだけですのでご安心ください。 起動方法インストールが完了する

    AG03のエフェクト設定方法。オススメ設定も紹介
    stealthinu
    stealthinu 2022/08/20
    AG03ってDSP使ってイコライザ掛けてからミキシングできるものなのね。んでPCからの設定でどういうイコライザ掛けるかを細かく設定できるものとのこと。だから簡易ノイズリダクションもできる。
  • Python:LibROSA のフェーズボコーダで時間伸縮・ピッチシフト librosa.phase_vocoder - Wizard Notes

    まえがき 使い方 関数の仕様 サンプルコードとプロット librosa.phase_vocoderの中身について 重要な中間変数を抜粋 メイン処理 補足:フェーズボコーダを使ったピッチシフトの実現方法 librosa.phase_vocoderの音質について 参考文献 まえがき オーディオ編集をしていると、楽器の録音データや楽曲データに、 「ピッチを変えずに、鳴っている時間長を短く/長くしたい」 「時間長を変えずに、ピッチを低く/高くしたい」 という処理をしたくなることが多々あると思います。 それらを実現するには時間伸縮やリサンプリングといった処理が必要ですが、 前者についてはフェーズボコーダという手法が知られています。 Python音楽分析モジュールLibROSAでも、ピッチシフトとタイムストレッチを行う関数 librosa.effects.time_stretchとlibrosa.e

    Python:LibROSA のフェーズボコーダで時間伸縮・ピッチシフト librosa.phase_vocoder - Wizard Notes
    stealthinu
    stealthinu 2022/08/20
    librosaのpitch_shiftはあまり品質よくないということについてここで記述があった。やはりよく知られた問題だったのか。
  • librosa.pyin — librosa 0.10.2dev documentation

    stealthinu
    stealthinu 2022/08/20
    librosaにはpyinが入ってるのでなんも考えずともF0推定できる。ありがたすぎる。
  • 基本周波数についてのまとめ - 備忘録

    稿では基周波数についての予備知識を簡単にまとめることにする。 【2020/11/20】Pythonによる実装例を追加(ページ最下部にリンク有り) そもそも音声分析とは 基周波数(F0)とは 基周波数の推定手法 A Robust Algorithm for Pitch Tracking (RAPT) A Sawtooth Waveform Inspired Pitch Estimator (SWIPE) STRAIGHT WORLD REAPER YIN TEMPO その他 Pythonによる基周波数推定の実装例 おわりに そもそも音声分析とは 音響特徴量(音高,音色等)の抽出 音声合成音声認識等の基礎技術 音声処理における前段処理 分析結果が後段の音声処理に与える影響大 基周波数(F0)とは 音声の周期性を表現,音高を司る音響特徴量 F0の有無 ⇒ 音声は有声音と無声音に大別

    stealthinu
    stealthinu 2022/08/20
    音声の音程を調べたくてここがとても参考になた。基本周波数(F0)推定は色んな手法がある。pYINとケプストラム法が良さそうだった。
  • 音声認識や音声合成に出てくる用語のまとめ - ichou1のブログ

    (随時、更新します) 「スペクトラム」と「スペクトログラム」の違い 時間領域で標化されたデータはチャンクに分けられ(チャンクは一般にオーバーラップさせる)、チャンク毎にフーリエ変換を施す。 各チャンクの変換結果が、ある時間における全周波数成分のグラフ(スペクトラム)となるので、これを時系列に並べるとスペクトログラムが完成する。 wikiより引用(一部、加工) 単語 言語 次元(x, y, z) spectrum 英語 2次元(周波数、信号成分の強さ) spectrogram 英語 3次元(時間、周波数、信号成分の強さ) 「スペクトラム」と「スペクトル」の違い 同じ意味。 言語 単語 品詞 英語 spectrum 名詞 spectral 形容詞 フランス語 spectre 名詞 「振幅」、「パワー」、「magnitude」、「Energy」の違い フーリエ変換で求まった「実数」と「虚数」に

    音声認識や音声合成に出てくる用語のまとめ - ichou1のブログ
    stealthinu
    stealthinu 2022/08/20
    「スペクトラム」と「スペクトログラム」の言葉の違いをよくわかってなかった。スペクトログラムが時間変化ありのもの。スペクトラム、スペクトル、スペクトラム、みな同じ意味。パワーは振幅の2乗。
  • 双2次フィルタ

    と表すことができます。 この伝達関数の周波数特性は、 ω0 を境にして減衰を始めるローパス特性になっています。 すなわち、このような RCL 回路を用いて、ローパスフィルタを作ることが出来ます。 ちなみに、クオリティファクタ Q を変えると、カットオフ特性のなだらかさなどが変化します。 ここではローパスフィルタを例に挙げましたが、 RCL の配置をいろいろと変えることで、さまざまな特性を作ることができます。 伝達関数の分母・分子ともに2次のフィルタを双2次フィルタ(biquadratic filter、あるいは biquad filter)といいます。 (余談ですが、quad- という接頭語は“4”という意味を表します。 quadratic は“四角形の”という意味合いから“2次元の”という意味で使われる言葉です。 ついでに、bi- は“2”を表す接頭語です。 biquadratic は文

    双2次フィルタ
    stealthinu
    stealthinu 2022/08/20
    biquad(双2次フィルタ)について。これだけでいろんな音声のイコライザが実現できる。一般にイコライザは普通これで実装されてるとのこと。STFT掛けなくてよいから軽いし逆変換での劣化とかもない。
  • Cute.Guides: 「音」とはそもそも何だろうか!?: 音の形取られ方

    芸術工学部音響設計学科卒、現在大学院に所属の僕が「音」とはそもそも何なのかを紹介する。音響学中〜上級編。 ここでは、前ページで紹介した「スペクトル包絡」について もう少し見ていきましょう! 人の声(音声)を例に考えてみましょう!! 私たちが声を出すときには、のどの奥にある「 声帯(せいたい)」を使います。 のど(首の付け根の辺り)に手を当てて「アー」と発声すると、 手に振動が伝わってくるかと思います。 その振動している位置にあるのが「声帯」です。 しかし、「声帯」で生まれた声がそのまま私たちの耳に届くわけではありません。 実は、「声帯」で生まれた声そのものは、まるでブザー音のような音をしています。 これがのどや口の中を通ることで、声らしい声になるのです。 この「のどや口の中」のことを「 声道(せいどう)」と呼びます。 下の図に、声帯で生まれてから声らしい声ができるまでの過程を表してみました

    stealthinu
    stealthinu 2022/08/20
    スペクトル包絡ってなに?と思ってたが「あ」の音とか特定の音の特徴を表してるスペクトルのことを言う言葉ってことなのね。
  • Mthesis_takamichi

    音声の特徴抽出 (DFT, LPC, ケプストラム分析) 東京大学 情報理工学系研究科 特任助教 高道 慎之介 奈良先端大 音情報処理論第2回 (2016/10/18) /61 自己紹介  名前・所属 – 高道 慎之介 (たかみち しんのすけ) – 東京大学 大学院情報理工学系研究科 特任助教  NAISTとの関わり – 2011/04: 知能コミュニケーション研究室 (中村 哲教授) 1期生 – 2016/03: 博士課程修了  研究分野 – 電気音響・音像定位 – 音声信号処理 – 音声合成・変換 – 言語教育 2 /61 講義の目的  デジタル信号処理の基礎 – 特徴抽出の前準備  音声とは – 音声の生成過程、言語依存性  音声の特徴抽出 – ケプストラム分析、LPC分析 3 音声の特徴とは何か、 それをどう定量化するかを学ぶ デジタル信号処理の基礎 4 /61 アナ

    stealthinu
    stealthinu 2022/08/20
    ディープラーニング使ったVCから始めたため音声の特徴抽出について基礎知識が全くなかったのでものすごく勉強になった。先にわからんことがあって?になってたとこに正解もらうからすぐに理解できた。