タグ

ブックマーク / srad.jp/~aito (6)

  • 09/05 音響学会3日目まとめ | aitoの日記 | スラド

    スペシャルセッション音声A/音声B/電気音響[音によるシーン理解とその進展 I] ・あらゆる音の検出・識別を目指して―音響イベント検出研究の現在と未来―(NTT CS研・大石康智) さまざまな録音に対して、これまでは音声や音楽などの特別な信号を検出・識別することが多かったが、それ以外の雑音も含めてすべての音を認識する「音によるシーン理解」。ICASSPでの発表件数も徐々に増えている。 これまでの研究課題を「音の特定度」と「時間的参照範囲」を軸として整理する。特定度は、データベースの音との同一性基準(完全同一波形かどうか)で、時間的参照範囲はフレーム単位か長時間統計を使うか。これらの分類は音楽検索からの借用。 大分類として「同一音の検出・識別」「音響イベントの検出・識別」「音声・音楽の区間検出・識別」「音環境の検出・識別」の4つを認定。 同一音の検出は完全に同じ波形の検出。研究は少ないが、今

    sucrose
    sucrose 2014/09/05
  • 9/4 音響学会2日目まとめ | aitoの日記 | スラド

    音声B[HMM音声合成] ・HMM音声合成のための系列内変動を考慮した高速スペクトル強調法の検討(東北大) 能勢先生。生成パラメータがなめらかすぎることに起因するHMM音声合成の自然性低下を防ぐため、従来は大域分散(GV)を制御したパラメータ生成が行われている。しかしこの方法では文によってパラメータ分散が変動せず、また計算コストが大きい。提案法では単純に生成パラメータの分散が自然音声に近くなるようにパラメータを定数倍するだけの簡単なものだが、うまくやれば単純な操作で品質を改善できる。 ・HMM音声合成における加算モデルに基づく任意話者への感情付与法の検討(東芝) 大谷さん。感情付き音声を合成するには学習話者の感情付き音声データが必要なのだが、それがない話者の音声を元にして感情音声を合成する方法。様々な話者のさまざまな発話スタイルの音声パラメータを「基バイアス+さまざまな要因によるバイアス

    sucrose
    sucrose 2014/09/05
  • 9/3 音響学会1日目まとめ | aitoの日記 | スラド

    スペシャルセッション「音楽と音のデザイン」1 ・音楽と音のデザイン(岩宮眞一郎) スペシャルセッションの趣旨説明と企画全体の概略。 従来の音楽伝達(楽譜→演奏家→演奏場→聴衆)では「音づくり」の過程はなかった。しかし現在のポピュラー音楽では、音の加工・編集などの音づくり(デザイン)が不可欠。 現代音楽の世界では、調性が従来のクラシックから変化し(ミュジック・セリエルなど)、またミュジック・コンクレートや電子音楽など音楽素材が拡大してきている。演奏者は自分で音から作るようになった(新しい音、おもしろい音の追求)。そのため音のデザインが重要な要素となった。 さらにコンピュータによる「音場のデザイン」、メディアアートのような芸術とデザインの境界分野、インタラクティブ音楽のようなものも一般的になってきた。 いずれもテクノロジーの発達と深い関わりがある。 ・音楽制作における音づくりとミュージシャンに

    sucrose
    sucrose 2014/09/05
  • 5/22 NL研&SLP研 まとめ | aitoの日記 | スラド

    ■学生セッション1:自然言語解析(10:00-12:00) (1) 係り受け解析におけるLeft-corner型遷移 能地 宏,宮尾 祐介 人間の文処理のモデル(left to rightで逐次構文木を生成する)。従来法は句構造対象だったが、この研究では係り受けを対象とした。人間が文を理解するときの認知的負荷の性質(右枝分かれと左枝分かれは同じぐらい難しく、それよりも埋め込み文の方が難しい)と似た性質を持つ解析法としてleft-corner parserに注目して、left-corner解析を使った係り受け解析法を考案。18の言語に対して係り受け解析を行い(treebankの正解をもとに解析する)、スタックの深さの分布を調べたところ、他の解析方法に比べてスタックサイズが小さく抑えられ、また言語依存性が小さかった(ので、人の解析方法に近いと主張したいようだ)。言いたいことは比較的明確な気がす

    sucrose
    sucrose 2014/05/23
  • aitoの日記 | スラド

    ■楽器 [11:00-12:00] (1) 手回しオルゴールの魅力と脳波的考察 関 妹子,志賀 一雅 最初に手回しオルゴールの紹介。今回利用しているのはカード式。福祉施設での音楽療法(聞くことではなく,ハンドルを回して演奏することによる),保育園や美術館などでの演奏活動。カードを作るワークショップなども開いている。好評なので,手回しオルゴールの音に癒し効果があるのか調べた。効果の計測は脳波によるが,脳波の説明は嘘とは言えないがやや怪しい。脳波の計測には脳力開発研究所というところが作っているアルファテック7という機器を使っているが,これ怪しくないのかなあ。参考文献にはバイオフィードバック学会と日サイ科学会の論文が並んでいる。演奏の実演では「こんぺいとうの踊り」の演奏を行った。オルゴールは素敵な音色。 (2) RWC楽器音データベースを利用したビブラート音の複数楽器にわたる比較分析 黒崎 友

    sucrose
    sucrose 2013/06/17
  • 5月16日 SIGSLP/SIGNL@東大まとめ | aitoの日記 | スラド

    途中から入場。 (3) 文書上の潜在トピックを捉える事象の検討とその応用(お茶の水女子大) LSIやPLSIにおける「単語」を「イベント」(単語列など)に拡張した潜在意味解析。実行が大変そうだ。イベントとして,係り受けがある単語(名詞と述語,任意の自立語)の組,文内で共起する自立語の組などいくつかを検討。トピック推定はLDA。楽天トラベルのレビューを対象にした文書検索課題で評価。結論としては,接続詞などで文を区切り,係り受けがある単語間の共起を使うのが良いとのこと。また,要約課題での評価では,係り受けのある単語の組のうちヒューリスティックに種類を選んだものが良い性能だった。 (4) 多言語トピックモデルによる言語横断リンク検出(神戸大) 江口研。多言語トピックモデルであるCI-LDA,SwitchLDA,CorrLDAの性能比較。CI-LDAは2つの言語が同じトピックを共有するモデル,Sw

    sucrose
    sucrose 2011/05/21
  • 1