タグ

画像処理と信号処理に関するotori334のブックマーク (15)

  • “液体”でリアルタイムAI学習 環境音に最適化、低消費電力でエッジデバイス応用に期待

    独自開発した液体に音の信号パターンを与えることで高速にAI学習する──東京理科大学と産業技術総合研究所の研究グループが、4月28日にこんな研究成果を発表した。コンピュータのみでの処理に比べて消費電力を低く抑えられ、処理も高速に行えることからエッジデバイスでのAI学習への応用が期待できるという。 ニューラルネットワークの中間層を、コンピュータの代わりに物理系の作用を使って情報処理する手法は「リザバーコンピューティング」と呼ばれている。その例として研究グループは「貯水池(リザバー)の水面に石を投げ込んで生じた波紋のパターンは、投げ込んだ石のサイズや投げ込む順序を反映することから、石の時系列情報を推測できる」と説明する。 研究グループは、生活環境で聞こえる人の声などの周波数に適した、イオン性の液体を開発。入力をパルス信号で与え、液体を通過して電流として応答する際に、電流の減衰時間に入力の特徴が反

    “液体”でリアルタイムAI学習 環境音に最適化、低消費電力でエッジデバイス応用に期待
  • ノイズリダクション - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "ノイズリダクション" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2017年3月) ノイズリダクション (Noise reduction) とは、音声や映像(動画)などといった信号に含まれるノイズを抑圧・軽減する、信号処理の一種である。 使われる場所・目的はさまざまであるが、主なものとして、撮像素子を高感度で使用した場合に混入を避けられない熱雑音などが発生源のノイズを取り除く、というような原信号を改善するタイプのものと、アナログ磁気記憶において避けられないヒスノイズを軽減するために、記録時に原信号を強調するような変換を掛けておき、再生時

  • ブラウザで動くリアルタイム画像/音声処理アプリをStreamlitでサクッと作る

    Overview 画像/音声処理をリアルタイムで行う、Webブラウザから利用できるアプリをStreamlitで作る方法を解説します。 StreamlitのおかげでPythonだけでwebアプリが作れます。さらに、一番簡単な例なら10行程度のPythonコードで、webカメラを入力にしてブラウザから利用できるリアルタイム画像処理アプリケーションになります。 Webベースなのでクラウドにデプロイでき、ユーザに簡単に共有して使ってもらえ、UIもイマドキで綺麗です。 人物・物体検知、スタイル変換、画像フィルタ、文字起こし、ビデオチャット、その他様々な画像・音声処理の実装アイディアをデモ・プロトタイピングするのになかなかハマる技術スタックではないでしょうか。 Webブラウザから利用できる物体検知デモの例。実行中に閾値をスライダーで変えられる。オンラインデモ🎈 同様にスタイル変換デモの例。実行中にモ

    ブラウザで動くリアルタイム画像/音声処理アプリをStreamlitでサクッと作る
  • ピーク信号対雑音比 - Wikipedia

    ピーク信号対雑音比 は画質の再現性に影響を与える、信号が取りうる最大のパワー[注釈 1]と劣化をもたらすノイズ[注釈 2]の比率を表す工学用語で、しばしばPSNR(Peak signal-to-noise ratio) と略される。多くの信号はダイナミックレンジが非常に広いため、PSNR比は通常10を底にした常用対数で表される。 PSNRが最も一般的に使用されるのは、画像圧縮など非可逆圧縮を使ったコーデックの再現性の品質の尺度としてである。その場合の信号は元データであり、ノイズは圧縮によって生じた誤りである。通常はPSNRが高い方が高画質であるが、場合によっては低いPSNRにもかかわらず元の画像に近いように人間に知覚される場合があるため、圧縮に用いるコーデック同士を比較する際はPSNR値はあくまで目安とすべきである。PSNRの数値を比較に用いる場合は適用可能な場合について注意を払わなければ

    ピーク信号対雑音比 - Wikipedia
  • 暗視野顕微鏡法におけるクラミドモナスの三次元トラッキング

    Recently, flagella and cilia have gathered attension since their important role in mammal cells and relation to genetic diseases of human were revealed. Chlamydomonas is one of the model organism of flagella and phototaxis research. The purpose of our research is to track a freely swimming individual Chlamydomonas cell to observe its flagella and whole body movement with dark field microscopy to i

  • 機械学習の元祖「パーセプトロン」とは? – 株式会社ライトコード

    パーセプトロンとは?パーセプトロンは、1958年に発表された、いわば「機械学習の元祖」です。 パーセプトロンはニューラルネットワークの一種で、形式ニューロンを複数用いてネットワーク状に接続したものを指します。 一般的に、以下のように分類されます。 2層からなる「単純パーセプトロン」3層以上からなる「多層パーセプトロン」現在は、後者の多層パーセプトロンが主流です。 しかし、入門編としまして、シンプルでわかりやすい単純パーセプトロンの解説と実装を紹介していきたいと思います。 実行環境実装はPythonでおこなっていきますが、筆者の実行環境は以下の通りです。

    otori334
    otori334 2021/09/16
    “決定境界と呼ばれるクラス分類の境界線を引くことが学習のゴール” 大津の多値化の閾値決定を自動化できそう.
  • 動物の目は「微分」を活用している - tsujimotterのノートブック

    数学は役に立つのか?」「微分や積分は役に立つのか?」というのは、たびたびSNS上で目にする話題ですね。もちろん、人間社会において、さまざまな場面で数学や微分・積分が役に立っているのはみなさんよくご存知かと思います。 今日紹介したいのは、人間が発見するよりもはるか昔に、生物がすでに既に微分を活用していたかもしれない というお話です。 たとえば、カブトガニのような生物は、実際に「微分」を活用していたのではないかと言われています。 By Togabi - Own work, CC BY-SA 4.0, Link カブトガニが誕生したのは2億年前ですが、人類が微分を発見したのはせいぜい300年前ですから、人類が活用するよりもはるか昔ということになります。 いったいどんなふうに微分を活用していたのでしょうか。面白い話なので、ぜひ最後まで読んでいただけると嬉しいです! 目次: 1. 物体認識とエッジ

    動物の目は「微分」を活用している - tsujimotterのノートブック
  • 網膜における視覚情報処理のメカニズム

    otori334
    otori334 2021/07/30
    網膜における視覚情報処理のメカニズム
  • クロマグラムと和音 – blog|メディア情報研究室|村上真研究室|東洋大学総合情報学部

    目的 音楽データは和音やコードと言われる心地良いいくつかの音の組み合わせで構成されることが多い.ここでは,和音と和音を表現するときに使用されることが多いクロマグラムについて学ぶ. 説明 長三和音 ピアノでC3から1オクターブ上のC4までの13音「C3 C#3 D3 D#3 E3 F3 F#3 G3 G#3 A3 A#3 B3 C3」を順に弾いたオーディオデータにConstant-Q変換をかけ,パワースペクトログラムを表示してみよう. 実行すると以下のように表示され,例えば最初の1秒でC3の音を弾いている区間では,C3の2倍・3倍・4倍…の周波数成分が強く現れていることがわかる.これは調波構造や倍音構造と呼ばれる特徴で,弦楽器や管楽器で弾いた音に現れる特徴である. C3の2倍の周波数の音は1オクターブ上のC4であり,4倍の周波数の音は2オクターブ上のC5であることは自明である.ここではC3の

  • 離散コサイン変換 - Wikipedia

    二次元DCTとDFTとの比較。左はスペクトル、右はヒストグラム。低周波域での相違を示すため、スペクトルは 1/4 だけ示してある。DCTでは、パワーのほとんどが低周波領域に集中していることがわかる。 離散コサイン変換(りさんコサインへんかん、英: discrete cosine transform、DCT)は、離散信号を周波数領域へ変換する方法の一つである。 概要[編集] DCTは、有限数列を、余弦関数数列 cos(nk) を基底とする一次結合(つまり、適切な周波数と振幅のコサインカーブの和)の係数に変換する。余弦関数は実数に対しては実数を返すので、実数列に対してはDCT係数も実数列となる。 これは、離散フーリエ変換 (DFT: discrete Fourier transform) が、実数に対しても複素数を返す exp(ink) を使うため、実数列に対しても複素数列となるのと大きな違い

    離散コサイン変換 - Wikipedia
    otori334
    otori334 2021/07/09
    直流バイアスの拡張 “DCTはy軸で折り返して偶関数化してDFTすることと等価であり、実際にそう計算することが多い。”
  • 直流バイアス - Wikipedia

    時間領域で周期関数を記述する場合、直流バイアス(直流成分、直流オフセット、直流係数)は波形の平均値である。平均振幅が0の場合、直流オフセットがないということである。直流成分のない波形は、直流バランス(DC-balanced)または直流フリー(DC-free)な波形として知られている[1]。 起源[編集] この用語は電子工学の世界において直流電圧を指す言葉に由来する。それに対し、他の様々な非直流周波数は重ね合わせた交流(AC)電圧・電流に類似しており、そのため交流成分もしくは交流係数と呼ばれる。 この発想は、あらゆる波形の表現や、JPEGで使われる離散コサイン変換のような2次元変換に拡張されている。 応用[編集] 電子増幅回路の設計では、全ての能動素子は信号が印加されていない時に、動作点、定常状態の電流電圧をデバイスに設定するためにバイアシングをしている。例えばバイポーラトランジスタのバイア

  • 30.ディープラーニングでノイズを消してみよう - keep learning blog(キープラーニングブログ)

    ――科学者とは、自然のひみつと美しさを探し求めるおとぎの国の旅人です。それは大変おもしろく、夢のある楽しい仕事なんですよ。―― マリア・スクウォドフスカ・キュリー ディープラーニングでノイズを消してみよう 論文の概要 U-Netとは U-Netのアレンジ Pythonで実装 ディープラーニングでノイズを消してみよう すっかり季節が初夏の陽気になってきたと思っていたら、暦はもう6月になっていました。キュリー夫人の言う「おとぎの国」という表現がぴったりのデンマーク生活も、そろそろ終わりを告げようとしています。 昨年7月にデンマークの土を踏んでから約1年間、短いようでとても長かったです。西洋のことわざで、「ロバが旅に出かけたところで、馬になって帰ってくるわけではない」という言葉があります。私はポニーくらいにはなれたでしょうか。 デンマーク生活で印象に残っていることはいくつかあります。そこに住む人

    30.ディープラーニングでノイズを消してみよう - keep learning blog(キープラーニングブログ)
    otori334
    otori334 2021/07/05
    “2015年頃に電子顕微鏡画像から細胞などの特定箇所を検出する(Segmentation)用途で開発された、U-Netという比較的シンプルな畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)を採用”
  • Python: LibROSA で調波打楽器音分離 (HPSS) - Wizard Notes

    調波打楽器音分離とは? 一般的な楽曲では、様々な楽器音が含まれています。 そのため、元の楽曲信号から直接、音楽的な情報(例:コード進行)を分析するのは 計算機ではなかなか難しいです*1。 そこで、分析の前処理として、 打楽器の音と非打楽器(調波楽器)の音を分離する調波打楽器音分離 (HPSS: Hermonic/Percussive Source Seperation) *2が良く使われています。 この記事では、HPSSの概要とPython (LibROSA) のコードの解説します。 調波打楽器音分離とは? 調波打楽器音分離のアイディア アルゴリズムの設計 非負値行列因子分解+基底クラスタリング 最適化問題(行列因子分解)として解く 深層学習を使った手法 メディアンフィルタベースの手法 LibROSAにおける調波打楽器分離(HPSS)の実装 使い方 実装の詳細 librosa.effect

    Python: LibROSA で調波打楽器音分離 (HPSS) - Wizard Notes
  • 折り返し雑音 - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "折り返し雑音" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2022年12月) 正しく標化されたレンガの壁の画像 空間折り返しひずみ(モアレ)が生じている例 折り返し雑音(おりかえしざつおん、(英: folding noise)またはエイリアシング(英: aliasing)とは、統計学や信号処理やコンピュータグラフィックスなどの分野において、異なる連続信号が標化によって区別できなくなることをいう。エイリアスは、この文脈では「偽信号」と訳される。信号が標化され再生されたとき、元の信号とエイリアスとが重なって生じる歪みのことを折り返し

    折り返し雑音 - Wikipedia
  • eeengblog.com

  • 1