jp-mykのブックマーク / 2018年11月21日

Spangle call Lilli lineが3年ぶりアルバム発売、結成20周年記念ツアーも（音楽ナタリー） - Yahoo!ニュース

jp-myk 2018/11/21

リンク

RNNoise: Learning Noise Suppression

The image above shows the spectrogram of the audio before and after (when moving the mouse over) noise suppression. Here's RNNoise This demo presents the RNNoise project, showing how deep learning can be applied to noise suppression. The main idea is to combine classic signal processing with deep learning to create a real-time noise suppression algorithm that's small and fast. No expensive GPUs re

jp-myk 2018/11/21

リンク

Real-Time Noise Suppression Using Deep Learning | NVIDIA Developer Blog

Imagine waiting for your flight at the airport. Suddenly, an important business call with a high profile customer lights up your phone. Tons of background noise clutters up the soundscape around you — background chatter, airplanes taking off, maybe a flight announcement. You have to take the call and you want to sound clear. We all have been in this awkward, non-ideal situation. It’s just part of

jp-myk 2018/11/21

リンク

Cyclic Redundancy Check(CRC)を理解する - Qiita

はじめに誤り検出に広く使われているCyclic Redundancy Check(CRC)について説明します。誤り検出誤り検出の概要を説明します。ビット列の送受信を考えます。ビット列をメッセージといいます。送信するメッセージをMsとします。受信するメッセージをMrとします。送信側 Ms -> 伝送 -> Mr 受信側メッセージだけでは誤りがあるかどうかの判定はできません。誤り判定に使用するデータをメッセージに付加して送信します。付加するデータをチェックデータといいます。送信側 Ms Cs -> 伝送 -> Mr Cr 受信側送信側はMsに対して演算Opを行います。結果をCsとします。Ms Csを送信します。受信側はMr Crを受信します。Mr Crに対して演算Opを行います。結果が0であれば誤りなしと判定します。 CRCの演算 CRCの大まかな流れを説明します。準

jp-myk 2018/11/21

リンク

libflac++について - SurigomaWiki

jp-myk 2018/11/21

リンク

Pythonで音響信号処理(2) - Qiita

この記事はPython Advent Calendarの17日目の記事です。去年の記事で書かなかったPythonを使った音響信号処理関連の内容について書きます。目次サンプリングレートを変換したい waveモジュールで24bitの音声ファイルを読みたい群遅延をscipy.signal.group_delayで推定したいフレーム処理をnumpyのstrideトリックを使って行いたい(スペクトログラムを描画したい) TSP信号を生成したい零点、極を可視化したいサンプリングレートを変換したいサンプリングレートを変換するためには、元のサンプリングレートと変換したいサンプリングレートが整数比であればアップ/ダウンサンプリングどちらか一方だけで済みますが、有理数比の場合はそれぞれのサンプリングレートの最小公倍数にアップサンプリングしてから、求めたいサンプリングレートにダウンサンプリングする

jp-myk 2018/11/21

リンク

BONXを支える音声信号処理開発のウラガワ - bonx tech blog

皆様はじめまして、BONXで技術顧問をやっている粟飯原と言います。BONXでは、開発領域では音声信号処理アルゴリズム開発とVoIPシステムに関するソフトウェアレベルでの音声通話品質向上だったりが主ですが、他いろいろやってます。技術顧問という肩書を頂いては居ますが、VoIPサーバをgolangで書いたり、組み込み向けの音声処理ライブラリをC++で実際に書いてます。 BONXは、御存知の通りアウトドアにかぎらず複数人で行う様々なアクティビティをより楽しくするためのコミュニケーションツールとして、ウェアラブルトランシーバとそれに付随するアプリケーションの開発を行っています。今回は、その中でもBONXを支える技術の一つである、音声信号処理アルゴリズムの開発過程をまとめさせて頂きます。 BONXと音声信号処理 BONXは、アウトドアスポーツ等を行っている間に利用するトランシーバーであるので、通常のト

jp-myk 2018/11/21

リンク

Amazon.co.jp: ディジタル信号処理のサプリ: 豊嶋久道: Digital Ebook Purchas

jp-myk 2018/11/21

リンク

Speeding up Keras with tfrecord datasets

Alright. So you just got started with Keras with Tensorflow as a backend. Introducing GPU computing was quite simple so you started increasing the size of your datasets. Everything works fantastic, your GPU is happy and hungry for more, so you increase the dataset size even more to improve the robustness of your model. At a certain size, you hit the limit of your RAM and naturally you write a quic

jp-myk 2018/11/21

リンク

【Tensorflow】TFRecordファイルでshuffle_batchしたときの偏り調査 - のどあめ

Tensorflowでは色々な形式のデータのRead/Writeに対応しています。これらの入力形式の中で最もスタンダードなのがTFRecord形式です。(とドキュメントに書いてました) TFRecord形式のファイルには、１つのファイルに複数のデータを格納できるので、毎日大量に生成されるようなデータを扱う場合は、日毎にデータを作ればとてもファイルの整理がしやすそうです。一方で、Tensorflowにはミニバッチを使った学習を簡単に行うための、tf.train.shuffle_batch関数が用意されています。これは、複数の入力ファイル内のデータをshuffleしてミニバッチにしてくれる便利関数で、大量データを扱うことを前提にした実装をするため、擬似的にshuffleしたバッチを作ります。この「擬似的」というのが曲者で、うっかり正例・負例を一つのファイルにそれぞれまとめて、サ

jp-myk 2018/11/21

リンク

2018年風TensorFlowでの学習処理の記述方法 - 終末 A.I.

TensorFlowが登場して早いことで3年近く経とうとしています。 Deep Learning自体がブームになってからだと、それ以上の月日が経っているわけで、人工知能ブームも以外と続いているなあというのが正直な感想です。 Theanoやtorch、chainerに遅れをとって立ち上がったTensorFlowでしたが、はじめのうちはチュートリアルコードですらこのようなありさまで、とてもではありませんが簡単に誰もが使えるというような状態ではありませんでした。 1年ほど前からようやく、Keras の取り込みや Dataset API の実装、MonitoredTrainingSession のようなリッチな Session オブジェクトの導入などで、少し凝ったことをする場合でもかなり簡単に書けるようになってきました。一方で公式のチュートリアルでは、データセットの読み込みはありもののAPIを使

jp-myk 2018/11/21

リンク

Tensorflow Lite (TensorflowLite) / Tensorflow+RaspberryPi+Python で超軽量 "Semantic Segmentation" モデル "UNet" "ENet" を実装する_軽量モデル_その２ - Qiita

Tensorflow Lite (TensorflowLite) / Tensorflow+RaspberryPi+Python で超軽量 "Semantic Segmentation" モデル "UNet" "ENet" を実装する_軽量モデル_その２PythonRaspberryPiDeepLearningTensorFlowSemanticSegmentation TensorflowLite-UNet Tensorflow-bin TensorflowLite-bin I wrote in English article, here (TensorflowLite-UNet) 【!注意!】この記事を先頭から末尾までクソ真面目にトレースすると、「ただひたすら待つ」という苦行に耐えるためにカップラーメン６００個を手配する必要がある。精神と財力に余裕がある方、あるいは悟

jp-myk 2018/11/21

リンク

Kerasで実装するSeq2Seq　−その4　Attention - Qiita

本稿では、KerasベースのSeq2Seq（Sequence to Sequence）モデルによるチャットボット作成にあたり、Attention機能をBidirectional多層LSTM(Long short-term memory)アーキテクチャに追加実装してみます。１．　はじめに本稿はSeq2SeqをKerasで構築し、チャットボットの作成を目指す投稿の4回目です。前回の投稿では、Bidirectional多層LSTMのSeq2Seqニューラルネットワークを構築しましたが、今回は、これにAttention機能を追加します。また、これまでの結果では、生成された応答文の内容が今一つだったので、Early stoppingをやめてとことん訓練したら、どの程度ましになるか確認してみます。２．　本稿のゴール以下のとおりです。 Attention付きニューラルネットワークの構築と、訓練

jp-myk 2018/11/21

リンク

TensorFlow Probabilityでガウシアンプロセス回帰の最尤推定を実行してみる - HELLO CYBERNETICS

はじめにガウシアンプロセスで最低限知ってほしいこと線形回帰ガウシアンプロセス回帰ガウシアンプロセス回帰のまとめガウシアンプロセス回帰の推定まとめ１．ガウシアンプロセスのモデル２．推定するべきガウシアンプロセスのパラメータ３．カーネル関数でガウシアンプロセスのパラメータを書き換える４．推定すべきパラメータをすり替える補足 TensorFlow Probabilityで実践必要なライブラリのインポートでたらめなガウシアンプロセス回帰データの準備パラメータをフィッティングしていないガウシアンプロセス回帰のサンプリング学習したガウシアンプロセス回帰データ点準備ガウシアンプロセスのモデル構築損失関数の設定ガウシアンプロセス回帰のサンプラーいざ学習！更に進むためにはじめに TensorFlow Probabilityには様々な確率分布が実装されています。

jp-myk 2018/11/21

リンク

GoogleがAI HubとKubeflow Pipelinesを発表、機械学習専門家の知見を再利用：ソフトウェアエンジニアが大きな役割果たせる - ＠IT

GoogleがAI HubとKubeflow Pipelinesを発表、機械学習専門家の知見を再利用：ソフトウェアエンジニアが大きな役割果たせる Googleは2018年11月8日（米国時間）、機械学習のパイプラインを容易に構築できるツール「Kubeflow Pipelines」と、機械学習のためのツールやデータのカタログとも呼べる「AI Hub」を発表した。 Googleは2018年11月8日（米国時間）、機械学習のパイプラインを容易に構築できるツール「Kubeflow Pipelines」と、機械学習のためのツールやデータのカタログとも呼べる「AI Hub」を発表した。Kubeflow PipelinesはGitHubで公開されている。また、AI Hubは限定ユーザーとαテスト中。この2つのツールの目的について、Google CloudでML Platform エンジニアリングディレ

jp-myk 2018/11/21

リンク

音声通話のノイズを除去するkrispが超便利

Krisp is a noise cancellation app that removes background noise in real time calls. Krisp for Windows is coming soon… 僕は今、釧路に住んでいるので、リモートで東京の会社とミーティングすることが多いんですが、そこで快適に仕事をするために、マイクをそれなりにいいやつを買ってみたり、ヘッドホンを変えてみたりとか様々工夫してきました。これまでもだいぶノイズを消せていたとは思っていたんですが、試しにkrispを使ってみると、さらに次元が変わるレベルでノイズが消えるようになりました。そして、それがかなり自然なレベルで行われていると感じています。たまにノイズサプレッサー付きの会議用マイクとかもあったりしますが、あれは結構不自然な挙動することが多いのと、やっぱりノイズサプレッサーだと聞

jp-myk 2018/11/21

リンク

はてなブックマーク

タグ

2018年11月21日のブックマーク (16件)

Spangle call Lilli lineが3年ぶりアルバム発売、結成20周年記念ツアーも（音楽ナタリー） - Yahoo!ニュース

RNNoise: Learning Noise Suppression

Real-Time Noise Suppression Using Deep Learning | NVIDIA Developer Blog

Cyclic Redundancy Check(CRC)を理解する - Qiita

libflac++について - SurigomaWiki

Pythonで音響信号処理(2) - Qiita

BONXを支える音声信号処理開発のウラガワ - bonx tech blog

Amazon.co.jp: ディジタル信号処理のサプリ: 豊嶋久道: Digital Ebook Purchas

Speeding up Keras with tfrecord datasets

【Tensorflow】TFRecordファイルでshuffle_batchしたときの偏り調査 - のどあめ

2018年風TensorFlowでの学習処理の記述方法 - 終末 A.I.

Tensorflow Lite (TensorflowLite) / Tensorflow+RaspberryPi+Python で超軽量 "Semantic Segmentation" モデル "UNet" "ENet" を実装する_軽量モデル_その２ - Qiita

Kerasで実装するSeq2Seq　−その4　Attention - Qiita

TensorFlow Probabilityでガウシアンプロセス回帰の最尤推定を実行してみる - HELLO CYBERNETICS

GoogleがAI HubとKubeflow Pipelinesを発表、機械学習専門家の知見を再利用：ソフトウェアエンジニアが大きな役割果たせる - ＠IT

音声通話のノイズを除去するkrispが超便利

お知らせ

はてなブックマーク透明性レポート（2024年 2月-2024年4月）

今週のはてなブックマーク数ランキング（2024年7月第1週）

月間はてなブックマーク数ランキング（2024年6月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス