タグ

データサイエンスとディープラーニングに関するbentsuyoshiのブックマーク (3)

  • いますぐ使える単語埋め込みベクトルのリスト - Qiita

    はじめに 単語埋め込みとは、単語を低次元(と言っても200次元程度はある)の実数ベクトルで表現する技術のことです。近い意味の単語を近いベクトルに対応させることができるとともに、ベクトルの足し引きで意味のある結果(例えば king - man + women = queen)が得られるのが特徴です。 単語埋め込みベクトルは品詞タグ付け、情報検索、質問応答などの様々な自然言語処理アプリケーションに使われる重要な技術です。とはいえ、実際に用意するのはなかなか骨の折れる作業です。大規模なデータをダウンロードし、前処理をかけ、長い時間をかけて学習させ、結果を見てパラメータチューニングを行う・・・。 そのため、単に使いたいだけなら学習済みのベクトルを使うのが楽です。というわけで、そんな単語埋め込みベクトルの中から今すぐ使えるものをピックアップしてみました。 埋め込みベクトルの情報は以下のリポジトリにま

    いますぐ使える単語埋め込みベクトルのリスト - Qiita
  • ディープラーニングで音声分類 - Qiita

    勉強がてらディープラーニングで環境音・自然音の分類をやってみました。 データセットはESC-50を使用します。 コード全文。 やったこと 環境音・自然音をConvolutional neural networkで分類します。 対象は動物の鳴き声や雨の音、人間の咳、時計のアラーム、エンジン音のような声(言葉)のない音です。 これらの音を使って、以下の手順で分類器をつくりました。 音声データの前処理 データの入手 Augmentation メルスペクトログラム データの用意 CNNで分類 CNNの定義 最適化関数にAmsgradを採用 学習データにmixupを採用 音声データの前処理 ESC-50は環境音を50クラス、2,000ファイル集めたデータセットです。 クラスには以下があります。 50クラスで各クラスのデータが40ファイルずつ用意されており、合計2,000ファイルです。 1ファイルの長

    ディープラーニングで音声分類 - Qiita
  • データレイクを「沼地」にしないために 2019年ストレージ技術予測 (1/3)

    関連キーワード ストレージ | IoT | ビッグデータ | ストレージ管理 | データセンター | インフラストラクチャ 2019年データストレージはどう進む? 米TechTargetはストレージ技術者やアナリストを対象に「2019年の大企業におけるデータストレージ予測」に関するパネル調査を実施した。これによると、大企業のIT組織の多くは「データレイク」に投入した全ての情報の分析、利用、管理の手法の改善に集中するという。データレイクとは構造化、非構造化データをまとめて集約できるデータ基盤だ。データの統合、設計、組織化のために設計された多くのツールを活用して「ビッグデータ用のストレージアーキテクチャを調整する」ことも手法の改善に含まれる。 稿は、ビッグデータ用のストレージアーキテクチャ、ストレージシステムとデータ管理、セキュリティやその他の一般的なストレージのトレンドに焦点を当てた201

    データレイクを「沼地」にしないために 2019年ストレージ技術予測 (1/3)
  • 1