Kaggle is the world’s largest data science community with powerful tools and resources to help you achieve your data science goals.
次元削減とは データの次元削減(Dimensionality reduction) + データの可視化(Data Visualization) PCA Principal Component Analysis(PCA) randomized PCA Online Robust Principal Component Analysis(OR-PCA) 多様体学習 t-Distributed Stochastic Neighbor Embedding(t-SNE) Multidimensional Scaling(MDS) Isomap Locally Linear Embedding (LLE) Laplacian Eigenmaps(LE) Semidefinite Embedding (SDE) Latent Dirichlet Allocation(LDA) Labeled LDA P
原文 ベクトル空間における言語特徴量の効率的推定(Efficient Estimation of Word Representations in Vector Space) Tomas Mikolov (2013) 1. 要約 「単語ベクトル(word vectors)」の効率的な学習方法の提示。Word2Vecというモデルに接続する考え方。 規模にして10億語超、語彙では100万語超の処理を試みる。 比較対象: 過去の言語処理規模では、1000万語レベルの処理が限界だった。 学習テクニックとして広く使われてきた手法は、次の3つである。 ①NNLM(Neural Network Language Model) 順伝播型NNを用いて、単語の特徴量を抽出する。教師データには、品詞タグ付けされたコーパスを用いる。 ②LSA(Latent Semantic Analysis) 精度はNNに劣る。教
大学と大学院の,理工系の講義ノートPDFのまとめ。 PDF形式の教科書に加え,試験問題と解答,および授業の動画も集めた。 学生・社会人を問わず,ぜひ独学の勉強に役立ててほしい。 内容は随時,追加・更新される。 (※現在,60科目以上) カテゴリ別の目次: (1) 数学の講義ノート (2) 物理学の講義ノート (3) 情報科学の講義ノート (4) 工学の講義ノート ※院試の問題と解答のまとめはこちら。 (1)数学の講義ノート 解析学: 解析学の基礎 (大学1年で学ぶ,1変数と多変数の微分・積分) 複素解析・複素関数論 (函数論) ルベーグ積分 (測度論と確率論の入門) 関数解析 (Functional Analysis) 代数: 線形代数 (行列論と抽象線形代数) 群論入門・代数学 (群・環・体) 有限群論 (群の表現論) 微分方程式: 常微分方程式 (解析的および記号的な求解) 偏微分方程
ビヘイビア駆動開発(BDD:Behavior-Driven Development、振る舞い駆動開発ともいう)を実務に沿って簡単に紹介し、ソフトウェア開発プロセスに対してこの手法がどれほど有益かを説明します。 はじめに BDDで重視しているのは、フィードバックループを最小限に短縮することです。BDDはソフトウェア開発手法の進化の中で、理論的に一歩前進したものといえます。本稿ではBDDの概念と、その原型のモデルを説明します。 ソフトウェア開発者や、エンジニア部門のマネージャー職に就いている人ならば恐らく、以下の図のようなウォーターフォールモデルはよくご存じでしょう。 注釈: Waterfall model:ウォーターフォールモデル System Requirements:システム要件定義 Software Requirements:ソフトウェア要件定義 Analysis:要求分析 Progr
ofmind.net 2020 Copyright. All Rights Reserved. The Sponsored Listings displayed above are served automatically by a third party. Neither the service provider nor the domain owner maintain any relationship with the advertisers. In case of trademark issues please contact the domain owner directly (contact information can be found in whois). Privacy Policy
教科書 The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition (Springer Series in Statistics) 作者: Trevor Hastie,Robert Tibshirani,Jerome Friedman出版社/メーカー: Springer発売日: 2008/12/01メディア: ハードカバー購入: 1人 クリック: 222回この商品を含むブログ (16件) を見る Classification and Regression Trees (Wadsworth Statistics/Probability) 作者: Leo Breiman,Jerome Friedman,Charles J. Stone,R.A. Olshen出版社/メー
福島真太朗『データ分析プロセス』を読みました。 データ分析プロセス (シリーズ Useful R 2) 作者: 福島真太朗,金明哲出版社/メーカー: 共立出版発売日: 2015/06/25メディア: 単行本この商品を含むブログ (2件) を見る 「データ分析」とひとことで言っても、色々な人たちが色々な考え方で「データ分析」をやっていると思います。 その一大勢力として挙げられるのが「Excelで集計だけしてる人たち」です。これは特にマーケター出身の人が多いのではないでしょうか。*1 一方、最近のデータ分析界隈に増加していると思われるのが「機械学習ツールにデータを入れるだけ」の人たちです。 特にエンジニア出身の方が、上司に「データ分析が流行ってるみたいだから今日からデータ分析やって」と言われて泣きながらやっているケースが多いのではないかと。 そういう人たちは、機械学習についてある程度理解してお
はじめに 4月ということで、新卒が入ってきたりRを使ったことないメンバーがJOINしたりしたので、 超便利なdplyrの使い方を何回かに分けてまとめて行きます。 Rは知らないけど、SQLとか他のプログラミング言語はある程度やったことあるみたいな人向けです。 dplyrを使いこなす!シリーズ 基礎編以外も書きましたので、↓からどうぞ。 * dplyrを使いこなす!Window関数編 * dplyrを使いこなす!JOIN編 dplyrとは データフレームの操作に特化したパッケージです。 Rは基本的に処理速度はあまり早くないですが、dplyrはC++で書かれているのでかなり高速に動作します。 ソースの可読性もよくなるので、宗教上の理由で禁止されている人以外は使うメリットは大きいです。 処理可能なデータサイズの目安 あくまでも個人の環境に強く依存した感覚値ですが、1000万行、100MBぐらいのデ
20128月3 Python:決定木の作成 Pythonを用いたデータマイニング事例として決定木の作成をまとめる。 これまでの事例は、ある変数とある変数の一対関係が中心だった。それに対し本手法は、ある目的変数に対し複数の説明変数がどのように組み合わさった関係があるのかを探索するための手法である。 決定木の強み•弱みは以下のページが参考になる。 http://scikit-learn.org/stable/modules/tree.html 上記ページはpythonのデータマイニングライブラリのscikit-learnのもので、 機能の多様さでいえばこれが一番良さそうに感じる。 ただし、結果の可視化方法まで含めた調査がスムースにいかなかったため、 機能の数はやや劣るが内容は十分にあるOrangeライブラリを用いた例を紹介したい。 scikit-learnは精度勝負の時には自由度と種類があ
Nastran(ナストラン)とは、構造解析を主用途とした有限要素法CAEソフトウェアである。従来は、開発者の設立したMSCソフトウェアよりリリースされていたが、反トラスト法の適用で、現在は複数の企業よりリリースされている。 概要[編集] リチャード・マクニール[1]とロバート・シュヴェンドラー[2]は、SADSAM[3]という名称で、構造解析プログラムを開発していた。同時期にアメリカ政府はアメリカ航空宇宙局(NASA)のために構造解析プログラム開発を要望していたため、彼らはMSCソフトウェアを設立し、開発したプログラムを1968年にNastran[4]という名称で納入した。 このプログラムを、MSCソフトウェアでは1971年から MSC.Nastran の名称のソフトウェアとして販売およびサポートを開始した。これは、まとまった構造解析プログラムとしては、初めての商業用リリースであったため、
MetaTrader 4 is a platform for trading Forex, analyzing financial markets and using Expert Advisors. Mobile trading, Trading Signals and the Market are the integral parts of MetaTrader 4 that enhance your Forex trading experience. Millions of traders with a wide range of needs choose MetaTrader 4 to trade in the market. The platform offers ample of opportunities to traders of all skill levels: adv
Installing IPython¶ There are multiple ways of installing IPython. This page contains simplified installation instructions that should work for most users. Our official documentation contains more detailed instructions for manual installation targeted at advanced users and developers. If you are looking for installation documentation for the notebook and/or qtconsole, those are now part of Jupyter
クラスタリング (clustering) とは,分類対象の集合を,内的結合 (internal cohesion) と外的分離 (external isolation) が達成されるような部分集合に分割すること [Everitt 93, 大橋 85] です.統計解析や多変量解析の分野ではクラスター分析 (cluster analysis) とも呼ばれ,基本的なデータ解析手法としてデータマイニングでも頻繁に利用されています. 分割後の各部分集合はクラスタと呼ばれます.分割の方法にも幾つかの種類があり,全ての分類対象がちょうど一つだけのクラスタの要素となる場合(ハードなもしくは,クリスプなクラスタといいます)や,逆に一つのクラスタが複数のクラスタに同時に部分的に所属する場合(ソフト,または,ファジィなクラスタといいます)があります.ここでは前者のハードな場合のクラスタリングについて述べます.
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く