1 2 3 4 5 6 7 2 X Y X Y 8 9 X X X X i X i 10 11 12 13 Y = f(X) X Y f f 14 15 16 17 18 19 20 21 22 23 Yes Yes No No 24 25 k 26 27 28 29 30 31 32 33 34 KDD Process: Knowledge Discovery and Data Mining 35 36 37 38 39 40 41 42 43 44 45 46 47 48
1 2 3 4 5 6 7 2 X Y X Y 8 9 X X X X i X i 10 11 12 13 Y = f(X) X Y f f 14 15 16 17 18 19 20 21 22 23 Yes Yes No No 24 25 k 26 27 28 29 30 31 32 33 34 KDD Process: Knowledge Discovery and Data Mining 35 36 37 38 39 40 41 42 43 44 45 46 47 48
NumPy 配列の基礎¶ ここでは,NumPy で最も重要なクラスである np.ndarray について, 本チュートリアルの方針 の方針に従い,最低限必要な予備知識について説明します. np.ndarray は, N-d Array すなわち,N次元配列を扱うためのクラスです. NumPy を使わない場合, Python ではこうしたN次元配列を表現するには,多重のリストが利用されます. np.ndarray と多重リストには以下のような違いがあります. 多重リストはリンクでセルを結合した形式でメモリ上に保持されますが, np.ndarray は C や Fortran の配列と同様にメモリの連続領域上に保持されます. そのため,多重リストは動的に変更可能ですが, np.ndarray の形状変更には全体の削除・再生成が必要になります. 多重リストはリスト内でその要素の型が異なることが許
配列の次元数や大きさの操作¶ ブロードキャストを紹介する前に, NumPy 配列の基礎 で紹介した,NumPy の配列クラス np.ndarray の属性 ndim と shape を操作する方法を紹介します. ndim は,配列の次元数を表す属性で,ベクトルでは 1 に,行列では 2 になります. shape は,スカラーや,タプルによって配列の各次元の大きさを表す属性です. 例えば,大きさが 5 のベクトルはスカラー 5 によって, \(2 \times 3\) の行列はタプル (2, 3) となります. 次元数を操作する必要がある例として配列の転置の例を紹介します. 転置した配列を得るには,属性 T か,メソッド transpose() を用います. 2次元の配列である行列を転置してみましょう: In [10]: a = np.array([[1, 3], [2, 1]]) In [
クラスタリング (clustering) とは,分類対象の集合を,内的結合 (internal cohesion) と外的分離 (external isolation) が達成されるような部分集合に分割すること [Everitt 93, 大橋 85] です.統計解析や多変量解析の分野ではクラスター分析 (cluster analysis) とも呼ばれ,基本的なデータ解析手法としてデータマイニングでも頻繁に利用されています. 分割後の各部分集合はクラスタと呼ばれます.分割の方法にも幾つかの種類があり,全ての分類対象がちょうど一つだけのクラスタの要素となる場合(ハードなもしくは,クリスプなクラスタといいます)や,逆に一つのクラスタが複数のクラスタに同時に部分的に所属する場合(ソフト,または,ファジィなクラスタといいます)があります.ここでは前者のハードな場合のクラスタリングについて述べます.
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く