タグ

関連タグで絞り込む (0)

  • 関連タグはありません

タグの絞り込みを解除

クラスタリングに関するkatz1955のブックマーク (7)

  • 株式会社ALBERT(レコメンドエンジン)

    データ分析から導き出されたインサイト無しにAI人工知能)の活用は始まりません。私たちは、各業界知識とデータ・アナリティクス技術を駆使しデータドリブン経営を強力に支援します。 データ、アナリティクス、AIは企業にとって競合他社との差別化を図るかつてないほど大きな要因になっています。今日の経営幹部が効率を向上しながら新たな収益源を開拓し、新しいビジネスモデルをタイムリーに構築する方法を模索する中、価値を生み出し成長を続ける企業には「データ活用」という共通項があります。私たちは、無数のデータから企業にとって当に必要なデータを活用するための方法を知っています。 将来を見据えたオペレーション体制を備えている企業の半数以上(52%)は、すでにデータとアナリティクスを大規模に活用しています。データとAIに関する取り組みをビジネス戦略に沿って実施することで投資利益率を迅速に最大化し、最終的にはAIをビ

    株式会社ALBERT(レコメンドエンジン)
  • 【R言語】政府統計を用いた階層的クラスタリングの実践例 - What a Wonderful World

    クラスター分析の復習の記事では、品ごとのたんぱく質摂取量のパターンにもとづいて欧州25ヵ国をグルーピングしており、地理的に近い地域の国でクラスタを形成しているならば、日々の事習慣みも似通ってくるのではないかと推測していました。なので、ここではクラスタ分析の使い方を覚えることを主眼に置きつつ、都道府県の主要な品の消費データを利用して、地理的に近い県で似通った品の消費傾向を示すクラスタが形成されるかを検証してみます。 目次 使用するデータ 使用するパッケージ データの読込み 階層的クラスタ分析 エルボー曲線 Calinski-Harabasz (CH) インデックス 主成分分析による変数の次元削減 クラスタの安定度 おわりに 使用するデータ 平成26年全国消費実態調査 都道府県別 家計収支に関する結果 表題:[二人以上の世帯]地域編第42表 地域別1世帯当たり1か月間の収入と支出 利用

    【R言語】政府統計を用いた階層的クラスタリングの実践例 - What a Wonderful World
  • クラスタリングとレコメンデーション資料

    Two sentences are tokenized and encoded by a BERT model. The first sentence describes two kids playing with a green crocodile float in a swimming pool. The second sentence describes two kids pushing an inflatable crocodile around in a pool. The tokenized sentences are passed through the BERT model, which outputs the encoded representations of the token sequences.

    クラスタリングとレコメンデーション資料
  • 階層的クラスタリングの併合方法を図で確認 - Qiita

    ずいぶんニッチな内容になってしまいますが、案外似たような内容がなかったのでメモしておきます。 階層的クラスタリングとは 詳しい内容は他記事に任せますが…、図のようにデータ同士の近さを可視化してどのあたりに似たデータが固まっているかを確認する手法です。 ただし、神嶌先生の解説ページに クラスタリングは探索的 (exploratory) なデータ解析手法であって,分割は必ず何らかの主観や視点に基づいているということです.よって,クラスタリングした結果は,データの要約などの知見を得るために用い,客観的な証拠として用いてはなりません. とあるように、どのような主観や視点でデータを分割しているのかを正しく理解して知見化していくことが大切です。 手法選択について 特に注意すべきパラメータとして距離の定義と併合方法があります。 距離はデータ同士の差をどう定義するか、併合方法はクラスタとクラスタの近さをど

    階層的クラスタリングの併合方法を図で確認 - Qiita
  • 株式会社ALBERT(レコメンドエンジン)

    データ分析から導き出されたインサイト無しにAI人工知能)の活用は始まりません。私たちは、各業界知識とデータ・アナリティクス技術を駆使しデータドリブン経営を強力に支援します。 データ、アナリティクス、AIは企業にとって競合他社との差別化を図るかつてないほど大きな要因になっています。今日の経営幹部が効率を向上しながら新たな収益源を開拓し、新しいビジネスモデルをタイムリーに構築する方法を模索する中、価値を生み出し成長を続ける企業には「データ活用」という共通項があります。私たちは、無数のデータから企業にとって当に必要なデータを活用するための方法を知っています。 将来を見据えたオペレーション体制を備えている企業の半数以上(52%)は、すでにデータとアナリティクスを大規模に活用しています。データとAIに関する取り組みをビジネス戦略に沿って実施することで投資利益率を迅速に最大化し、最終的にはAIをビ

    株式会社ALBERT(レコメンドエンジン)
  • クラスター分析

    クラスター分析とは クラスター分析とは、異なるものが混ざりあっている集団の中から互いに似たものを集めて集落(クラスター)を作り、対象を分類するという方法の総称です。 「対象」というのは人間とは限らず、企業や商品や地域や、そして時には質問項目を分類する場合もあることに注意してください。このクラスター分析を用いると、標準化された手続に従って対象の分類ができるため、マーケティングリサーチにおいてはポジショニング確認を目的としたブランドの分類や、イメージワードの分類、生活者のセグメンテーションなどに用いられます。 調査データに対してクラスター分析を実行することで、メーカーサイドの視点に立ったブランドの分類や、デモグラフィック要因による生活者の分類とは異なった「生活者サイドの視点に立った分類」を発見できます。 2種類のクラスター分析 クラスター分析には、大きく分けると階層クラスター分析、非階層クラス

    クラスター分析
  • 分析手法解説

    クラスター(cluster)とは、(ぶどう等の)房、群れ、集団という意味の言葉です。 クラスター分析とは、分析の対象となる個体を、お互いの類似度にしたがって いくつかのグループに分割する手法の総称です。 クラスター分析には多様なアルゴリズムが存在し、データの特性や分析の目的に応じて適切なアルゴリズムを選択する必要があります。実際にクラスター分析を用いるとき、特に問題となるのは主に以下の2点です。 対象間の類似度(距離)の定義 クラスターの結合方法 対象間の類似度としては、ユークリッド距離で定義されることが一般的です。 クラスターの結合方法とは、新しく形成されたクラスター間の距離をどのように定義するかを定めるものです。クラスターの重心から測る「重心法」、最も近い点から測る「最近法」、最も遠い点から測る「最遠法」などがありますが、比較的よく用いられるのは「ウォード法」です。 ウォード法では、ク

  • 1