サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
画力アップ
knowledge.insight-lab.co.jp
始めに 最近、M2 Macbook Airを入手したBudoこと荻本です。 この記事では、教師なし学習であるK-meansやその発展形のアルゴリズムについて調査を行ったので、いくつかの手法を紹介したいと思います。 K-meansとは 教師なし学習の手法の一つです。 非階層クラスタリング手法であり、以下のような工程となります。 各点に対しランダムにクラスタリングを行う 各クラスタに割り当てられた点について重心を計算する 各点について上記で計算された重心からの距離を計算し、距離が一番近いクラスタに割り当て直す 2.と3.の工程を、割り当てられるクラスタが変化しなくなるまで行う 図で表現すると下記のように(a)→(b)→(c)→(d)のような順序を辿ってクラスタが収束していくイメージです。 (b)の段階でまず各点に適当にクラスタが割り振られ、その重心が計算されます(重心は赤星で図示)。 (c)で
こんにちは!Leonです。 今回は前から気になっていたMetabaseを軽く触ってみたのでそちらについて書いてみます! Metabaseって? OSSのBIツールです。よく聞くRedashとかKibanaと同じです。 OSSなので無料で扱えてjavaのアプリでjarファイルを実行するだけで環境が簡単に作れちゃいます。 Google認証が使えたりSlack連携ができちゃったりと結構便利で無料でそんなことやっちゃっていいのかと思います。 調べると他のOSSのBIと比べて後発的なソフトになっている分デザインとかイケてるらしく、 BIを触ってきたものとしては触れておかねばということで社内サーバーに構築してみました。 軽く触ってみた感じはコードを書かずにクリックのみでグラフが作れたり、SQLでデータを加工できたりするので無料BIとしてはとても便利だなという印象です。 Metabase環境を作る 環境
ここ最近「SnowflakeとTreasure Dataの違いを教えてほしい」 といった質問を頂くことが増えています。 どちらもクラウドDWH(データウェアハウス)や、 クラウドデータプラットフォームと呼ばれるように、競合するプロダクトですね。 クラウドのスケールメリットを活かしている点、 ユーザビリティの高いGUIが用意されている点など、共通点が多いです。 2011年に米国で日本人が創業し、 2013年から今日に至るまで日本国内での普及を着実に進めていったTreasure Data。 2012年に米国で元Oracle出身者が創業し、 グローバルでの評価を確固たるものとし、 満を持して2019年に日本法人を設立したSnowflake。 グローバルでの知名度は圧倒的にSnowflakeの方が高いのですが 日本国内での歴史はまだ浅く、 国内においてはTreasure Dataの方が知名度が高く
Introduction AWSが提供するDWHサービス、Amazon Redshift。 全世界での採用企業は数万社を超えており、弊社も国内において多くのお客様に導入のご支援をさせて頂きました。 RedshiftはAWSエコシステムとの親和性が高く、AWSを既にご利用のお客様は導入の敷居が低いDWHサービスとなっております。 しかし、適切なテーブル設計を行わなければパフォーマンスを全く発揮できません。 不適切なテーブル設計をしてしまったが故、「バッチ処理が当初想定していた時間で終わらない」等、弊社にご相談頂いたお客様も数多くいらっしゃいます。 では、Redshiftを扱うにあたってどのようなテーブル設計を行えば良いのか。 本記事では、パフォーマンスの向上に繋がるテーブル設計のポイントを3つ、ご紹介致します。 1. ソートキー(SortKey) ソートキー(SortKey)は、テーブルのデ
この課金モデルだと、ウェアハウスサイズを大きくしても処理時間がその分短くなるので、1タスク当たりのコストは変わらないことが分かる。 例えば、X-Smallで128分掛かるタスクを4X-Largeで実行すると1分で終了するため、それぞれの時間単価を掛けた時のコストはどちらも128となる。 これをうまく利用すれば、大きいタスクが走る時間帯にサイズを上げ、逆にタスクが少ない時間帯はサイズを下げる等の運用ができるようになり、コストを抑えつつもハイパフォーマンスなDWH環境を常に提供することができるようになる。 そこで気になるのが、実際どのくらいの性能なのか。 Snowflakeのトライアルで確かめていく。 2.Snowflakeのトライアルを始める Snowflakeのトライアルでは、1ヶ月で400ドル分のリソースを無料で利用することができる。 試しに1.2TBのデータをスキャンし240億件のデー
この記事では、Tableau製品の中でも異彩を放つ『Tableau Reader』について 「他の製品との違いは何なのか」 「結局なにが出来るのか」 を整理していきたいと思います。 ■Tableauの製品紹介ページは以下ご参照下さい。 >>データ可視化ツール「Tableau(タブロー)」とは 『Tableau Reader』とは? Tableauの数ある製品群の中で、 Tableau Readerの立ち位置は、無料の共有用製品 『Tableau Reader』は、 Tableau製品の中では分析結果の共有用の製品に分類されます。 そして、誰でも無料で期限なく使用することができます。 共有用の製品ですので、『Tableau Desktop』の様に、 データを取り込んで分析用のビューを作成することはもちろんできません。 実際の画面は以下のようになっています。 『Tableau Desktop』
QlikViewの概要、使い方の説明から、他BI製品との比較まで、幅広い情報をご提供します。
このページを最初にブックマークしてみませんか?
『knowledge.insight-lab.co.jp』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く