サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
iPhone 16
blogs.teradata.com
データウェアハウスやアナリティクスの最新情報はこちら 前回までで、それぞれの分析機能について俯瞰してきました。… Read More »
データウェアハウスやアナリティクスの最新情報はこちら 線回帰分析は、複数の変数における相関関係を直線モデルによって説明しようとする分析手法です。仕組みをご理解いただくために極めて簡潔なデータを利用しますが、データサンプル数が数万件、変数の数が数十に及んでも考え方は同じです。図6 のデータセットにおいて、x は年齢を、そして y は化粧品会社に対する年間支出額を表しているとします。この 2つの変数にはなんらかの関係があるのか、より具体的には、年齢という変数は、年間支出額を説明できるのかを分析によって探っていきます。 そしてこの表から横軸に年齢(x)を、縦軸に年間支出額(y)をとり、プロットしたものが以下のグラフ(図7)となります。さて、このグラフから読み取れる傾向を 1本の直線で表すと、どのような線になるでしょうか。数学の授業で習ったかもしれませんが、グラフ上の直線は y=ax+b と表すこ
データウェアハウスやアナリティクスの最新情報はこちら この手法は意思決定ツリー、またはデシジョンツリーとも呼ばれる手法で、樹形図、またはツリー構造と呼ばれる図を作り出し、アウトプットには分類を行なうためのルールを作成します。決定木を実施した場合、アウトプットとして以下図33 のようなツリー構造が示されます。ここで、このツリー構造は、ノード(節)と、そこから分岐したリーフ(葉)で示されます。ノードはそこからの分岐条件を示し、データサンプル(ここでは顧客)は次のノード、もしくはリーフへと引き渡されます。リーフはこれ以上分岐する必要がない状態を意味し、最終的な分類を意味します。これを別な形で表現すると、以下図34 のような IF THEN形式のルールになります。 決定木は、上述した例のように予測(購入するグループと、しないグループ)に活用することも可能ですし、この構造を利用して分類に活用すること
Teradata Magazine Japan Special Edition online データウェアハウスやアナリティクスの最新情報はこちら データウェアハウスがなくても明細データは持てるのでは? その通りです。データウェアハウスの価値の源泉の「ひとつ」は明細データを持つことにある、と考えられますが、明細データを持つこと自体は、直接データウェアハウスを持つ理由にはなりません。 しかし、なぜデータウェアハウスを語る文脈で、わざわざ明細データのことを強調するのかといいますと、データを保有するコストを考えると、明細データはデータウェアハウスに統合して保有するのがいいからです。 データを保有するコストというのは主に、(1)データを格納する器(ハードウェア)のコスト、(2)データをロードしてデータベースを維持・運用するためのコスト、の 2つがあります。 ストレージ装置の価格が安くなったといって
Teradata Magazine Japan Special Edition online データウェアハウスやアナリティクスの最新情報はこちら データウェアハウスと単純にデータを集めただけのデータベースの違いはどこにあるのでしょうか? 企業内の色々な業務システムからデータを丸ごとコピーして集めればデータウェアハウスになるものではありません。単にデータを寄せ集めただけではデータが増えれば増えるほどデータの整合性の維持やメンテナンス、使い勝手など様々な面で混乱や不都合を来たすばかりです。 そこで業界にはデータウェアハウスとして成り立たせるために備えるべき定義といわれているものがあります。 データウェアハウスの定義 「4つの特性」 1.サブジェクト指向 データをサブジェクト(主題)ごとに分解、整理して格納します。目的別に格納しないのがポイントです。これはちょうど図書館での資料整理の方法に似て
データウェアハウスやアナリティクスの最新情報はこちら 線形回帰分析が量的変数を予測するのに対して、ロジスティック回帰分析は発生確率を予測する手法です。基本的な考え方は線形回帰分析と同じなのですが、予測結果が 0 から 1 の間を取るように、数式やその前提に改良が加えられています。0 から 1 の間ということは、例えば 0.4 のような確率で予測を行うということになります。そしてそのために従属変数(被説明変数)に 2値の質的変数を用いています。例えばある商品の購入有無(Yes or No)のように、2値しかとりえない値を従属変数の実績値として用い、説明変数を用いてその発生確率を説明するという構造になっています。 マーケティングにおける利用可能性としてもっとも大きなものは、顧客がある特定のキャンペーンに対して反応を示すか(Yes)、否か(No)というテーマを他の変数を利用して予測するものです。
I’m very excited about Teradata’s latest cloud announcement – that Teradata Database, the market’s leading data warehousing and analytic solution, is being made available for cloud deployment on Amazon Web Services (AWS) to support production workloads. Teradata Database on AWS will be offered on a variety of multi-terabyte EC2 (Elastic Cloud Compute) instances in supported AWS regions via a listi
Teradata is making Presto enterprise-ready so global powerhouses can be as innovative as elite big data practitioners including organizations like Facebook, Netflix, Airbnb, Dropbox and Groupon. By Justin Borgman Today, I’m proud to announce that Teradata has joined the open source community for Presto, the open-source distributed SQL query engine used by big data innovators to run interactive ana
このページを最初にブックマークしてみませんか?
『blogs.teradata.com』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く