タグ

ブックマーク / dbconcept.hatenablog.com (2)

  • 基幹システムが劣化するとデータ分析が栄える - 設計者の発言

    現在、IT系の仕事の中でデータアナリストは高い人気を博している。大手を含めて日企業の大多数は情報活用が出来ていないので、データアナリストやその志望者にはブルーオーシャンが広がっているように見えるかもしれない。しかし、情報の分析・活用の現場で欠けているのはデータ分析のスキルではない。豊穣かつ正確なローデータ(分析用の生データ)の供給源となるべき「まともな基幹システム」である。 「いや、だからこそ分析基盤の整備から始める必要があるんです」とデータアナリストは語るかもしれない。そんな彼らにはあらためて"garbage in, garbage out"の格言を送りたい。garbage(ゴミ)を手間暇かけて整形しても、そこから得られる分析結果は「整形されたゴミ」でしかない。基幹システムがポンコツである限り、分析基盤をいかに充実させても効果は出ない。かつてビッグデータという言葉があったが、企業が抱え

    基幹システムが劣化するとデータ分析が栄える - 設計者の発言
    toya
    toya 2025/03/17
  • 野球のデータモデル:一球速報からペナントレースまで - 設計者の発言

    WBCが楽しかったので、野球のペナントレースを表すデータモデルを考えてみた。まずは基礎となる球団や選手、およびそれらの年次成績(年次サマリ)の関係を見てほしい(図1)。 図1.基情報のデータモデル 年次サマリには「セパ別年次サマリ」、「球団別年次サマリ」、「選手別年次サマリ」の3種類あるが、これらのうち「選手別年次サマリ」の主キーが{選手№+年}ではなく{選手№+所属開始日+年}となっている点に注意してほしい。この主キーは「所属球団」の主キー{選手№+所属開始日}に<年>を複合させたものだ。これはシーズン中の移籍にともなって成績がリセットされるためである。つまり、選手の年間成績は「所属球団」を年で展開した定義域に関数従属する。 3つの年次サマリには集計項目(カッコ付きは論理フィールド*1であることを示す)がいくつか載っているが、その集計過程を説明しよう。「セパ別年次サマリ」上の<試合数>

    野球のデータモデル:一球速報からペナントレースまで - 設計者の発言
    toya
    toya 2023/04/04
  • 1