タグ

analyticsとzennに関するnabinnoのブックマーク (6)

  • スタースキーマ(基礎)

    スタースキーマ wikipedia スタースキーマ または 星型スキーマ はデータウェアハウスに利用される最も単純なスキーマである。スタースキーマには唯1つもしくは少数のファクト表と複数のディメンション表が含まれる。スタースキーマはスノーフレークスキーマの一種であるが、多くの用途で利用されている。 スタースキーマは、ディメショナル・モデリングをリレーショナル・データベースで実装したものになる。 詳しくは、ディメンショナル・モデリング にまとめている。 この記事は、あなたが「様々な指標を様々な軸で、レポートを見たい」類の要望に応えるためのスキーマ設計に困っている場合に役立つだろう。 ディメンションテーブル設計 サロゲートキー スタースキーマでは、各ディメンションテーブルに、サロゲートキーを割り当てる。このキーは、業務システムで使われているキー(ナチュラルキー)とは別のものを使用し、データウェ

    スタースキーマ(基礎)
  • 複数スタースキーマ

    複数スタースキーマ(Multiple star schema) 1つのファクトで、全ての分析対象がカバー出来ることは稀である。ほとんどのケースで複数のファクトテーブルが必要になるだろう。当に価値ある分析は複数のプロセスを横断した分析である。これを誤った方法で実現するとどうなるか?どうすれば良いのかを見ていく。 スタースキーマの作り方に関しては、別の記事にまとめている 。 発生タイミングが異なるファクト 2つ以上のファクトがあったとする。それらは同時に発生しないファクトである場合、異なるファクトテーブルに配置するべきである。誤って単一ファクトテーブルにまとめられると、個々の分析が困難になる。もし分けていれば個々に分析が可能になる。 ある営業部門で以下のような分析要件があったとする。 日付、顧客、製品別注文数量の分析 日付、顧客、製品別出荷量の分析 ディメンションは日付と顧客。ファクトは製品

    複数スタースキーマ
  • GPT4oを使って、訓練無しで物体検出(BBox)ができるか試してみる

    今日も今日とてopenAIの新発表が機械学習界隈を賑わせていますね。 今回は、2024/05/14に発表されたGPT4oについてです。 返答速度があがったり画像認識精度があがったり音声会話の性能が良くなったりと色々話題が尽きません。 具体的にどのあたりが凄くなったのかは僕以外にもまとめている人が多そうなのでこの記事では触れません。 個人的に特に気になっているのが画像認識の精度向上部分で、今回は画像認識精度がどの程度あがったのか?というのを画像系機械学習の主要なタスクであるBBoxによる物体認識というタスクで簡単にチェックしてみようと思います。 BBoxとは BBoxはBoundingBoxの略で、画像内の特定のオブジェクトを囲むために使用される長方形のボックスの事を指します。 BoundingBoxの定義は以下の通り このBBox検出は画像系機械学習モデルの基的なタスクであり、自動運転の

    GPT4oを使って、訓練無しで物体検出(BBox)ができるか試してみる
  • chatGPTにアドバイスをもらったらデータサイエンスを知って1週間の友人がコンペで上位6.5%に入った話

    先日、データ解析のセミナーを開催しました。 未経験の方でも、2時間で予測モデルを作成することができるハンズオンセミナーでした。 好評だったので、その内容をYouTubeにまとめたのでご興味ある方はご覧ください。 このハンズオンセミナーで予測モデルの作り方を知った友人chatGPTにアドバイスをもらって、データサイエンスのコンペティションサイトに応募したところ、上位6.5%に入ることができたという報告を受け、驚愕しました。 chatGPTを上手く使えば素人がプロに勝つことも十分できるのだなと実感しました。 友人が参加したデータサイエンスのコンペは、SIGNATEの糖尿病予測問題でした。 以下のような進め方をしたとのことでした。 まず、問題の概要を説明して、どのように進めていけば良いかを確認したそうです。 そうすると、chatGPTからデータサイエンスの問題を解くための手順を一覧化してくれて

    chatGPTにアドバイスをもらったらデータサイエンスを知って1週間の友人がコンペで上位6.5%に入った話
  • BigQueryとデータポータルで、Firestoreのデータを分析する

    はじめに 個人開発しているサービスで、追加した機能の効果測定がしたいと思ったので、データ分析の仕組みを整えることにしました。 実現手段の検討 分析したい内容を決める まず、分析したい内容を決め、取得したいデータの内容を決定します。これはサービス個別の内容なので省略します。 Firestoreのデータをどう分析するか DBFirestoreを使用しているので、Firestoreからどうやってデータを取得して表示するか考えました。 [却下] 管理画面を作って、そこにデータを表示する 管理画面用にFirestoreセキュリティールールを作成したり、いちいちFunctionsでデータを取得してくるのは面倒なので却下。 [却下] GASを使って、Google Spredsheetに表示 Fuctionsでデータを加工、取得してきて、それをGASでゴニョゴニョして、Googleスプレッドシートに表

    BigQueryとデータポータルで、Firestoreのデータを分析する
  • 東京近郊でフルタイム勤務しつつ情報系の修士号が取れる大学院を調べてみた【2020年9月ver】

    まえがき 記事では、筆者が2020年に情報系修士号取得のために出願する大学院を探した際の結果をまとめています。もし同じ様に東京近郊で社会人として働きつつ情報系修士号を取りたいと思う方がいましたらご参考にどうぞ。 対象読者 情報系の修士号が欲しいが、仕事は辞められない人 東京近郊に居住している人 各大学の公式サイトを一つ一つ追うのが面倒な人 調査対象の大学院 調査対象は以下の条件に合致しそうな大学院の中から選定しました。 情報系の修士号が取れる 東京近郊に所在している or 東京にサテライトキャンパスがある or 月に2回程度の通学であればギリギリ何とかならないことも無い距離にある (2020/09/28追記) Twitter記事のコメントで情報を頂いた産業技術大学院大学、情報セキュリティ大学院大学について記載しました。 海外大学院のオンラインコースに関する記事を書いていた方がいたので

    東京近郊でフルタイム勤務しつつ情報系の修士号が取れる大学院を調べてみた【2020年9月ver】
  • 1