サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
パリ五輪
skellington.blog.ss-blog.jp
データ分析の本質を書く前に、なんだか最近データサイエンティストと呼ばれる人って増えている気がします。 色々な企業でデータ分析の重要性が認識され、分析者が不足しています。 需要が多いと、データサイエンティストを目指そうとする人が増えるのはわかりますが、それにしても、そんなに急に増殖するものなのでしょうか…ね。。 最近、分析者(データサイエンティスト)と呼ばれる人をよく面接しますが、顕著な現象が起きています。 「私、分析できます!」という人に会うと、 a.きれいに成形されたデータが準備されたという条件のもと b.ソフトにデータを入れて、工夫をせずに(デフォルトの設定のまま) 分析ができます、という人が多い。 条件付き確率的に、P(分析できる| a ∩ b) といった感じです。 それだけ、最近のソフトウェアが進化し使いやすくなったということでしょうか。 昔(2006年)、将棋の羽生さんが ITと
アイテムベースの協調フィルタリングの作り方 その2 ★ アイテムベースの協調フィルタリングの作り方 その1 ★ http://skellington.blog.so-net.ne.jp/2009-08-20 の続き。 前回終了した時点でのデータは、 という形になっている。 Step3 のイメージは、 というデータを作りたい。 Step3 のストリームは、 で作られる。 最初のレコード集計ノードは、 レコード集計_合計ノードは、 レコード結合は、 score(フィールド作成)は、 となる。 最後、Step4では、データを整形するだけなので、簡単。 フィルタノードは、 ソートノードは、 となる。 最後にデータを出力してみると となる。 例えば、商品a を買った人に、何をリコメンドするかってことを考えたら、 商品c の score が一番高いので、商品c をリコメンドしよう!ってのに使えるかもし
以前、 ★ アイテムベースの協調フィルタリングの作り方 その1 ★ http://skellington.blog.so-net.ne.jp/2009-08-20 ★ アイテムベースの協調フィルタリングの作り方 その2 ★ http://skellington.blog.so-net.ne.jp/2009-08-21 という記事を書いた。 今度は、ユーザベースの協調フィルタリングの話。 例として、5人のユーザが下記の4つの食べ物について食べたい度合い(得点)を付けたとする。 Step1 ユーザとユーザの距離をコサイン類似度や相関係数などを利用して計算する。 このあたりの距離をどう計算するかは、一つの研究課題。 ユーザ数が M 人いた場合、M ×(M - 1)個の類似度を計算する。 得点(連続値)ではなく、1 or 0 で与えてあげれば、アクションする/しないの判別分析に使うことができる。
家のノートPC(Windows)が古くなって壊れかけたので、ノートPCを買いに行った。 そこで、前から気になっていたAppleのマックを買うことにしました。 目指すは、先週ヤマダ電機がオープンした新宿へ。 元々、ビックカメラのポイントカード&クレジットカードを持っているので、気持ちとしてはビックカメラで買いたいところ。 候補として、↓の3つあった。 第一候補:MacBook 2260/13.3 MC207J/A 定価 ¥98,800 第二候補:MacBook Pro 2400/13.3 MC374J/A 定価 ¥114,800 第三候補:MacBook Pro 2660/13.3 MC375J/A 定価 \138,800 まずは、ヨドバシカメラへ。 3つとも定価売りで5%ポイント還元って書かれてありました。 あんまり安くない印象。。。 値切れば、もっと安くなるんだろうけど、ヨドバシだったの
天気の子を観ました。 新海誠監督らしい作品だったかなと思います。 以下、少しネタバレの感想。 「世界なんてさ どうせ 元々 狂ってんだから」 というのがキーな気がしました。 このセリフ以外にも、「もともとは、海だった」というのもありますね。 人間環境が原因と考えられる異常気象。 10年に1度、100年に1度という災害が毎年来ています。 しかし、長い地球の歴史で見れば、以前はもっと荒れた気候だったかもしれない。 もっと熱い世界、もっと冷たい世界だったこともあります。 今の気象を維持しようとするあまりに、過剰なことをし過ぎていないだろうか? 新型コロナの対応しかり、寝たきり老人の延命措置しかり、 社会保障が逼迫し、声を上げて決断をしなければならない時期に来ています。 一方、何もしないという選択をとり続けることで、ゆっくりと日本経済という船は沈んでいく。 最後、東京が沈んだままでしたが、あの描写
データサイエンス研究会報告書 スパース推定と機械学習 https://www.jmra-net.or.jp/Portals/0/committee/innovation/20240508_001.pdf 朝野先生と研究をしていましたが、その報告書が出来上がっていました。 自分も一部担当しています。 そういえば、転職して3年が過ぎた。 上手く行ったプロジェクトもあったが、そうでなかったプロジェクトもある。 少し振り返ってみると・・・ データサイエンス組織が会社で活きるために必要な文化ってなんだろうか? 大きく2つあるように感じる。 1. 予算を取得するまでに、時間がかかりすぎる (アイデアを試すまでの時間が長い) やってみないとわからないことが多い。 いきなり、「数億の金をくれ」といっているわけではない。 小さなPOCをするために何ヶ月も説明をし、頭が硬い役員を説得し続けるのは疲れる。 2.
このページを最初にブックマークしてみませんか?
『Minkyのよもやま日記』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く