[B! 分析] otento-samasamaのブックマーク

Lessons on ML Platforms — from Netflix, DoorDash, Spotify, and more

otento-samasama 2021/06/03

分析

リンク

シナモンが金メダルを3つ取ってKaggle Masterになるまでにやったこと - mamastan’s blog

どうも、Kaggle界のシナモンです。https://twitter.com/mamas16k シナモンはKaggleを一旦やめる予定です。これを機に、これまでやってきたことをまとめようと思います。機械学習を始める前（高校～学部1年の夏まで）機械学習を始める & 勉強期間（学部1年の夏～学部2年の2月） ALBERTでバイトをする（学部2年の2月 ~ 10月）初めて機械学習コンペに出る（学部2年の4月 ~ 7月） 2回目の機械学習コンペに出る（学部2年の10月 ~ 11月） Kaggleに初めて出る（学部2年の3月 ~ 学部3年の5月） DeNAでバイトする（学部3年6月～学部3年9月まで） 2回目のKaggle（学部3年10月～学部3年12月） 3回目のKaggle（学部4年3月～学部4年4月）これから（学部4年4月～）最後に機械学習を始める前（高校～学部1年の夏まで）シナ

otento-samasama 2021/03/29

分析

リンク

2020年に行われたGoogle検索の約3分の2が検索結果のサイトをクリックしない「ゼロクリックサーチ」だったことが判明

検索ワードを入力すると関連するウェブサイトを一覧表示してくれるGoogle検索は世界中の人々に利用されており、日本でも「ググる」という動詞として用いられることがあります。そんなGoogle検索について、検索エンジン最適化(SEO)やマーケティング事業を手がけるSparkToroのランド・フィシュキンCEOが、「2020年に行われたGoogle検索のうち約3分の2は検索結果画面に表示されたウェブサイトへのリンクをクリックしない『ゼロクリックサーチ』だった」との調査結果を発表しました。 In 2020, Two Thirds of Google Searches Ended Without a Click | SparkToro https://sparktoro.com/blog/in-2020-two-thirds-of-google-searches-ended-without-a-cl

otento-samasama 2021/03/24

分析

リンク

untitled

otento-samasama 2021/01/24

分析

リンク

https://cs.uwaterloo.ca/~ilyas/papers/IlyasFnTDB2015.pdf

otento-samasama 2021/01/24

分析

リンク

ABテストの勝ちパターンは本当に有効？シーケンス分析で劇的に変化したエイチーム引越し侍の施策設計法

『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day

otento-samasama 2021/01/20

分析

リンク

言語学の勝利〜〜！「魏志倭人伝」完全解読！3世紀当時の発音から地名や方言とも照らし合わせた研究がすごい邪馬台国の場所も推定される

すきえんてぃあ@書け @cicada3301_kig 着ぐるみ生命体／トランスヒューマニスト／コピミズム／言語／謎エスニック料理／リキュール／主なるねこかわの御名においてにゃーん twitter.com/search?q=%E6%9…

otento-samasama 2021/01/08

分析

リンク

なぜ状態空間モデルを使うのか | Logics of Blue

最終更新：2016年1月24日このサイトでは統計学や統計モデルの紹介を多くしています。その中でも、状態空間モデルは、力を入れている分野の一つです。ところで、なぜ状態空間モデルを使う必要があるのでしょうか。そもそもにおいて、統計モデルを使う必要性はどこにあるのでしょうか。今回は個々の手法の説明ではなく「なぜそれを使うのか」という理由を解説します。スポンサードリンク目次 1．なぜモデルを使うのか 2．なぜ統計モデルを使うのか 3．なぜ状態空間モデルを使うのか 4．なぜたくさんのモデルを統一的に表せると便利なのか 5．状態空間モデルを使う注意点 6．状態空間モデルの御利益 7．おまけ：統計モデルと機械学習の違い 1．なぜモデルを使うのかモデルとは､「見やすくなるように簡略化したもの」です。モデルを作る行為、すなわちモデル化とは､「見やすくなるように簡略化すること」です。例えば

otento-samasama 2020/12/26

分析

リンク

Home | Booking.com WSDM challenge

Booking.com Challenge ACM WSDM 2021 WebTour ACM SIGIR 2021 Resource Track Booking.com’s mission is to make it easier for everyone to experience the world. By investing in the techno logy that helps take the friction out of travel, Booking.com seamlessly connects millions of travellers with memorable experiences, a range of transport options and incredible places to stay. Many of the travellers go o

otento-samasama 2020/12/21

分析

リンク

Tableau：分かりやすいLOD-FIXED編

マーケティングテクノロジーの情報やノウハウ・TIPS、エクスチュア社の情報を発信。【ブログネタ募集】ご興味のある分野を教えてください！ご要望の内容を記事に起こします！メニューの「ブログへの」リクエストよりお送りください。 menu こんにちは、エクスチュアの渡部です。 LODブログ第二弾です。今回は、FIXED関数について説明します。前回のブログの続きになります。お読みで無い方は下記を見ることによって理解が深まります。 Tableau-分かりやすいLOD 概要編前回のブログでは、通常の集計関数は「データソースの行レベル」でしか集計を行えないことを説明しました。対して集計の粒度を自由に変えられるのがLOD計算でしたね。では、FIXEDはどのような仕組みで集計の粒度を変えられるのでしょうか？・通常の集計関数と、FIXED関数の集計の違い実は、「通常の集計関数を使った集計」と「FIX

otento-samasama 2020/12/10

分析

リンク

回帰分析におけるｔ値とｐ値の意味について

回帰分析におけるｔ値とｐ値の意味について調査情報担当室前田泰伸《要旨》回帰分析とは、統計的手法によって説明変数と被説明変数の関係を推計する分析方法である。ｔ値及びｐ値は、係数の有意性を示す重要な指標であるが、有意性ばかりに気を取られていると、思わぬ陥穽に陥る可能性もある。すなわち、回帰分析の際、データの個数が極端に多くなった場合には、係数や決定係数が小さく、説明変数と被説明変数の間に関係がありそうに見えなくても、係数のｔ検定の結果、ｔ値やｐ値が有意となることがあり得る。これは、データの個数が増えたため推計の精度が上がり、係数がゼロに近い値であっても、それがゼロであるとはいえないという意味でｔ値（及びｐ値）が有意となるからである。今はビッグデータの時代であり、億単位のデータの収集も困難ではないが、そうして得られたデータから手当たり次第に回帰分析を行っていった場

otento-samasama 2020/11/25

分析

リンク

【macOS High Sierra以前】「A5:SQL Mk-2」をMacで簡単に使えるようにする方法

Wineを使うという選択肢そんなWindows専用アプリケーションをMacで動かす方法はいくつか方法があります。今回はその中の一つ、Wineというアプリケーションを使って動かしてみます。この「Wine」を導入するだけで、Wine上でWidnwosアプリケーションを起動できます。 MacでWineを導入するには？ MacでWineを導入する方法ですが、「homebrew」や、「公式のpkg」など選択肢がいくつかあります。しかし、本家のWineは元々Linux用のアプリであることから、MacOS上では動作が不安定だったりイマイチ使い勝手が悪いのがデメリットです。しかし、そんなWineを「MacOS上で簡単に導入出来るアプリ」が存在します。それがMacOS用に開発された「EasyWine」です。実際に「EasyWine」を使用すると安定して「A5:SQL Mk-2」が動作させる

otento-samasama 2020/11/23

分析

リンク

Digdag と Embulk と Athena で作る Gunosy の ELT基盤

生データを最速で取り込むチャレンジ ~LayerXデータ基盤成長物語 part1~ / Building a data infrastructure that captures raw data at the fastest

otento-samasama 2020/11/09

分析

リンク

GAFAも注目するグラフニューラルネットワーク(GNN)活用法｜Tack@データサイエンス

近年、Google, Apple, Facebook, Amazonなど、世界を代表する企業で研究されている分析手法があります。それがグラフニューラルネットワーク(GNN)です。GNNは現在ではビジネスで結果を出す段階にまで進化を遂げてきました。今回はGNNとは何かから、実際にどのような結果を出しているかを紹介します。 GNNとは何かグラフニューラルネットワーク (GNN) とは、グラフ上の問題を扱うニューラルネットワークです。グラフとは、以下のノードとエッジから成るデータ構造を示します。・ノード：何かの対象を表す・エッジ：ノード同士を結び、関係性を表すこのグラフの使用例として、GNNでは以下のものがあります。・コミュニティ：ノード→人、エッジ→友人関係・交通：ノード→地点、エッジ→ルート・化合物：ノード→原子、エッジ→結合 Graph Neural Networks: M

otento-samasama 2020/10/29

分析

リンク

Mobilenet v2とInception v4の転移学習 - フレクトのクラウドblog re:newal

みなさんこんにちは。技術開発室の岡田です。前回の投稿では、エッジデバイス上での画像認識技術についてご紹介しました。 cloud.flect.co.jp 今回は、この中で紹介した画像認識技術の一つである、Image Classification(物体認識)に用いるモデル(分類機)の作成方法についてご紹介します。画像認識の分野では転移学習と呼ばれる方法でモデルを作成することが多いです。転移学習は既存のモデルを利用してモデル作成を行うもので、今回も転移学習を用いてモデルを作成しますが、転移学習については多くの文献が存在しています。このため転移学習を用いたモデルの作成方法自体はリファレンスを示すことにし、その中でもあまり文献が発見できなかったMobilenet v2, Inception v4のモデルを転移学習で作成する方法を説明します。また、簡単にではありますが、Mobilenet v1/v

otento-samasama 2020/10/22

分析

リンク

How to Build a Product Recommender Using Multi-Armed Bandit Algorithms

otento-samasama 2020/10/16

分析

リンク

データ利活用を促進するメタデータ

ヤフーのメタデータ可視化の取り組みについて紹介します。メタデータを３つのlayerに分類してそれぞれの課題と対応について説明しますRead less

otento-samasama 2020/10/14

リンク

Big Data + Fast Data = ラムダアーキテクチャー！ | NTTデータ先端技術株式会社

はじめに本コラムでは、ビッグデータ分析とファストデータ分析を組み合わせるための仕組みである「ラムダアーキテクチャー」の紹介をする。私どもは現在、Apache Sparkを最大限に活用したラムダアーキテクチャーの構想を練っており、その実現方式が固まった際は、コラムにてサンプルを紹介しようと考えている。ただ、「ラムダアーキテクチャー」という言葉に耳慣れない人もまだ多いかと思い、まずはラムダアーキテクチャーについての説明から始めることとする。ビッグデータ、ファストデータ関連の潮流まずは、ビッグデータとファストデータ（≒リアルタイム、≒ストリーミング）の世間の潮流について復習する。ここでの「世間の潮流」とは、あくまで、筆者の個人的な感覚をもとにして記載している。エンジニア視点で書いているため、経営者支援やマーケッター視点とは異なると思われるが、その点はご容赦頂きたい。 Hadoopの登場によ

otento-samasama 2020/10/14

リンク

統計学の基準値の由来：5%有意水準，カイ二乗検定，相関係数の出典と引用

統計学の基準値の由来：5%有意水準，カイ二乗検定，相関係数の出典と引用井口豊（生物科学研究所，長野県岡谷市）最終更新：2023 年 10 月 21 日 1. はじめに統計学において，しばしば用いる基準値というものがある。それにもかかわらず，その由来とか，出典元とかが不明のまま使われる基準値がある。それがあまりにも有名で広く使われているために，かえって原典が不明になってしまったケースと言って良い。ここでは，そのような基準値の原典は何か，という考察である。興味のある人は，実際にその原典までたどって読んでほしい。いくつかの文献には， PDF が読めるサイトをリンクした。なお，四分位数の定義とその用語の歴史については，別のページの解説参照：四分位数と四分位群：複数定義と用語の区別，その歴史なお，本ページは，以下の論文に引用されています。高野真史・倉持龍彦・久松学・細川正浩・蜂谷仁 (

otento-samasama 2020/10/09

分析

リンク

リグレット解析のメモ - 緑茶思考ブログ

MLP オンライン機械学習本でリグレット解析について勉強した際のメモ．リグレット解析の概要リグレット解析(regret analysis)はアルゴリズムが最適な戦略をとった場合と比べてどの程度悪かったのか，そのリグレット（後悔）を測ることでアルゴリズムの性能を測る．リグレット解析自体はオンライン学習だけでなく、ゲーム理論など広い問題設定で利用されている。リグレット解析の定義リグレット解析は次のような問題設定を扱う。プレイヤーは毎回、可能なアクション集合から1つのアクションを選択する。その後に、コスト関数が提示され、その回のコストが決まる。この操作を何回も繰り返していく。回目のアクションを、コスト関数をとする。コスト関数は毎回全く違っていても、同じでも構わない。プレイヤーのアクションを決める方法を戦略と呼ぶことにする。プレイヤーはどのような戦略をとれば合計コストを最小

otento-samasama 2020/10/02

分析

リンク

はてなブックマーク

タグ

関連タグで絞り込む (6)

分析に関するotento-samasamaのブックマーク (229)

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第4週）

今週のはてなブックマーク数ランキング（2024年8月第3週）

今週のはてなブックマーク数ランキング（2024年8月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス