どうも、Kaggle界のシナモンです。https://twitter.com/mamas16k シナモンはKaggleを一旦やめる予定です。これを機に、これまでやってきたことをまとめようと思います。 機械学習を始める前(高校~学部1年の夏まで) 機械学習を始める & 勉強期間(学部1年の夏~学部2年の2月) ALBERTでバイトをする(学部2年の2月 ~ 10月) 初めて機械学習コンペに出る(学部2年の4月 ~ 7月) 2回目の機械学習コンペに出る(学部2年の10月 ~ 11月) Kaggleに初めて出る(学部2年の3月 ~ 学部3年の5月) DeNAでバイトする(学部3年6月~学部3年9月まで) 2回目のKaggle(学部3年10月~学部3年12月) 3回目のKaggle(学部4年3月~学部4年4月) これから(学部4年4月~) 最後に 機械学習を始める前(高校~学部1年の夏まで) シナ
検索ワードを入力すると関連するウェブサイトを一覧表示してくれるGoogle検索は世界中の人々に利用されており、日本でも「ググる」という動詞として用いられることがあります。そんなGoogle検索について、検索エンジン最適化(SEO)やマーケティング事業を手がけるSparkToroのランド・フィシュキンCEOが、「2020年に行われたGoogle検索のうち約3分の2は検索結果画面に表示されたウェブサイトへのリンクをクリックしない『ゼロクリックサーチ』だった」との調査結果を発表しました。 In 2020, Two Thirds of Google Searches Ended Without a Click | SparkToro https://sparktoro.com/blog/in-2020-two-thirds-of-google-searches-ended-without-a-cl
『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day
最終更新:2016年1月24日 このサイトでは統計学や統計モデルの紹介を多くしています。 その中でも、状態空間モデルは、力を入れている分野の一つです。 ところで、なぜ状態空間モデルを使う必要があるのでしょうか。 そもそもにおいて、統計モデルを使う必要性はどこにあるのでしょうか。 今回は個々の手法の説明ではなく「なぜそれを使うのか」という理由を解説します。 スポンサードリンク 目次 1.なぜモデルを使うのか 2.なぜ統計モデルを使うのか 3.なぜ状態空間モデルを使うのか 4.なぜたくさんのモデルを統一的に表せると便利なのか 5.状態空間モデルを使う注意点 6.状態空間モデルの御利益 7.おまけ:統計モデルと機械学習の違い 1.なぜモデルを使うのか モデルとは、「見やすくなるように簡略化したもの」です。 モデルを作る行為、すなわちモデル化とは、「見やすくなるように簡略化すること」です。 例えば
Booking.com Challenge ACM WSDM 2021 WebTour ACM SIGIR 2021 Resource Track Booking.com’s mission is to make it easier for everyone to experience the world. By investing in the technology that helps take the friction out of travel, Booking.com seamlessly connects millions of travellers with memorable experiences, a range of transport options and incredible places to stay. Many of the travellers go o
マーケティングテクノロジーの情報やノウハウ・TIPS、エクスチュア社の情報を発信。【ブログネタ募集】ご興味のある分野を教えてください!ご要望の内容を記事に起こします!メニューの「ブログへの」リクエストよりお送りください。 menu こんにちは、エクスチュアの渡部です。 LODブログ第二弾です。今回は、FIXED関数について説明します。 前回のブログの続きになります。 お読みで無い方は下記を見ることによって理解が深まります。 Tableau-分かりやすいLOD 概要編 前回のブログでは、通常の集計関数は「データソースの行レベル」でしか集計を行えないことを説明しました。 対して集計の粒度を自由に変えられるのがLOD計算でしたね。では、FIXEDはどのような仕組みで集計の粒度を変えられるのでしょうか? ・通常の集計関数と、FIXED関数の集計の違い 実は、「通常の集計関数を使った集計」と「FIX
回帰分析におけるt値とp値の意味について 調査情報担当室 前田 泰伸 《要旨》 回帰分析とは、統計的手法によって説明変数と被説明変数の関係を推 計する分析方法である。t値及びp値は、係数の有意性を示す重要な指 標であるが、有意性ばかりに気を取られていると、思わぬ陥穽に陥る可 能性もある。すなわち、回帰分析の際、データの個数が極端に多くなっ た場合には、係数や決定係数が小さく、説明変数と被説明変数の間に関 係がありそうに見えなくても、係数のt検定の結果、t値やp値が有意 となることがあり得る。これは、データの個数が増えたため推計の精度 が上がり、係数がゼロに近い値であっても、それがゼロであるとはいえ ないという意味でt値(及びp値)が有意となるからである。 今はビッグデータの時代であり、億単位のデータの収集も困難ではな いが、そうして得られたデータから手当たり次第に回帰分析を行って いった場
Wineを使うという選択肢 そんなWindows専用アプリケーションをMacで動かす方法はいくつか方法があります。 今回はその中の一つ、Wineというアプリケーションを使って動かしてみます。 この「Wine」を導入するだけで、Wine上でWidnwosアプリケーションを起動できます。 MacでWineを導入するには? MacでWineを導入する方法ですが、 「homebrew」や、「公式のpkg」 など選択肢がいくつかあります。 しかし、本家のWineは元々Linux用のアプリであることから、MacOS上では動作が不安定だったりイマイチ使い勝手が悪いのがデメリットです。 しかし、そんなWineを「MacOS上で簡単に導入出来るアプリ」が存在します。 それがMacOS用に開発された「EasyWine」です。 実際に「EasyWine」を使用すると安定して「A5:SQL Mk-2」が動作させる
近年、Google, Apple, Facebook, Amazonなど、世界を代表する企業で研究されている分析手法があります。それがグラフニューラルネットワーク(GNN)です。GNNは現在ではビジネスで結果を出す段階にまで進化を遂げてきました。 今回はGNNとは何かから、実際にどのような結果を出しているかを紹介します。 GNNとは何かグラフニューラルネットワーク (GNN) とは、グラフ上の問題を扱うニューラルネットワークです。 グラフとは、以下のノードとエッジから成るデータ構造を示します。 ・ノード:何かの対象を表す ・エッジ:ノード同士を結び、関係性を表す このグラフの使用例として、GNNでは以下のものがあります。 ・コミュニティ:ノード→人、エッジ→友人関係 ・交通:ノード→地点、エッジ→ルート ・化合物:ノード→原子、エッジ→結合 Graph Neural Networks: M
みなさんこんにちは。技術開発室の岡田です。 前回の投稿では、エッジデバイス上での画像認識技術についてご紹介しました。 cloud.flect.co.jp 今回は、この中で紹介した画像認識技術の一つである、Image Classification(物体認識)に用いるモデル(分類機)の作成方法についてご紹介します。 画像認識の分野では転移学習と呼ばれる方法でモデルを作成することが多いです。転移学習は既存のモデルを利用してモデル作成を行うもので、今回も転移学習を用いてモデルを作成しますが、転移学習については多くの文献が存在しています。このため転移学習を用いたモデルの作成方法自体はリファレンスを示すことにし、その中でもあまり文献が発見できなかったMobilenet v2, Inception v4のモデルを転移学習で作成する方法を説明します。また、簡単にではありますが、Mobilenet v1/v
はじめに 本コラムでは、ビッグデータ分析とファストデータ分析を組み合わせるための仕組みである「ラムダアーキテクチャー」の紹介をする。私どもは現在、Apache Sparkを最大限に活用したラムダアーキテクチャーの構想を練っており、その実現方式が固まった際は、コラムにてサンプルを紹介しようと考えている。ただ、「ラムダアーキテクチャー」という言葉に耳慣れない人もまだ多いかと思い、まずはラムダアーキテクチャーについての説明から始めることとする。 ビッグデータ、ファストデータ関連の潮流 まずは、ビッグデータとファストデータ(≒リアルタイム、≒ストリーミング)の世間の潮流について復習する。ここでの「世間の潮流」とは、あくまで、筆者の個人的な感覚をもとにして記載している。エンジニア視点で書いているため、経営者支援やマーケッター視点とは異なると思われるが、その点はご容赦頂きたい。 Hadoopの登場によ
統計学の基準値の由来:5%有意水準,カイ二乗検定,相関係数の出典と引用 井口豊(生物科学研究所,長野県岡谷市) 最終更新:2023 年 10 月 21 日 1. はじめに 統計学において,しばしば用いる基準値というものがある。それにもかかわらず,その由来とか,出典元とかが不明のまま使われる基準値がある。それがあまりにも有名で広く使われているために,かえって原典が不明になってしまったケースと言って良い。ここでは,そのような基準値の原典は何か,という考察である。興味のある人は,実際にその原典までたどって読んでほしい。いくつかの文献には, PDF が読めるサイトをリンクした。なお, 四分位数の定義とその用語の歴史については,別のページの解説参照: 四分位数と四分位群:複数定義と用語の区別,その歴史 なお,本ページは,以下の論文に引用されています。 高野真史・倉持龍彦・久松学・細川正浩・蜂谷仁 (
MLP オンライン機械学習本でリグレット解析について勉強した際のメモ. リグレット解析の概要 リグレット解析(regret analysis)はアルゴリズムが最適な戦略をとった場合と比べてどの程度悪かったのか, そのリグレット(後悔)を測ることでアルゴリズムの性能を測る. リグレット解析自体はオンライン学習だけでなく、ゲーム理論など広い問題設定で利用されている。 リグレット解析の定義 リグレット解析は次のような問題設定を扱う。 プレイヤーは毎回、可能なアクション集合から1つのアクションを選択する。 その後に、コスト関数が提示され、その回のコストが決まる。 この操作を何回も繰り返していく。回目のアクションを、コスト関数をとする。 コスト関数は毎回全く違っていても、同じでも構わない。 プレイヤーのアクションを決める方法を戦略と呼ぶことにする。 プレイヤーはどのような戦略をとれば合計コストを最小
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く