はじめに おはようございます。こんにちは。こんばんは。 GMOアドマーケティングのY-Kです。 今回は機械学習への足がかりとなるような記事を書きたいと思ったので、クラスタリングタスクを通して機械学習の流れを大雑把に書いていこうと思います。 機械学習における基本的な データ分析 -> 予測 -> 評価の流れを体験しつつ、読んでいる間に気になるところがあればそこを深掘りしていくなど、機械学習への興味/勉強の第一歩としていただければと思います。 クラスタリングとは クラスタリングは機械学習における教師なし学習の一種で、データの類似度でデータをグループ(クラスタ)分けする手法のことを指します。 データに対して答えが存在する教師あり学習とは異なり、各データに答えがない状態で学習されるので、クラスタリングによってまとめられたデータのグループが何を示しているのかは解釈が必要となります。 しかしその分、ク
新年あけましておめでとうございます🎍 年末年始は色々と手を動かしつつ*1, 積ん読を消化していたのですが, 昨年最後の読書🍺 特にこの本にオッってなりまして読み終わる寸前には, これもうすぐ読み終わるのですが、なぜ積ん読にしてたワイは🤔 ってぐらい名著でした📖 https://t.co/RgTILDGc7r— Shinichi Nakagawa (@shinyorke) 2021年1月3日 ...という感想が出る程度にこちらの書籍に興奮しました. データ分析人材になる。 目指すは「ビジネストランスレーター」 作者:木田 浩理,伊藤 豪,高階 勇人,山田 紘史発売日: 2020/10/15メディア: Kindle版 データを使って仕事をする人は(データサイエンティストに限らず)サラッと読んだほうがええやぞ! というぐらい良い本だったという話を2021年最初のブログとして書きたいと思い
画像は『総務省統計局「社会人のためのデータサイエンス演習」講座PV』より 総務省は9月29日から、実践的なデータ分析の手法を学習できるとうたう、データサイエンス・オンライン講座「社会人のためのデータサイエンス演習(外部サイト)」を開講している。登録料および受講料は無料。閉講日時は12月7日の23時59分。 本講座では、ビジネスや行政での活用を想定しており、社会人や大学生に向けて、ビジネスや業務上での分析事例を中心に実践的なデータ分析(統計分析)の手法をわかりやすく解説するという。前提条件は表計算ソフトMicrosoft Excelの基本的な操作ができること。 『総務省統計局「社会人のためのデータサイエンス演習」講座PV』より 講師は、総務省統計局の會田雅人氏、総務省統計局の阿向泰二郎氏、株式会社電通の佐伯諭氏、東京大学の松尾豊氏、株式会社ブレインパッドの奥園朋実氏、株式会社ブレインパッドの
1.それぞれ異なるデータをもとにする ランダムフォレストでは、もとの訓練データから、(各 $i$ に対して)$i$ 番目の決定木を作成するための「サブ訓練データ」を抽出します。それぞれの抽出は復元抽出で行います(同じデータを何回も抽出することもある)。このように、復元抽出によってサブデータを作成する手法を、ブートストラップサンプリングと言います。 例えば、もとのデータが $(d_1,d_2,d_3,d_4,d_5)$ の5つからなるとき、 ・1番目の決定木の作成には $(d_1,d_2,d_4,d_4)$ を使い ・2番目の決定木の作成には $(d_1,d_3,d_4,d_5)$ を使う というような感じです。 2.異なる説明変数を分割候補として使う 各決定木を作成するときには、1つのノードから初めてどんどん分割していくわけですが、分割は、 訓練データの説明変数のうち、$K$ 個をランダム
By darkday AI(人工知能)が大きな話題となっているコンピューターサイエンスの世界で、その技術を支えているのが「ディープラーニング」です。一方、コンピューターを使った「機械学習」という言葉を耳にすることも多いものですが、実はその違いがよくわからない人も多いはず。そんな両者の違いを、数学的計算ソフトウェア「MATLAB」の開発元であるMathWorksが簡単に解説しています。 Introduction to Deep Learning: Machine Learning vs Deep Learning - YouTube 機械学習もディープラーニングも、学習モデルを提供してデータを分類することに使われる技術です。その働きを解説するのによく用いられるのが、犬と猫の画像を分類するという例。この画像の場合、ほぼ全ての人が左が犬、右が猫と答えるはず。 しかし、別の画像を持ってきた時、それ
(写真=PIXTA) 2016年3月、Google傘下の人工知能(AI)会社であるDeepMindの「AlphaGo」が囲碁で韓国のトッププロ棋士に勝利した。囲碁でAIが人に勝つまで発展するには、まだ10年以上かかると言われていたことからも世界の注目を集めた。 2015年以前のAIはアマチュアの段レベルに達するのがやっとだった。AIのこの急激な発展を支えたのが、AIに「学習」させる技術の進化だ。そうした技術を応用することで、さまざまな分野でAIは急激に賢くなっている。今回は、カギとなる技術を解説する。 AIで注目される「機械学習」と「ディープラーニング」 AIに「学習」させるとはどういうことだろうか。最も典型的な答えは、例えば写真を見たときに「犬」なのか「猫」なのか(または違う生物なのか」を区別する方法を学ぶことだ。 人間が一目見て分かることでも、何も学習していないAIは分からず、教えなけ
本稿は、長年のテクノロジ・ジャーナリストであるマイケル・コープランド(Michael Copeland)氏がディープラーニングの基本を説明する一連の記事の第一弾です。 「人工知能は未来のテクノロジだ」、「人工知能はサイエンス・フィクションだ」、「人工知能はすでに私たちの日常生活の一部だ」――これらの説明はすべて事実であり、単にAIのどの面を指して言っているかによります。 たとえば、今年、Google DeepMindが開発したプログラム「アルファ碁」(AlphaGo)が囲碁の対局で韓国のプロ棋士イ・セドル(Lee Se-dol)氏を破った際に、DeepMindが勝った経緯を説明するため、「AI」、「機械学習」、「ディープラーニング」という言葉がメディアでさかんに取り上げられました。この3つは、どれもアルファ碁がイ・セドル棋士を打ち負かした理由の一部ですが、同じものではありません。 その関係
(Photo credit: A Health Blog via Visual Hunt / CC BY-SA) 「人工知能」ブームが本格化してまだほんの数ヶ月だと思うんですが、気がついたらTV含む大手メディアが皆こぞって毎日のように「人工知能」を取り上げ、あまつさえ政府や与党の諮問会議でまで「人工知能」の語が飛び交う有様で、一体何をどうしたらこうなるのか僕には全く分かりません(汗)。 とは言え、実際にビジネスの現場でも「人工知能」への期待感が日に日に高まり続けているのは事実で、例えば友人知人の経営者との酒席でも「最近人工知能ってめっちゃくちゃ流行ってるじゃん、あれって実際どうなの?本当に役に立つの?今からでも人工知能事業に参入すべきなのかな?それとも俺たちあいつらに滅ぼされちゃうの?」みたいなことを聞かれることが多いんですよね。 ということで、そういう「人工知能」ブームに乗り遅れたけれど
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く