統計的推定とは統計的推定とは、標本の特徴から母集団の性質を推測することです。また、このような手法を用いる統計学を推計統計学、推測統計学、または推計学などと呼びます。 そして、統計的推定には大きく分けて「点推定」と「区間推定」があります。 点推定標本から求められるただ一つの値によって母数を推定するという手法です。 点推定の例としては、不偏推定量や一致推定量があります。
統計学は「記述統計学」と「推測統計学」の2種類に分けられるということは、16-1章で既に学びました。 記述統計学:データを整理し、表やグラフを使ってわかりやすく表すこと。 推測統計学:母集団の「一部(標本)」を使って、母集団の情報を推測すること。 推測統計学の中には「推定」と「検定」が含まれます。ある母集団から標本を抽出した時に、 推定:母集団を特徴づける母数(パラメーター:平均など)を統計学的に推測すること。 検定:母集団から抽出された標本の統計量に関する仮説が正しいかを統計学的に判定すること。 を意味します。 日本人全員(母集団)からランダムに100人を抽出した標本を例に取ると、 推定:抽出された100人の身長から日本人全員の平均身長を推測すること。 検定:日本人の平均身長が165cmと言われているが、抽出された100人の平均は167cmだった。このとき、100人の平均値は妥当かどうか
区間推定は、母集団の従う分布が正規分布であると仮定できるときに、標本から得られた値を使ってある区間でもって母平均などの母数を推定する方法です。このときの区間のことを「信頼区間」といいます。論文などでは略語表記として「CI」が用いられます。 母平均の区間推定では、母分散が分かっている場合と分からない場合とで、その算出方法が異なります。19章では、母分散が分かっている場合の信頼区間の求め方について説明します。 母分散が分かっている場合(母分散既知) :母分散の値を使い、標準正規分布を用いて信頼区間を算出する 母分散が分からない場合(母分散未知) :次の式から算出される不偏分散の値を使い、t分布を用いて信頼区間を算出する(20章で説明します) ただし、母平均が分からないのに母分散だけは分かっている、という状況は現実にはほとんどありません。したがって、通常母平均の区間推定を行う場合にはt分布を用い
単純無作為抽出法は標本調査の最も基本的な方法ですが、母集団から完全に無作為に調査対象を取り出すのは、非常に手間と時間がかかる場合があります。そこで、母集団の特徴を反映させつつより手間を軽減させた様々な無作為抽出法があります。 ■層化抽出法(層別抽出法) 母集団をあらかじめいくつかの層(グループ)に分けておき、各層の中から必要な数の調査対象を無作為に抽出する方法 【例】男女比が7:3の高校で、10人の学生を対象に意識調査を行う場合、男子の中から7名を、女子の中から3名をそれぞれに無作為に抽出する(このように、層の大きさに比例させて調査対象を抽出する方法を層化抽出法の中でも特に「比例配分法」といいます) 【メリット】母集団内情報(年齢別、性別など)の比較を行える、推定精度が高くなる、各層において分布が大きく異なる場合に使うことができる 【デメリット】母集団の構成情報を事前に知っておく必要がある
ディープラーニングの「メリット」と「デメリット」 ディープラーニングの「メリット」と「デメリット」について紹介。 メリット ■柔軟性 機械学習では「人間がデータにモデルを当てはめる」という決定論的なビジネスルールにもとづいてハードコーディングされた分析システム構築が行われてきた。 一方、ディープラーニングは、「継続的改善により情報パターン変化に適時対応可能」なダイナミック性により、一般化と適応が良好に行われ、柔軟性の高いデータをアナリティクスに取り込むことが可能になった。 機械学習では扱いづらい複雑なデータ(言葉で特徴を定義するのが難しい場合)であっても、ディープラーニングの場合、大量のデータさえあれば処理を行え、新しいデータに合わせた継続的な改善も可能である。 ■分析結果出力までの大幅な時間短縮 ディープラーニングはトレーニングに時間がかかる。 しかし、トータルのデータ分析フローで考える
第3次AIブームといわれる昨今において、AIは多くの企業に注目され始めています。しかし、ディープラーニングと機械学習の違いまでは詳しくは理解できていないという方も多いのではないでしょうか。 AIを深く理解するためには、ディープラーニングと機械学習の違いをしっかりと理解しておかなくてはなりません。そこで今回は、「ディープラーニング」と「機械学習」の違いを分かりやすく解説していきますので、ぜひ参考にしてみてください。 ディープラーニングについて詳しく知りたい方は以下の記事もご覧ください。 ディープラーニングとは?仕組みやできること、実用例をわかりやすく紹介 AIにおける「機械学習」「ディープラーニング」それぞれの位置づけとは AIについて触れる中で目にする機会が多い「ディープラーニング」と「機械学習」は、それぞれどのような特徴があり、どのような位置づけになっているのでしょうか。まずは、それぞれ
キーワード 論理演算、ベン図、真理値表、否定、論理和、論理積、排他的論理和、交換則、結合則、分配則、吸収則、ド・モルガンの公式、集合演算、要素、元、外延的定義、内包的定義、補集合、積集合、差集合、直積 論理演算 1と0、真と偽、ON/OFFのように2つの状態だけをとることのできる数を論理数といい、論理数の間の演算を論理演算(プール代数ともいう)といいます。 論理演算を理解するには、図表が役に立ちます。代表的な図にベン図、表に真理値表があります。 論理演算子 否定 論理積 論理和 排他的論理和 論理演算の基本公式 AとAの演算 交換則 A×B=B×A A+B=B+A 結合則 (A×B)×C=A×(B×C) (A+B)+C=A+(B+C) 分配則 A×(B+C)=(A×B)+(A×C) A+(B×C)=(A+B)×(A+C) 吸収則 A+(A×B)=A 証明:A+(A×B)=A×(1+B)=A
私は高校生の頃数学が苦手で嫌いだった。嫌いだから不勉強になり、更に苦手になっていくという悪循環だった。 ただ振り返ってみて感じるのは、数学の勉強の仕方がよく分かってなかったのかなということだ。 今のようにインターネットや動画で検索できる時代でもなかった。 現代は情報過多かもしれないけど、とても便利な世の中になってきたなと思う。 コンピュータを学ぶ上でも、数学の素養は必須である。 今回は、コンピュータにおいて相当重要な分野である、論理演算と集合演算について観てみよう。 論理演算 ある条件があったとして、それが正しいか正しくないかを判断できるものを命題といい、正しいことを真(true)、正しくないことを偽(false)という。 また任意の命題を表す変数を論理変数(命題変数)という。 論理変数は真、偽のいずれかの値で表され、真と偽を1と0で表現することもある。これを真理値という。 論理変数を論理
対数関数のグラフはなかなか書くことがないので、グラフの形を忘れてしまいますよね。 本記事では対数関数のグラフの特徴と書き方を解説しました。 この記事を読んで対数関数のグラフの特徴と書き方をぜひ覚えていってください。
回帰とは、目的変数について説明変数を使った式で表すことをいいます(目的変数と説明変数の詳細については1-5章を参照)。この式のことを「回帰方程式」、あるいは簡単に「回帰式」といいます。また、回帰式を求めることを「回帰分析」といいます。 例題: 次の散布図は都道府県の人口密度と人口10万人あたりの薬局の数を示したものです。薬局の数 を目的変数、人口密度 を説明変数とするとき、回帰式を求めるとどのようになるでしょうか。 出典:総務省統計局 社会生活統計指標-都道府県の指標-2015 次の2つの図は散布図上に回帰式を描いたものです。このように、データに対しては様々な回帰式を求めることができます。この章では、左側の図のように ( は切片、 は傾きを表します)という一次関数で表される回帰式について説明します。 回帰式 には、説明変数 が1つだけ用いられています。このような式を「単回帰式」といい、単回
データ分析から導き出されたインサイト無しにAI(人工知能)の活用は始まりません。私たちは、各業界知識とデータ・アナリティクス技術を駆使しデータドリブン経営を強力に支援します。 データ、アナリティクス、AIは企業にとって競合他社との差別化を図るかつてないほど大きな要因になっています。今日の経営幹部が効率を向上しながら新たな収益源を開拓し、新しいビジネスモデルをタイムリーに構築する方法を模索する中、価値を生み出し成長を続ける企業には「データ活用」という共通項があります。私たちは、無数のデータから企業にとって本当に必要なデータを活用するための方法を知っています。 将来を見据えたオペレーション体制を備えている企業の半数以上(52%)は、すでにデータとアナリティクスを大規模に活用しています。データとAIに関する取り組みをビジネス戦略に沿って実施することで投資利益率を迅速に最大化し、最終的にはAIをビ
アンケートやリサーチといった調査は顧客の動向やニーズを把握する方法として大変有効で、マーケティングを進めるにあたって欠かせない要素です。アンケートの結果を効果的に活用するためのスタンダードな集計方法であるクロス集計は、単純集計よりも掘り下げたデータ分析が可能です。この記事では、単純集計との違いやクロス集計表の見方を解説。エクセルを使ったクロス集計表の作り方もわかりやすく解説していきます。
「クロス集計」は、アンケート調査やネットリサーチでよく用いられる基本的な方法です。 表計算ソフトのピボットテーブル機能を使えば誰でも簡単にできてしまうクロス集計ですが、調査企画の段階で、予め集計方法と分析計画を立てておくことが活用のコツです。 この記事では、クロス集計の活用方法やデータの分析・作成方法を解説します。 クロス集計とは ※数表に使用しているデータはダミーです クロス集計とは、2つ以上の質問項目の回答内容をかけ合わせ、回答者属性ごとの反応の違いを見るようなときに用いる集計方法です。 集計したデータを細分化して把握できるため、あらゆる統計的調査で使用されます。 上の表は、性別と年代別で、ある商品Aについての興味を分析したクロス集計表です。 このクロス集計表からは、例えば、以下のような客観的な事実を発見することができます。 全体値を見ると、「非常に興味がある」が最も高く44.8%、次
【クロス集計とは】クロス集計の方法と具体例、メリット・デメリットを解説 クロス集計 ビジネス用語 マーケティング 疑問解決 アンケートなどで得たデータは、そのままの数字を見るだけでなく、クロス集計をすると、得られるものが多くなります。 今回はクロス集計とは何か、その方法と具体例、クロス集計のメリット・デメリットについて解説します。 【関連記事】「「定量」と「定性」の違いとは!?--ビジネスで活かせる「定量」「定性」分析」 1.クロス集計とは クロス集計とは、アンケート結果などのデータを集計する時に、2つ以上の観点でまとめる統計手法のことです。 最も多いのは、アンケート結果の「はい」「いいえ」を横軸に、「男性」「女性」の性別を縦軸に置いた2×2のクロス集計表です。 2.クロス集計の実例 クロス集計の定義を読むとわかりづらいかもしれませんが、クロス集計はさまざまな場所で使われているため、見れば
本画面に掲載されている情報は、個人情報保護法等の概要をまとめたものであり、個人情報取扱事業者の義務や例外規定の全てを記載したものではありません。個人情報保護法のより詳細な内容については、個人情報保護委員会のホームページ内、個人情報保護に関する法律や、ガイドライン等をご参照ください。 法令・ガイドライン等
本画面に掲載されている情報は、個人情報保護法等の概要をまとめたものであり、個人情報取扱事業者の義務や例外規定の全てを記載したものではありません。個人情報保護法のより詳細な内容については、個人情報保護委員会のホームページ内、個人情報保護に関する法律や、ガイドライン等をご参照ください。 法令・ガイドライン等
本画面に掲載されている情報は、個人情報保護法等の概要をまとめたものであり、個人情報取扱事業者の義務や例外規定の全てを記載したものではありません。個人情報保護法のより詳細な内容については、個人情報保護委員会のホームページ内、個人情報保護に関する法律や、ガイドライン等をご参照ください。 法令・ガイドライン等
本画面に掲載されている情報は、個人情報保護法等の概要をまとめたものであり、個人情報取扱事業者の義務や例外規定の全てを記載したものではありません。個人情報保護法のより詳細な内容については、個人情報保護委員会のホームページ内、個人情報保護に関する法律や、ガイドライン等をご参照ください。 法令・ガイドライン等
本画面に掲載されている情報は、個人情報保護法等の概要をまとめたものであり、個人情報取扱事業者の義務や例外規定の全てを記載したものではありません。個人情報保護法のより詳細な内容については、個人情報保護委員会のホームページ内、個人情報保護に関する法律や、ガイドライン等をご参照ください。 法令・ガイドライン等
本画面に掲載されている情報は、個人情報保護法等の概要をまとめたものであり、個人情報取扱事業者の義務や例外規定の全てを記載したものではありません。個人情報保護法のより詳細な内容については、個人情報保護委員会のホームページ内、個人情報保護に関する法律や、ガイドライン等をご参照ください。 法令・ガイドライン等
本画面に掲載されている情報は、個人情報保護法等の概要をまとめたものであり、個人情報取扱事業者の義務や例外規定の全てを記載したものではありません。個人情報保護法のより詳細な内容については、個人情報保護委員会のホームページ内、個人情報保護に関する法律や、ガイドライン等をご参照ください。 法令・ガイドライン等
「仮名加工情報」とは、データ内の特定の個人を識別できる情報(氏名等)を、ガイドラインに従って削除または他の記述に置き換えることで、他の情報と照合しない限り特定の個人を識別することができないように加工した情報のことである。 \r\n現行法には匿名加工情報という、一見仮名加工情報との違いの判別が難しい情報について、すでに定められている。匿名加工情報は、特定の個人を識別できないように個人情報を加工し、かつ復元できないようにした情報のことで、事業者間におけるデータ利活用を促進することを目的に導入されている。仮名加工情報は、データとしての有用性を個人情報と同等程度に保ちながら、匿名加工情報と比べ加工範囲が縮小し、利用制限が拡大された情報として、企業内部におけるビッグデータ等の利活用を促進するために創設されたものである。 \r\n"}}" id="commontext-312ffe5e64" clas
「仮名加工情報(かめいかこうじょうほう)」とは、個人情報保護法のもとで2022年4月1日から導入される、新しいタイプの情報です。 近年では、データサイエンスや機械学習(いわゆるAI)など、データを活用した企業活動が重要になってきました。 「仮名加工情報」は、このような時代背景に合わせて、企業による情報の利活用を促進する目的で導入されたものです。 「仮名加工情報」ができたことによって、これまでよりも、企業による情報の利活用がしやすくなることが期待されています。 この記事では「仮名加工情報」について弁護士が詳しく解説していきます。 ぜひご参考になさって下さい。 個人情報保護法とは 個人情報保護法は、日本の企業が個人情報を取り扱うにあたって守らなければならないさまざまなルールを定めた法律です。 企業が個人情報を集めたり利用したりする場合には、個人情報保護法が定めているルールを守らなければなりませ
1.仮名加工情報とは 仮名加工情報とは、「他の情報と照合しない限り特定の個人を識別することができないように加工された個人に関する情報」です。改正個人情報保護法で定義されており、個人情報を保護しつつ、データ利活用を促進するための情報加工の要件が定められています。 個人情報の利活用については、2015年に匿名加工情報が創設され、厳密な匿名性を担保することで本人の同意なしにデータの第三者提供および当初の利用目的以外への活用が可能となっています。しかし、匿名性を担保するための加工が難しい、また、加工によって情報の粒度が粗くなる場合がある、といった課題がありました。このような状況に対し、2022年4月に施行予定の個人情報保護法改正で新設されるのが仮名加工情報です。 図1で、仮名加工情報と匿名加工情報の加工処理のイメージを示します。匿名加工情報は、他の個人情報とのマッチングを防ぐためのIDなどを削除す
匿名加工情報は、特定の個人を識別することができないように個人情報を加工して得られる個人に関する情報であって、当該個人情報を復元することができないようにしたもの(法第2条第6項)です。「個人情報」(法第2条第1項)に該当せず、本人の同意を得ずに第三者に提供することが可能です(匿名加工情報の取扱いに係る義務等については、ガイドライン(仮名加工情報・匿名加工情報編)3-2参照)。 これに対し、仮名加工情報は、他の情報と照合しない限り特定の個人を識別できないように加工した個人に関する情報(法第2条第5項)であり、仮名加工情報を作成した個人情報取扱事業者においては、通常、当該仮名加工情報の作成の元となった個人情報や当該仮名加工情報に係る削除情報等を保有していると考えられることから、原則として「個人情報」(法第2条第1項)に該当するものです。変更前の利用目的と関連性を有すると合理的に認められる範囲を超
1.匿名加工情報とは 匿名加工情報とは、特定の個人を識別することができないように個人情報を加工し、当該個人情報を復元できないようにした情報のことをいいます。 >また、匿名加工情報は、一定のルールの下で、本人同意を得ることなく、事業者間におけるデータ取引やデータ連携を含むパーソナルデータの利活用を促進することを目的に個人情報保護法の改正により新たに導入されました。 個人データをマスキングすれば匿名加工情報になるの? 個人データを単にマスキングしただけで、法令に定める適切な加工を行っていない場合は、匿名加工情報ではなく、個人データです。匿名加工情報は、以下で紹介している事業者の適切な加工を行ったものを指します。 ポイントカードの購買履歴や交通系ICカードの乗降履歴等を複数の事業者間で分野横断的に利活用することにより、新たなサービスやイノベーションを生み出す可能性 医療機関が保有する医療情報を活
線の交差が少ない:正の相関 線の交差が多い:負の相関 イメージが湧かないのでとりあえず描いてみる。 matplotlibでは平行座標プロットの描画は組み合わせで作るしかないようです。 plotlyだと直接平行座標プロットを描画できるのでplotlyを使います。 #使うライブラリなど import pandas as pd import matplotlib.pyplot as plt import plotly.express as px from sklearn.datasets import load_iris import seaborn as sns 量的変数の平行座標プロット てきとうな例 身長と体重の量的変数2つ。 10人想定して、 BMIの式にほぼ当てはまる、身長高いほど体重が高いという正の相関を8人。 負の相関になる超モデル体系と超幸せ体系を2人作ってみる。 import
IT(情報技術)の発達に伴い膨大なデータが集積されるようになり、この「ビッグデータ」を分析して新しい知見や価値を生み出す試みが広がりを見せている。そうした中で、ビッグデータを分析する手法として「プリスクリプティブ分析」が注目されるようになってきた。「指示的分析」、「処方的分析」などと訳される分析手法で、複雑な条件の組み合わせの中から「目的」に対する最適な解を導こうというものだ。多くのビッグデータ分析で使われている「説明的分析」、「予測的分析」との違いや、適用でメリットが得られる範囲など、プリスクリプティブ分析の特徴をひもといてみた。 日常生活からビジネスシーンまで、現代はデジタル化されたデータと縁が切れることがない。例えばスマートフォンを使うと、アプリで使ったデータはもとより、位置情報や加速度などのデータが刻一刻と生まれてくる。多くの人のスマートフォンの利用データを集めて分析すれば、繁華街
Seabornとは Seaborn (シーボーン) とは、Pythonの可視化ライブラリの一つです。 SeabornはMatplotlibの機能をより美しく、より簡単に実現するための可視化ライブラリです。 Seabornの特徴として、Matplotlibベースで作られているため、折れ線グラフや棒グラフ、散布図などの基本的なグラフ描画はMatplotlibの機能を利用していることが挙げられます。 公式ドキュメント Seabornのインストール pipコマンドを用いたSeabornのインストールは下記のコマンドをMacの方はターミナル、Windowsの方はコマンドプロンプト場で実行することでインストールが出来ます。 pip install seaborn 問題を報告するJupyter Notebookをお使いの方は、起動したNotebookのセルに、先頭に!マークをつけて実行することでインスト
この例では、各種の統計プロットを使用して多変量データを視覚化する方法を示します。統計分析の多くでは、予測子変数と応答変数という 2 つの変数のみを使用します。このようなデータは、2 次元散布図、二変量ヒストグラム、箱ひげ図などを使用すると容易に可視化できます。また、3 次元散布図を使用したり、3 番目の変数を色などでエンコードした 2 次元散布図でも、三変量データも可視化できます。しかし、データセットの多くには、変数が多数含まれるため、直接的な可視化は困難です。この例では、Statistics and Machine Learning Toolbox™ を使用して MATLAB® で高次元データを可視化する方法をいくつか紹介します。 この例では、carbig データセットを使用します。これは、1970 年代と 1980 年代の約 400 台の自動車について測定されたさまざまな変数を含むデー
ヒストグラムの階級数を決めるときには、スタージェスの公式が参考になります。 スタージェスの公式とは、ヒストグラムを作成するときに、階級の幅の目安を決めるための数式です。 度数分布表およびヒストグラムを作るときには、階級数、階級幅をどうするかが問題です。 参考記事 ヒストグラム(QC7つ道具)の用語と作り方 階級数が少なすぎてグラフがドテッとすると、分布が読みとれないのでダメですし、 逆に、階級数が多すぎて歯抜け型になってもいけません。階級の幅を狭くしすぎて、データが不足しています。 ヒストグラムの目的とは、得られたデータに関しての理解を手助けをすることであり、現象の背景にどういったことがあるか見ていきたいわけで、それにかなうグラフにしないといけませんよね。 設定に決まったルールはないですが、参考として スタージェスの公式 があります。スタージェスの公式で求めた階級幅がベストというわけではな
スタージェスの公式とは、 データ数がnの時,ヒストグラムの階級数(ビンの数)は1+log2nにするのがよい という、ヒストグラムを作成するときに階級数の目安を決めるための数式です。 logを見ると拒否反応を示す人が多いと思いかもしれません。 ですが計算は意外とシンプルですし、エクセルなら一瞬で計算してくれますので、数学が苦手な方でも安心して使えます(エクセルでの活用方法は後ほど!)。 一度知っておくと階級数を決めるいい目安になって便利ですよ! 実際にスタージェスの公式を使って階級数を調べてみましょう。 このような感じでデータ数に2をかける毎に階級数が1つずつ増えていきます。 そんなに複雑じゃないですよね。 計算式でみた時より、大分イメージが出来てきたのではないでしょうか。 このようにデータ数から階級数の目安を算出できるのが、スタージェスの公式の利点です。 ただこのスタージェスの公式、本当に
IoTやビックデータ解析、そしてAIという言葉が広く使われるようになって、長い年月が経ちました。 今ではApple Watchのようなウェアラブル端末と呼ばれるIoT機器が一般的に利用されるようになり、それらから派生するデータを使ってビックデータ解析やAIという技術がビジネスで使われるようになりました。 これらの技術は少しずつ幅広い分野で使われ始めていますが、これらの技術が浸透することによって社会にはどのような変化が生まれると考えられているのでしょうか。また、日本政府としてどのような社会を目指しているのでしょうか。 今回の投稿ではそのキーワードとなる「データ駆動型社会」を扱い、データ駆動型社会とはどのような社会なのかを整理していきます。 また日本政府が打ち出しているSociety5.0との関係についても見ていきます。 1.データ駆動型社会という言葉データ駆動型社会は経済産業省における議論の
サイバーフィジカルシステム(Cyber-physical systems)とは、物理世界とサイバー世界(コンピュータ上)を連携させて、物理世界では時間的・コスト的に不可能といえるような様々な検討、設計、最適解探索をサイバー世界で実行し、 それを物理世界にフィードバックするシステムのことを指します。 つまり、昔ながらの経験や勘ではなく、データとデジタル技術を活用した最適化のことであり、サイバーフィジカルシステムをあらゆる産業に適用しようという動きが広まりつつあります。 サイバーフィジカルシステムはCPSと略されて使われることもあります。 Cyber-physical systems (CPSs) are the result of the integration of connected computer systems with the physical world.(サイバーフィジカルシ
CPSとは、実世界(フィジカル)におけるデータを収集し、 サイバー世界でデジタル技術などを用いて分析したり、活用しやすい情報や知識とし、 それをフィジカル側にフィードバックすることで、付加価値を創造する仕組みです。 今、多くの人がスマートフォンを持ち、情報をやり取りするのが当たり前になりました。また、IoT、センサーの充実によって、モノづくりなどの現場からも多くの情報を集められるようになっています。この時代において、私たちが生かすべきなのが「データの力」です。サイバー空間にあるデータだけでなく、私たちが暮らす現実世界におけるデータを生かし、サイバー空間と現実世界でデータを循環させることが企業の競争力につながります。 東芝は、人と地球を持続可能にするためにデータの力を最大限に生かします。 50年以上にわたるAI技術開発や、最先端の量子技術、CPSテクノロジーへの取り組みが「データの力」を存分
現在大きな注目を集めている「サイバーフィジカルシステム(CPS)」。このサイバーフィジカルシステムがどういうことを示し、製造業にとってどういう意味があるのかを5分で分かるように簡単に分かりやすく説明します。 IoT(モノのインターネット)活用などで注目が集まる「サイバーフィジカルシステム(CPS)」ですが、これがどういうことを示し、製造業にとってどういう意味があるのかを「5分で分かる」ように簡単に分かりやすく説明します。 「サイバーフィジカルシステム(CPS)」とは何か 「サイバーフィジカルシステム」とは、現実(フィジカル)の情報を、コンピュータによる仮想空間(サイバー)に取り込み、コンピューティングパワーによる分析を行った上でそれをフィードバックし、現実の世界に最適な結果を導き出すという、サイバー空間とフィジカル空間がより緊密に連携するシステムのことです。 サイバーフィジカルシステムその
▶IoT導入のお問い合わせはこちら IoTという言葉が、すでに一般にも普及している現在。段階は一歩進み、“どう生かすのか”に話題がシフトしてきています。そんな中、聞く機会が増えているのが「CPS」というフレーズです。それはなんなのか、どう役立っていくのか。ここで書いていきたいと思います。 CPSとは、Cyber-Physical Systemの頭文字を取った略称です。フィジカルシステム=現実世界で、センサーシステムが収集した情報をサイバー空間でコンピューター技術を活用し解析。経験や勘ではなく、定量的な分析で、あらゆる産業へ役立てようという取り組みです。 例を挙げれば、自動運転がわかりやすいでしょう。自動車のセンサーがフィジカルの様々な情報を収集し、AI・IT技術(サイバー)が分析したうえで、駆動系(フィジカル)を動かす。自動車に限らず、ロボットやドローンなどでも、基本的にはこの流れがベース
CPSとは 産業と暮らしを元気にする サイバーフィジカルシステム(CPS) CPSとは、実世界(フィジカル空間)にある多様なデータをセンサーネットワーク等で収集し、サイバー空間で大規模データ処理技術等を駆使して分析/知識化を行い、そこで創出した情報/価値によって、産業の活性化や社会問題の解決を図っていくものです。 情報社会からCPS/IoT社会へ 情報社会においては、分野ごとの合理化や最適化が主たる目的と言えましたが、テクノロジーのさらなる進化は、これまでは実現できなかったデータの収集、蓄積、解析、解析結果の実世界へのフィードバックといった一連のサイクルを社会規模で可能にしていきます。 実世界とサイバー空間が相互連携した社会(CPS/IoT社会)においては、私たちとインターネット空間の接点はパソコンやスマートフォンといった端末に留まらず、車や家といった生活空間に広がり、収集されたデータはあ
AI(人工知能)には、いくつかの違う方法論があったり、そもそも、AI(人工知能)と呼ぶべきかどうかの線引きが難しいものがありますが、ここでは「特化型・汎用型」と「弱いAI・強いAI」という分類方法について説明します。 AI(人工知能)の区分の仕方に、「特化型」と「汎用型」という分類方法があります。 特化型とは特定の専門分野でのみ能力を発揮できるAI(人工知能)のことです。囲碁・将棋・チェスの対戦ができるAI(人工知能)や、法律や医療、故障診断などの専門分野に特化したものです。一世代前のエキスパートシステムも特化型のAIと言えますが、当時はルールを人間が教える(記述する)必要があったので、ディープラーニングを活用した今流行りのものとは使っている技術が違うものです。 一方、汎用型とは、人間のように幅広い対象に対して推論等が行えるものです。SF映画に出てくる人型のアンドロイドやアニメのドラえもん
AI(人工知能)を分類する際のひとつとして、広く一般的に「強いAI」と「弱いAI」にわけられます。ですが、これらの定義や違いについて、理解や認識が曖昧な方は多いのではないでしょうか。また、「汎用型AI」と「特化型AI」の違いもわかりづらいポイントです。本稿では、強いAIと弱いAIの定義、汎用型AIと特化型AIの関係について解説します。 「強いAI」と「弱いAI」の意味と定義を解説 強いAIとは、「適切にプログラムされた『意識』を持ち、総合的な判断ができるAI」です。一方の弱いAIとは、「一定の領域のみの業務に特化したAI」です。現在企業などの業務効率化や自動化する際に導入が進んでいるAIの多くは、弱いAIにあたります。 強いAIとは強いAIとは、人間のような自意識を備え、全認知能力を必要とする作業も可能なAIを指します。 「ターミネーター」シリーズのスカイネットや「アベンジャーズ」シリーズ
今回はデータベースの正規化について取り上げます。 PostgreSQL固有ではなく、RDBMS全般に関わる一般的なテーマですが、データベースを扱う上で重要な下地となる部分ですので、ぜひ基礎固めとしてご利用ください。「正規化」はOSS-DB Exam Silverの出題範囲にも含まれていますので、受験を考えている方も気を抜かずに取り組みましょう。 データの重複をなくし整合的にデータを取り扱えるようにデータベースを設計することを、データベースの正規化と呼びます。正規化を行っておくと、データの追加・更新・削除などに伴うデータの不整合や喪失が起きるのを防ぎ、メンテナンスの効率を高めることができます。 正規化の段階には、第1~第5正規形およびボイスコッド正規形がありますが、ここでは、データベースを設計する際に一般的に用いられる第1~第3正規形までを、前回登場したテーブルをもとにして説明していきます。
交差検証(交差確認)[1](こうさけんしょう、英: cross-validation)とは、統計学において標本データを分割し、その一部をまず解析して、残る部分でその解析のテストを行い、解析自身の妥当性の検証・確認に当てる手法を指す[2][3][4]。データの解析(および導出された推定・統計的予測)がどれだけ本当に母集団に対処できるかを良い近似で検証・確認するための手法である。 最初に解析するデータを「訓練事例集合(training set、訓練データ)」などと呼び、他のデータを「テスト事例集合(testing set、テストデータ)」などと呼ぶ。 交差検証はSeymour Geisserが生み出した。特にそれ以上標本を集めるのが困難(危険だったり、コストがかかったり)な場合は、データから導いた推定は、交差検証などで慎重に裏付けを確認するべきである。
その提言の中には「40代ひとり暮らしが日本を滅ぼす」という過激な内容も飛び出し、ネット上で話題を呼んだ。「本当にAIなのか」「統計的に正しい操作がされているのか」「40代ひとり暮らしを全否定するのか」「AIという“虎の威を借りて”発言の責任転嫁をしているのでは」――など批判の声も目立った。 これらの真相は。番組内や公式サイトでは十分な答えが得られなかったため、ITmedia NEWS編集部はNHKに質問状を送った。その回答が届いたので、論点を整理しながらNHKの回答を紹介する。 「AI」なるものは何者か NHKが独自に開発したという「社会問題解決型AI」とは何者なのか。 番組内では、「日本のあらゆるデータ」30年分、合計700万個のデータをAIにインプットし、さらに1万5000人分の人生を10年以上に渡って追跡したデータも用いたという。「パターン認識」や「ディープラーニング」を駆使したとい
回帰モデルやクラス分類モデルを検証するときの話です。 モデルの検証 一般的には、データセットが与えられたとき、サンプルをモデル構築用サンプル (トレーニングデータ, training dataset) とモデル検証用サンプル (テストデータ, test dataset) に分けます。そして、トレーニングデータで構築された回帰モデルやクラス分類モデルの推定性能を、テストデータで検証します。 回帰分析手法・クラス分類手法の中には、モデルを構築する前に決めておかなければならないパラメータ (ハイパーパラメータ) が存在します。たとえば、Partial Least Squares (PLS) における成分数、Support Vector Machine (SVM) における C やガウシアンカーネルの γ などです。このようなハイパーパラメータの値の決め方として、クロスバリデーションが一般的です。
口上 『ゼロから作る Deep Learning ~ Python で学ぶディープラーニングの理論と実装』という本を買って深層学習の勉強をマターリしているのですが、 「そういえば情報検索や自然言語処理の実験でもよくやる交差検証 Cross Validation って意外に気にしてる人いないかも?」 と思ったので、自分でまとめることにしました。 もちろん、今までにも優秀な人達が記事を書いてくださっていますし(しかもググるとイパーイ出てくる)「もう知っているよ!」「やってるし!」っていう方は全く読む必要がないので、華麗にスルーして 1 回でも多く自分の学習のための Epoch を回した方がいいと思うのですが、もしお時間があって「よし粗探しでもしてやるか!」と思った奇特な方がいらっしゃったならばお読みいただいて、妙なところがあれば是非ご指摘・ご指導ください。 m(__)m 誰のための記事か? 「
[評価指標]再現率(Recall)/感度(Sensitivity)とは?:AI・機械学習の用語辞典 用語「再現率」、別名:「感度」について説明。二値分類タスク(問題)に対する評価指標の一つで、実際の正解値が「陽性」で、かつ、予測値も「陽性」だった正解数(=TP)を、実際の正解値が「陽性」である全てのデータ数(=TP+FN)で割った値を指す。 連載目次 用語解説 統計学/機械学習における再現率(Recall)もしくは感度(Sensitivity)とは、(基本的に)二値分類のタスク(問題)に対する評価指標の一つで、正解値(真の値)が「陽性(Positive、正例)」であるデータ全体のうち、機械学習モデルによる予測値も「陽性」で正解だった確率である。0.0(=0%)~1.0(=100%)の範囲の値になり、1.0に近づくほどより良い。 言い換えると再現率は、正解値が陽性である場合において、機械学習
用語「適合率」について説明。二値分類タスク(問題)に対する評価指標の一つで、機械学習モデルによる予測値が「陽性」で、かつ、実際の正解値も「陽性」だった正解数(=TP)を、「陽性」と予測した全てのデータ数(=TP+FP)で割った値を指す。 連載目次 用語解説 統計学/機械学習における適合率(Precision、精密さ、精密度、精度)とは、(基本的に)二値分類のタスク(問題)に対する評価指標の一つで、「陽性(Positive、正例)」と予測したデータの中で実際に「陽性」が正解だった確率である。0.0(=0%)~1.0(=100%)の範囲の値になり、1.0に近づくほどより良い。 言い換えると適合率は、機械学習モデルによる予測が陽性だった場合に、どれくらい正解に「適合」できるか、を表現したものだ。適合率の計算は、予測値が「陽性」で、かつ、実際の正解値も「陽性」だった正解数(=TP)を、「陽性」と予
こんにちは(@t_kun_kamakiri)。 小学生の理科の実験で、「片方を対数にしたグラフ:片対数グラフ」や「両方の軸を対数にしたグラフ:両対数グラフ」を扱ったことがある人もいるかもしれません。
今では、データ分析官、データコンサルなどの専門家だけではなく、幅広い職業分野において、ビジネススキル・基本教養の1つとしてデータリテラシーが求められています。 個人だけではなく、経営層および社員一人ひとりのデータリテラシーの高さが企業組織のデータドリブン文化の成功、ならびに企業価値を左右します。IT部門やデータセンターに所属する社員だけではなく、データと少しでも接触がある人は、データをもとに正しい判断をできることが重要です。近年、企業内や部署内のデータリテラシーのレベルを引き上げるために、すべての社員にデータサイエンス研修の受講を推奨する動きが出ています。 本記事では、データリテラシーに必要な能力、データリテラシーがもたらすメリットを解説します。 資料請求でデータサイエンスの基礎が学べる講義を無料プレゼント ・講座(G検定・機械学習・データ分析など) 約3時間分 現役プロ講師によるわかりや
お知らせ 2024年9月1日より、connpassではスクレイピングを禁止し、利用規約に明記しました。以降の情報取得にはconnpass APIをご利用ください。APIご利用についてはヘルプページをご確認ください。 新機能 「QRコード読み取りによる出席機能」をリリースしました。事前に入場受付が必要な場合や、受付時に参加枠などによって個別の誘導が必要な場合にご利用ください。詳しくは こちら をご覧ください。 新機能 connpass APIに新しく、ユーザーのプロフィールを取得できるユーザーAPIを追加しました。APIリファレンスは こちら を、またAPI利用希望の方は こちら をご覧ください。
今年8月、石川県加賀市の自宅で、同居する母親を自殺に追い込んだとして、自殺教唆と暴行の罪に問われた54歳の男の初公判が25日、金沢地裁で開かれ、男は起訴された内容を認めました。裁判は即日結審し、検察側は懲役3年を求刑しました。 同居の母親(当時78)に「はよ死ねや」この裁判は今年8月、加賀市塩屋町の自宅で、当時78歳の母親に殴る蹴るなどの暴行を加えた後、包丁を差し出し「はよ死ねや」と迫ったとして、同居していた54歳の長男が自殺教唆と暴行の罪に問われたものです。 25日、金沢地裁で開かれた初公判で、被告は起訴された内容について、裁判長に「間違っている点はないですか」と問われると、はっきりとした大きい声で「ないです」と答えました。弁護側も、起訴内容については争わない方針を示しました。 幼少期から好きだった“母の手作りカレー” 隣人におすそ分けされ激高検察側の冒頭陳述などによりますと、被告は当時
中国発のファッションブランド『SHEIN(シーイン)』。格安を武器に人気を集めているが“パクリ疑惑”が浮上している。 【写真】ゴムゴムの実、チキンラーメン『ひよこちゃん』…。パクリ疑惑のSHEIN商品と並べてみると 「流行の商品が安く購入できるとして、若者を中心に利用者を増やし、11月13日には原宿に常設のショールームをオープン。急成長していますが、ラルフローレンやステューシー、ドクターマーチンなどの有名ブランドから商標権の侵害などをめぐって、訴訟を起こされています」(ファッション誌ライター) 海外ブランドだけでなく、日本のイラストレーターも“被害”を訴えている。アイスクリーム『食べる牧場ミルク』の牛のイラストを手がけた、しばたまさんはTwitterに《SHEIN...堂々とやってくれてますな》と画像付きで投稿。 この投稿に対して、SHEINジャパンは《弊社はこちらの投稿にてご指摘頂いた内
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く