「データサイエンティストのためのスキルチェックリストとタスクリスト」 データサイエンティスト協会が無料で公開:今必要とされるデータ利活用のためのスキルを体系化 データサイエンティスト協会とIPAは、「スキルチェックリスト」と「タスクリスト」の読み解き方や活用方法を記した公式ガイドブック『データサイエンティストのためのスキルチェックリスト/タスクリスト概説』を刊行した。
「データサイエンティストのためのスキルチェックリストとタスクリスト」 データサイエンティスト協会が無料で公開:今必要とされるデータ利活用のためのスキルを体系化 データサイエンティスト協会とIPAは、「スキルチェックリスト」と「タスクリスト」の読み解き方や活用方法を記した公式ガイドブック『データサイエンティストのためのスキルチェックリスト/タスクリスト概説』を刊行した。
どの企業でも自社が保有するデータを分析、活用してビジネスに活用したいと考えている。しかし、特に大企業では日々生み出されるデータが多過ぎてデータの保持や管理が煩雑になり、データ活用まで至らない場合もみられる。 そうした企業がデータ管理と活用のヒントを得られるイベントとして、インターシステムズジャパンは、「InterSystems Japan Virtual Summit 2022」を2022年3月にオンラインで開催した。 冒頭、インターシステムズジャパン カントリーマネージャーの林雅音氏があいさつした後、米国本社の創業者兼CEOのテリー・レーガン氏がビデオメッセージでデータ活用について語った。 レーガン氏は、「少し前までは、運用システムと、1カ月分のデータを保存できるデータウェアハウスがあれば、企業の優位性を保つ上で十分だった。だが多くの業界では、もうこれは通用しない。適切な判断を下し、迅速
「GAFAM」から学ぶ、自動テスト手法――アジャイル開発で単体テストの“確からしさ”を検証する、ミューテーションテストとは:海外企業に学ぶテスト自動化(1) 海外の先進的企業の事例を基にテスト自動化に使われる手法を解説する本連載。第1回は、アジャイル開発において単体テストを検証する「ミューテーションテスト」について。 今の時代に「海外に学ぶ」というタイトルは反感を覚える方がいるかもしれませんが、残念ながら日本のソフトウェア企業と「GAFAM」(Google、Amazon.com、Facebook、Apple、Microsoft)との技術力の差は大きいです。それは日本の技術者が米国などの海外の技術者より劣っているという話ではなく、企業の利益の差が大きいと思っています。例えば、Googleの利益は約4兆円で、利益率約20%、1人当たりの利益は約7000万円、Microsoftの利益は約6兆円、
「数理最適化」とは――4つの応用事例、実問題適用への手順、機械学習との違い、使い分け方:リクルート事例で分かる数理最適化入門(1) リクルートにおける数理最適化の応用事例の紹介を通じて、数理最適化とは何か、どのようにビジネスに応用できるのかを紹介する連載。初回は、数理最適化の概要、リクルートにおける4つの応用事例、実問題適用への手順、機械学習との違い、使い分け方などについて。 近年多くの企業で、ビジネスでのデータ活用が当たり前になっています。中でも機械学習を用いた成功事例については、耳にしている読者の方も多いと思います。一方で、同じくデータ活用の技術である「数理最適化」は、さまざまな領域で成果を上げているにもかかわらず、その実態について知っている人はあまり多くないようです。 本連載ではリクルートにおける数理最適化の応用事例の紹介を通じて、数理最適化とは何か、どのようにビジネスに応用できるの
連載目次 前々回は「説明変数が1つだけの回帰分析」を、前回は偏微分の考え方と計算の方法について学びました。それらの内容を踏まえて、今回は偏微分の応用編として「説明変数が複数ある重回帰分析」を行う方法を見ていきます。 目標: 偏微分を利用して重回帰分析を行う 重回帰分析の回帰式の例は以下のようなものでした。いくつかの値を基に、このような回帰式の定数項と係数を求めようというのがここでの目標です。 回帰式の求め方は前々回の例と同様で、観測値(実際に得られたデータ)と理論値(回帰式で求めた値)との差の二乗和が最小になるように定数項や係数を決めるという方法です。 解説:偏微分を利用して重回帰分析を行う まずは、具体的な例で考えてみましょう。図1のような不動産データがあったとします。このデータを基に回帰式の定数項と係数を求めてみたいと思います。実はこの例であればExcelでもできるので、ついでにExc
※本稿は2017年4月12日の情報を元に作成しています。この記事内で使用している画面やコグニティブサービスの仕様は変更になっている場合があります。 本連載「認識系API活用入門」では、マイクロソフトのコグニティブサービスのAPIを用いて、「現在のコグニティブサービスでどのようなことができるのか」「どのようにして利用できるのか」「どの程度の精度なのか」を検証していきます。連載第1回の「Deep Learningの恩恵を手軽に活用できるコグニティブサービスとは」では、コグニティブサービスとは何かの概要とAPIを使うための準備の仕方を説明しました。 今回はSpeech Recognition APIを試します。 Speech Recognition APIとは Speech Recognition APIは、前回のText To Speech APIの逆で、音声データをAPIに渡すとその音声デー
Webシステムの双方向連携で知らないと損するスクレイピングライブラリ/ツール8選&主な使い方:Webスクレイピングで始める業務システムのモバイル化(3) 既存Webシステムをモバイル化するに当たっての課題を明確にし、それらを解決するためには何が必要なのかを考えていく本連載。今回は、実際にスクレイピング技術を用いて既存Webシステムからデータを抽出する実例をツールを題材にしながら説明します。 連載目次 前回の「モバイル化におけるWebスクレイピング技術活用の利点と注意点」では、Webスクレイピング技術を用いた際のメリット・デメリットと、使用時の注意点について説明しました。 今回は、実際にWebスクレイピング技術を用いて既存Webシステムからデータを抽出する実例をいくつかのツールを題材にしながら説明します。 ユーザーオペレーション再現のために必要な双方向連携 既存WebシステムをWebスクレイ
ビッグデータ活用:その分析実装として注目されるMahout 長年蓄積した企業内データや、ソーシャルネットワークサービス、センサ端末から集められる膨大なデータを活用し、企業における利益向上やコスト削減などに活用する動きが活発になってきました。 データの分析手段として最近とみに注目されている技術として「機械学習」があります。大規模データの処理を得意とする大規模分散処理基盤「Apache Hadoop」の強みを生かし、簡単に機械学習を行うためのライブラリが、「Apache Mahout」(以下、Mahout)です。 本稿ではMahoutを用いたデータ分析の例として「文書分類」を取り上げます。マシンを用いて分析実行する際の手順や陥りがちなポイント、チューニング方法の一例を紹介します。 Mahoutとは? MahoutとはApache Software Foundationが公開しているOSSの機械
※2015/08/08 更新:「Office用アプリ」(App for Office)は「Officeアドイン」(Office Add-ins)に名称変更されました。これに合わせて、本文の記述を一部修正しました。 ※2016/01/15 更新:Office 2016におけるOfficeアドインの機能強化に合わせて、本文の記述を一部修正しました。 最新のOffice 2013で使用可能なOfficeアドイン(=Office Add-ins、OfficeのWebアドイン。以前は、Office用アプリ、または、Apps for Officeと呼ばれていた)は、JavaScriptで記述できる。従来、「アドイン」と言えば、ネイティブコードや.NETなどで構築したが、新しいアドイン(Webアドイン)では、JavaScriptに慣れ親しんでいる開発者であれば、誰でも既存のスキルを生かしてOffice上
リポジトリだけじゃ終わらないGitHubの魅力に迫る Gitリポジトリの「GitHub」が最近注目を浴びています。Gitを使っていなくても、ほとんどの人は名前くらいは聞いたことがある人は多いと思います。今年の3月に、あるサンプルアプリのソースコードがGitHubに公開されたというニュースが話題になり、GitHubの知名度が日本でも高まりました。なぜ話題になったかというと、そのサンプルアプリが日本のダンスグループ「Perfume」が踊っている姿のモーションキャプチャデータを使ったものだったのです。 Gitは強力なツールですが、Gitというキーワードが先行しているので、GitHubのことを「Gitリポジトリが使えるWebサービス」くらいにしか感じてない人も見掛けます。 しかし、一昔前は貧弱だったGitHubのIssue(チケット)機能も最近のバージョンでは大幅に強化され、GitHubは情報共有
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く