[B! DataScience] cipron81のブックマーク

Data Science in Public Health and Epidemiology | Careers in Public Health for Masters-Prepared Data Scientists

cipron81 2017/12/22

リンク

「データサイエンティストスキルチェックリストver.2」および「データサイエンス領域タスクリスト」を発表

このたび、データサイエンティスト協会スキル委員会（委員長：安宅和人、副委員長：佐伯諭）は、10月23日（月）に開催した「データサイエンティスト協会4thシンポジウム」内において発表した、データサイエンティストに必要とされるスキルをまとめた「データサイエンティストスキルチェックリスト」の第２版を公開いたしました。本内容は、2014年～2015年に公開したデータサイエンティストの「ミッション、スキルセット、定義、スキルレベル」および「スキルチェックリスト」を、現在のビジネス環境や実態にあわせて全面的に見直したものです。改定のポイントは大きく以下の通りです。・機械学習、深層学習時代に対応した項目の見直し・追加・「画像・動画処理」「音声/音楽処理」のカテゴリ・項目見直し（データサイエンス領域）・「知財」カテゴリをビジネス領域に追加・「データの理解・検証」「分析プロセス」をビジネス

cipron81 2017/10/27

リンク

leafletではじめるRによる地図プロット

1 はじめにこの記事は、R Advent Calendar 2015の12月22日担当分の記事です。また、この内容は2015年12月5日に私がJapan.R 2015にて発表した内容をベースに、説明をくわえ再編集したものです。その時のスライドは以下に設置しています: http://rpubs.com/kazutan/leaflet_slide 1.1 leafletとは leafletとは、JavaScriptのオープンソースライブラリである“leaflet.js”をRでも利用できるようにしたパッケージです。これはhtmlwidgetsパッケージにより実現されています。JavaScriptを使わなくてもRだけで利用可能ということで、非常に注目を集めているパッケージです。 1.2 特徴最大の特徴は、htmlで動的な地図が作れることです。主に以下のような特徴が挙げられます。ぐりぐり動か

cipron81 2017/10/18

リンク

Redirecting to http://harvard-iacs.github.io/CS109/

cipron81 2017/10/11

リンク

統計解析の再現可能性を高める取り組み

統計解析の再現可能性を高める取り組み 1. 統計解析の再現可能性を高める取り組み専修大学人間科学部心理学科国里愛彦 2017/7/8 臨床疫学研究における報告の質向上のための統計学の研究会第30回「Rを用いたデータハンドリング入門：効率的かつ再現性の高い統計解析のための第一歩」 2. 再現性の危機 • 心理学研究本のうち再現されたのは本 • 引用数が多く効果があるとされた臨床医学研究本のうち再現されたのは本 • 名の調査から，が他の研究者の研究を再現できず，が自分の研究の再現もできなかった 3. と • 再現可能性：ある現象が他の研究者が行った研究でも再現されること（新規なデータ収集あり） • 再生可能性：データから解析結果が再生できること（新規なデータ収集なし。コードやデータの共有などで確認する） →今回は，再生可能性について扱う Peng, R. D.

cipron81 2017/07/19

DataScience

リンク

OpenRefineを用いてWikidataの項目と照合する - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? 手元のデータをWikidataのデータと照合させたいとき、すなわち、手元のデータをWikidataと関連付けてリンクを張りたいときに便利なツールとしてOpenRefineがあります。本記事を執筆している時点でバージョン2.7が公開されており、Windows、Mac OS、Linux向けにそれぞれ実行ファイルが配布されています。OpenRefineの使い方は統合TVで紹介されていますので、そちらをご覧ください。ここでは、このOpenRefineの提供する照合機能（Reconciliation、以下、照合機能）を用いて、Wikidataの

cipron81 2017/07/19

DataScience

リンク

データサイエンス・オンライン講座「誰でも使える統計オープンデータ」

第1週：e-Statの統計データを活用したデータ分析の事例、基本的な活用方法を学ぶ・統計を仕事に活かすとはどういうことか・e-Statを使った現状把握・複数の統計を組み合わせた指標の計算・e-Statを使った関連要因の探索・e-Statを使った将来の予測・e-Statによるデータの探し方・e-Stat上でグラフを描こう第2週：国の経済の規模をはかるGDP統計と関連する統計の見方を学ぶ・景気判断に求められる統計・GDP統計～GDPとは・GDP統計の読み方・GDP統計からみた基礎統計・関連資料・GDPの名目と実質第３週：人口統計・労働関連統計を中心に景気判断に用いられる統計の見方を学ぶ・長期の経済成長と人口統計・公的統計の活用①　人口統計・労働市場の分析：雇用と賃金・公的統計の活用②　雇用・賃金統計・その他の公的統計：事業所・企業第4週：統計データ

cipron81 2017/06/23

リンク

The “Ten Simple Rules for Reproducible Computational Research” are easy to reach for R users | R-bloggers

cipron81 2017/03/29

リンク

https://www.ispor.org/research_pdfs/45/pdffiles/PRM111.pdf

cipron81 2017/03/22

カプランマイヤーとマルコフのお話

DataScience

リンク

データサイエンティスト協会、データサイエンティストのミッション、スキルセット、定義、スキルレベルを発表

cipron81 2017/02/08

DataScience

リンク

解説・講義資料 - Toshihiro Kamishima

機械学習・データマイニング全般変わりゆく機械学習と変わらない機械学習 [物理学会誌 2019]：機械学習・データマイニングについての専門家以外に向けた解説記事機械学習・データマイニング分野の概要：分野全体の概要と国際会議動向まとめ資料 ML, DM, and AI Conference Map：人工知能，機械学習，およびデータマイニング関係の国際会議関連マップデータマイニング：4種類の主要分析タスクとデータマイニングによる知識発見プロセスについての学部前半レベルの説明資料社会における機械学習 Fairness-Aware Machine Learning and Data Mining: Tutorial on data analysis considering potential issues of fairness 知識の森『機械学習の公平性』 [電子情報通信学会 2023

cipron81 2017/01/07

リンク

再現性なんてないさ（？）

（わざわざ手描きにしたのに結局著作権が危うい絵を描いている）どうもこんにちは、博士論文（仮）を提出したばかりのぴちぴちのD3、@calicolicaliです。学生最後ということで、院生しか登録できないAdvent calendarに登録させていただきました！ ʕ◔ϖ◔ʔ 「統計について」という事前コメントをしましたが、私の専門はアルゴリズム寄りのComputational Biologyで、これまではRNA二次構造予測ソフトウェアParasoRの開発や、配列アラインメントソフトウェアLASTの開発に関わらせていただいたりしてきました。（ご興味あればぜひ！）しかしこの分野では「網羅的な遺伝子データや配列情報を扱うためには統計や機械学習が必要！」ということで、日々これらの分野の勉強をしております。そんな私が紹介する、今年読んだ一番好きな論文はこちら(｀・ω・´)つ "Estimating

cipron81 2016/12/26

DataScience

リンク

The Distribution of Users’ Computer Skills: Worse Than You Think

Summary: Across 33 rich countries, only 5% of the population has high computer-related abilities, and only a third of people can complete medium-complexity tasks. One of usability’s most hard-earned lessons is that you are not the user. This is why it’s a disaster to guess at the users’ needs. Since designers are so different from the majority of the target audience, it’s not just irrelevant what

cipron81 2016/12/07

リンク

クラウド機械学習の進歩で「プラモデルのように機械学習システムが作れる」時代が到来しつつある - 渋谷駅前で働くデータサイエンティストのブログ

こんなブログ・プレスリリースが出ていました。TensorFlowベースで実装されたクラウド機械学習アプリケーション、"Cloud Machine Learning"だそうです。以前から既に取り沙汰されていたCloud Vision APIに加えて、Cloud Speech APIさらにはCloud Translate APIが使えるようになったということで、学習済みモデルの適用で事足りるというケースではこれらを使えば画像認識・音声認識・自動翻訳は片付いてしまうという話にもなります。またTensorFlowベースということは例えば普通の線形モデルだけでなく、それこそDeep Learningであっても使えるということになるようです（あくまでもプロダクトサイトから読み取った限りの話ですが）。 (Photo via Visual Hunt) これまでも様々な機械学習クラウドソリューションが各社

cipron81 2016/12/02

DataScience

リンク

岩波データサイエンス

岩波データサイエンス　サポートページ各巻に対応する内容は，上のバーの３本線「三」をクリックして左に表示されるメニューからご覧ください（トップページの内容が空白の場合も，メニューで下位の階層をクリックして頂くと内容が表示される場合があります）新グーグル・サイトに移行しました．自動変換のため，見難くなっている部分，表示されない部分がありますが，ご容赦くださいシリーズ「岩波データサイエンス」では、統計科学や機械学習など、データを扱うさまざまな分野について、多様な視点からの情報を提供することをめざします。まったくの初歩からやや高度な話までのいろいろな手法の解説、実務に役立つソフトの使い方、さらには各領域のサイエンスや応用に踏み込んだ内容まで、多彩な記事を掲載します。装丁には蛯名優子さんの作品を使わせて頂いています。蛯名さんのホームページはこちらです。【公式ツイッターアカウント】ツイッタ

cipron81 2016/12/02

DataScience

リンク

データベースオブジェクトの命名規約 - Qiita

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

cipron81 2016/11/11

リンク

こわくないRパッケージ開発！2016

この記事についてこの記事では、R言語で書かれたコードを、パッケージとして開発・管理するメリットとその方法について紹介しています。以下はあくまで概要であるため、詳細についてはぜひ今年2月にオライリージャパンから邦訳刊行された『Rパッケージ開発入門』や、その原著の**R packages**（ウェブ版）、そして記事末尾のリファレンスをご参照下さい。想定する読者層業務・研究、あるいはプライベートでR言語を使いプログラムを書いている、またはこれから書く予定がある他の人からもらったRのコード（または、他の人に渡したRのコード）がなぜかうまく動かなかった経験がある以前書いたソースコードやファイルが散らばっており途方に暮れたことがある Rのパッケージ開発なにそれこわいと感じている提案次のような場合、分析タスクの運用や共有を楽にするため、Rのコードをパッケージ化しましょう。その場限りの分

cipron81 2016/10/26

リンク

GitHub - rstudio/RStartHere: A guide to some of the most useful R Packages that we know about

Each data science project is different, but each follows the same general steps. You: Import your data into R Tidy it Understand your data by iteratively visualizing tranforming and modeling your data Infer how your understanding applies to other data sets (including future data, i.e. predictions) Communicate your results to an audience, or Automate your analysis for easy reuse Program the whole w