"data science"の人気記事 74件 - はてなブックマーク

1 - 40 件 / 74件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

"data science"の検索結果1 - 40 件 / 74件

"data science"に関するエントリは74件あります。データ、統計、学習などが関連タグです。人気エントリには『東大が無料公開している超良質なPython/Data Science/Cloud教材まとめ (*随時更新) - Digital, digital and digital』などがあります。

東大が無料公開している超良質なPython/Data Science/Cloud教材まとめ (*随時更新) - Digital, digital and digital
- 2420 users
- digitaldigital.hatenablog.com
- テクノロジー
- 2021/05/01
東京大学がちょっとびっくりするくらいの超良質な教材を無料公開していたので、まとめました Python入門講座東大のPython入門が無料公開されています。scikit-learnといった機械学習関連についても説明されています。ホントいいです Pythonプログラミング入門東京大学数理・情報教育研究センター: utokyo-ipp.github.io 東大のPython本も非常にオススメです Pythonによるプログラミング入門　東京大学教養学部テキスト: アルゴリズムと情報科学の基礎を学ぶ https://amzn.to/2oSw4ws Pythonプログラミング入門 - 東京大学数理・情報教育研究センター Google Colabで学習出来るようになっています。練習問題も豊富です https://colab.research.google.com/github/utokyo-ip
- python
- あとで読む
- 学習
- プログラミング
- aws
- 機械学習
- 大学
- 勉強
- 研究
- science
高等学校情報科「情報Ⅱ」教員研修用教材(本編)：文部科学省
- 2075 users
- www.mext.go.jp
- テクノロジー
- 2020/06/23
PDF形式のファイルを御覧いただく場合には、Adobe Acrobat Readerが必要な場合があります。 Adobe Acrobat Readerは開発元のWebページにて、無償でダウンロード可能です。
- 教育
- あとで読む
- 情報
- データサイエンス
- 学校
- PDF
- 科学
- 開発
- IT
- education
全国民に配るべき！総務省が示した「データ入力の統一ルール」｜Excel医ブログ
- 1922 users
- excel-design-dr.com
- 政治と経済
- 2021/06/14
2020年12月、総務省より【機械判読可能なデータの表記方法の統一ルール】が策定されました。統計表における機械判読可能なデータの表記方法の統一ルールの策定 https://www.soumu.go.jp/menu_news/s-news/01toukatsu01_02000186.html 2020年11月に河野太郎行政改革担当大臣のツイートが話題となりました。その後正式に統一ルールが公開された形です。各省庁がネット上で公開する統計を機械判読可能にするために、データの表記方法を統一させます。「政府統計の総合窓口（e-Stat）」で本日から１２月１日までの間、表記方法案に関する意見照会を行います。研究者をはじめ、皆様のご意見をお待ちしています。https://t.co/h07tCTDazc — 河野太郎 (@konotarogomame) November 25, 2020
- excel
- あとで読む
- データ
- 統計
- 仕事
- IT
- ルール
- PC
- Office
- ブログ
社内SQL研修のために作った資料を公開します | 株式会社AI Shift
- 1882 users
- www.ai-shift.co.jp
- テクノロジー
- 2021/06/21
こんにちは、Development Teamの三宅です。先日、社内（AI事業本部内）でSQL研修の講師を担当したので、今回はその内容について簡単に共有したいと思います。はじめに例年、AI事業本部では、新卒エンジニアの育成のためにソフトウェアエンジニア研修を行っております。今年はフルリモートでの実施となりました。研修期間は2週間ほどで、内容は前半が講義、後半が実践（チーム開発）でした。私が担当したのは、講義パートの一部であるSQL研修です。SQLやRDBにあまり慣れていない人でも、できるだけ体系的な学びが得られるようにすることを目標に、様々な資料をまとめて提供する方針で準備しました。結果的には、ハンズオン込みで4時間ほどのやや長い講義となりましたが、勉強になったという声も頂けたのでやって良かったと思っています。研修資料研修内容 SQL研修の内容は、基本的には大学のデータベース講義で
- sql
- あとで読む
- データベース
- 資料
- DB
- 学習
- 研修
- エンジニア
- プログラミング
- 設計

経産省が公表した「フリーランスとして安心して働ける環境を整備するためのガイドライン」はフリーランスじゃない人も必読らしい
- 1804 users
- togetter.com
- 政治と経済
- 2021/03/30
弁護士　河野冬樹 @kawano_lawyer 経産省から「フリーランスとして安心して働ける環境を整備するためのガイドライン」が公表。著作権譲渡について、強要したり、作成の目的たる使用の範囲を超えて譲渡させたりすることは、下請法や独禁法に抵触しうることが指摘されてます。meti.go.jp/press/2020/03/… 2021-03-26 18:22:30 リンク www.meti.go.jp 「フリーランスとして安心して働ける環境を整備するためのガイドライン」（案）に対するパブリックコメントの結果及び同ガイドラインを取りまとめました（METI/経済産業省）「フリーランスとして安心して働ける環境を整備するためのガイドライン」（案）について、令和2年12月24日（木曜日）から令和3年１月25日（月曜日）までパブリックコメントを実施しましたが、本日、その結果を公示するとともに、内閣官房
- フリーランス
- あとで読む
- 仕事
- 労働
- ガイドライン
- 法律
- togetter
- ビジネス
- 環境
- work
「未経験文系から3ヶ月でデータサイエンティストになって一発逆転」はここで終わり (2020/7/31 更新) - todo-mentor’s diary
- 1360 users
- todes-mentor.hatenablog.com
- テクノロジー
- 2020/07/13
データサイエンティストを生業にする手段と実態について述べる。途中、具体例・境界値の例として私個人の話もするが、なるべく一般性のある話をする。この記事で言いたいことは具体的には4つだ。プログラミングスクールをディスるなら代わりの入門方法を提供しようよ。もう「未経験文系から3ヶ月でデータサイエンティストで一発逆転物語」を止めろ。*1 おじさんは人生逆転したいなら真面目にやれ。若者はワンチャンじゃなくて、ちゃんと化け物になれよ。この記事についてはパブリック・ドメインとして転載・改変・リンク記載を自由にしてよいです。 (続き書いた) a. 入門は辛いが… b. 思考停止でプログラミングスクールに通うな。なろう系・始めてみよう系資料一覧（最速・最短ルート用）まずは動かしてみよう。強くてニューゲームが体験出来るぞ！入門以前の本一般向け業界本 (AI業界と展望がわかる本) 技術者入
総務省が無料データサイエンス講座を開講、松尾豊氏ら講師に | Ledge.ai
- 1359 users
- ledge.ai
- テクノロジー
- 2020/10/07
画像は『総務省統計局「社会人のためのデータサイエンス演習」講座PV』より総務省は9月29日から、実践的なデータ分析の手法を学習できるとうたう、データサイエンス・オンライン講座「社会人のためのデータサイエンス演習（外部サイト）」を開講している。登録料および受講料は無料。閉講日時は12月7日の23時59分。本講座では、ビジネスや行政での活用を想定しており、社会人や大学生に向けて、ビジネスや業務上での分析事例を中心に実践的なデータ分析（統計分析）の手法をわかりやすく解説するという。前提条件は表計算ソフトMicrosoft Excelの基本的な操作ができること。『総務省統計局「社会人のためのデータサイエンス演習」講座PV』より講師は、総務省統計局の會田雅人氏、総務省統計局の阿向泰二郎氏、株式会社電通の佐伯諭氏、東京大学の松尾豊氏、株式会社ブレインパッドの奥園朋実氏、株式会社ブレインパッドの
- 学習
- あとで読む
- 統計
- データ
- AI
- 勉強
- 分析
- データサイエンス
- 機械学習
- 社会
「遺伝的アルゴリズムで最高にエッチな画像を作ろう！」がGoogleに怒られた話｜群青ちきん
- 1262 users
- note.com/ultrmrn_chicken
- おもしろ
- 2021/02/11
「そらとぶあざらしさん」を遊んで頂くと、大体の温度感がご理解いただけるかと思います。制限がされたページ今年の1月10日に、noteタイトルにもある「遺伝的アルゴリズムで最高にエッチな画像を作ろう！」というページを公開しました。内容はタイトルの通りです。ランダムに生成された2枚の画像から「エッチ」な方を選んでいくと、アルゴリズム学習によってだんだんとエッチな画像になっていくというものです。遺伝的アルゴリズムで最高にエッチな画像を作ろう！ (エッチな画像が見れるとは言っていない)　よりこのページには、筆者のささやかな収入源として、GoogleAdSenseの広告を貼っていました。 GoogleAdSenseとは、大企業であるGoogleが運営している個人クリエイター向けの広告プログラムです。 AdSenseのポリシーとして、「性的に露骨なコンテンツ」(Sexually explici
総務省、社会人のためのデータサイエンス入門を無料開講 | Ledge.ai
- 1240 users
- ledge.ai
- テクノロジー
- 2021/01/05
サインインした状態で「いいね」を押すと、マイページの「いいね履歴」に一覧として保存されていくので、再度読みたくなった時や、あとでじっくり読みたいときに便利です。
- 統計
- あとで読む
- データ
- データサイエンス
- AI
- 機械学習
- 勉強
- 入門
- 社会
- 学習
ガラケーしか使えないデジタル音痴だった私が「GISでデータ分析」できるようになるまでの話｜NHK取材ノート
- 1221 users
- note.com/nhk_syuzai
- 暮らし
- 2022/03/16
NHKのニュースや番組をつくっている私たちが取材に込めた思いや取材手法などをお話します。一緒に「取材ノート」をつくっていきましょう。サイトはhttps://www.nhk.or.jp/d-navi/note/ 利用規約はhttps://nhk.jp/rules
- データ
- あとで読む
- GIS
- NHK
- 地図
- 統計
- 分析
- 仕事
- 社会
- note
統計の入門講座が無料に、京大メソッドでデータサイエンス関連教員が担当 | Ledge.ai
- 1097 users
- ledge.ai
- テクノロジー
- 2021/09/12
サインインした状態で「いいね」を押すと、マイページの「いいね履歴」に一覧として保存されていくので、再度読みたくなった時や、あとでじっくり読みたいときに便利です。
- 統計
- あとで読む
- 入門
- 教育
- データ
- 学習
- データサイエンス
- 研究
- AI
- 勉強
『データ分析のための統計学入門』PDFが無料公開データサイエンティストたちが執筆 | Ledge.ai
- 1012 users
- ledge.ai
- テクノロジー
- 2021/04/08
サインインした状態で「いいね」を押すと、マイページの「いいね履歴」に一覧として保存されていくので、再度読みたくなった時や、あとでじっくり読みたいときに便利です。
- 統計
- あとで読む
- データ
- 入門
- AI
- 勉強
- pdf
- 数学
- 分析
- データ分析
「出会って4秒で合体」は本当に４秒で合体しているのか - 多目的トイレ
- 833 users
- tamokuteki.hatenablog.com
- おもしろ
- 2020/09/24
「出会って4秒で合体」という名シリーズがある。いまでも多くの人々の心をつかんで離さない、そんな不朽の名作だ。これは老舗AVメーカーであるアリスJAPAN（銀色の人が走っていてドッカンドッカン柱が倒れてくるオープニング映像で有名）が2008年3月に世に放った「麻美ゆま　出会って4秒で合体（2008年03月14日発売：DV-888 / 収録時間：120分、アリスJAPAN）に端を発する一連の作品群だ。本作は、大人気女優である麻美ゆまさん（2015年AVから引退、現在はタレント業）を相手に、打ち合わせと称して普段の様子を撮影するところから始まる。序盤は本番（ダブルミーニング）以外の素の表情を撮影しつつ、他愛もない会話が続くが、突如（本作では映像開始から3分17秒）としてソファ（クリーム色）の後ろから男優（全裸）が登場し、麻美ゆまさんが「なに？　なに？」と困惑しているうちに合体、となるものであ
- 読み物
- あとで読む
- ネタ
- 性
- 統計
- セックス
- pato
- データ
- neta
- おもしろ
データサイエンス初学者のための実践的な学習環境「データサイエンス100本ノック（構造化データ加工編）」をGitHubに無料公開 | 一般社団法人データサイエンティスト協会
- 831 users
- digitalpr.jp
- テクノロジー
- 2020/06/15
一般社団法人データサイエンティスト協会（所在地：東京都港区、代表理事：草野隆史、以下データサイエンティスト協会）は、構造化データの加工について実践的に学ぶことができる無料の学習環境「データサイエンス100本ノック（構造化データ加工編）」をGitHubに公開しました。「データサイエンス100本ノック（構造化データ加工編）」は、データサイエンス初学者を対象に、データの加工・集計、統計学や機械学習を駆使したモデリングの前処理等を学べるよう、データと実行環境構築スクリプト、演習問題をワンセットにしています。近年、データ活用の重要性についての認知が広がる中で、書籍やWebサイトなど、データ分析のスキル向上に役立つ情報源も多く提供されています。一方で、実践するための「データ」や「プログラミング実行環境」を持ち合わせていないことも多く、「実践力」を身につける機会が限られていました。特に、「構造化デ
「NHK全国ハザードマップ」を公開した理由 34テラバイトのデータと格闘 - NHK
- 677 users
- www3.nhk.or.jp
- 世の中
- 2022/06/21
34テラバイトのデータと格闘して「全国ハザードマップ」を公開した理由 5月下旬に公開を開始したNHKの「全国ハザードマップ」。川の氾濫による洪水リスクを中心に掲載し、多くの方に活用頂いています。 ⇒「NHK全国ハザードマップ」の紹介記事はこちら一方で、「市町村が出しているハザードマップがあれば十分だ」「リスクを網羅していない不完全なマップの公開は良くない」「NHKではなく国が取り組むべき仕事ではないか」といった意見も頂きました。今回なぜ、このような取り組みを行ったのか。どうやってデータを収集して地図を作ったのか。詳しく説明します。 2022年のNHKスペシャルなどで紹介された内容ですなぜ「デジタルデータ」を集めたのか？私たちはこれまで「ハザードマップを見て下さい」という呼びかけを、テレビやラジオのニュースや番組、ネット記事、SNSなどで繰り返してきました。なぜなら、自分の暮らす場
- 統計
- NHK
- あとで読む
- データ
- 災害
- map
- 地図
- DX
- 行政
- 調査
顔写真から自閉症を判別してみた - Qiita
- 674 users
- qiita.com/YUUUUUUUUUNA
- テクノロジー
- 2024/08/03
はじめにこの記事では今回開発したWebアプリ、自閉症識別（後に理由を説明しますが、動作が大変モッサリです）を公開するまでの経緯や考え・思いをまとめた。 6月中旬に差し掛かる頃から、Aidemy PewmiumのAIアプリ開発コースで、Pythonを用いてアプリ開発を行えるようになることを目標に学んできた。その成果として開発したのが、顔写真から自閉症を判別するWebアプリだ。この記事では私自身がプログラミング超初心者として、そしていち支援者として感じたことも多く綴っているため、必要に応じて適宜読み飛ばしてもらえると良いかもしれない。開発開始に至るまで私はこちらの記事にあるように、保育士として児童発達支援に関わってきた。大変ではあるが非常に楽しい仕事だった。とはいえAidemyの講座受講中、成果物を何にするかをずっと考えていたが、この領域で何かやろうなんてことは全く考えていなかった。
- AI
- 障害
- あとで読む
- 差別
- 医療
- 開発
- 発達障害
- 倫理
- アプリ
- 機械学習
データサイエンティスト生活でお世話になった本｜武田邦敬｜Kunihiro TAKEDA
- 598 users
- note.com/ku2t
- 学び
- 2020/08/15
みなさんこんにちは。くにです。データ分析の世界に足を踏み入れてから9年が過ぎました。分析実務未経験でキャリアチェンジできたのは幸運としか言えませんが、ある意味無知だったからこそ無謀な挑戦ができたのかもしれません。この挑戦の泥臭い記録は、この記事に書きました。ポジションは変われど、データを扱う仕事をまだ続けています。私は実務で手を動かしつつ、不格好に失敗しながら学んできました。わからないことにぶつかるたびに本を買い、その本でわからないことがあればまた本屋に行き、自分が少しでも理解できそうな本を探して買いました。そして、気になる参考文献があれば、それも買って読んでみる…。こんな生活を続けているうちに、部屋が本だらけになってしまいました。正直に言って読み切ったという実感のある本はありません。しかし、実務で何かしらお世話になった本は数多くあり、そういう本は手放さずに手元に置いています。
- データサイエンス
- あとで読む
- 本
- 統計
- 機械学習
- データ分析
- データ
- 分析
- book
- 書籍
Netflixを支える推薦システムの裏側｜masa_kazama
- 588 users
- note.com/masa_kazama
- テクノロジー
- 2020/08/05
イントロNetflixは、スマホやPCがあれば、どこでもいつでも、映画やドラマを見放題で楽しむことができます。今年はお家時間が増えたことで、Netflixをより満喫している方も多いのではないでしょうか。実際に、2020年1月〜3月に会員が全世界で1600万人ほど増え、合計1億8000万人を超えています。 Netflixをいくつかの数字で見てみると、さらにその凄さに驚かされます。・全世界のインターネット通信量(下り)の15%をNetflixが占めており、YouTubeを超える世界一の動画サービス・時価総額が20兆円超え・サブスクリプション収入が月々約1500億円そんな多くのユーザーを有するNetflixの魅力の１つに、推薦システムがあります。Netflixのホーム画面には、今話題の作品やユーザーにパーソナライズ化されたおすすめの作品が並びます。 Googleの検索と違って、Netfl
機械学習のパラメータチューニングを「これでもか！」というくらい丁寧に解説 - Qiita
- 586 users
- qiita.com/c60evaporator
- テクノロジー
- 2021/06/06
はじめに私はこれまで機械学習のパラメータチューニングに関し、様々な書籍やサイトで学習を進めてきました。しかしどれもテクニックの解説が主体のものが多く、「なぜチューニングが必要なのか？」という目的に関する記載が非常に少なかったため、体系的な理解に苦労しました。この経験を後世に役立てられるよう、「初心者でも体系的に理解できる丁寧さ！」をモットーに記事にまとめたいと思います。具体的には、 1. パラメータチューニングの目的 2. チューニングの手順とアルゴリズム一覧 3. Pythonでの実装手順 (SVMでの分類を例に) の手順で解説を進めます。独自解釈も含まれるため、間違っている点等ございましたら指摘頂けると有難いです。なお、文中のコードはこちらのGitHubにもアップロードしております。 2021/9/6追記：LightGBMのチューニング実行例追加以下の記事に、Ligh
Appleの移動データを加工したらわかった東京の厳しい現実 - Qiita
- 572 users
- qiita.com/takatoshiroto
- テクノロジー
- 2021/04/07
こんにちは、Exploratoryの白戸です。 Appleは新型コロナウイルスの対策支援として、Appleマップでの経路検索をもとにした移動傾向のデータを公開しています。ところが、残念ながらこのデータはそのままでは簡単に可視化できるようなフォーマットになっておらず、ちょっとした加工を行う必要があります。しかし逆に、加工の仕方さえわかってしまえばそれぞれの都市や地域の移動データを可視化することで、恐怖を煽るばかりのマスコミからは見えてこない現状を理解することができるようになります。今回はこのAppleの移動傾向データを簡単に可視化できるようにするための基本的な加工方法を、みなさんと共有させていただければと思います。データはこちらからダウンロードすることができます。以下は「モダンでシンプルなUIを使ってデータサイエンスができる」Exploratoryを使って、「日本で最も自粛している都
- データ
- 統計
- あとで読む
- COVID-19
- apple
- Qiita
- data
- 分析
- データ分析
- 交通
はじめに — マンガと学ぶデータビジュアライゼーション
- 546 users
- kakeami.github.io
- アニメとゲーム
- 2022/02/13
はじめに# データビジュアライゼーションとは，数値や文章などのデータに基づいた情報を，人間が理解しやすい形に視覚化する技術を指します．このサイトは，文化庁のメディア芸術データベース・ラボ（MADB Lab）で公開されている四大少年誌（週刊少年サンデー，週刊少年ジャンプ，週刊少年チャンピオン，週刊少年マガジン）のデータを用いて，データビジュアライゼーションの学習を手助けすることを目指しています．データビジュアライゼーション（に限らずデータ分析全般）の学習において重要なのは，分析対象のデータに興味を持てるかどうかです．本書では約47年の四大少年誌のマンガ作品データを採用しているため，モチベーションを保ちつつ学習を進めることが可能です．
バンナム、約42万フレーム分のモーションデータ無償公開　歩行、格闘、ダンスなど　研究用に
- 532 users
- www.itmedia.co.jp
- テクノロジー
- 2022/04/28
ライセンスは「CC BY-NC-ND 4.0」で、利用の際にクレジットを表示すること、非営利でのみ利用すること、内容を改変しないことを求めている。バンダイナムコは、メタバースやXR技術が広まる中、コンテンツ規模が拡大すると従来のモーション制作過程では限界を迎えると予想。AIを活用したキャラクターのモーションを生成する研究を行っている。一方、AIによるモーション研究はデータセットの入手が難しいため研究開発が進んでいないとして、自社で使っているデータの一部を提供することにしたという。関連記事実在しない顔の画像3000点を無償配布、AI学習用データセットに　法人向け・商用利用可 AI活用のコンサルティング事業を手掛けるAPTOなど2社が、AIの学習データとして利用できる、実在しない男女の顔写真3000枚の無償配布を始めた。法人を対象に11月30日までの期間限定で提供し、商用利用も認める。
- 3DCG
- あとで読む
- 素材
- 3D
- データ
- AI
- 研究
- 開発
- モーション
- game
何故データサイエンティストになりたかったら、きちんと体系立てて学ばなければならないのか - 渋谷駅前で働くデータサイエンティストのブログ
- 524 users
- tjo.hatenablog.com
- テクノロジー
- 2021/05/14
先日、Quora日本語版でこんなやり取りがありました。基本的にはここで述べた通りの話なのですが、折角なのでブログの方でも記事としてちょっとまとめておこうと思います。題して「何故データサイエンティストになりたかったら、きちんと体系立てて学ばなければならないのか」というお話です。問題意識としては毎回引き合いに出しているこちらの過去記事で論じられているような「ワナビーデータサイエンティスト」たちをどう導くべきかという議論が以前から各所であり、それらを念頭に置いています。なお毎度のことで恐縮ですが、僕も基本的には独学一本の素人ですので以下の記述に誤りや説明不足の点などあればご指摘くださると幸いです。一般的なソフトウェア開発と、統計分析や機械学習との違い統計分析や機械学習を仕事にするなら、その「振る舞い」を体系立てて学ぶ必要があるきちんと体系立てて学ばなかった結果として陥りがちな罠余談
データサイエンス系チートシートを網羅してみた - Qiita
- 515 users
- qiita.com/tarantula426
- テクノロジー
- 2025/01/13
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめにこの記事では、私がこれまでXで発信してきたデータサイエンスに関わるさまざまな分野のチートシートを一挙にまとめました。前処理、可視化、機械学習、深層学習、ベイズ・統計、さらにはその他の関連トピックまで、私が作成したものからネット上のものまで多岐にわたる内容を網羅しています。それぞれのセクションでは、実践的かつ即戦力となる情報が詰まったチートシートを紹介しており、初心者から上級者まで幅広い層に役立つ内容を目指しました。日頃からX（旧Twitter）を通じて、データサイエンスに関する知識や役立つリソースを共有していますが、今回の
データ分析のはじめの一歩を無料で学べる総務省監修の高校教材『データサイエンス・データ解析入門』がpdfで公開 | Ledge.ai
- 470 users
- ledge.ai
- テクノロジー
- 2021/09/27
サインインした状態で「いいね」を押すと、マイページの「いいね履歴」に一覧として保存されていくので、再度読みたくなった時や、あとでじっくり読みたいときに便利です。
- 学習
- あとで読む
- データ
- 統計
- データ分析
- 分析
- 勉強
- 入門
- 教育
- AI
データエンジニア道の俺のバイブル
- 434 users
- zenn.dev/pei0804
- テクノロジー
- 2023/01/03
先人の知恵に学ぶデータエンジニア道で、本当に良かった！読み物を、不定期に追記していく。 A Beginner’s Guide to Data Engineering — Part I データエンジニアをこれから始める人に、必ず薦める記事。データエンジニアの基本を学べるかつ、どういう世界に広がっていくのかまで、一気に学べるのでとても良い。 Functional Data Engineering — a modern paradigm for batch data processing 関数型パラダイムを使ったデータパイプラインの構築方法。これを初めて読んだ時の衝撃は今でも忘れないし、フルスクラッチからdbtを使ったデータパイプラインになっても健在な設計手法。 Engineers Shouldn’t Write ETL: A Guide to Building a High Function
2023年版：実務データ分析を手掛けるデータサイエンティスト向け推薦書籍リスト（初級6冊＋中級8冊＋テーマ別15冊） - 渋谷駅前で働くデータサイエンティストのブログ
- 422 users
- tjo.hatenablog.com
- テクノロジー
- 2023/02/07
(Image by wal_172619 from Pixabay) 去年で恒例の推薦書籍リストの更新は一旦終了したつもりだったんですが、記事を公開して以降に「これは新たにリスト入りさせないわけにはいかない！」という書籍が幾つも現れる事態になりましたので、前言撤回して今年も推薦書籍リストを公開しようと思います。初級向け6冊実務総論データサイエンス総論 R・Pythonによるデータ分析プログラミング統計学機械学習中級向け8冊統計学機械学習テーマ別15冊回帰モデル PRML 機械学習の実践 Deep Learning / NN 統計的因果推論ベイズ統計学時系列分析グラフ・ネットワーク分析データ基盤コメントや補足説明など完全なる余談初級向け6冊今回は新たに加わったテキストがあります。実務総論 AI・データ分析プロジェクトのすべて[ビジネス力×技術力＝価値創出
- 本
- あとで読む
- 統計
- データ
- 学習
- 分析
- データ分析
- 書籍
- book
- データサイエンス
データ基盤にありがちな「何を使って作ればよいか？」という問いに対する処方箋を用意してみました. - Lean Baseball
- 399 users
- shinyorke.hatenablog.com
- テクノロジー
- 2022/12/01
ちょっと昔まではデータ基盤の管理人・アーキテクト, 現在は思いっきりクラウドアーキを扱うコンサルタントになったマンです. 私自身の経験・スキル・このブログに書いているコンテンツの関係で, 「データ基盤って何を使って作ればいいの?」的なHow（もしくはWhere）の相談. 「Googleのビッグクエリーってやつがいいと聞いたけど何ができるの?」的な個別のサービスに対するご相談. 「ぶっちゃけおいくらかかりますか💸」というHow much?な話. 有り難くもこのようなお話をよくお受けしています. が, （仕事以外の営みにおける）個人としては毎度同じ話をするのはまあまあ疲れるので, データ基盤にありがちな「何を使って作ればよいか？」という問いに対する処方箋というテーマで, クラウド上でデータ基盤を構築する際のサービスの選び方（データ基盤に限らず）クラウド料金の基本的な考え方をGoogle
- データ
- あとで読む
- gcp
- データ基盤
- aws
- データ分析
- アーキテクチャ
- DWH
- サービス
- cloud
デート代平均は男性が6,805円、女性が2,612円｜デート代実態調査
- 368 users
- leadingtech.co.jp
- 世の中
- 2021/01/25
リーディングテック株式会社は『デート代実態調査』の結果を公表しました。本調査では異性とデートをしたことがある全国の18歳以上の男女を対象として調査を行い、対象となった2,450人のうち49.0%にあたる1,200人から有効回答を得ました。デート代の平均値は男性が6,805円、女性が2,612円デート代は「男性が多めに払う」が多いものの、若い世代では「割り勘」も多い女性は割り勘だと思っているが、男性は自分が多めに負担していると思っている可能性がある年収が高いほどデート代も高い未婚だとデート代が高いデート代の金額（平均値、中央値）デート代の平均値は男性が6,805円、女性が2,612円 1回のデートで回答者が支払う金額（以下「デート代」）は、男女全体の平均値が4,041円、中央値が3,000円となりました。しかし男女で金額に大きく開きがあり、男性の平均値は6,805円で中央値
- 男女
- 統計
- 恋愛
- あとで読む
- gender
- ジェンダー
- 女性
- 社会
- デート
業務でどれだけSQL力がつくのか ~SQLアンチパターンを用いて確認~ 前編
- 337 users
- techblog.gmo-ap.jp
- テクノロジー
- 2021/06/23
はじめにこんにちは。 GMOアドマーケティングのKONCEです。新卒で入社し、数年経ちました。日々の業務で学ぶことは多いですが、今年度は技術の深堀りをテーマにやっていきたいと思っています。今回は入社してDBやSQLに関しては業務内で学ぶことが多く、特別訓練をしていたわけではなかったのですが、「SQLアンチパターン」を用いて学びながら、改めて自分の現状を見つめ直していけたらと思います。今回は学習を行う側面と自分自身のレベルについて見直していきたいので知っていた → ○ 部分的に知っていた → △ 知らなかった → × を付けてみようと思います。目次 SQLアンチパターンについて Ⅰ部データベース論理設計のアンチパターン 2-1. [○]1章ジェイウォーク（信号無視） 2-2. [×]2章ナイーブツリー（素朴な木） 2-3. [○]3章 IDリクワイアド（とりあえずID） 2
- SQL
- あとで読む
- 設計
- データベース
- DB
- database
- GMO
- book
- RDBMS
- パターン
22社、52人のデータサイエンティストに聞いてみた！「どんなお仕事してますか？」 | Da-nce
- 325 users
- da-nce.jp
- テクノロジー
- 2021/07/26
データ分析とビジネス活用のプロとして、さまざまな業界・フィールドで活躍する「データサイエンティスト」。スキルセットや必要な知識などが語られることはあるものの、まだはっきりとした定義がなく、いったいどんな人たちなのか？と疑問を持つ人も少なくないのでは。そこで本企画では、企業で働くデータサイエンティストたちの"リアル"を調査。データサイエンティストを志した理由や興味深かった論文、普段の業務、自社で働く魅力などを22社、52人のデータサイエンティストに聞きました。企業一覧 DataRobot Japan株式会社株式会社GA technologies 株式会社HACARUS 株式会社JMDC 株式会社LIFULL MNTSQ株式会社 NABLAS株式会社株式会社Rist Sansan株式会社 SOMPOホールディングス株式会社株式会社ZOZO 株式会社ZOZOテクノロジーズアスクル株
データサイエンティストという職業の10年間の変遷を振り返る - 渋谷駅前で働くデータサイエンティストのブログ
- 316 users
- tjo.hatenablog.com
- テクノロジー
- 2022/10/22
(Image by Gordon Johnson from Pixabay) TL;DR　今年の6月に僕自身がデータサイエンティストに転じて10年という節目の年を迎え、10月でDavenportの「データサイエンティストは21世紀で最もセクシーな職業である」HBR総説から10周年になるのを機に、この10年間のデータサイエンティストという職業の変遷を振り返ることにしました。 6月の回顧録記事でも書いた通り、僕がデータサイエンティストの仕事に就いてから今年で10年になります。最近も同じかどうかは分かりませんが、古くから「10年ひと昔」という常套句がある通りで個人的には大きな節目の年だと感じています。一方で、今年の10月にはあまりにも有名な「データサイエンティストは21世紀で最もセクシーな職業である」HBR総説が出てから10周年を迎え、後述するようにDavenportは「今もデータサイエンティ
お前らのpandasの使い方は間違っている - Qiita
- 311 users
- qiita.com/141sksk
- テクノロジー
- 2022/12/09
この記事は株式会社Nuco Advent Calendar 2022の9日目の記事です。はじめにいきなりお馴染みの「キャッチーでウィットでセンセーショナルな」タイトルで失礼します。私自身、業務の中でpandasに大変お世話になっており、自戒も込めてpandasの「アンチパターン」をまとめてみました。この記事を読んで、より快適なpandasライフを送っていただけると嬉しいです。対象読者 Pythonを使ったデータ分析や機械学習に携わる方この記事はpandasの基本的な使い方を解説するものではないので注意してください。表形式ファイルを加工する必要がある方 pandasの強みはリレーショナルなデータ全般です。必ずしもデータ分析や機械学習だけが守備範囲ではありません。 pandasとは pandasの公式ドキュメントの概要には、以下のように記載してあります。 pandas is a
地理空間情報を扱うなら知っておきたいPythonライブラリ、GeoPandas入門~基礎編~ | 宙畑
- 276 users
- sorabatake.jp
- テクノロジー
- 2021/06/13
さまざまなデータを地理空間情報として重畳する上で有用なPythonのライブラリであるGeoPandas。前編ではGeoPandasを用いたデータの描画方法など基礎的な扱い方を紹介し、後編では衛星データと組み合わせて解析結果を可視化する方法を紹介します。 Pythonで地理空間情報を行う場合、GeoPandasの使い方を覚えておくととても便利です。例えば、都道府県別の気象データを持っていたとします。そのテーブルデータ(csv)には地理情報と言えば、都道府県の名称くらいしかありません。このような場合、これを日本地図の上に重畳して可視化することはできません。しかし、このデータに地図上に描画できる情報を与えることさえできれば、好きなデータを地図の上に重ねることができます。このようなことをしたい場合に、GeoPandasの使い方を知っておけば助けになります。今回は、簡単な例を通じて、GeoPa
データサイエンスを学び、休職中でも年収1,000万超で転職　副業や転職前に知っておきたい、高評価のポイント | ログミーBusiness
- 265 users
- logmi.jp
- 学び
- 2022/09/26
年間2,200名以上の社会人が受講する、データサイエンスを学ぶビジネススクール「datamix」。同スクールを運営する、株式会社データミックスのオンライントークイベント「データサイエンス業界の転職と副業の“今”」に、同社の立川裕之氏と福山耀平氏が登壇。データサイエンスを学んで独立した立川氏と、転職支援や副業の紹介を行っている福山氏が、データサイエンス業界の働き方について解説します。後編では、転職・副業における最大の強みや、転職の成功事例のパターンなどを紹介しています。取締役に近いポジションなら、年収3,000万円以上も福山耀平氏（以下、福山）：ちょうど昨日、ある大手の損保企業の担当者と話していたら、データサイエンティストのチームの統括ができて、経営層としゃべれる人材を募集されていました。これはもちろんチームを率いた経験など、難易度は高くなるんですけど、取締役に近いポジションの仕事です。
- 転職
- あとで読む
- 副業
- 仕事
- お金
- データ
- 業界
- 分析
総務省の無料データサイエンス入門講座、終了までのタイムアップ迫る | Ledge.ai
- 248 users
- ledge.ai
- テクノロジー
- 2021/02/13
画像は『総務省統計局「社会人のためのデータサイエンス入門」講座PV』よりオンライン講座サイト「gacco（ガッコ）」では、総務省による「社会人のためのデータサイエンス入門」が特別開講中だ。閉講日時は3月16日の23時59分まで。学習期間は4週間なので、今すぐ始めるとギリギリ間に合うはず。登録料および受講料は無料。本講座では入門編として、統計学の基礎やデータの見方・データの取得方法などを学べる。統計学の基礎を学ぶことで、活用編の「誰でも使える統計オープンデータ」をより効果的に受講できるという。本講座のコースは4つの部分に分かれている。第1週では、社会でデータがどのように活用されているかについて、実際のデータを用いた分析事例を紹介する。第2週では、データを理解し、分析する際に必要な統計学の基礎について学ぶ。第3週では、日ごろ目にすることの多いデータの見方について学習する。第4週では、誰も
- 学習
- あとで読む
- 統計
- AI
- 入門
- データ
- 社会
- 大学
事業に貢献するデータ基盤を作ろう・考え方編 / data_engineering_study_2
- 201 users
- speakerdeck.com/shinu
- テクノロジー
- 2020/08/19
Data Engineering Study #2「データ収集基盤とデータ整備のこれまでとこれから」https://forkwell.connpass.com/event/182769/ 作成者：しんゆう＠データ分析とインテリジェンス Twitter：https://twitter.com/d…
Pythonで学ぶ衛星データ解析基礎 ――環境変化を定量的に把握しよう
- 166 users
- gihyo.jp
- テクノロジー
- 2022/12/06
2022年12月19日紙版発売 2022年12月15日電子版発売田中康平，田村賢哉，玉置慎吾　著，宮﨑浩之　監修 B5変形判／352ページ定価3,520円（本体3,200円＋税10%） ISBN 978-4-297-13232-3 Gihyo Direct Amazon 楽天ブックス丸善ジュンク堂書店ヨドバシ.com 電子版 Gihyo Digital Publishing Amazon Kindle ブックライブ楽天kobo honto 本書のサポートページサンプルファイルのダウンロードや正誤表などこの本の概要本書籍は，Pythonによる衛星データ解析に興味がある初学者に向けた入門書となっています。学校の情報の授業等で利用する際の副教材になることを意識し，衛星データだけでなくデータサイエンスの基礎的な内容も含めました。学校で地球環境やご自身が住んでいる地域がどのように変化し
「ETC2.0」がサーバに送信している速度や位置情報、民間活用の動き始まる　トラック運行情報や保険にも
- 159 users
- www.itmedia.co.jp
- テクノロジー
- 2022/10/24
「ETC2.0」がサーバに送信している速度や位置情報、民間活用の動き始まる　トラック運行情報や保険にも（1/3 ページ）高速道路の料金を無線通信で支払えるETCは、1日あたりの利用台数が780万台を超え93.9%が利用するまで普及した。そして次世代版であるETC2.0も、2015年に始まって以来835万台に搭載され、利用率で見ると28.7%を占めるに至っている。高速道路を走っているクルマの4台に1台はETC2.0を使っているわけだ。しかしETC2.0が、クルマの位置情報や速度などを、国土交通省のサーバに随時アップロードしていることは意外と知られていない。
- 交通
- あとで読む
- 自動車
- privacy
- クルマ
- 行政
- セキュリティ
- security
Kaggleで勝ちっぱなしのデータサイエンティストに話を聞いてみた | AI専門ニュースメディア AINOW
- 154 users
- ainow.ai
- テクノロジー
- 2021/02/22
著者のParul Pandey氏は世界各地に拠点のあるAIスタートアップH2O.aiでデータサイエンス・エバンジェリストを務めており、AINOW翻訳記事『あなたのビジネスにAI戦略を効果的に使用する方法』の著者でもあります。同氏が最近Mediumに投稿した記事では、H2O.aiに所属するKaggleグランドマスターにKaggleの取り組み方に関してインタビューしました。データサイエンティストのPhilipp Singer氏は、オーストリアのグラーツ工科大学で博士号を取得後、自身の知識を応用する機会を求めてデータサイエンス業界に入りました。同氏がKaggleを始めたのは単なる情報収集がきっかけだったのですが、優秀な成績をおさめたことによってKaggleに夢中になりました。そんな同氏のKaggleの取り組み方、そしてKaggleから学んだことの要点をまとめると、以下のようになります。 Kag