タグ

統計と本に関するshion214のブックマーク (8)

  • Pythonによる重複の確認方法とデータ匿名化の方法 - Qiita

    概要 目次 Pythonでデータに重複があるか確認する方法 PyCon JPが不正をしていない理由の解説 記事では、Pythonで重複したデータを集約する方法、及び、機密情報を隠して集計をするための手法について解説します。 記事で紹介するコードは投票結果の集計やアイデアの集計などで有効に使うことができます。 内容に誤りがありましたらご指摘ください。 記事は、今後の健全なコミュニティの発展に必要不可欠な情報であるため、健全な技術コミュニティの発展を目指す情報交換プラットフォーム、Qiita.comにて公開します。 Pythonでデータに重複があるか確認する方法 リスト形式の場合 Pythonでリストから重複があるか確認する3種類の方法を紹介します。 重複の有無をbool値で出力します。 外部ライブラリ、cythonを使わない場合、データの分布に関する事前情報がない場合はこれらの方法が有

    Pythonによる重複の確認方法とデータ匿名化の方法 - Qiita
  • [pandas超入門]Pythonでデータ分析を始めよう! データの読み書き方法

    連載目次 シリーズと連載について シリーズ「Pythonデータ処理入門」は、Pythonの基礎をマスターした人を対象に以下のような、Pythonを使ってデータを処理しようというときに便利に使えるツールやライブラリ、フレームワークの使い方の基礎を説明するものです。 Pythonだけを覚えれば何でもできるわけではない、というのはハードルが高く感じられるかもしれません。それでもプログラミング言語に関する基礎が身に付いたら、後は各種のツールを使いながら、言語とツールに対する理解を少しずつ、しっかりと深めていくことで自分がやれることも増えていきます。そのお手伝いをできたらいいな、というのがシリーズの目的とするところです。 なお、連載では以下のバージョンを使用しています。 Python 3.12 pandas 2.2.1 pandasとは pandasはデータ分析やデータ操作を高速かつ柔軟に

    [pandas超入門]Pythonでデータ分析を始めよう! データの読み書き方法
  • 基礎から学ぶ統計学

    理解に近道はない.だからこそ,初学者目線を忘れないペース配分と励ましで伴走する入門書.可能な限り図に語らせ,道具としての統計手法を,しっかり数学として(一部は割り切って)学ぶ.独習・学び直しに最適 書の使い方 統計学を学ぶ心がけ/予備知識/書の学び方/のんびり取り組む/書の難所/練習問題を解く/数学が得意なら/ご協力ください 序章 はじめに 1.統計学の必要性 2.散らばり(バラツキ) 3.基的な用語と概念 ①観測値と標 ②母集団 ③統計学の目的 ④統計学の理論を支える土台 ⑤単純無作為標 4.書の2柱 ①平均の比較 ②2変数の関係 5.検定統計量 第Ⅰ部 統計的仮説検定の論理 1章 検定の論理(二項検定を教材として) 1.例題1:B薬はA薬より有効か? ①例題1.1:18人に効果がある場合 ②例題1.2:14人に効果がある場合 ③例題の解答 2.二項分布 ①二項係数 nC

    基礎から学ぶ統計学
  • 2023年版データ分析の100冊 - Qiita

    わ、去年2023-08-26にこの記事書いたんだね。まる1年だね。2024年版機械学習データ分析の必須10冊+ガチ90冊+Next5冊=105冊書きましたよ。 【データ分析の必読10冊+差をつける10冊+100冊超】データサイエンス、データ分析機械学習関連のがご好評いただいてましたが古くなりごちゃごちゃしているので新たに作り直しました 記事のめあて IT系の技術者の方がデータ分析関連の仕事をするために役立つを紹介する(私が学び始めた時にあれば欣喜雀躍したであろう)記事として書いております。 記事作者の青木はバイオインフォマティクス(ゲノムデータのDB化中心・PerlMySQL)からRで時系列分析→Pythonデータ分析一般と業務をしてまいりました。 ですので研究者目的のはありません。また、データ分析の基礎は主にRで学んだのですが、昨今の流行に合わせてPythonを中心に

    2023年版データ分析の100冊 - Qiita
  • 統計検定準1級 合格体験記 - Qiita

    はじめに 統計検定準1級は(一財)統計質保証推進協会が実施、(一社)日統計学会が公式認定する「2級までの基礎知識をもとに、実社会の様々な問題に対して適切な統計学の諸手法を応用できる能力を問う」試験です。現在はCBTでの実施となっています。 主観を込めて言いますと、2級と準1級では難易度に雲泥の差があります。 強調して言っておきます。まったく違います! 準1級では統計的推定や検定に加えて、多変量解析(重回帰、PCA、主成分分析、数量化)、時系列解析、マルコフ連鎖、確率過程、分散分析、ベイズ統計、MCMC...と範囲が広いのが特徴です。 以下、かなりの長文になりましたが、受験して得た知見をかなり具体的に記述しました。読者の皆様の合格への一助となれば幸いです。 目的 私はとある私立中高で物理と情報を教えています。統計の勉強を始めたのは、教科「情報」を教えるにあたってのスキルアップが目的です。も

    統計検定準1級 合格体験記 - Qiita
  • 総務省、きょうから「社会人のためのデータサイエンス入門」を無料開講 | Ledge.ai

    サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

    総務省、きょうから「社会人のためのデータサイエンス入門」を無料開講 | Ledge.ai
  • データ視覚化のプロが選ぶデータ分析のオススメ本32選

    データ分析&データ視覚化のコンサルティングをしております、永田ゆかりと申します。 これまで2000人以上の方にデータ分析や活用の研修・トレーニング講師、企業への分析コンサルティングをさせていただいており、仕事をさせていただく中で必要なを読み続けているうちに、気がついたらデータ分析領域のを200冊以上読んでいました。 中でもデータビジュアライゼーション・視覚化の領域に関しては私自身の得意領域ということもあり、数多く読み込んでいます。 記事では数多くのクライアントの方々との問題解決に役立った知識・ノウハウが書かれている良書をご紹介させていただきますので、是非最後までご覧ください。 データ可視化そのものについて知りたいたは、こちらの記事からどうぞ。 データ可視化とは?その重要性や手法、よくある課題と解決策を解説 データ分析における視覚化(ビジュアライゼーション)系のおすすめの17選1 S

    データ視覚化のプロが選ぶデータ分析のオススメ本32選
  • ベイズ統計分析ハンドブックは神本! - Fire and Motion

    なんかダンコーガイみたいなエントリータイトルです(そういえば最近ダンコーガイどうしてるんだろ…).さて,仙台にはジュンク堂が駅前に3つあり,その中でイービーンズに入っているのが一番専門書がしっかり揃っていて良いです.というか,3つもいらないし,ちゃんと1つ大きいのが欲しいなぁ...池袋ジュンク堂が近かった自分としては仙台の残念なところは良い大きな屋さんがないところですね. で,最近ノンパラベイズを少しだけ勉強しようと思っていて(がっつりではない),でもそのレベルだとなかなか良い資料が見当たらない.暇なときに目を通すレベルであれば,持橋さんや上田さんによる良い資料・チュートリアルがあるのですが,それ以上のこととなると真面目に論文を読むしかない.たとえば,真面目にDirichlet過程の導出と意味を理解しようとするとFerguson (1973)を読む必要があるでしょうし,そのアプリケーショ

    ベイズ統計分析ハンドブックは神本! - Fire and Motion
  • 1