[データ分析]折れ線グラフで「変化」を可視化 ~ 売り上げは本当に上がっているか?:やさしいデータ分析 データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の第8回。グラフを利用して時間的な変化を可視化する方法と、それに関連するさまざまな考え方を追いかけます。具体的には折れ線グラフを使いますが、データの取り扱い、結果の見方などに関して、考慮すべき点や見落としがちな点について見ていきます。
埼玉西武ライオンズは、来季のデータサイエンティストを募集します。 野球界では人的に入力するデータだけではなく、トラッキングシステム、映像解析ソフトなどからさまざまなデータが取得できる時代になりました。これらのデータを駆使して選手やチームの潜在的な能力を評価・予測し、さまざまなスタッフと連携してチーム強化につなげていただきます。チーム全体の力でチャンピオンフラッグをつかんだ時の喜びは人生の宝物になること間違いないでしょう。 応募希望の方は、下記応募条件をご確認のうえ、応募フォームよりお申込みください。 ご応募はこちらから 募集職種 データサイエンティスト 業務内容 ・データを活用して深層的且つ潜在的な能力を見極める選手評価 ・選手やチームのパフォーマンスを確度高く予測する戦力予測モデルの構築と運用 ・選手育成計画を基に成長進捗管理モデルの構築と運用 ・スカウティングに関する管理指標の構築と運
西武はデータを駆使して選手の潜在的な能力を評価、予測するデータサイエンティストを9月末まで募集している。 近年、野球界では人的に入力するデータだけではなく、トラッキングシステム、映像解析ソフトなどから様々なデータを取得できるようになっている。そのような環境下で多様なデータを駆使、分析しながらチームスタッフとコミュニケーションを図ることができる人材を発掘し、さらなる戦力アップを目指していく。要項は以下の通り 【募集職種】 データサイエンティスト 【業務内容】 データを活用して深層的且つ潜在的な能力を見極める選手評価。 選手やチームのパフォーマンスを確度高く予測する戦力予測モデルの構築と運用。 選手育成計画を基に成長進捗管理モデルの構築と運用。 スカウティングに関する管理指標の構築と運用。 チームスタッフとのコミュニケーションを通して課題発掘、データ分析による課題解決の企画立案と提言。 各種デ
わ、去年2023-08-26にこの記事書いたんだね。まる1年だね。2024年版機械学習・データ分析の必須10冊+ガチ90冊+Next5冊=105冊書きましたよ。 【データ分析の必読10冊+差をつける10冊+100冊超】データサイエンス、データ分析、機械学習関連の本がご好評いただいてましたが古くなりごちゃごちゃしているので新たに作り直しました 本記事のめあて IT系の技術者の方がデータ分析関連の仕事をするために役立つ本を紹介する(私が学び始めた時にあれば欣喜雀躍したであろう)記事として書いております。 本記事作者の青木はバイオインフォマティクス(ゲノムデータのDB化中心・Perl・MySQL)からRで時系列分析→Pythonでデータ分析一般と業務をしてまいりました。 ですので研究者目的の本はありません。また、データ分析の基礎は主にRで学んだのですが、昨今の流行に合わせてPython本を中心に
このブログでも何度か引用しているこちらの記事で、「データサイエンティストという職業は10年以内に消える」という趣旨の議論がされていたのがちょうど10年前の2013年でした。ちなみにこの記事はついているブックマーク数に比して当時は結構注目を集めたという記憶があり、割と業界内では「確かにこんな中途半端な職業が10年後もあるわけないよね」と言われていたのを思い出します。 実際には皆さんもご存知のように、2023年になってもデータサイエンティストという職業はついに消えることなく、現在に至るまで残り続けています。その経緯がどんなものであったかは、業界10年史記事でもある程度触れた通りです。 しかし、同時に現在では「生成AIの普及でデータサイエンティストの仕事がなくなる」という風説も出回っており、改めてデータサイエンティストという職業の将来性に不透明感が漂いつつあるのもまた事実です。そこで、今回の記事
データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の特別予告編。次回から数回に分けてグラフを利用した可視化の方法を見ていきます。それに先だって、今回は可視化の目的と手法を概観します。「何を見たい」→「どのグラフを使うのか」→「何がうれしいのか」という流れをひととおり確認し、次回以降のお話にスムーズに入れるようにします。 連載目次 データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の特別予告編です。第6回(前回)までは、平均値や標準偏差などの値を求めることによって、データを分析する方法を見てきました。特に、前回は、集団の中での位置を知るために、パーセント単位での順位や偏差値などを求めました。 次回からは「可視化による分析」をテーマとして、何回かに分けて幾つかの事例を見ていきます。話の内容や展開がこれまでと少し変わるので、今回は特別予告編として、可視
これから所謂データサイエンスを学んだり仕事で活用したりしようと考えている者です。「所謂」と書いたのは、巷間言われている同分野があたかも統計学と同義であるかのように解説されているからです。例えば既存のデータに対して最もFitの良い関数を推計する場合、データが時系列ではなくクロスセクションであった場合などは不均一分散が発生するため最小二乗法よりもプロビットやロジットなどの最尤法を使うことで解決できますが、それでもこれは統計学の範疇です。そこで質問です。 (1)上記のようなケースや、或いはそれに限らずFitの良い関数を推計するテクニックとして、統計学ではなく近似理論(数値解析法の一分野)の、例えばLagrange function、Newton's/Hermite interpolation formula(Divided difference)、Bernstein Operator、Minim
データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の第6回。集団の中での位置をパーセント単位で求めたり、偏差値を求めたりする方法と、その考え方を説明します。偏差値は大学や高校のランク付けによく使われていますが、序列を付けるためのものではなく、異なる分布の集団の間でも位置が比較できるとても便利な値です。 連載目次 データ分析の初歩から応用まで少しずつステップアップしながら学んでいく連載の第6回です。これまでは、集団のばらつきの度合いを表す散布度について見てきました。具体的には、前々回は間隔尺度や比率尺度で使われる分散/標準偏差を、前回は、順序尺度で使われる四分位範囲/四分位偏差と、名義尺度で使われる平均情報量/相対情報量を紹介しました。今回は、集団そのものの特徴から少し視点を変えて、集団の中にある個々の値に注目していきます。個々の値が集団の中でどの位置にあるのかをパーセ
こんにちは! 構造化データグループのグループリーダー小林広明です。 今回は表題について、いくつか資料の紹介と私なりに思うところを少し書いていきます。 免責事項 応募書類/履歴書 面接 終わりに 免責事項 弊社の選考基準について書いたものではありません。エクサウィザーズの他の面接官は異なる意見を持っていると思います。 ただし、私も書類選考や面接に関わっていて、その視点は入っています。 私は AI Frontier 部に所属していて、こちらのメンバーには基本的に機械学習エンジニアという職名を用いています。 ですが、特に私が所属している表形式データを主に扱うグループでは、一般にデータサイエンティストと呼ばれている職種が担う仕事も多く扱っていると思われるので、この記事では機械学習エンジニア・データサイエンティストの違いには触れずに書いていきます。*1 どちらかといえば中途採用(経験者)での転職希望
データドリブンにプロダクトを改善していきたい、とはどんなプロダクトマネージャーでも志すことですが現実には上手く行かないこともあると思います。その時に、参考になる動画を見つけたので紹介します。 Product School のチャンネルで公開されている Webinar: Top 10 Digital Analytics Mistakes by Amplitude's Adam Greco and WillowTree's Jeremy Stern です。登壇者の Adam Greco さんは Amplitude という分析プラットフォームの Product Evangelist 、 Jeremy Stern さんは WillowTree というプロダクトでのデータ活用を支援するコンサルティングサービスの Director of Product Analysis を担当されています。動画の見ど
2022年新卒入社のデータサイエンティストが、ブレインパッドの入社1年目の過ごし方について、同期にアンケートをとりその結果をまとめました。今回はその内容をブログでご紹介します! はじめまして、2022年に新卒社員として入社しましたアナリティクス本部の見上です。 今回は「新卒データサイエンティストの1年目の過ごし方」をご紹介します。 ブレインパッドに新卒で入社した社員はまず、4~6月の3ケ月間でビジネス・技術系の研修およびミニプロ(※1)を実施し、それぞれの職種で仕事をするための基礎の基礎を学びます。 その後の約半年間はOJT(On-the-Job Training)期間です。この時期は、新卒社員も実案件に配属され、PM(プロジェクトマネジャー)や先輩方とともに仕事をしながら一人前になるための訓練を積みます。 本記事では、「データサイエンティストのOJT」に着目し、皆さんにいろいろな情報をお
データ分析とは具体的にどのようなことをするのか? 全くイメージが湧かない人、自分ではやってみたことがない人に向けて、気軽な疑似体験を通してデータ分析の雰囲気をお伝えします。具体的には、データを整理/変換し、グラフを作成して統計量も計算。さらにデータから次の数値を予測してみます。 連載目次 最近は、質問に答えてくれるChatGPTなどの文章生成AIや、指示したテキストからイラストが作成できるStable Diffusionなどの画像生成AIが大きな話題ですよね。そういった一般社会で注目される話題の裏で、企業の中やビジネスパーソンの間ではリスキリングやDX(デジタル・トランスフォーメーション)が急激に進んできています。 ある調査の結果によると、この1年で驚くべき変化が起きていました。リスキリング対象者層において「リスキリングに既に取り組んでいる」人が、2022年時点ではわずか1.4%だったのに
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く