2024年4月8日のブックマーク (11件)

  • 反実仮想機械学習 〜機械学習と因果推論の融合技術の理論と実践

    2024年4月13日紙版発売 2024年4月13日電子版発売 齋藤優太 著 A5判/336ページ 定価3,520円(体3,200円+税10%) ISBN 978-4-297-14029-8 Gihyo Direct Amazon 楽天ブックス ヨドバシ.com 電子版 Gihyo Digital Publishing Amazon Kindle honto このの概要 反実仮想(Counterfactual)─ 起こり得たけれども実際には起こらなかった状況 ─ に関する正確な情報を得ることは,機械学習や意思決定最適化の応用において必要不可欠です。例えば,「現在運用している推薦アルゴリズムを仮に別のアルゴリズムに変えたとしたら,ユーザの行動はどのように変化するだろうか?」や「仮にある特定のユーザ群に新たなクーポンを与えたら,収益はどれほど増加するだろうか?」「仮に個々の生徒ごとに個別化さ

    反実仮想機械学習 〜機械学習と因果推論の融合技術の理論と実践
    takumaO
    takumaO 2024/04/08
  • 【FDUA】第二回 金融データ活用チャレンジにDataikuを活用して参加してみる。|NECネッツエスアイ株式会社(公式)

    NECネッツエスアイ データ分析チームの鈴木(良)です! 今回は、現在進行形で参加している【FDUA(※)】第二回 金融データ活用チャレンジの取り組みをご紹介します! データ分析チームのスキルアップを目指して、上位ランクインを目標に🏆 楽しみながらやっていきたいと思います! 応援&いいね👍も、ぜひ!お願いします🤩 ※FDUA=金融データ活用推進協会のことです。 記事は、データ分析をしている人向けの内容になってます😎 もちろん興味ある人にも読んでいただきたいのですが、用語説明などをいつもより省いていますので、検索しながら読んでみてください👀 金融データ活用チャレンジについて「金融データ活用チャレンジ」は、金融データの活用可能性を深化させる業界を挙げた超実践プログラムのデータ分析コンペティションです。 詳細は下記をご覧ください。 はじめに金融データ活用チャレンジのコンペ内容は、借り

    【FDUA】第二回 金融データ活用チャレンジにDataikuを活用して参加してみる。|NECネッツエスアイ株式会社(公式)
    takumaO
    takumaO 2024/04/08
  • 第2回 金融データ活用チャレンジ -効率的なデータ分析・予測を行えるコードの紹介- - Qiita

    概要 SIGNATEで2024年1月18日~2024年2月15日において開催中のコンペ「第2回 金融データ活用チャレンジ」のデータを可視化し、LightGBMでの予測を行ってみました。 可視化はSeabornを活用することで、0,1のデータの分布を比較的簡単に見ることができるようになります。 予測結果のファイル名を都度設定するのは面倒なので、notebookのファイル名がそのまま使えると便利ですよね。notebookの設定を自動的に読み取る方法も紹介します。 とりあえずLightGBMで予測してみました。欠損値の補完などがなくても予測できてベースライン作成に便利です。 Confusion Matrix や Classification Reportを使って予測結果を出力できるようにしておきましょう。 データのインポート・前処理 ライブラリのインポート notebookの横幅を広げたいときに

    第2回 金融データ活用チャレンジ -効率的なデータ分析・予測を行えるコードの紹介- - Qiita
  • SIGNATE 「第2回 金融データ活用チャレンジ」でやったこと - Qiita

    はじめに どうも、お久しぶりです。 今回、SIGNATEの第2回 金融データ活用チャレンジというコンペに参加しましたので、その分析内容などを載せようと思います。 結果は大したことないですが、自分が今までにやったコンペの中では色々面白いことを試せたので、せっかくなので記録として残しておこうかなと思いました。 コンペの概要 項目 詳細

    SIGNATE 「第2回 金融データ活用チャレンジ」でやったこと - Qiita
  • 【FDUA】第一回 金融データ活用チャレンジをやり終えた - Qiita

    これは2023/3月に書いていたのですが、下書きのまま放置していたものです。 相当古い内容ではあるのですが、放置しっぱなしも(自分の精神的に)良くないなと思いましたので、備忘録として少しだけクリーンアップして投稿します。 なお、金融データ活用チャレンジも先日2回目が終了しました。そちらは参加登録だけして、活動できずに終わったのですが、次回があれば今度こそちゃんとやりたいと思っています。 参加していた以下のコンペが終了しましたので、最後のまとめを書いてみます。 今回は完全にコラムです。 まずは事務局の方、参加された皆様方、大変お疲れさまでした 初コンペということもあって右往左往している中、Slack上のやり取りは癒しでした。 ここからはコンペの結果や試みたことなどを、分析プロセスごとに書き残してみます。 結果 暫定評価:0.9860 最終評価:0.9878 ランクとしては45位でした。 初期

    【FDUA】第一回 金融データ活用チャレンジをやり終えた - Qiita
  • 【FDUA】第2回 金融データ活用チャレンジ結果(63th) - Qiita

    はじめに SIGNATEの「第2回 金融データ活用チャレンジ」に参加しました。LB0.6908の28位ぐらいで最終63位でした。(みなさん同じだと思いますが最終subを選択したかった・・・)解法自体はたいしたことないので最後に少し書いておきます。主にコンペ中に考えたことをまとめておきたいと思います。 自己紹介 データサイエンスの仕事初めて約1年。職はアナログ回路設計者です。プログラミングも初心者レベルです。 EDA NaN数も少なく優しいデータセットなのかなと最初は思いました。しかしちゃんとデータを見ていくと、"Term"の中に0がある、"NoEmp"にも0があるというデータでした。返済期間が0ヶ月はありえないし、NoEmpが0って誰も働いていないのか(社長除いてるかも)と思いました。"ApprovalDate"より前にある"DisbursementDate"・・・などなど。この時点で生

    【FDUA】第2回 金融データ活用チャレンジ結果(63th) - Qiita
  • FDUA金融コンペで垣間見えたDataikuへの高いニーズと強いモメンタム - Qiita

    はじめに 金融データ活用推進協会(FDUA) のお取組に賛同し、金融業界全体のリテラシー向上およびデータ活用の高度化、スケール、加速化に貢献できればという思いから、第2回 金融データ活用チャレンジに分析環境および教育コンテンツを提供させて頂きました。 Dataikuはノーコーダー・ローコーダー・フルコーダー、全てのユーザーが直感的に操作可能で、分析プロセス全体をカバーします。今回、400名を超える参加者に製品を体験していただき、「ワクワクした」「楽しかった」「自分でもできた」「コーダーも使うべきだ!」とのコメントを多く頂き、Dataikuに対する高いニーズと強いモメンタムを実感しました。 普段お客様とお話していると下記のような声が聞こえてきます。 「AIに取り組まなければいけないのはわかっているけど、どのように進めればいいかわからない」 「数年前からAIの民主化のためにAutoMLツールを

    FDUA金融コンペで垣間見えたDataikuへの高いニーズと強いモメンタム - Qiita
  • 第2回金融データ活用チャレンジにDataikuのノーコードでチャレンジしてみた - Qiita

    概要 夏秋といいます。 2月15日までSIGNATEで開催されていた「第2回金融データ活用チャレンジ」に参加してました。 普段は金融機関に勤めていて、データ分析とは無縁の仕事をしていますが、去年の「第1回金融データ活用チャレンジ」に参加してPython機械学習を勉強し、データ分析コンペの楽しさに触れました。 第1回に参加した時は「Databricks」というプラットフォーム上でPythonを使用してデータ分析をしていたのですが、今回は「Dataiku」というプラットフォーム上でノーコードデータ分析ができるとのことで、今回はそちらを使ってノーコードでのデータ分析にチャレンジしてみました。 コンペの成績まずまずでしたが、データ分析初心者の目線から去年のフルコードと今回のノーコードの差について説明できればと思い、この記事を書くことにしました。 また、記事はコンペにおいて「精度での入賞」と別

    第2回金融データ活用チャレンジにDataikuのノーコードでチャレンジしてみた - Qiita
  • 【dataiku】「コードも書けるけどツールって使った方がいいの?」を考える趣味プログラマーの金融データ活用チャレンジ - Qiita

    【dataiku】「コードも書けるけどツールって使った方がいいの?」を考える趣味プログラマーの金融データ活用チャレンジPythonコンペティションDataikuSIGNATE金融データ活用チャレンジ はじめに 記事を閲覧いただきありがとうございます。 私は金融機関でシステム開発の仕事に従事しております。 データ分析業務やPython言語は共に仕事では未経験ですが、趣味pythonを使ってものづくりを楽しんでおります。 そしてこの度はsignateで開催されました「第2回 金融データ活用チャレンジ」に参加させていただきました。 今回は様々なツールを提供していただいており、その中でも特に魅力的に感じましたdataikuのすばらしさを記事にして共有したいと思い執筆いたしました。 社内の勉強会でもdataikuの紹介をいたしましたが非常に好評でした。 この記事では 「コード(python)も書け

    【dataiku】「コードも書けるけどツールって使った方がいいの?」を考える趣味プログラマーの金融データ活用チャレンジ - Qiita
  • [SIGNATE]FDUA金融データ利活用コンペ振り返り - Qiita

    初めに SIGNATEの「第2回 金融データ活用チャレンジ」にチームで参加しました。 結果は104位に終わりました。個人的にはシルバーやゴールドを目指して参加していたので、すごく悔しい結果でした。 以下コンペの概要です。 ▼課題 今回は企業向けローンの返済可否予測というテーマを通して、ローンに関連したデータを基に、企業が返済不能になるかどうかの予測に挑戦して頂きます。このデータを活用することで、どの業種や地域が成長の機会を持っているか、あるいはどのような要因がビジネスの成功に影響を与えるかなど、金融機関は効果的な企業支援の戦略を立てることができます。 今回提供するデータは、米国小企業庁(U.S. Small Business Administration、略称SBA)によるデータをもとに生成した人工的なもの(※)で、SBAのローン保証を受けたスタートアップや小企業に関する情報が含まれていま

    [SIGNATE]FDUA金融データ利活用コンペ振り返り - Qiita
  • 会議中に発言してもらえない原因は、マネージャーの私にあった - Qiita

    はじめに チームのメンバー皆に意見を出してもらいたいような会議をすることはよくあると思います。 稿は、そういう時に積極的に発言してもらえるようにするための考え方とプラクティスの紹介です。 チームの皆に意見を出してもらいたい会議とは いろいろあると思いますが、以下に2つの例を挙げます。 UXレビュー 私のチームでは、開発中のプロダクトに対する改善点を皆で挙げるという活動を行っています。 チーム内では「UXレビュー」と呼んでいます。 具体的には、開発メンバーが開発中のプロダクトを実際にユーザーがよく使うユースケースでどんな体験をするのかをデモしながら説明し、それに対して他メンバーが気付いた改善点を挙げるという活動です。 人によって感じ方が異なるため、複数人で実施して、各自が感じたことを積極的に意見してもらった方が多様な観点での改善が期待できます。 設計レビュー 複数人で開発するプロダクトに対

    会議中に発言してもらえない原因は、マネージャーの私にあった - Qiita
    takumaO
    takumaO 2024/04/08
    “チームのゴールに対してペアプロ・モブプロなどを用いて皆で達成するのでなく、各自がソロでやるタスクが1週間以上先まで決まっており各自に仕事の期限があるよ”