ブックマーク / atmarkit.itmedia.co.jp (7)

  • Dataset Search:Googleによる「データセット検索」サイト

    Dataset Searchは、2018年9月からグーグルGoogle)が提供しているサイトの一つで、世界中からデータセットを検索できる(=ググれる)。「機械学習で利用するデータセットを手軽に探したい」という場合に、最初に実行してみるツールとして非常に有用である。通常のGoogle検索では、例えば「PyTorch cats dogs images classification」などのようなキーワードを入れて検索することになるだろうが、その結果、必ずしもデータセットのみがヒットするわけではない。それと比べると、データセットのみを効率的に表示してくれるので便利である。 データセット検索 例えば図1は、Dataset Searchで実際にデータセットを検索しようとしているところである。

    Dataset Search:Googleによる「データセット検索」サイト
  • 僕たちのKaggle挑戦記

    僕たちのKaggle挑戦記 Kaggle初心者がKaggleに挑戦した過程や得られた知見などを記事化していく連載。執筆者と読者が初心者レベル同士だからこそできる意見効果/悩み共有/情報提供を行っていきます。 I-第1回 Kaggle初心者のためのコンペガイド ― Titanicの先へ(2021/08/30) 連載の目的 初心者のためのコンペガイド ・構造化データ - 表形式データ ・非構造化データ - 画像/動画 - 音声 - テキスト/言語 - ゲーム/ロボット Kaggleを始めるのに役に立ったこと ・1. 「30 Days of ML」プログラム ・2. 英語は何とかなる ・3. 世界中の人はもっと気楽にコミュニケーションしている ・4. 世の中は良コンテンツであふれている ・5. Kaggle日記というアイデア I-第2回 「無料のKaggle公式講座×コンペ初参戦」で機械学習

    僕たちのKaggle挑戦記
  • 企業の“Kaggler枠”って実際どうなの? ― データサイエンティスト協会 7th シンポジウム

    企業の“Kaggler枠”って実際どうなの? ― データサイエンティスト協会 7th シンポジウム:Kaggleイベントレポート 最近注目を集めている“Kaggler採用枠”やKaggler社内ランク制度の実態はどのようなもので、それによってどのようなメリットがあるのか。実際にKaggler制度を運用する企業の代表者やその制度の下で働くKagglerたちの意見を聞いてみよう。

    企業の“Kaggler枠”って実際どうなの? ― データサイエンティスト協会 7th シンポジウム
  • 無料で読める「機械学習/ディープラーニング」の有名書籍! 厳選4冊

    稿は、2020年7月27日に公開した記事を、2022年7月5日の最新情報に合わせて改訂したものです。各項目の内容をアップデートし、無料ではなくなった『Deep Learning with PyTorch』をカットした代わりにベストセラーである『An Introduction to Statistical Learning』を追記しました。

    無料で読める「機械学習/ディープラーニング」の有名書籍! 厳選4冊
  • 統計処理言語「R」の最新版が公開、次期「R 4.0.0」版の主な新機能も明らかに

    Microsoftは2019年12月13日(米国時間)、プログラミング言語「R」の最新版「R 3.6.2」について同社のRコミュニティーブログで紹介した。Rは、統計処理と処理結果のグラフィックス表示に向いたオープンソースの言語。併せて次期メジャーバージョン「R 4.0.0」の主な新機能についても触れた。 R 3.6.2は、既存リリースに小規模な改良を加えたマイナーリリース。WindowsmacOSLinuxで利用できる。 主な改良点は、ドットチャートに新しいオプションを加えたことや、グラフをスムーズにするためにメディアン法を使用する際に課題となる欠損値の処理を改善したことなどだ。加えて、幾つかのバグを修正し、処理性能を改善した。 一方、R 4.0.0では大きな変更が加わる予定だ。Rは、安定したβ版が公開されてから、2020年2月29日に20周年を迎える。それから間もなく、R 4.0.0

    統計処理言語「R」の最新版が公開、次期「R 4.0.0」版の主な新機能も明らかに
  • TensorFlowを使った機械学習を論文抽出に適用、ヒントは大学入試問題対策の裏ワザ

    これを行ったのは、東京共済病院腎臓高血圧内科部長、東京医科歯科大学臨床教授などを務める神田英一郎氏。日腎臓学会の組織した委員会による、慢性腎臓病(CKD)をテーマとした「エビデンスに基づくCKD診療ガイドライン2018」(未出版)の作成に関わった。その作成プロセスにおいて、論文スクリーニング作業の負担が重いことから、機械学習の活用を思い付き、「第3のスクリーニング担当者」を生み出した。 以下では、同氏の説明に基づき、これを紹介する。 「心の折れる作業」をどう軽減できるか 医療の世界では、「EBM(Evidence Based Medicine)」への取り組みが進められてきた。EBMとは、「医療行為は最新、最良の科学的根拠に基づいて行うべき」という考え方だ。診療ガイドラインは、EBM推進の観点から、臨床現場での意思決定における判断材料の1つとして利用することを目的とした文書で、各専門分野の

    TensorFlowを使った機械学習を論文抽出に適用、ヒントは大学入試問題対策の裏ワザ
  • VBAにおけるワークシート関数――INDEX、MATCH、VLOOKUPの使い方

    ワークシート関数は、VBA関数とは別物 今回はVBAにおけるワークシート関数の使い方について解説する。 ワークシート関数はExcelの「数式」で使える関数であり、VBAの「関数」とは別物だ。名前が同じで、同じ機能を持つものもあれば、名前が同じでも機能が多少異なるものもあるので、注意してほしい。 VBAでワークシート関数を呼び出して利用するには、ApplicationオブジェクトのWorksheetFunctionオブジェクトを取得して「メソッド」として利用する。Applicationオブジェクトは省略が可能だ。 WorksheetFunctionのメソッド一覧については、「WorksheetFunction メンバー (Excel)」を参照してほしい。 ここからは代表的なワークシート関数である「INDEX」「MATCH」「VLOOKUP」を例に、VBAにおけるワークシート関数の使い方を解説

    VBAにおけるワークシート関数――INDEX、MATCH、VLOOKUPの使い方
  • 1