You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
まずは、素うどんのXGBoostにかけて、plot_importance, feature_importances_を確認する。しかる後に、各特徴量をF-SCOREの高い順にExploratory Data Analysis (EDA)を行い、データに対する感覚を掴む。特徴量の数が少ないのであれば、初めからEDA。 情報を含まないcolumnsを除く。[Kaggle Kernel: R, Python] 標準偏差が0の説明変数 (constant cols) を除く。 重複した説明変数 (duplicated cols) を1つだけ残して他を除く。 相関係数が1である説明変数の組 (perfectly correlated cols) を探し、1つだけ残して他を除く。 各列について、値が0である説明変数の数を数えて、合計値を追加の説明変数として加える (count 0 per row)。逆
単語埋め込み (Word embeddings) コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。 このチュートリアルでは、単語埋め込みを紹介します。このチュートリアルには、小さいデータセットを使って単語埋め込みを最初から学習させ、その埋め込みベクトルを Embedding Projector (下図参照)を使って可視化するためのプログラムがすべて含まれています。 テキストを数値で表す 機械学習モデルは、ベクトル(数値の配列)を入力として受け取ります。テキストを扱う際、最初に決めなければならないのは、文字列を機械学習モデルに入力する前に、数値に変換する(あるいはテキストを「ベクトル化」する)ための戦略です。このセクションでは、これを行う3つの戦略を見てみます。 ワンホット・エンコーディング 最初のアイデアとして、ボキャブラリの中の単語それぞれを「ワンホット」
Working as a core maintainer for PyTorch Lightning, I've grown a strong appreciation for the value of tests in software development. As I've been spinning up a new project at work, I've been spending a fair amount of time thinking about how we should test machine learning systems. A couple weeks ago, one of my coworkers sent me a fascinating paper on the topic which inspired me to dig in, collect
構造化された面接とは、簡単に言えば、同じ職務に応募している応募者に同じ面接手法を使って評価するということです。構造化面接を行うと、応募した職務自体が構造化されていない場合でも、応募者のパフォーマンスを予測できるという調査結果があります。Google では構造化面接を採用しています。つまり、すべての応募者に同じ質問をして、同じ尺度で回答を採点し、事前に決められた一貫した採用要件に基づいて採用を決定しています。 では、構造化面接の質問を使う組織があまり多くないのはなぜでしょうか。実は、質問を作成するのが難しいのです。構造化面接の質問は、記述してテストする必要があります。また、面接担当者が他の質問をしないように指導する必要もあります。さらに、同じ質問が何度も出されると予想した応募者同士が、情報を交換してすべての回答を用意してこないように、質問を絶えず更新する必要があります。別の調査によると、構造
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く