hnishi2509のブックマーク / 2020年8月20日

hnishi2509 id:hnishi2509

2020年8月20日のブックマーク (8件)

GitHub - amaotone/kaggle-memo: Tips for data science competitions (e.g. Kaggle, SIGNATE)
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
hnishi2509 2020/08/20
kaggle

tips
リンク
GitHub - nejumi/kaggle_memo
まずは、素うどんのXGBoostにかけて、plot_importance, feature_importances_を確認する。しかる後に、各特徴量をF-SCOREの高い順にExploratory Data Analysis (EDA)を行い、データに対する感覚を掴む。特徴量の数が少ないのであれば、初めからEDA。情報を含まないcolumnsを除く。[Kaggle Kernel: R, Python] 標準偏差が0の説明変数 (constant cols) を除く。重複した説明変数 (duplicated cols) を1つだけ残して他を除く。相関係数が1である説明変数の組 (perfectly correlated cols) を探し、1つだけ残して他を除く。各列について、値が0である説明変数の数を数えて、合計値を追加の説明変数として加える (count 0 per row)。逆
hnishi2509 2020/08/20
kaggle

tips
リンク
https://github.com/phalanx-hk/kaggle_cv_pipeline/blob/master/kaggle_tips.md
hnishi2509 2020/08/20
kaggle

tips
リンク
Language-Agnostic BERT Sentence Embedding
Philosophy We strive to create an environment conducive to many different types of research across many different time scales and levels of risk. Learn more about our Philosophy Learn more
hnishi2509 2020/08/20
“LaBSE”

あとで読む

paper
リンク
Google | LaBSE | Kaggle
hnishi2509 2020/08/20
あとで読む

deeplearning

deep learning
リンク
単語埋め込み (Word embeddings) | TensorFlow Core
単語埋め込み (Word embeddings) コレクションでコンテンツを整理必要に応じて、コンテンツの保存と分類を行います。このチュートリアルでは、単語埋め込みを紹介します。このチュートリアルには、小さいデータセットを使って単語埋め込みを最初から学習させ、その埋め込みベクトルを Embedding Projector （下図参照）を使って可視化するためのプログラムがすべて含まれています。テキストを数値で表す機械学習モデルは、ベクトル（数値の配列）を入力として受け取ります。テキストを扱う際、最初に決めなければならないのは、文字列を機械学習モデルに入力する前に、数値に変換する（あるいはテキストを「ベクトル化」する）ための戦略です。このセクションでは、これを行う3つの戦略を見てみます。ワンホット・エンコーディング最初のアイデアとして、ボキャブラリの中の単語それぞれを「ワンホット」
hnishi2509 2020/08/20
あとで読む

notebook
リンク
Effective testing for machine learning systems.
Working as a core maintainer for PyTorch Lightning, I've grown a strong appreciation for the value of tests in software development. As I've been spinning up a new project at work, I've been spending a fair amount of time thinking about how we should test machine learning systems. A couple weeks ago, one of my coworkers sent me a fascinating paper on the topic which inspired me to dig in, collect
hnishi2509 2020/08/20
機械学習のテスト

machine_learning
リンク
Google re:Work - ガイド: 構造化面接を実施する
構造化された面接とは、簡単に言えば、同じ職務に応募している応募者に同じ面接手法を使って評価するということです。構造化面接を行うと、応募した職務自体が構造化されていない場合でも、応募者のパフォーマンスを予測できるという調査結果があります。Google では構造化面接を採用しています。つまり、すべての応募者に同じ質問をして、同じ尺度で回答を採点し、事前に決められた一貫した採用要件に基づいて採用を決定しています。では、構造化面接の質問を使う組織があまり多くないのはなぜでしょうか。実は、質問を作成するのが難しいのです。構造化面接の質問は、記述してテストする必要があります。また、面接担当者が他の質問をしないように指導する必要もあります。さらに、同じ質問が何度も出されると予想した応募者同士が、情報を交換してすべての回答を用意してこないように、質問を絶えず更新する必要があります。別の調査によると、構造
hnishi2509 2020/08/20
google の面接方法
リンク
- 2020年8月21日
- 2020年8月20日
- 2020年8月19日