knokのブックマーク / 2018年6月25日 - はてなブックマーク

knok id:knok

2018年6月25日のブックマーク (6件)

KaggleのWinner solutionにもなった「K近傍を用いた特徴量抽出」のPython実装 - u++の備忘録
今回は、KaggleのWinner solutionにもなった「K近傍を用いた特徴量抽出」を紹介します。 Rでの実装は公開されていますが、Pythonでの実装は確認できなかったので、自前のPython実装も公開しています。 github.com アルゴリズムの概要 Pythonでの例可視化のためのパッケージ読み込みサンプルデータの生成可視化 K近傍を用いた特徴量抽出可視化 iris での例追記20180624 実装の修正はてなホットエントリ入りアルゴリズムの概要近傍数を、分類するクラス数をとした場合に、アルゴリズムは個の特徴量を生成します。生成される特徴量は下記のように、観測値と各クラス内の最近傍点との間の距離から計算されます。とあるクラスに属する訓練データの中の第1近傍までの距離を1つ目の特徴量とするとあるクラスに属する訓練データの中の第2近傍までの距離の和を2つ目の
knok 2018/06/25
リンク
GitHub - mahyarnajibi/SNIPER: SNIPER / AutoFocus is an efficient multi-scale object detection training / inference algorithm
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session.
knok 2018/06/25
リンク
Python製シェルxonshを半年使った所感や環境設定のまとめ - Stimulator
- はじめに - Pythonにおけるpython-prompt-toolkit(以下ptk)を使って作られたシェルである「xonsh」を同僚にオススメされて、大体半年くらい使ったので設定とかxontribとか所感を晒していく。前半でxonshのメリット、デメリットの概要を記載し、後半に自身が利用する設定やxontribについて記載する。この記事は、xonsh導入に至る人もしくは、環境設定について広く知りxonshを扱える人を増やす事が目的である。追記：2018/07/18 xonsh 0.7.0が出ていますが、現在prompt-toolkit2.0の各機能対応中という感じです。これは、ptk1.x -> 2.xにおいて結構な破壊的変更があるためです。現状はpip install xonshする時に pip install prompt_toolkit==1.0.15 pip i
knok 2018/06/25
言語処理系そのものをshellにする発想は昔からあるけどこれはどうだろう
リンク
数えきれないほどの分類を行うExtreme Classification - Technical Hedgehog
本記事では分類タスクの一種であるExtreme Classificationの代表的な手法と特徴を紹介します。機械学習においてアヤメの分類など10数個までのラベルやクラスへの分類タスクはチュートリアルなどで多く取り上げられています。一方で商品をカテゴリに分類したい場合など大量のラベルやクラスで分類したい場合、既存手法では計算量が膨大になるなど様々な問題に直面します。そこで大量のラベルやクラスを用いて分類を行うタスクをExtreme Classificationと呼び研究が進められています。 Extreme Classificationとは？ Extreme Classificationは10万〜100万にも及ぶ膨大なラベルやクラスを用いて対象を分類するタスクです。このタスクは少なくとも10年以上前から研究が行われており、学会のワークショップなどでも取り組まれています。直近ではNIPS E
knok 2018/06/25
リンク
別シリーズにBGMが流用されてアレンジされるパターン
めっちゃ好きなんだがパッっと思いつかねえ
knok 2018/06/25
スパイダーマンホームカミングのOPで往年のドラマテーマソングの一節をアレンジして入れてたのは最高だった
リンク
「db analytics showcase Sapporo 2018」で玉川竜司さんのParquetの話を聞いてきました #dbts2018 #dbasSPR | DevelopersIO
「db analytics showcase Sapporo 2018」で玉川竜司さんのParquetの話を聞いてきました #dbts2018 #dbasSPR はじめに 2018年6月23日、札幌で開催されている「db analytics showcase Sapporo 2018」の玉川竜司さんのセッション「Parquet あるいは - まだCSVで消耗しているの？ -」へ参加してきましたのでそのレポートとなります。玉川さんのセッションは、単なるParquetの技術解説で終わらず、Apache ArrowによってHadoopエコシステムとPythonエコシステムの連携や、分散処理ではなくむしろ分散せずにローカルでうまくやるというパラダイムシフトを予感させる内容です。スピーカーあの玉川竜司さんです。「あの」って、、、そうです、下記の技術翻訳書をはじめ、他にも多数発刊している方です。
knok 2018/06/25
Python

分散処理

Amazon Web Services

techfeed

あとで読む
リンク
- 2018年6月26日
- 2018年6月25日
- 2018年6月24日