タグ

2018年3月3日のブックマーク (7件)

  • xgboost: テーブルデータに有効な機械学習モデル - Qiita

    import xgboost as xgb from sklearn.model_selection import GridSearchCV from sklearn.datasets import load_boston from sklearn.metrics import mean_squared_error # データ読み込み boston = load_boston() X_train, X_test = boston.data[:400], boston.data[400:] y_train, y_test = boston.target[:400], boston.target[400:] # xgboostモデルの作成 reg = xgb.XGBRegressor() # ハイパーパラメータ探索 reg_cv = GridSearchCV(reg, {'max_depth'

    xgboost: テーブルデータに有効な機械学習モデル - Qiita
    Kanasansoft
    Kanasansoft 2018/03/03
    XGBoostの使い方の簡単な解説。
  • Global COE Hi-Stat

    稿では、多変量回帰モデルにおける説明変数や構造変化の数についてのモデル選択規準を開発した最近の研究(Kurozumi and Tuvaandorj 2010)に関連して、情報量規準について話してみたい。情報量規準といえば、実証分析でもしばしば用いられるモデル選択の手法であるので、研究者はもちろん、多くの大学院生が利用していると思う。モデル選択の手法としては、この情報量規準と、仮説検定を繰り返し用いて有意な変数を残すという方法が代表的なものであるが、情報量規準の良さの一つは、その簡便性にあるだろう。たとえば、時系列モデルのラグ次数を選択する場合、仮説検定による方法は有意水準の設定いかんによって選択されるラグ次数が変ってしまうことがあるが、情報量規準だとそのようなことはなく、最適なモデルがただ一つ選択される。このように述べると、まるで情報量規準の方が優っているという誤解を招きかねないが、決し

    Kanasansoft
    Kanasansoft 2018/03/03
    AICとBICの解説。特にAICについて詳細に説明されている。まだ理解できていない。
  • 『傾打500円 超有名店販売品ん十万円品を暴く』

    わが国屈指の有名貨幣商で販売された500円180度傾打エラー銭 みごとな傾打だが・・・ 鑑定の依頼を受け調べてみましたところ、40~100倍程度の実体顕微鏡で加工痕を発見 画像からお分かりいただけますでしょうか? ニコイチ物であることがわかりますか? 加工の無い通用銭の拡大画像はこちら↓ 輪の内側をくり貫き精密に研磨された別個体をはめ込んでいるのがわかりますでしょうか? この痕跡は熟達すればルーペでも違和を感じることは可能ですが、こうしたものを目にしたことのない人ではまず気がつかない加工の痕跡でしょう。 事実品を販売したコイン商は知らない人はいないと言う有名店。 当時の古い所見でレベルもまだまだ低いものですが、参考までに その後品をX線透過撮影してみたところ驚愕の事実が判明いたしました。 まずわかりやすいように一般的な流通500円硬貨のX線透過撮影画像をご覧ください 表側と裏側の模様が

    『傾打500円 超有名店販売品ん十万円品を暴く』
    Kanasansoft
    Kanasansoft 2018/03/03
    『2枚の500円玉を削り1枚は蓋に、1枚はケースにしさらにその中に薄く削り500円玉ケースの中収納できるよう加工した50円白銅貨(額面側面)と同じく薄く研磨した10円青銅貨(額面面)を忍ばせてある』
  • 無償 Windows トラブルシューティング ツール集

    注意 このページにアクセスするには、承認が必要です。 サインインまたはディレクトリの変更を試すことができます。 このページにアクセスするには、承認が必要です。 ディレクトリの変更を試すことができます。 Windows Sysinternals は、IT 担当者や開発者が、Windows システムやアプリケーションを管理、トラブルシューティング、および診断する際に役立つ無償の Windows トラブルシューティング ツールの総称です。 Sysinternals Web サイトは、1996 年に Mark Russinovich (英語) によって、彼の高度なシステム ツールや技術情報をホストするために、作成されました。 Windows Sysinternals では、Windows のプロセスやファイル アクセスの状態を把握するための、さまざまなツールが無償で提供されています。例えば Win

    無償 Windows トラブルシューティング ツール集
    Kanasansoft
    Kanasansoft 2018/03/03
    『IT 担当者や開発者が、Windows システムやアプリケーションを管理、トラブルシューティング、および診断する際に役立つ無償の Windows トラブルシューティング ツール』
  • AWSのシステム構成情報を集めて構成図を自動生成してくれる「CloudMapper」、オープンソースで公開

    AWSのシステム構成情報を集めて構成図を自動生成してくれる「CloudMapper」、オープンソースで公開 CloudMapperを用いることで、AWS上のシステムについて以下のような状況をすぐに把握することができると説明されています。 どのリソースがインターネットに公開されているか? どのリソース同士がつながっているのか? アベイラビリティゾーンが落ちたときでも十分堅牢なアーキテクチャか? このアカウントはいくつのリージョンを利用しているか? どれだけ大きないシステムを運用しているか? CloudMapperを開発しているDUOは、セキュリティサービスを提供する企業。同社は自身もAWSユーザーで、さまざまなオープンソースのツールを試してみたものの満足できるようなものがなかったため、自社でCloudMapperを開発したとのこと。 CloudMapperの仕組みは、まずAWSコマンドライン

    AWSのシステム構成情報を集めて構成図を自動生成してくれる「CloudMapper」、オープンソースで公開
  • R言語 標準データセットの私的まとめ - Qiita

    Rには、分析手法や可視化手法を試すことのできる多くのデータセットが同梱されています。 その数は2016年12月現在で104個にも達していますが、その大半はあまり紹介されることがなく、知る機会も多くはありません。「ヘルプが英語で書かれている」というのもその要因の1つでしょうが、「数が多すぎて、何に使えるのか把握しきれない」という理由も大きいのではないでしょうか。 実は、 間瀬先生のR 基統計関数マニュアル の巻末 パッケージ 'datasets' の情報 - RjpWiki R 3.3.1の datasets パッケージ中のオブジェクトの全ヘルプドキュメント一覧 (Google Docs) などに情報がまとまっているのですが、アルファベット順に表記されているため、データの「構造」でソートしたものがあってもいいんじゃないかな、とふと思いました。 これらのデータについておおまかに分類して、概要

    R言語 標準データセットの私的まとめ - Qiita
    Kanasansoft
    Kanasansoft 2018/03/03
    Rに添付されているデータセットの解説。
  • https://prs.ism.ac.jp/~nakama/Rjp/datasets-manual.pdf

    Kanasansoft
    Kanasansoft 2018/03/03
    Rに同梱されている各データセットの説明。