タグ

2015年8月24日のブックマーク (4件)

  • MySQL使いが知るべきPostgreSQLとの違いと変わらない一つのこと

    — そーだい@初代ALF (@soudai1025) 2015, 8月 24 とブーメラン投げて見事に刺さってるので今から記事書く。 両サイドにはかなり厳しい話もするが俺の音を聴いておけ(関白宣言) まぁ歴史の長いRDBなのでお互いの比較記事は沢山ある。 なのでマルチスレッド(MySQL)とマルチプロセス(PostgreSQL)だとかVACUUMだって話はしない。 むしろ実際に使ってみた際の違いをにフォーカスする。 1. SQLの違い 基的にMySQLでやっていたことはPostgreSQL出来る。 しかし関数の挙動の違いは幾つかある。 例えば時間から曜日に該当する数字に変換した場合に MySQL → date_format(time,"%w") 0から始まり、日曜日に該当する PostgreSQL → to_char(time,'D') 1から始まり、日曜日に該当する など挙動に互換性

    MySQL使いが知るべきPostgreSQLとの違いと変わらない一つのこと
    incep
    incep 2015/08/24
  • How to calculate 10-fold cross validation paired t-test for classification data?

  • Rによるウィルコクソンの順位和検定

    Rにてウィルコクソンの順位和検定 (Wilcoxon rank sum test) を行う。検定法は、ウィルコクソンの符号順位検定 (Wilcoxon signed rank test) とは別の検定法である。パッケージ"exactRankTests"に搭載されている関数"wilcox.exact"にて検定する。Rにデフォルトでインストールされている"stats"パッケージには"wilcox.test"が搭載されているが、この関数より"wilcox.exact"が使い勝手が良い。"wilcox.test"と違い、"wilcox.exact"では、正確なp値が計算される。 まず、Rを起動させ、以下のコマンドにてパッケージをインストールし、そのパッケージを読み込む。

  • 第21回(最終回) 機械学習 はじめよう | gihyo.jp

    連載第1回が掲載された2010年の6月から、休み休みながらも足かけ3年続いてきたこの『機械学習 はじめよう』も今回が最終回です。 21回にわたる連載の最後を飾る今回は、ここまでの流れの中では触れられなかった「機械学習で実用的なアプリケーションを作るときに気をつけたいこと」を中心にいくつかまとめます。 未知のデータへの対応能力 第9回で「過学習」について少し紹介しました。簡単に復習すると、「⁠過学習」とはモデルが「訓練データさえ正解になればいい」と状態になってしまうことで、未知のデータ(訓練データに含まれない、モデルが知らないデータ)に対する結果がデタラメになりがちという困った特徴があります。 しかも都合の悪いことに、モデルの表現力が高い(パラメータが多く、色々な分布を表すことができる)ほど過学習になりやすいことがわかっています。 そんな困った過学習を防ぐ方法の1つは、期待した答えのみが得ら

    第21回(最終回) 機械学習 はじめよう | gihyo.jp
    incep
    incep 2015/08/24
    基本的な考え方が書かれてあり気づき多し."いやいや,そんな湯水のように正解つきデータが出てくるなら,むしろ全部訓練データに回したいところです。"のくだりとか.過学習を避けるには.モデル選択の重要さ.