![はてなにおけるLinuxネットワークスタックパフォーマンス改善 / Linux network performance improvement at hatena](https://cdn-ak-scissors.b.st-hatena.com/image/square/a9b619053194e464e0c01042b7db8f25a0befc59/height=288;version=1;width=512/https%3A%2F%2Ffiles.speakerdeck.com%2Fpresentations%2F1c0ab465dca74bc7b0f955cb6955ba8a%2Fslide_0.jpg%3F6532770)
概要 多くの機械学習関連のライブラリのチュートリアルは解決するべき問題に対してある程度適切なモデルを初めから提示してくれますが、実際に機械学習を応用するのにあたって一番難しくて手間のかかるのはモデルのチューニングである気がします。特に最近流行ってる(ディープ)ニューラルネットワークを使いこなすのにはチューニングの要素が強いことが指摘されています。 モデルのチューニングで必要不可欠となるのがその検証です。この記事では機械学習全般で用いられる幾つかの検証方法を実装して比較します。 データの分割と誤り率 (error rate) モデルの学習に使用するデータを学習データ (Train Data)、検証に使用するデータをテストデータ (Test Data)といいます。時々学習データと同じテストデータを用いた検証を見かけますが、その場合機械学習の学習能力を示したことにはなっても、汎化能力を示したこと
SQLのパフォーマンス問題は、SQLそのものと同じぐらいの歴史がある―― ある人は、SQLはそもそも遅いものだとすら言うかもしれません。これは、SQLの歴史が始まった頃は正しかったかもしれませんが、今となっては全く 当てはまらないでしょう。にもかかわらず、SQLのパフォーマンス問題は今も一般的でよくあることです。どうしてそうなってしまうのでしょうか? SQL言語は、恐らく最も成功した第4世代言語(4GL)でしょう。その最大の利点は、「何を」と「どのように」 を分離できることです。SQL文は、どのようにそれを実行するかを記述せずに、単純に 何を必要としているかのみの記述になっています。以下のような例を考えてみましょう。 SELECT date_of_birth FROM employees WHERE last_name = 'WINAND'SQLのクエリは、データを要求する英語の文として読
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く