blanketskyのブックマーク / 2009年1月19日

SVMにおける損失と正則化 - 射撃しつつ前転改

前に書いたSVMの記事で、「L1とかL2というのは間違えたときのペナルティをどう定義するかを意味しており」と書いていたが、L1とかL2って正則化項の話なんじゃないの、と疑問に思った。1ヶ月ほど時間をおいてのセルフツッコミである。確認しようとしてカーネル多変量解析を読むと、やはり正則化項についてはL1とL2の両方の説明が書いてあるが、損失に関しては普通のHinge Loss（=L1 Loss）しか書いてない。と言う訳で、ああ、間違えちゃったなぁ、と暗澹たる気持ちで"A dual coordinate descent method for large-scale linear SVM"を読み直してみたところ、やっぱりL1-SVMというのは損失が普通のHinge Lossで、L2-SVMというのはHinge Lossの2乗を損失とすると書いてあった。両方とも正則化項についてはL2正則化を使って

blanketsky 2009/01/19

svm

リンク

DBMによるテーブルデータベース - mixi engineer blog

正月早々インフルエンザにかかって寝込んだmikioです。電車に乗る時や繁華街などに出る時はマスク着用が必須ですね。さて今回は、Tokyo Cabinetで実装したテーブル方式のデータベースについて紹介します。意外にどうして強力な機能なので、このネタは連載することを予告します。テーブルデータベースとは簡単に言えば、リレーショナルデータベースのテーブルのように、複数の列からなるレコードを格納できるデータベースです。SQLや表結合などの複雑な機能はサポートしませんが、そのぶん高速に動作します。つまり、DBMの速度で動くリレーショナル風データベースです（厳密にはリレーショナルデータベースではありません）。 TCの基本となるハッシュデータベースは、単純なkey/value型のデータベースであり、つまりキーにも値にもスカラ（数値や文字列などの特に構造を持たない単一の値）しか格納することはできません

blanketsky 2009/01/19

DB

リンク

Programming UNIX Sockets in C - Frequently Asked Questions

Created by Vic Metcalfe, Andrew Gierth and other contributers (Transrated into Japanese by: Keisuke Mori)May 21, 1998 この文書は、UNIX 上でのソケットインターフェースを用いた TCP/IP アプリケーションプログラミングについて、頻繁に行われる質問とその解答を集めたものです。 1. 一般的な情報と概念 1.1 更新情報 1.2 この FAQ について 1.3 この FAQ はどのような人向けでしょうか? 1.4 ソケットって何ですか? 1.5 ソケットはどのように動作するのでしょうか? 1.6 [ある本の題名] という本のソースコードはどこから取得できますか? 1.7 どこでもっと情報を得ることができますか? 2. クライアントとサーバ(TCP/SOCK_STREA

blanketsky 2009/01/19

リンク

Unix Programming Frequently Asked Questions 日本語訳 - Table of Contents

このFAQについて 1 プロセス制御 1.1 新しいプロセスの生成: fork() 1.1.1 fork()は何をするのですか? 1.1.2 fork()とvfork()の違いは何ですか? 1.1.3 forkによる子プロセスを終了するときにexitよりも_exitを使うのはなぜですか? 1.2 環境変数 1.2.1 どうすればプログラム内で環境変数の値を取得・設定できますか? 1.2.2 どうすれば全ての環境変数を調べられますか? 1.3 どうすれば一秒未満のsleepができますか? 1.4 粒度の細かいalarm()はどうすれば得られますか? 1.5 どうすれば親プロセスと子プロセスの間で通信できますか? 1.6 どうすればゾンビプロセスができることを防ぐことができますか? 1.6.1 ゾンビプロセスってなんですか? 1.6.2 どうすればゾンビプロセスになることを防げますか? 1.7

blanketsky 2009/01/19

linux

リンク

*BSD で kqueue・kevent を使ってみよう

*BSD で kqueue・kevent を使ってみよう select() の欠点 select() は複数のディスクリプタをポーリングできる便利なシステムコールです。しかしパフォーマンスはよくありません。理由は以下の通りです。ユーザプロセスは、監視対象のディスクリプタ一覧をユーザ領域からカーネル領域にコピーする必要がある。カーネルがポーリング結果をユーザ領域に返す際もコピーしなければならない。カーネルは、ポーリング対象のディスクリプタを知るために、配列の全要素を調べなければならない。ユーザプロセスも、入出力可能なディスクリプタを知るために、配列の全要素を調べなければならない。上記の作業は、select() を発行するたびに毎回行わなければならない。 select() のパフォーマンスが悪いことは広く知られていたので、各 OS でいろいろな取り組みが行われてきました。 Sol

blanketsky 2009/01/19

network
BSD

リンク

poll/epoll/kqueueを任意に切り替えられるコード - Blog by Sadayuki Furuhashi

ネットワークで通信するプログラムを書いていると、ファイルディスクリプタ（ネットワークならソケット）をselectやpollで監視して、パケットが届いたら何かする、ということが良くあります。しかしselectやpollは、*BSD で kqueue・kevent を使ってみようで書かれているように、どうも遅いらしい。C10K問題が取りざたされている昨今、Linuxにはepoll、BSDにはkqueue、Solarisには/dev/pollというより高速な仕組みが用意されているのですが、epollを使ってしまうとLinuxでしか動かないし、kqueueで書くとBSDでしか動かない。というわけで、epollもkqueueも同じインターフェースで使えて、#defineで簡単に中身を切り替えられると嬉しい、とは誰しも一度は思うはず。そうに違いない。もちろん先人も同じことを考えており、libev

blanketsky 2009/01/19

リンク

はやいTCPサーバを書く際に忘れがちなこと - kazuhoのメモ置き場

はやいTCPサーバの書き方 - nyaxtのPC作業ログで id:nyaxt さんが書いてらっしゃるように、 epoll や kqueue を使う TCP_NODELAY, TCP_DEFER_ACCEPT *1 等を活用する TCP パケットを意識する I/O システムコールの回数を最小にする sendfile といったあたりは、確実にやるべきことだと思います。一方で、TCP 関連以外のオーバーヘッドが実は結構あって、接続のタイムアウト処理ログの出力メモリの確保や解放をやらないあたりにも気を配る必要がある、と思います。接続のタイムアウト処理については、以前 Kazuho@Cybozu Labs: 高速なCometサーバを書いてみた件に書いたように、ビットアレイのリングバッファを使うのがベストだと思います。ログの出力について、複数行を１回のシステムコールにまとめてもいいかど

blanketsky 2009/01/19

リンク

「ループは -1 まで回せ」 - kazuhoのメモ置き場

元の話題は int vs size_t probl em のあたり。符号なし型の減算ループをどう書くかという話。実は、一定数までカウントアップするよりも 0 を通り過ぎるまでカウントダウンする方が速度とコードサイズの両面で良い、ってのは最適化の定石だと思ってました。特にアセンブリレベルでは。自分が使ってた 68000 だと、ずばり、「レジスタの値をデクリメントして -1 じゃなければジャンプ」という DBRA 命令がある (しかも速い) し、x86 でも、 loop: ... subl $1, %esi jns loopみたいな形で、カウンタが符号なし型であっても高速なループが書けるんじゃないかと。でもそういえば Metrowerks のコンパイラはこの最適化をしてくれなかったような気がするけど GCC (4.0.1 (Apple Inc. build 5465)) だとどうなんだろと

blanketsky 2009/01/19

optimization

リンク

はてなブックマーク

タグ

2009年1月19日のブックマーク (8件)

SVMにおける損失と正則化 - 射撃しつつ前転改

DBMによるテーブルデータベース - mixi engineer blog

Programming UNIX Sockets in C - Frequently Asked Questions

Unix Programming Frequently Asked Questions 日本語訳 - Table of Contents

*BSD で kqueue・kevent を使ってみよう

poll/epoll/kqueueを任意に切り替えられるコード - Blog by Sadayuki Furuhashi

はやいTCPサーバを書く際に忘れがちなこと - kazuhoのメモ置き場

「ループは -1 まで回せ」 - kazuhoのメモ置き場

お知らせ

今週のはてなブックマーク数ランキング（2024年10月第2週）

今週のはてなブックマーク数ランキング（2024年10月第1週）

月間はてなブックマーク数ランキング（2024年9月）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス