id:yaneurao:20091001でFUJITSU ScanSnap S1500 FI-S1500を買って書籍を裁断してスキャンした話を書いた。 「もうどうせ残りの本は売ってもたいしたお金にもならないし」と書いたが、取り込んだ書籍の数は3,000冊強。総スキャンページ数、262,845枚。消耗品のパッド交換4回。ローラー交換2回。1冊の平均価格は3,000円程度。全体でおおよそ1,000万円。今回は、気がついたらこれだけの本を切り刻んでいた。id:yaneurao:20060131の本棚に換算すると14個分である。 たぶんアマゾンで売れば、その1/3ぐらいのお金にはなっていただろうから、ちょっともったいない気もする。私も当初はそこまで本を徹底的に切り刻む気はなかったのであまり気にもかけてなかった。 そこで、どうしてこんなことになったのか、つらつら考えてみた。 ■ 切り刻まずに取り込ん
大量のデータに対して散布図を描く場合、半透明な点をプロットすると、なんとなくカッコよく見えます。それだけと言えば、それだけですが。 ↑普通の散布図 ↑半透明化(アルファブレンド) ↑半透明化(アルファブレンド、縁なし) コードはこんな感じ。適当な乱数データをk-means法で3群にクラスタリングして、赤・青・緑の3色に色づけします。 # 300データ、3変数からなる標準正規乱数 x <- matrix(rnorm(900), 300, 3) # z変換して主成分分析 (3変数を2成分に要約するのに利用) pr <- prcomp(scale(x)) # k-means法で3クラスタに分離 cl <- kmeans(x, 3)$cl # プロット用データ x11 <- pr$x[cl==1,1] x12 <- pr$x[cl==1,2] x21 <- pr$x[cl==2,1] x22 <-
The BioInformatics Resource Inventory (B.I.R.I.) is a public online searchable index of bioinformatics resources developed at the Biomedical Informatics Group. The information describing the resources has been automatically extracted from the literature and indexed using Natural Language and Text Mining techniques. The index is automatically updated by analyzing new papers describing existing reso
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く