タグ

ブックマーク / tmasui.blogspot.com (4)

  • ユビキタスの街角: ISBNについて調べたり教えてもらったりしたので情報をまとめておく

    ISBNについて調べたり教えてもらったりしたので情報をまとめておく。 番号の構成 従来は10桁(9桁の番号+チェックディジット)だったが、番号枯渇の心配があるためため2007/1から13桁になった。 2008/1現在、10桁で処理されている環境も多いようである。(e.g. AmazonのASIN) 日の10桁ISBNは4-AAAA-BBBB-Cという形式になっている。最初の「4」が日の番号。 AAAAは出版者記号で2桁〜7桁の数字。 BBBBは書名記号で6桁〜1桁の数字。 Cはチェックディジットで、その前の9桁から計算される。 AAAAとBBBBの桁数の合成は8桁に固定。出版者記号が7桁の場合10冊しか定義できない。 出版者記号が2桁の会社は岩波(00), 角川(04)など20社。 ISBN出版社リスト - 2桁出版者, 3桁出版者, 4桁出版者, 5桁出版者, 6桁出版者, 7桁出版

  • ユビキタスの街角: ブラウザ操作の自動化

    Perl/Rubyのようなスクリプト言語やElispプログラムを使って 面倒な仕事や編集操作を自動化することはよく行なわれているが、 ブラウザ上での操作の自動化はまだあまり流行っていないようである。 ブラウザ上の処理を簡単にプログラミングする方法がなかったためであるが、 最近はブラウザ操作を自動化するためのツールが増えてきた。 Firefoxの拡張機能であるMozLabの MozReplというツールを使うと、 Firefoxに外部からtelnetして制御することができる。 Firefoxの拡張機能であるChickenfootを 使うと、JavaScriptでFirefoxを制御できる。 Firefoxの拡張機能であるiMacrosを使うと、 ユーザ操作を記録して再生することができる。 これらを使えばFirefoxでもEmacsと同じように様々なプログラミングや自働処理ができるようになる。

  • ユビキタスの街角 データ圧縮手法の応用

    PPM (Prediction by Partial Matching)というデータ圧縮アルゴリズムがある。 一般に、あるデータ列が与えられているとき、次に来るデータを予測することができればデータ圧縮を行なうことができる。 データ列から判断して次に来るデータが「a」だと確実に判断できるときは「a」を記述する必要が無いからである。 PPM法では、既存のデータ列中の文字列出現頻度を計算することによってこのような予測を行なう。 たとえば「abracadab」というデータの次にどの文字が来るか予測する場合、 「a」は4回、「b」は2回出現している 「b」の後に「r」が続いたことがある 「ab」の後に「r」が続いたことがある ... といった情報を累積して確率を推定する。 この場合、 (3)から考えて次の文字は「r」である確率が高いが、 (1)も考慮すると「a」の確率もある、という風に計算を行なう。

  • ユビキタスの街角: Knuth先生にアルゴリズムを教えたよ

    Donald Knuth先生の 弟子の播口さんに誘われて、 Knuth先生と夕を御一緒させていただいた。 185cm以上はある大きな人で、想像よりも若かった。 1938年生まれだからまだ70歳らしい。 とても頭が良さそうな顔をしている。当たり前か。 世間話の中で先生の執筆環境について聞いてみた。 M: 「文章書きとかどういう環境でやってるですか?」 K: 「大きなマシンも使ってるけど文章とかはLinuxノーパソでEmacsだね」 M: 「Emacsなんですか。仕様が変で困ったりしませんか?」 K: 「変な機能は使わないからね。自分で色々カスタマイズしてるし」 K: 「たとえば行に色をつけるElispを使ってる。参考文献リストとか書くときに、 大事なのとそうじゃないので色を変えるんだ」 K: 「CWEBを書くための仕組みも作ってる。まだ書いてないモジュールのリストは全部 木構造でダンプして

  • 1