タグ

ブックマーク / sleepy-yoshi.hatenablog.com (4)

  • 文字列をn文字ずつ分割 - シリコンの谷のゾンビ

    以前,split//を使って文字列を一文字ずつ分割という方法を学んだけれど,今度はn文字ずつ分割をしたい. どうやらsplitではできなさそうなので,正規表現を使う. # これでよい my @array = $str =~ /.{2}/g; # 直接スカラーに入れるのであればこうする my ($hh, $mm, $dd) = $str =~ /.{2}/g; これは便利!何ら新しい知識を使わずに解けた.

    文字列をn文字ずつ分割 - シリコンの谷のゾンビ
  • googletestではじめるC++の単体テスト - シリコンの谷のゾンビ

    今年度になって初めて単体テストなるものを使うようになったゆとりであるが,人間変われば変わるもので,コードを書いたら一緒にテストを書かないと不安を感じるようになった.それまでprintfデバッグでなんとかしてきたC/C++のコーディングもこのままではまずいと思って,巷で評判のgoogletestなるものを使うことにした. 家のページから最新版をダウンロード(orレポジトリからチェックアウト)して % ./configure % make % sudo make installすればいいんでしょフフン,と思っていたらmake installで怒られた.どうやらv.1.5あたりからgoogletestのアーカイブファイルをその都度作成することを推奨するようになったらしい.ゆとりは想定外の挙動に大層弱いので,これで一晩費やしたことは秘密.というわけで二晩目に何とか動いたので,作業メモ. さて,こ

    googletestではじめるC++の単体テスト - シリコンの谷のゾンビ
  • awk歴一日の初心者が語るawk理解のポイント - シリコンの谷のゾンビ

    今までテキスト処理などでワンライナーを使うときはperlを使っていた.Perlを先に覚えた身としてはawkやsedは過去の産物だと思い込んでいた.awkの方が簡潔に書けるケースに出くわしたことをきっかけにawkを勉強してみたら単なわず嫌いだったことに気が付いたのでポイントをまとめてみる. なおプログラミング言語としてはAWKという表記が正しく (Aho, Weinberger, Kernighanの頭文字! ということだけは以前から知っていた),オリジナル処理系のことをawkと呼ぶのだろうけれど,今回は処理系の違いは気にしないのでawk, nawk, gawkの違いは気にしないことにした.ていうか詳しく知らない. 「awkってなんぞ?」という方が対象読者.スクリプト言語と正規表現の基礎知識が少しでもあれば,たぶんすぐに使えるようになると思う.awkを一度でも使ったことがある人には新しい情

    awk歴一日の初心者が語るawk理解のポイント - シリコンの谷のゾンビ
    iww
    iww 2011/09/20
    なんというわかりやすさ
  • 転置インデックスで学ぶ検索エンジンの中身アプリ - シリコンの谷のゾンビ

    学生の頃から情報検索っぽい研究をやっていたくせに,転置インデックスてこんなものなんだ,ということを知るまで検索エンジンが正直怖かった.転置インデックスの概要を理解したら急に甘く見はじめるようになった(それはそれでいかんのだけど). 位置情報を持たせたり,転置インデックスの圧縮をした状態で説明されると急にアッーてなるけれど,一番単純な例を見るとすぐに理解できる. というわけで転置インデックスってこんな感じなんですよー.という一例を体験するプログラムをつくってみた.またJavaScript+TinySegmenter.工藤様毎度ありがとうございます. Text search indexing demo - 転置インデックスで学ぶ検索エンジンの中身アプリ これを見ると,転置インデックスって基的にこういう構造でデータを持つのかということが納得できると思います.Termをkey,Posting l

    転置インデックスで学ぶ検索エンジンの中身アプリ - シリコンの谷のゾンビ
    iww
    iww 2008/09/22
  • 1