タグ

ブックマーク / polog.org (3)

  • 誤字ェネレータを作った (polog)

    誤字ェネレータは、入力された文章に含まれている漢字を誤字に置換するアプリです。dreamhost上のRailsで動いてます。 glitchmonkeyとかその辺の技術が僕は結構好きで、glitchというかcorruptingと言うか、そう言ったノイズ系のフィルタを日語の文章にかけるのはどうしたらいいのか考えてました。一つの解は多分カットアップなんですが、それはもうきょうじんでやっていて結構いい感じなので、別のアプローチを考えてたんです。で、誤字かな、と。誤字って大抵見た目の似てる漢字を書いてしまうものなので、そういった感じの事を裏側ではやっています。 ぶっちゃけこれ僕の初めての割とまともな趣味webアプリなので、嬉しくって動画とか撮っちゃってます。使い方結構シンプルですがとりあえずこれを見て頂くと言う事で。 見ると分かると思うのですが、日語の文章なんてぱっと思いつかねえよって方の

  • Rubyで全ての漢字を列挙する (polog)

    正しくは"UTF-8で表現できる"が接頭辞につきます。また、前提として僕はエンコードやらバイナリやらに関してはドがつく素人です。 すべての漢字を取り出す正規表現を以前読んでいて、ちょっと作りたいものがあって全ての漢字の列挙を行いたかったのでこれを参考にやってみた。 多分だけど、Rangeで範囲内の全ての漢字を取り出せるかなあと思って、まずは単純にirbで ("一".."龠").step(1){|s| puts s} ってやった所、数百文字で止まり、しかも途中からは漢字ではない??みたいなのが出力されている。おかしい。どれくらいの範囲が確保されていて、どれくらい漢字でないものが含まれているんだろう。 unpackしてバイト列に直したものを10進数に変換してみる。 >> "一".unpack('C*').map{|i| i.to_s(16)}.join => "e4b880" >

  • http://polog.org/lab/kyoujin/kyoujin.cgi

  • 1