タグ

2008年2月14日のブックマーク (10件)

  • 高速半角全角ライブラリ

    Perlで半角・全角・絵文字処理を行うのに欠かせない Jcode モジュールですが、如何せん処理が遅い。Perl 5.8.xでは Encode モジュールがあるのですが Jcode と扱いが結構違うので (+д+)マズー Jcode 1.9 系/2.x系も内部実装が Encode モジュールに変更されたので、Jcoce 0.x 系と動作が違って (+д+)マズー そこで XS を使った半角・全角・imode絵文字処理を高速処理するモジュールを公開します。Jcode の処理に比べて 10 倍程度の高速化が期待できますが、XS モジュールなのでコンパイルできる環境が必要となります。 ※コンパイル済みのモジュールは gcc のバージョンの差異で動作しない可能性があるので配布を停止しました。 ≫スクリプトはこちら(DrkEncode.tar.gz) 動作環境 gcc 等の C コンパイラが使用

    mogwaing
    mogwaing 2008/02/14
    半角を全角に変換。cのソースが使えそう
  • 速く・短く・小さく - ユーザが作って公開する動画の今後の傾向

    速く・短く・小さく - ユーザが作って公開する動画の今後の傾向 2008-02-12-4 [Opinion][Video] ユーザが作って公開する動画の今後についての予想。 とくに根拠の無い勝手な予想です。 テレビが伝える時間当たりの情報量は少なすぎてかったるい、 と思っている人を対象とした編集が主流になる、というのが前提。 ■「速く」なる: 早送り再生機能がバリバリと使われるようになるだろう。 速視聴の時代が来る! 昔、早送り再生しても音が甲高くならないことを売りにした ビデオデッキがあったけど、ああいうのがまた来るだろうな。 あと、動画サムネールによるブラウズの高速化も必須。 サムネールで観たい部分をすばやく探して、早送り再生ですばやく観る、 というスタイルが流行る。 逆にそもそも早送り気味に編集したものが流行る。 ■「短く」なる: 長い動画をじっくり観るよりも、短い動画をたくさん観た

    速く・短く・小さく - ユーザが作って公開する動画の今後の傾向
  • テキストの文字種分割の補足 - daily dayflower

    Perl で日語テキストを簡単に字種かたまりに分割できないかな、 と思い、perlunicode を読みながらサンプルプログラムを書いてみました。 対象テキストは UTF-8Perl で日語テキストを字種分割 たつをさんは,m// でマッチングさせて分割させてますけど,これだと正規表現で網羅されてないトークンが失われてしまうと思います。 #!/usr/bin/perl use strict; use warnings; use utf8; binmode \*STDOUT, ':utf8'; my $src = <<"END_DATA"; zーあyxルーラでう、う9 10AB.DE「"GH'」★で漢字をカ・ナったー!?MJD39\x{2466}。 END_DATA print $src, "\n"; my @cs = ( $src =~ m/ ( \p{M}+ | \p{N}+

    テキストの文字種分割の補足 - daily dayflower
    mogwaing
    mogwaing 2008/02/14
    よくまとまっていて、すごい!
  • Japanese Katakana Unicode Entities

    mogwaing
    mogwaing 2008/02/14
    code カタカナ 全角 半角
  • Katakana - Wikipédia Sunda, énsiklopédi bébas

    mogwaing
    mogwaing 2008/02/14
    全角 半角 カタカナ
  • Perl で日本語テキストを字種分割

    Perl で日語テキストを字種分割 2008-02-06-2 [Programming] Perl で日語テキストを簡単に字種かたまりに分割できないかな、 と思い、perlunicode を読みながらサンプルプログラムを書いてみました。 対象テキストは UTF-8。 chunker.pl : #!/usr/bin/perl use strict; use warnings; use Encode; use utf8; use open ':utf8'; binmode STDIN, ":utf8"; binmode STDOUT, ":utf8"; while (<>) { chomp; my @cs = m/(\p{M}+|\p{N}+|\p{P}|\p{S}+|\p{Z}+|\p{C}+ |\p{Latin}+ |\p{Han}+ |\p{Hiragana}[\p{Hiragana

    Perl で日本語テキストを字種分割
  • 検索結果キーワードをハイライトするPerlモジュール

    検索結果キーワードをハイライトするPerlモジュール 2006-02-11-1 [Programming] HTML::ColorKeywords <http://ta2o.net/tools/pm/src/HTML-ColorKeywords-0.1.tar.gz> <http://ta2o.net/tools/pm/src/> (←最新版を調べるときはこっち) キーワード(複数)とマッチする箇所を span + background-color で ハイライトするPerlモジュールを作ってみました。 そもそも、Yasazon や AsamasiBookSearch で使ってたやつなのです。 このたび練習がてらPerl Module化[2006-02-03-3]してみました。 ↓こんな感じでハイライト。 なお、色はYahoo!のWeb検索結果のキーワードの色(10色)に準拠。 まあ、車輪

    検索結果キーワードをハイライトするPerlモジュール
  • McCoy | MDN

    McCoy は、アドオン作者がユーザのために安全な更新を提供できるようにしてくれるアプリケーションです。Firefox や Thunderbird などのアプリケーションはアドオンについて、定期的に更新情報を探し、インストールします。この時、取得された更新情報が、アドオンの作者によって書かれて以降、第三者によって改変されていないことが重要です。具体的にいうと、McCoy は更新情報の定義ファイルを電子署名するという処理に主眼を置いています。これによって、Firefox などのアプリケーションは、通常の安全でない経路を通じて取得した定義ファイルの完全性を検証することができます。 McCoy の技術的な詳細について学びたい場合は、プロジェクトの wiki を参照してください。

    McCoy | MDN
  • Latest topics > Firefox 3で安全にアドオンを配布するための方法のまとめ - outsider reflex

    Latest topics > Firefox 3で安全にアドオンを配布するための方法のまとめ 宣伝。日経LinuxにてLinuxの基礎?を紹介する漫画「シス管系女子」を連載させていただいています。 以下の特設サイトにて、単行まんがでわかるLinux シス管系女子の試し読みが可能! « ユニコーンガンダム 腕 Main ボーイズ・オン・ザ・ラン8 » Firefox 3で安全にアドオンを配布するための方法のまとめ - Dec 25, 2007 第8回Mozilla拡張機能勉強会のプレゼン資料を公開した。 以下、内容を改めて整理してみる。 update.rdfの確実性の保証 まず、Firefox 3ではセキュアな方法で自動更新が行われないアドオンはインストールできなくなる。ここでいう「セキュアな自動更新」とは、「インストールされたアドオンについて、自動更新でダウンロードしてきた新バージョン

  • Firefox/Roadmap - MozillaWiki

    Firefox is a key expression of Mozilla's mission and manifesto; it represents our vision of a people-centric web experience, as well as a platform and tooling that make it possible to do amazing things with the web.