
日本語の漢字は、戸籍などに使われているものも含めると6万字あるのに対し、コンピューターは、実は1万字しか扱うことができません。これに対し、このほど15年越しの作業の末、6万字すべてが統一の規格にまとめられて、コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。 中には、メーカーなどが独自に対応した外字もありますが、コードが無いために、メーカーごとの互換性が無く、データを受け渡してもコンピューターが認識できずに「文字化け」してしまったり、ある人の名前に本名の外字を充てたものと略字を充てたものの2つのデータがあった場合、コンピューター上では、別の人と認識されてしまったりするなどの問題が起きていました。 このためIPA=情報処理推進機構は平成14年から、経済産業省とともに外字を含めたおよそ6万字の漢字1つ1つに、コードを割りつける作業を進め
basE91という符号化方式を最近知った。Base64のような感じで91文字使うというもの。1文字のバリエーションが多いので、Base64より膨張率が低いのが特徴だ。C,Java,PHPあたりの実装が公開されている。 http://base91.sourceforge.net/ ちょっとJavascriptから使いたいことがあったので、実装を探したところJavaからの移植版があったんだが、ちょっと遅い…*1。 というわけで移植し直して、アルゴリズム以外のところでできるだけ速くしてみた。 http://no18.info/~kazy/javascript/base91.html encode/decodeのテストと繰り返し実行時の時間計測ができるようになっている。一応UTF-16⇔UTF-8変換をして日本語も通るようにした。 dankogaiさんの正規表現使ったBase64実装とも比較できる
商品リンクをクリックし通販サイトへ飛ぶ物は 「 広告 」のリンクです。 記事を AI に読ませ、読みやすいよう指摘を受け 表現を調整することはありますが記事全体を AI にて執筆することはございません。 Base64 のエンコード/デコードが物入りになったので Vector にて入手した後、うろついていたら Base91 をエンコード/デコード できるソフトを以下のサイトで発見。 Chop chop Master at Infoseek Base91 とかほぼ聞いた事無いけど 使う事がある時用メモ・・・使う事あるのかなあ。 おすすめリンク ・Amazon / 楽天市場 でお買い物をする。 関連リンク ・拡張子.axx を復号化する。 ・Win7でPGPを使う。 関連記事 たまに食べたくなる パンの耳 侮れないおいしさ。 (2017/01/10) 第2211回「ブログを始めたきっかけはなんで
2019年8月6日に開催されたヤフー名古屋Tech Meetup #3の内容です。 #3 は「Webフロントエンドを支えるノウハウ」をテーマに開催しました。 JJUG CCC 2019 fall g3のセッション資料です。 「ちょっと凝ったことをしようとすると大量のXMLを書かなきゃいけない」「プラグインを並べてもうまく動いてくれない」など、Mavenは誤解され敬遠され、Gradleなどの他のビルドツールにシェアを奪われてきました。 が、依然としてMavenはJavaのデファクトスタンダードなビルドツールに位置づけられており、マスターする価値は十分にあります。そして良く学んでみると、そもそもXMLで過度なカスタマイズしようというのが誤った使い方だったのに気づきます。そこへ至るにも、タスクランナーの延長線上にある他のビルドツールと異なり、Maven独特なライフサイクルとプラグインの関係性もき
Base64 Encoding for Images. 画像自体をBase64エンコードしてHTML内に埋め込んで高速化するPHPコード例。 Googleがインスタントプレビューや画像検索で導入してその読み込み速度に驚いた方も多いかもしれません。 その手法をPHPで実現するコードが掲載されていましたのでご紹介。 PHPでやるにはそんなに難しいわけではなさそう。 <?php $img_src = "image/sample.png"; // 画像ファイルの指定 $imgbinary = fread(fopen($img_src, "r"), filesize($img_src)); // バイナリデータを読み込み $img_str = base64_encode($imgbinary); // base64エンコード echo '<img src="data:image/png;base6
補足 この記事は旧徳丸浩の日記からの転載です(元URL、アーカイブ、はてなブックマーク1、はてなブックマーク2)。 備忘のため転載いたしますが、この記事は2010年9月27日に公開されたもので、当時の徳丸の考えを示すものを、基本的に内容を変更せずにそのまま転載するものです。 補足終わり PHPカンファレンス2010にて「文字コードに起因する脆弱性とその対策」というタイトルで喋らせていただきました。プレゼンテーション資料をPDF形式とslideshare.netで公開しています。 文字コードのセキュリティというと、ややこしいイメージが強くて、スピーカーの前夜祭でも「聴衆の半分は置いてきぼりになるかもね」みたいな話をしていたのですが、意外にも「分かりやすかった」等の好意的な反応をtwitter等でいただき、驚くと共に喜んでいます。土曜にPHPカンファレンスに来られるような方は意識が高いというの
「プログラマのための文字コード技術入門」を読んで自分なりに理解した点をザックリとまとめてみる。 それほど正確性を求めて書いているわけではないので、間違ってる可能性大です。 間違いなどあればコメントなど頂けるとありがたいです。 それぞれの文字コードはどう違うのか? 日本語の文字コードは大きく以下の2つに分けられる JIS X 0208 文字集合をベースにしたもの Unicode文字集合をベースにしたもの JIS X 0208 文字集合をベースにした文字コードには、EUC-JP, Shift_JIS, ISO-2022-JP がある。 Unicode文字集合をベースにした文字コードには、UTF-8, UTF-16 などがある。 上で挙げた「文字コード」とは正確には「エンコーディング(文字符号化方式)」の事を指す。 文字符号化方式 文字集合って? 読んでそのまんま”文字の種類の集まり”。「キャラ
JavaScript encodeURIComponent() UTF-8限定 /home/akiyan/encodemaniax/webroot/index.html on line 70 "> Warning: Undefined array key "js_encodeuricomponent" in /home/akiyan/encodemaniax/webroot/index.html on line 71 JavaScript encodeURI() UTF-8限定 /home/akiyan/encodemaniax/webroot/index.html on line 70 "> Warning: Undefined array key "js_encodeuri" in /home/akiyan/encodemaniax/webroot/index.html on line
2009年06月08日14:30 カテゴリLightweight Languages perl - use encoding; #は黒歴史 ぎゃあぁぁ length関数で文字列の長さを求める - perl初心者BLOG - Hatena::Group::Perl 日本語の文字数を正確に求めたい場合、use encodingを指定する use encoding;は、jperlなど、かつて存在したL10Nされたperl用に書かれたレガシースクリプトを、モダンperlで動かすときのためのおまじないです。こういう目的で利用すべきではありません。 このあたりのことは、以前 404 Blog Not Found:perl - no encoding; # whenever possible でも書いたのですが、大事なことなのでまた書きます。 スクリプトはUTF-8で書き、use utf8;する のがモ
x264 日本語 Wiki † ようこそ! ここは x264 について日本語で情報を交換するための場所です。 誰でも編集が可能で、誤りも後から直せます。どんどん編集を加えていってください! フォーラムもあります。気軽に参加してみてください。初心者の質問も募集中! ↑ x264 リヴィジョン情報 † rev968 未満と以降とで大きな違いがあります。変更点がよく分からない場合は rev967 を使ってください。 ↑ seraphy 氏ビルド † 通常版: rev999 release01 (2008年10月03日) いろいろパッチ版: rev999 release01 (2008年10月03日) OreAQ 版: rev999 release01 (2008年10月03日) readme.txt を必ず読んでください。 いろいろパッチ版を使うときは通常版の readme.txt も
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く