タグ

*historyとsys*に関するsh19910711のブックマーク (12)

  • そろそろMySQLのutf8について一言いっとくか - tmtms のメモ

    MySQLのutf8 charsetは、やれ「罠」だの「絵文字が入らなくて使えない」だの「utf8という名前はutf8mb4の別名にすべき」だの、散々な言われようでディスられてかわいそうな charset なんだけど、というか主に私がそう言ってる気もするんだけど、そろそろ utf8mb3 のエイリアスとしての utf8 は消え去ろうとしてるみたいなので、ここでちょっと勝手にフォローしておく。 UTF-8 エンコーディングの RFC は RFC3629で、ここで UTF-8 は最大4バイトと書かれている。 しかし、この RFC3629 の前のRFC2279では6バイトだった。 RFC3629 の日付は 2003/11 なので、つまり 2003/11 よりも前は UTF-8 の1文字のバイト数は最大6バイトだったのだ(少なくともRFC上では)。 MySQL が Unicode に対応したのはバ

    そろそろMySQLのutf8について一言いっとくか - tmtms のメモ
    sh19910711
    sh19910711 2023/04/09
    2018 / "MySQLのutf8 charset: 「絵文字が入らなくて使えない」だの「utf8という名前はutf8mb4の別名にすべき」だの、散々な言われようでディスられてかわいそう / 2003/11 よりも前は UTF-8 の1文字のバイト数は最大6バイトだった"
  • 名称未設定.entry : 404 Blog Not Found

    2005年12月18日19:57 カテゴリLogos 名称未設定.entry そう言い切ってしまうのは、名前の一面しか見ていない証拠だ。 Zopeジャンキー日記 :なぜネットではディレクトリが敗れ、サーチとタグが勝利するのか ネットでディレクトリが敗れ、サーチとタグが勝利するのなら、 1台のPCの中でもそうなるのは時間の問題だという気がする。 言語ゲーム - 無名ファイルシステムファイルは無名であるべきである。名前は単なる識別子ではないことを失念しているのではないか。 言語ゲーム - 無名ファイルシステム そこで、ファイルは無名を基とする。ファイル名の代わりにそれぞれのファイルに重複しないIDを付加し、参照するときはIDを使う。ファイル名とIDの違いは、ファイル名はディレクトリが持つのに対し、IDはファイル自身が持つ。勿論、ファイル名があっても良い。プログラマにはファイル名は非常に便利な

    名称未設定.entry : 404 Blog Not Found
    sh19910711
    sh19910711 2023/02/27
    2005 / "HFS(HFS+): OS X以前のMacのファイルシステム + ファイルを参照する時にはファイル名ではなくFRefNumという識別子を使う / ファイル名に識別子としての機能だけではなく、そのファイルが持つ役割を表す機能もある"
  • これだから世の中にはiso-8859-1しかないと思ってる奴らは... - 川口耕介のブログ

    NetBeansの中の人経由でこれを発見した。 Without default value for source encoding, platform encoding is used, which is bad for build reproducibility. Then setting a default value consistently across every Maven plugin will improve build reproducibility. Proposed default value: ISO-8859-1, which must be supported by every JVM (see java.nio.Charset) and is already the default value for some plugins (the majority of

    これだから世の中にはiso-8859-1しかないと思ってる奴らは... - 川口耕介のブログ
    sh19910711
    sh19910711 2023/02/08
    2008 / "「ソースファイルをiso-8859-1以外で書いているプロジェクトは無視できるくらい少数」っていう風に書いてある / 元々英語圏の人はエンコーディングとか文字セットとかそういうのが今ひとつわかってない"
  • Recent Topics on Internet Domain Names

    1. ドメイン名システム 歴史 1970年代、ARPANETはわずか数百台のホストから構成される、 非常に小さなネットワークであった。 これらのホストに関する情報はすべて HOSTS.TXTという一つのファイルに収められていた。 ファイルの体裁はUnixの/etc/hostsとよく似ていた。 すなわち、ホストの名前とIPアドレスとの対応がずらずら並んでいたのである。 このファイルはSRI-NIC (Stanford Research Institute - Network Information Center)によって一元管理されていた。 ARPANETの各サイトの管理者は、自分のサイトのホスト情報に変更が生じると、 それを電子メールでSRI-NICに連絡し、 SRI-NICの担当者は手動でその変更をHOSTS.TXTに反映させたのである。 また、各サイトの管理者は定期的にSRI-NICか

    sh19910711
    sh19910711 2022/09/17
    "ドメイン名: 1995年9月、それまで無料であったドメイン名登録に対して、 今日から手数料の徴収を開始する、とのアナウンス / 独自にルートネームサーバを立ち上げ、 勝手にドメイン名を割り当てるAlterNICなども現れた"
  • 研究室の思い出 印刷された大量のソースコード - yunomuのブログ

    2004年頃、大学4年で研究室に配属され、OSとネットワークの研究室でちょっと専門外の機械学習の研究をしていた。配属直後なので研究というより概念のお勉強から始まる。 その研究室では既に10年続くプロジェクトもあり、打ち合わせのために作られた大量の検討資料がファイルに綴じられて棚に刺さっていた。しかしよく見ると半数以上のラベルがプロジェクト名ではなく、「FreeBSD src/sys/alpha」とか「FreeBSD src/sys/boot」とか、何かのパス名みたいなものだった。そういうファイルが棚の1列分以上ある。なんだこれ、と思って先輩に聞いてみた。 「あのファイル何なんですか?」 「あーそれ、俺が印刷した」 この研究室は私が配属される2年前に教授が他の大学から移られてきてできたものであり、先輩は何もわからないままその研究室に入った人だった。教授が前にいた大学に研究室の先輩と言える

    研究室の思い出 印刷された大量のソースコード - yunomuのブログ
  • シフトJISの誕生 - 未来のいつか/hyoshiokの日記

    パソコンで最もよく利用されているエンコーディングの一つがシフトJISなのだが、その誕生については、なかなかまとまった資料がない。当時の関係者の証言を断片的にまとめたものしかない。 まづ小形さんの以下のBLOGとコメントを読む。当時の当事者が証言をしている。 http://d.hatena.ne.jp/ogwata/20051228/p1 シフトJISを発明したのは誰か? http://d.hatena.ne.jp/ogwata/20051229/p1 シフトJISを発明したのは誰か?(2) http://d.hatena.ne.jp/ogwata/20051230/p1 「BASIC80を漢字化した経理専用マシン」のこと http://d.hatena.ne.jp/ogwata/20060102/p1 たくさんのコメント、ありがとうございます 安岡さんの日記も参考になる。 http://s

    シフトJISの誕生 - 未来のいつか/hyoshiokの日記
  • yohei-y:weblog: CAP と BASE について調べたこと

    時系列で 1990年代後半: Eric Brewer (UCB)が inktomi でいろいろ作る CAPとBASEの基礎ができる http://www.ccs.neu.edu/groups/IEEE/ind-acad/brewer/ 2000年7月19日: Eric Brewer が PODC (Principles of Distributed Computing) の基調講演で CAP 定理?と BASE を発表 CAP は Brewer 予測として知られるようになる この時点で、inktomiと同等スケールのWebサービスの問題に対処していた人はあまりいなかったのかもしれない 2002年 MIT の Seth Gilbert と Nancy Lynch が CAP を形式化 ここで Brewer の CAP が晴れて定理となった この間、よくわからず 2007年-: eBay の

  • únicode is hard

    In the last couple of months, I've been seeing the ú symbol on British receipts. Why? 1963 - ASCIIIn the beginning* was ASCII. A standard way for computers to exchange text. ASCII was originally designed with 7 bits - that means 128 possible symbols. That ought to be enough for everyone, right? Wrong! ASCII is the American Code for Information Interchange. It contains a $ symbol, but nothing for o

    únicode is hard
  • RFCは、なぜ「意見募集」という名前だったのか?:Geekなぺーじ

    インターネットで使われる各種仕様の多くは、RFCと呼ばれる文書として発行されています。 RFCは、「意見募集」や「意見を求む」といった意味を持つRequest For Commentsの略ですが、インターネットに関連する通信仕様の標準を示す文書の名称が、なぜ意見を募集するとなっているのでしょうか? それには、初期のRFCが発行された時代背景があるのです。 RFCの文書番号は新しい文書とともに増加していくので、基的に文書番号が小さいほど昔のものになります。 最初のRFCである、RFC 1は、1969年4月7日に発行されています。 多少余談になりますが、RFC 1は、「インターネット」という単語が生まれる前に発行されています。 「インターネット(internet)」という単語が初めて登場するRFCは、1974年に発行されたRFC 675です。 1973年に発行されたRFC 604とRFC 6

    sh19910711
    sh19910711 2016/12/22
    “RFC 1は、「インターネット」という単語が生まれる前に発行されています。 「インターネット(internet)」という単語が初めて登場するRFCは、1974年に発行されたRFC 675です”
  • Javaのログ出力: 道具と考え方

    Concepts and tools of logging in Java. Javaにおけるログ出力の考え方と道具について説明. CC Attribution Licenseの元に公開します.Read less

    Javaのログ出力: 道具と考え方
  • なぜ html の form は PUT / DELETE をサポートしないのか? - Block Rockin’ Codes

    注意 内容については一切保証しません。 ここでは、主に W3C ML での議論や各種仕様などに基づいて書いています。 ここに書かれていることが正しいかどうかは、自身で判断して下さい。 事実としておかしいところなどは、コメントでどんどん指摘して下さい。遠慮はいりません。 ただし、このエントリでは「form が PUT/DELETE をサポートするべきかどうか?」の議論はしません。 「REST の是非」や「PUT/DELETE の意義」についても議論する気はありません。 ここでやっているのは、あくまでもどういった議論の末現状があるのかの調査です。 そうした意見がある場合は、 W3C などに投稿するのが最も有益だと思います。 History 2014/03/29: 公開 2014/03/29: XForm と XHTML の関係を明確化(thanx koichik) 2014/03/29: HT

  • Assembler/なぜx86ではMBRが"0x7C00"にロードされるのか?(完全版) - Glamenv-Septzen.net

    どの世代でも、当時のマシンに搭載されていた標準的な物理メモリを越えた場所を指している。 これは割り込みベクタの影響でアドレス0を使えない為と、最初の命令フェッチから始まる初期化プログラムをなるべくアドレスの高位に配置することで、一般的なプログラムの使えるアドレス空間を邪魔しないようにとの意図らしい。 BIOSが格納されたROMは、電子回路のレベルでこれら高位アドレスにマッピングされるよう調整されている。 IBM PC 5150 ではROM BIOSがFE000以降にロードされるようになっており、丁度 FFFF0H に、BIOSコードの先頭へJMPする機械語コードが配置されている。(後述) ※1 : 80286は24bitのアドレスバスを持つが、リアルモードでは20bitしか使われない。A20-A23はリセット後は1になっている。そのため、CSこそ"F000H"になっているが、もう4bit

  • 1