春から山田孝雄「假名遣の歴史」のテキスト化を進めてゐたが、漸く年内中にPDF化まで漕ぎ着けた(出來れば製本まで進めたかつた)。爲事の遲い私にしては上出來だつた。材料自體は何年も前に揃へてゐたが、昔の舊字舊假名の本をOCRで讀みとるのは結構厳しいものがあつた。 次は誰をやつてみようかな。
漢字データベースを引くソフトを作る。 XUL+JavaScriptで作成することにした。GUIやSQLiteが使えて、マルチプラットフォームで動くからだ。 現時点ではコードポイントまたは漢字を入力すると、いくつかクエリを投げて表示するだけ。 将来的にはIDSデータなどと組み合わせて部品による検索や異体字表示ができるようにしたい。
「ネットワーク最前線」では,IPv4アドレス枯渇とIPv6移行をテーマとしたネットワーク関連の最新技術を展示する。また,最先端のAR(Augmented Reality:拡張現実)システムを,実際に触って試せるデモも用意する。 ITpro EXPO恒例の「ネットワーク最前線」。今回は大きく二つのテーマを掲げている。一つが「IPv4アドレス枯渇/IPv6移行」,もう一つが「AR(Augmented Reality:拡張現実)」だ。 IPv4アドレス枯渇/IPv6移行の最新対策 IPv4アドレスは早ければ2011年にも割り当て可能なアドレス・ブロックがなくなってしまうと言われている。そこでネットワーク最前線のIPv4アドレス枯渇/IPv6移行ホットステージでは,IPv4アドレスの枯渇に備えた最新の技術を紹介する。ポイントはIPv4ネットワークとIPv6ネットワークが混在する環境での対策だ。 A
命名・「やられWebアプリケーション」(仮) 構築したWebアプリケーションがセキュアかどうかを確かめる方法として、疑似的に攻撃を行うことで問題を発見する「脆弱性診断」があります。脆弱性診断は専門業者が実施することがほとんどだと思いますが、あなた自らが脆弱性診断の技術を身につけることで、セキュアWebアプリケーションについての理解が深まるとか、自社内で脆弱性診断ができるようになるといったこともあるかもしれません。 脆弱性診断の技術を身につける過程では、脆弱性を見つける手法を試したり、診断ツールを試したりする必要がありますが、診断といえど攻撃と同様のことを行うので、気軽に実稼働環境で実験するわけにもいきません。ましてや、他人や他社のWebサイトで試すなどはもってのほかです。 そこで、わざと脆弱性を持たせたWebアプリケーションと、それを動作させる環境が必要になります。 このような環境をわざわ
2009/10/08 Google DocsやGmail向けとしてグーグルが実装した「Google Docs Viewer」は、PDFやPowerPoint、TIFFに対応するJavaScript版の文書ビューアだ。もともとGoogle DocsやGmailといったサービス上にある文書ファイルや添付ファイルを対象とするビューアだったが、外部のオンライン文書に対してもURLをダイレクトに指定することで利用できる(例えば総務省の資料をDocs Viewerで開く例をクリックしてみてほしい)。Docs Viewerではサーバ側が実体ファイルを読み込み、それをレンダリング。その結果を1ページ1画像としてクライアントに順次読み込ませるという動作をする。 Docs Viwerはグーグルの外部にあるファイルでも利用でき、HTMLページに埋め込む機能もある。このことに、一部のユーザーは気付いていたが、これ
前の記事 ドイツの主流メディア、巧妙な「ネットの嘘」にだまされる どの虫にも強力な効果:万能防虫剤は「死の匂い」 2009年9月14日 Hadley Leggett Flickr/bensheldon. Flickrには「死んだゴキブリ」の画像シリーズが膨大にある/サイトトップの画像はWikimedia Commonsより ゴキブリからイモムシまで、昆虫は死んだ際にすべて、ある特定の臭いのする脂肪酸の組み合わせを放出することを、科学者が発見した。この不吉な臭いに出会うと、どの虫も一目散に逃げ出すのだという。 カナダのマックマスター大学の生物学者David Rollo氏は、ゴキブリの社会行動を研究中に、この気味の悪い発見に至った。研究チームは『Evolutionary Biology』の9月号で今回の研究結果を発表している。 ゴキブリは、(台所の食器棚など)素晴らしい居場所を見つけると、仲間
文字コードが引き起こすセキュリティ上の問題として、もっとも興味深いもののひとつである、Unicodeから他の文字コードへの「多対一の変換」で引き起こされる問題点について、今回と次回で説明します。 ご存じのとおり、Unicodeには非常に多数の文字が収録されていますが(現在最新版のUnicode 5.1.0では100,713文字が収録されているそうです)、Unicodeから他の文字コードへの変換においては、互換性や可読性の維持のためか、複数のUnicodeの文字が他の文字コードでは単一の文字に変換されることがあります。 この「多対一」の変換が、開発者も想定していなかったような問題を引き起こす原因となることが多々あります。 具体的な例として、Windows上でのUnicodeからの変換について説明します。 Windows上でのUnicodeからShift_JISへの変換 Windows上で
Apple Storeに立ち寄って買ってきたMac OS X 10.6 Snow Leopardを、仕事用のマシンにちゃらちゃらと上書きインストール。で、mashabowさん(しろもじメモランダム)のエントリ「Snow LeopardはIVSに対応しているらしい」の件について確認してみた。 テキストエディット*1とIVS対応フォント(手元にあるものでは、小塚明朝Pr6N、小塚ゴシックPr6N、花園明朝OT xProN)の組み合わせでは、異体字セレクタによってグリフが変化するのを見ることができる。IVSはクリップボード経由でコピー、ペーストすることが可能。 Snow Leopardに付属するヒラギノのバージョンはLeopardのそれと変わっておらず、IVSをサポートしていない。ファイル名中にIVSを含めることは可能だが、Finderで漢字を表示するフォントがヒラギノである限り、異体字セレクタ
遊べるものから辞書まで、それはもうたくさんのアプリが出ていますが、制作作業で使えそうなものを3つほどご紹介します。 NumberKey iPhoneをテンキーにするアプリ。テンキーのないMacBook Proなどで作業しているときに重宝します。 リリースが古いのでご存じの方が多いと思います。BALMUDA designさんが作っただけあって、MacBook Airと並べると純正アプリのようなできばえです。 BALMUDA design | NumberKey | Gallery Mobile Air Mouse MacBookのタッチパッド部分をアプリにしたようなもの。横向きにすれば全面で使えるだけでなく、Exposéまで使えます。 試してみたところ、かなり快適です。でも、制作作業がどう、というより、ちょっとしたプレゼンとか、少し離れたところからの操作に向いています。その際には[ユニバーサ
ルールブックに書かれたやりかたと、そのゲームに勝つためのやりかたとはしばしば異なって、 ゲームはだから、「ルールを守る」のが好きな人と、「ゲームに勝つ」のが好きな人と、 たいていは2つの文化が衝突する。 「イヤーノート」という教科書 「本がルールを書き換えた」先例がうちの業界にはあって、医学生ならたいてい誰もが持っていて、 医師ならたぶん10人が10人、その本を「クソだ」と断じる、「イヤーノート」という教科書がある。 医学部というのは医学を学ぶ場所だから、医学生の教科書というのは、 もちろん「医学」が体系的に、権威ある先生がたによって記述される。 教科書には、医師として知っていなくてはならないこと、診療に大切なことが中心に記載されて、 みんなそれを読んで勉強する。 ところが自分たちには「国家試験」というものがあって、これに合格しないことには、仕事が始まらない。 国家試験も試験である以上、「
InD-Boardの「字形について」というスレッドで話題になっていた「SINGで拡張された小塚Pro」の文字化けについて、InDesign CS4と小塚明朝Pro Rで検証してみた。 再現性にあいまいさはあるが、次のように言えそうだ。SINGで拡張された小塚Pro書体において、グリフXがSING拡張分ではなく(CIDが15443以下)、なおかつグリフXの親字PがSING拡張分であり(CIDが15444以上)、なおかつ親字Pの符号位置が基本多言語面の範囲外(Unicodeスカラ値が5桁)である場合、ドキュメントを保存して閉じた後に再び開くと、グリフXが親字Pに化けることがある。 わたしの環境では、字形パネルからダブルクリックで入力して(コピー&ペーストや書体の変更などをせずに)すぐに保存し開き直した場合、前項の条件を満たすものは100%化けた*1。 下図は、化ける文字のリスト*2。グレー枠の
以下、2009年7月13日23時頃の、n[ケヶカヵ个箇か]月に関する日本語ページの検索結果。 nケヶカヵ个箇か 一55,2006,250,000243,000400,00017,80038,100515,000 二22,000951,000106,00092,70052517,100135,000 三44,000924,000107,00088,6003,86026,00088,800 四4,670191,00036,30014,2001,7305,17019,900 五9,780122,00024,6009,2805683,73013,400 六6,620644,00048,20012,4001,49031,10018,700 七1,51067,10013,6005,3103459207,820 八99884,30018,4005,6105022,00013,000 九1,73040,9
tonan's blog: リュウミンやヒラギノ明朝の違いは「書体」の違いではない 個人的な感覚では、リュウミンやらヒラギノ明朝やら、(狭義の)「書体」(=タイプフェイス)を「書風」と呼ぶのはなんとなく違和感がある。「書風」という言葉からはどうも抽象的で、ある程度幅のあるイメージを受けるので、それこそ solid で「紋切り型」な活字に使うとしっくりこないというか、なんというか。印刷文字が手書き文字と不可分だということは分かっているけども、ここでは無理にまとめなくてもいいような気がする。 ちなみに、このあたりの用語を日中台で比較してみると、だいたいこんな感じになる*1。 日本中国台湾tonan案例 書体(広義)字体字體書体明朝体、ゴシック体、… 書体(狭義)、タイプフェイス字型書風リュウミン、ヒラギノ明朝、… 字体字形字形 字形 とはいっても、日本では書体・字体・字形の語がよくごっちゃで使
トナン・大熊肇の(ほぼ文字についての)覚え書きです。 充分に検証していないこともありますので、眉につばをつけてご覧ください。 連絡先:hajimeアットマークtonan.jp(「アットマーク」を「@」に変えてください) 『文字の骨組み』2刷の間違いとご指摘 『文字の骨組み』初刷の間違いとご指摘 『文字の組み方』訂正箇所 リュウミンとかヒラギノ明朝などのフォントの違いを「書体」の違いと書いてあるのを見かけるがそれはおかしいのではないだろうか。 楷書、行書、ゴシック、明朝とかの分類が「書体」の分類であって、リュウミンやヒラギノ明朝は明朝体という同じ書体である。 リュウミンやヒラギノ明朝というのは「書体」の下の階層の分類である。 ヒョウは 「動物界・脊索動物門・哺乳綱・ネコ目・ネコ科・ヒョウ属」 に分類される。 それならばリュウミンは 「図形界・文字門・表意文字綱・漢字目・明朝体科・リュウミン属
1989年、Appleは漢字Talk 6をリリースし、また、初の日本語対応PostScriptプリンタであるApple LaserWriter II NTX-Jを発売した。NTX-Jに搭載されていた日本語フォントは、モリサワのリュウミンL-KLと中ゴシックBBB。 プリンタ・フォントであるリュウミンL-KLと中ゴシックBBBの文字セットとエンコーディングは、Adobeによって83pv-RKSJ(以下単に「83pv」と呼ぶ)*1として定義されており、その外字部分(下図・左)は、NECのPC98外字のサブセットとなっていた。 リュウミンL-KLと中ゴシックBBBに対応するスクリーン・フォントとしてAppleから提供されたのが、細明朝体と中ゴシック体。漢字Talk 6.0.7でForeign System Fontをインストールすると、上図青地部分を画面表示することができた。 上図ピンク地部分の
いやいや、いままでWebで数式書くのに非常に苦労をしていたわけですよ、このブログも含めて。LaTeXからjpeg, gifの画像を出力したり、mimetexを使ったり、MathML使ったりと。しかし、画像だとあまりに汚いし、mimetexでもインテグラルの形だとかフラクションの大きさといった数式のバランスが悪くて気持ち悪くてしかたないし、その気持ち悪い数式にも関わらず個人的な相性がよくないはてな(mimetexがデフォルトで利用できる)に移るのはかなりビミョウだし。更に、MathMLにするとプラグイン入れていないと見えないし、通常の標準ブログではMathML自体をサポートしていないし。 だが、ここでようやく満足ができるレベルのLaTex->Webツールを見つけた。codecogsのこれである。 これなら例えばRiemann-von Mangoldtの明示公式は、 <img src="htt
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く