[B! unicode] [4ページ] kenjiro_nのブックマーク

kenjiro_n id:kenjiro_n

unicodeに関するkenjiro_nのブックマーク (118)

UnicodeのWAVE DASH例示字形が、25年ぶりに修正された理由　
kenjiro_n 2015/03/11
charcode

Unicode
リンク
JEPAセミナー「漢字データベースとユニコード」まとめ
含羞草 @humbleplant 空席あとわずかです。日本電子出版協会（JEPA）のセミナーのご案内。お題は「漢字データベースとユニコード」。『世界の文字と記号の大図鑑』の小泉均氏も本に絡めた話をします。本の〈特別割引〉有りです！詳しくは、以下をご覧ください。info.jepa.or.jp/seminar/201412…
kenjiro_n 2014/12/11
Unicode

_later
リンク
Pythonで出力したCSV(UTF-8)がExcelで読み込めなくて困った話 - 唯物是真 @Scaled_Wurm
Pythonで出力したUTF-8のCSVを渡したら「文字化けしてExcelで読めない」と言われて困りました原因は文字コードがUTF-8の時によく問題になるBOM(バイトオーダーマーク)ですバイトオーダーマーク - Wikipedia UTF-8のファイルにはBOMが付いている場合と付いていない場合があります ExcelはBOMが付いていないと正しく読み込んでくれませんなので、例えばメモ帳で開いて保存し直すと、BOMが付いてExcelでも開けるようになります今回の問題とは逆にBOMがついていると動かないこともあって、以前BOMが付いたUTF-8のファイルをChromeに渡したら何故か動かなくて悩みました Google Chrome のユーザースクリプトで名前やバージョン番号が反映されない - 唯物是真 @Scaled_Wurm ちなみにPythonだと文字コードにutf-8ではなくu
kenjiro_n 2014/12/09
OpenDocumentってほんと普及しませんなあ。

python

Unicode

MSOffice

badknowhow
リンク
Unicodeで伝わる間違った日本文化 - Folioscope
寒くなってきた今日このごろ、おでんが食べたくなったらUnicodeのU+1F362がある。しかしU+1F362には大きな間違いがある。それはUnicode Character Code ChartsのMiscellaneous Symbols and Pictographsに載っている。 seafood on skewer、日本語にすると「串に刺さったシーフード」である。確実に僕の知っているおでんの定義じゃない。念の為、「seafood on skewer」で画像検索してみる。やっぱり僕の知らないおでんだった。おまけ1 おでんの定義、ドラフト時には更によくわからなく、SEAFOOD CASSEROLE (Temporary Notes: seafood hotchpotch, oden)、日本語に訳すと「シーフード鍋料理（シーフードの鍋、おでん）」である。 SEAFOOD CA
kenjiro_n 2014/10/10
food

culture

Unicode
リンク
「絵文字に平等をサポートしてください」人種差別の指摘にゆれるUnicode　
kenjiro_n 2014/10/07
emoji

Unicode

humanrights
リンク
全角チルダ問題
株式会社メルカリ様で行われた第2回CircleCI ユーザーコミュニティミートアップでの資料です。 #circlecijp
kenjiro_n 2014/07/06
charcode

Unicode
リンク
携帯・PHS各社、メールの絵文字を共通化　Unicodeに対応
携帯電話・PHS6社は4月24日、キャリアメールとSMSで使える絵文字の数と種類の共通化を5月以降順次始めると発表した。従来は他社ユーザー宛てに送ったメールの絵文字が「〓」表示に置き換わるケースがあったが、今後は同じ文字が共通に表示されるようになる。発表したのは、NTTドコモ、KDDI、沖縄セルラー電話、ソフトバンクモバイル、イー・アクセス、ウィルコム。
kenjiro_n 2014/04/24
いまさら遅いんだっての。

emoji

Unicode

keitai

mobile

e-mail
リンク
文字コード地獄秘話第1話：Unicodeにおける全角・半角 - ALBERT Engineering Blog
ごあいさつ皆様はじめまして、文字コードおじさんです。細々とカメラ屋を営んでおりましたが、エンジニアとしての技量を評価され、ALBERTのシステム開発・コンサルティング部で働くことを許されました。特技はサーバーの統廃合です。今回は最初ということですが、Unicodeにおける全角・半角の取り扱いについて触れてみようと思います。なお、さも連載するかのように第1話と銘打っていますが、上層部の無慈悲な裁決によっては1話打ち切りもありえますので、その際はご容赦ください。固定観念を捨てよう「全角50文字、半角100文字まで」といったような文言を見かけたことがあると思います。特にUnicode以前のレガシーな処理系では全角文字に2バイト、それ以外は1バイトという割り当てが慣習となっていました。このため、「全角=2バイト文字、半角=1バイト文字」という観念が世間に定着しているのが現状です。しか
kenjiro_n 2014/04/21
Unicode

charcode

font
リンク
Unicodeを送られてLINEを初期化されたんですけど、強力なUnicodeありませんか？お願いします。 - リクエスト... - Yahoo!知恵袋
Unicodeを送られてLINEを初期化されたんですけど、強力なUnicodeありませんか？お願いします。
kenjiro_n 2014/01/07
とはいえレガシーとの橋渡しで悪戦苦闘している身としてはLINEの中の人も同様な悩みを持っているのかと同情してしまう。

LINE

Unicode
リンク
エクセルマクロの文字コード変換について。UTF8からSJIS変換 - VBA初心者です。以下のコードを使用してファイルの変... - Yahoo!知恵袋
エクセルマクロの文字コード変換について。UTF8からSJIS変換 VBA初心者です。以下のコードを使用してファイルの変換を行うと、変換元のファイルが上書きされてしまいます。有識者の方、コードの詳しい説明と解決方法をご教授下さい。 Sub UTF8toSJIS(ByVal InFile As String, ByVal OutFile As String) Const adTypeText = 2 Const adSaveCreateOverWrite = 2 Dim myST1 As Object, myST2 As Object Set myST1 = CreateObject("ADODB.Stream") Set myST2 = CreateObject("ADODB.Stream") myST1.Type = adTypeText myST1.Charset = "UTF-8"
kenjiro_n 2013/11/28
charcode

MSOffice

COM

VBA

Unicode
リンク
UTF-8にもいろいろある - ザリガニが見ていた...。
前回からの続き。改行コードの違いを体感してみる - ザリガニが見ていた...。文字エンコードとロケールを体感する - ザリガニが見ていた...。改行コードの違いも知った。文字コードとロケール、ターミナルの言語環境との関係も知った。これで文字にまつわる悩みとはおさらばできると思ったら、まだダメだった...。実験環境 OSX 10.8 Mountain Lion以前((OSX 10.9 Mavericksでは、Mac仕様なNFDのUTF-8を表示しようとするとエラーになってしまったため、10.8以前の環境で実験した。Assertion failed: (width > 0), function conv_c, file /SourceCache/shell_cmds/shell_cmds-175/hexdump/conv.c, line 137. ** ** Abort trap: 6
kenjiro_n 2013/11/25
charcode

Unicode

MacOSX
リンク
a2ps 4.14 の UTF-8 対応 (日本語のみ Japanese Only)
説明 a2ps で直接 UTF-8 なテキストファイルを印刷しちゃおうという試みです。 Fedora や Ubuntu あたりのパッチだと、EUC-JP は印刷できるけど UTF-8 のファイルを直接印刷しようとすると文字化けしてしまうのです。 UTF-8 なテキストファイルを iconv とかで EUC-JP に変換するようなラッパースクリプトを書いちゃえば良いと言えばそれまでですが、一応そのまま印刷できるようなパッチを作成してみました。とはいえ、a2ps の中で nkf (libnkfm)使って EUC-JP に変換してるだけという、かなりお粗末なものなので、もちろんw 日本語にしか対応していません。 m(__)m あと、エラー処理なんてしてませんので、気になる方は適当に直していただけますでしょうか。修正したものをフィードバックしてもらえるとうれしかったりします。 a2p
kenjiro_n 2013/10/18
野良ビルドする予定なのでCentOSタグは付けず。必要となるlibnkfmは同サイトの id:entry:166288490 にあり。

Kanji

postscript

Linux

text

charcode

Unicode
リンク
VARCHAR2(10)で何文字挿入できるのか(ORA-12899)
Oracleで文字列を入れるための項目属性 Oracleのデータベースの項目属性を定義する時、VARCHAR2()があります。 VARCHAR2()は、可変長の文字列です。 ()の中の数字が、挿入できるbyte数となります。このByte数を超えると、ORA-12899値が大きすぎますというエラーがでます。では、実際何文字入るのでしょうか。 VARCHAR()とVARCHAR2()は何が違うの？本論に行く前に、少し余談です。例えば、MySQLでは文字列の属性としてVARCHAR()があります。しかし、OracleではVARCHAR2()です。何故、Oracleは２なのでしょうか？実は、Oracleも以前はVARCHAR()で定義していました。しかし、ある時から廃止になり、現在はVARCHAR2()のみが利用されています（経緯不明）。 OracleのVARCHAR2(10)は何
kenjiro_n 2013/09/20
Oracle

Unicode

charcode
リンク
波ダッシュはチルダではない
コード変換において、JIS X 0208/0213の波ダッシュ「〜」(1面1区33点、シフトJISでは8160)をUnicodeの「FULLWIDTH TILDE」(U+FF5E)にうつす実装は不適切である。適切な変換先はWAVE DASH (U+301C)である。以下に理由を述べる。 JISの規格では「〜」は「波ダッシュ」と記述されており、文字名称は WAVE DASHと規定されている。よってUnicodeのWAVE DASHに対応すると考えるのが妥当。UnicodeのもとになったJIS X 0208-1990においてもやはり「波ダッシュ」であった。チルダではない。区点の並びからも、ダッシュやハイフンのような一般の記述記号の中にあり、チルダが属すべきダイアクリティカルマークとは離れている。 Unicode仕様書のWAVE DASHの説明には「JIS punctuation」
kenjiro_n 2013/09/05
Unicode

charcode
リンク
Hiki の UTF-8化 - EAGLE 雑記
ローカルに Wiki があるとメモに便利だと思ってインストールした。いろんな種類がある Wiki だけどシンプルなアピアランス日本語が不自由無く使えてちゃんとした HTML を出力する Ruby で実装されているということで Hiki を選んだ。しかしこれは EUC-JP で出力され、まぁ特に不自由はしないんだけど、UTF-8 が好きなので UTF-8 でやりとりするように改造してみた。とりあえず nkf で各テキストファイルを UTF-8 にする % find . -type f -exec nkf --in-place -w {} \; % find ~/hiki/data -type f -exec nkf --in-place -w {} \; ここで、~/hiki/data は hikiconf.rb の @data_path とする。 hiki.cgi の $KC
kenjiro_n 2012/04/13
UTF-8環境で運用できるhikiの作り方その２

hiki

Unicode

knowhow
リンク
16 « 11月 « 2008 « wp.krks.net
kenjiro_n 2012/04/13
UTF-8環境で運用できるhikiの作り方

hiki

Unicode

knowhow
リンク
Twitterで見かけるハミ出した顔文字の正体 - RyoAnna
少し前からTwitterで見かけるようになった、上下に飛び出す変な顔文字。気持ち悪いのであまり関わらないようにしていたのだが、この顔文字の謎が明らかになったのでお伝えしたい。いつものようにiPhoneのApp Storeをぶらぶらしていた時のこと。 Unicoder Lite (App Store)というアプリが気になりダウンロードした。起動するとなにやら見慣れた文字が。顔文字でよく使われるギリシャ文字やキリル文字だ。しばらく眺めているとこんな符号が。合成用区分符号これが上と下の行にはみ出す顔文字の正体だった。ためしに作ってみよう。ベースとなる顔文字を置く。左目に合成用区分符号を入れる。続いて右目に。見事にはみ出す。 Unicode（ユニコード）とは、世界中のコンピュータの文字を符号化したもの。その "U+0300-036F" に配置されているダイアクリティカルマー
kenjiro_n 2011/06/09
こういう文字の表示ってiPhoneの実装依存なの？

aa

Unicode

iPhone
リンク
「Unicode 6.0」が策定、絵文字が国際標準に
kenjiro_n 2010/10/14
表情系が元々のキャリア各社のものとUnicode化されたものとで意味が違ったという話 id:entry:16999107 は解決したのだろうか？

emoji

Unicode

charcode
リンク
MySQL 文字化け問題を本気で直す
mysql> status; -------------- mysql Ver 14.7 Distrib 4.1.20, for redhat-linux-gnu (i386) using readline 4.3 Connection id: 36 Current database: staff2006 Current user: maiha@localhost SSL: Not in use Current pager: lv Using outfile: '' Using delimiter: ; Server version: 4.1.20 Protocol version: 10 Connection: Localhost via UNIX socket Server characterset: latin1 Db characterset: latin1 Client char
kenjiro_n 2010/08/10
charcode

Unicode

knowhow

MySQL
リンク
文字コード（UTF-8,Shift_JIS,EUC-JP,ISO-2022-JP）についての俺的まとめ - 今日もスミマセン。
「プログラマのための文字コード技術入門」を読んで自分なりに理解した点をザックリとまとめてみる。それほど正確性を求めて書いているわけではないので、間違ってる可能性大です。間違いなどあればコメントなど頂けるとありがたいです。それぞれの文字コードはどう違うのか？日本語の文字コードは大きく以下の２つに分けられる JIS X 0208 文字集合をベースにしたもの Unicode文字集合をベースにしたもの JIS X 0208 文字集合をベースにした文字コードには、EUC-JP, Shift_JIS, ISO-2022-JP がある。 Unicode文字集合をベースにした文字コードには、UTF-8, UTF-16 などがある。上で挙げた「文字コード」とは正確には「エンコーディング（文字符号化方式）」の事を指す。文字符号化方式文字集合って？読んでそのまんま”文字の種類の集まり”。「キャラ
kenjiro_n 2010/07/12
いわゆる半角カナことJIS X 0201の話はややこしくなるからスルーしたのか。まあしょうがないか。

Unicode

charcode
リンク
前のページ 1 2 3 4 5 6 次のページ