タグ

twitterとunicodeに関するtarchanのブックマーク (3)

  • 「突然の死」1行化プロジェクト(しっぱい!) - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    たとえば、こんなの(下図)を……*1 Safariのようなブラウザで見ると、改行が保障されずレイアウトが崩れてしまう(下図)。自分の環境であればスタイルシートで改行を有効にしたりできるのだけれど、他人様の環境はどうしようもない。 そこで、改行を含まない(上下の部品に結合文字を使った)「突然の死」を、いくつか試作してみた(下図)。A案はオリジナルを比較的忠実に再現したものだが、どうも迫力がない。そこで結合文字をさらに重ねて上下に伸ばしたのがB案。オリジナルに似せるのを完全に諦めてインパクトを重視したのがC案。いずれもエディタ上ではそこそこに見えるが、実際にツイートしてみると、どうだろう。 下図はMacTwitterアプリ。A案(中)の不等号が&gtや&ltになってしまうのはTwitterアプリのバグだろうか。C案(上)とB案(下)は、なかなかいいかんじ(?)。 下図はMacのSafari。

    「突然の死」1行化プロジェクト(しっぱい!) - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • Twitterで見かけるハミ出した顔文字の正体 - RyoAnna

    少し前からTwitterで見かけるようになった、上下に飛び出す変な顔文字。 気持ち悪いのであまり関わらないようにしていたのだが、この顔文字の謎が明らかになったのでお伝えしたい。 いつものようにiPhoneのApp Storeをぶらぶらしていた時のこと。 Unicoder Lite (App Store)というアプリが気になりダウンロードした。 起動するとなにやら見慣れた文字が。 顔文字でよく使われるギリシャ文字やキリル文字だ。 しばらく眺めているとこんな符号が。 合成用区分符号 これが上と下の行にはみ出す顔文字の正体だった。 ためしに作ってみよう。 ベースとなる顔文字を置く。 左目に合成用区分符号を入れる。 続いて右目に。 見事にはみ出す。 Unicode(ユニコード)とは、世界中のコンピュータの文字を符号化したもの。その "U+0300-036F" に配置されているダイアクリティカルマー

    Twitterで見かけるハミ出した顔文字の正体 - RyoAnna
  • Python-twitterが欧米仕様だったので日本仕様に直したでござるの巻 — TRIVIAL TECHNOLOGIES 2.0

    みんなのIoT/みんなのPythonの著者。二子玉近く160平米の庭付き一戸建てに嫁/息子/娘/わんこと暮らしてます。月間1000万PV/150万UUのWebサービス運営中。 免責事項 プライバシーポリシー 半裸Botを作ったとき,PythonTwitterAPIをほげほげするのにPython-twitterを使ったんだけど。ちょっと長いTweetをPostしようとすると,「140文字以上あるよ!」という例外が発生してしまう。実際Tweetは60文字くらいしかないんだけど,おかしい。 なんでだろうと思ってソースを見てみたら原因が判明。ユニコードの8ビット文字列を,バイト列として見ている。これだと日語のマルチバイト文字列が3倍の文字数と判別されてしまう。ASCII圏のことしか考えないのは欧米製のライブラリにはよくあることで,ひょっとしたらとは思ってたけど。 ソースコードをちょっと書き換え

  • 1