タグ

文字に関するS0R5のブックマーク (11)

  • デーヴァナーガリー文字を普段使いしたい

    1993年生まれ。京都市伏見区出身、宮崎県在住。天性の分からず屋で分かられず屋。ボードゲームと坂口安吾をこよなく愛している。 前の記事:高千穂の郷土料理「かっぽ鶏」はワイルドでおいしい > 個人サイト もがき続けて100年生き抜くブログ >ライターwiki こういうことがしたいのです ラテン文字で書かれた文章がすべて英語ではないことと同様に、デーヴァナーガリー文字で書かれた文章がすべてヒンディー語やサンスクリット語になるというわけではない。これが今回の特集のキモである。詳しいことは後述するとして、まずは目指すところを提示したい。 これがデーヴァナーガリーで書かれた文章である。読み方は知らなくとも、なにか神聖なメッセージが記されているという気はするだろう。 しかし書かれているのは、こちら側のどこからでも切れます、だ。 他の例も挙げよう。日常に根ざしたメッセージを書くこともできる。 よりにもよ

    デーヴァナーガリー文字を普段使いしたい
  • 端末の文字幅問題の傾向と対策 | IIJ Engineers Blog

    電子メール、ネットワーク機器集中管理、異常検知、分散処理、クラウド基盤などのシステム開発に従事。古代Rubyist。 CLI や TUI なアプリケーションを使っていると、端末の画面が崩れてしまうことがよくあります。 たとえば、こんな TUI が、 環境によってはこんな感じで崩れます。 スクロールなどをしながらしばらく使っているとさらにどんどん崩れていきます。 こうなってしまった場合、とりあえず Ctrl-l で画面を再描画することで、大抵はなんとか読める程度にリセットできますので、ことあるごとに Ctrl-l を連打することになります。 ですが、どうしようもないケースもままあります。 例えば、私の場合は以下のようなシチュエーションで困ります。 w3m でテーブルなどを表示するとレンダリングが崩れる less でログの閲覧の際に表示されるべき文字が表示されず見落としが発生する Wander

    端末の文字幅問題の傾向と対策 | IIJ Engineers Blog
  • お医者さんからもらった診断書の衝撃的な文字を手書きフォントにして『走れメロス』を書いたらこうなった

    藤原 麻里菜 | Marina Fujiwara @muda_zukuri みなさんも使えるようにダウンロードリンクを用意しました。ひらがなカタカナ簡単な漢字と記号が入っています。 fujiwaram.com/archives/1001 2021-09-01 12:55:38

    お医者さんからもらった診断書の衝撃的な文字を手書きフォントにして『走れメロス』を書いたらこうなった
    S0R5
    S0R5 2021/09/04
    そういえば、先日ワクチン接種した時の予診票に書かれた医師の署名も、読めない文字で書かれてた。
  • 戸籍統一文字の見たことない漢字鑑賞会

    2020年のプープーテレビで好評だった「戸籍統一文字の見たことない漢字鑑賞会」を文字起こししました。 動画で見逃した人もどうぞ。 --- 林:たまたまたどり着いて知ったんですが、「戸籍統一文字」っていうのを法務局が作ってるんですよ。戸籍ってコンピューターで出ない文字が使われているので、専用にコードをふっているんですよ。そしてまだたまに追加されているらしいです。 べつやく:まだ追加されているんだ 林:そう、そして検索できるページが用意されているんです。 林セレクト 林:これはすごいのあるぞ、と推したい字はこれですね。三の続きで「シ」。 西村:三の次だからね べつやく:「二」がふたつなんですよね 伊藤:もっと4以上はないんですか? 西村:「ご」とかね 林:なかったんですよ 西村:探したんですね? べつやく「ろく」もなかったんだね 西垣:なだらかに四になっててもいいのにね 林:そうですよねぇ

    戸籍統一文字の見たことない漢字鑑賞会
    S0R5
    S0R5 2021/04/18
  • 漢字のようで漢字でないUnicodeの「康熙部首」と「CJK部首補助」|TechRacho by BPS株式会社

    きっかけ 以下のツイートで「埼玉埼⽟問題」と康煕部首を知りました。 「埼玉」と「埼⽟」の話。unicodedata.normalize('NFKC', '「埼玉」と「埼⽟」') でいけそう https://t.co/kte0sxDvZT — Haruhiko Okumura (@h_okumura) July 11, 2020 康煕部首とは ⼀⼁⼂⼃⼄⼅⼆⼇⼈⼉⼊⼋⼌⼍⼎⼏⼐⼑⼒⼓⼔⼕⼖⼗⼘⼙⼚⼛⼜⼝⼞⼟⼠⼡⼢⼣⼤⼥⼦⼧⼨⼩⼪⼫⼬⼭⼮⼯⼰⼱⼲⼳⼴⼵⼶⼷⼸⼹⼺⼻⼼⼽⼾⼿⽀⽁⽂⽃⽄⽅⽆⽇⽈⽉⽊⽋⽌⽍⽎⽏⽐⽑⽒⽓⽔⽕⽖⽗⽘⽙⽚⽛⽜⽝⽞⽟⽠⽡⽢⽣⽤⽥⽦⽧⽨⽩⽪⽫⽬⽭⽮⽯⽰⽱⽲⽳⽴⽵⽶⽷⽸⽹⽺⽻⽼⽽⽾⽿⾀⾁⾂⾃⾄⾅⾆⾇⾈⾉⾊⾋⾌⾍⾎⾏⾐⾑⾒⾓⾔⾕⾖⾗⾘⾙⾚⾛⾜⾝⾞⾟⾠⾡⾢⾣⾤⾥⾦⾧⾨⾩⾪⾫⾬⾭⾮⾯⾰⾱⾲⾳⾴⾵⾶⾷⾸⾹⾺⾻⾼⾽⾾⾿⿀⿁⿂⿃⿄⿅⿆⿇⿈⿉⿊⿋⿌⿍⿎⿏⿐⿑⿒⿓⿔⿕ KangXi Radica

    漢字のようで漢字でないUnicodeの「康熙部首」と「CJK部首補助」|TechRacho by BPS株式会社
  • UTF-8 の文字列をできる限り Shift_JIS に変換したい - きりきりやま

    Shift_JIS の CSV で連携する外部サービスがあり、DB では UTF-8 でテキストを持っていたため文字コードを変換する必要が生じた。 ところが UTF-8 に存在する多くの文字は Shift_JIS に対応がないため変換することができない1。 そこで、事前に NFKC 形式で Unicode 正規化することで変換可能な文字を増やすことを試みた。 まずは Unicode 正規化の前提として、Unicode の正準等価と互換等価について説明する。 以降の U+16進数 という表記は Unicode のコードポイント (文字に ID のようなものが割り当てられている) を示す。 また、コードポイントに対応する文字の詳細は https://codepoints.net/ といったサイトで確認することができる。 正準等価 例として、ひらがなの「が」について考える。Unicode では「

    UTF-8 の文字列をできる限り Shift_JIS に変換したい - きりきりやま
    S0R5
    S0R5 2020/08/07
  • ヴォイニッチ手稿について - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? ヴォイニッチ手稿ハッカソンという謎のイベントが開催されるので主催でもなんでもないけど勝手にそれ向けの資料をまとめていく。 計算言語学の論文を書いた時に、ネタでVoynich manuscriptとRongorongoも一緒に計算対象にしたりして、サーベイをしたのでその時の知見をまとめて行く。書いた論文は別に未解決文字にフォーカスした論文ではなく面白いかどうかはわからないけどかなり真面目な内容の奴なのであしからず。 voynich maniscriptとは 謎の文字と気持ち悪い絵がいっぱい書かれた変な。何らかの未知言語で書かれているかも

    ヴォイニッチ手稿について - Qiita
  • 誰がUTF-32が使われてないなんて言ったんだ | κeenのHappy Hacκing Blog

    最近ではUTF-8でソースコードを書いてUTF-8で出入力をする。それ以外のエンコーディングは使われていない。…だと?誰がそんなこと言ったんだ ASCIIと古いUnicodeと新しいUnicode 少し長くなるが文字コードの話から始まる。ASCIIはお馴染み最低7bitあればASCIIの定義する文字集合を表せる。 古いUnicodeは16bitで全ての文字を表わすことを目標に作られた。 新しいUnicodeは文字(主に漢字)が多過ぎて16bitでは表せなかったので21bitに拡張された。 文字コードとエンコーディング 文字コードをどういう形式で表すかがエンコーディングだ。文字コードが7bit、16bit、21bitだからといってそのままのサイズで表わす訳ではない。ASCIIは普通8bitの型で表わすし21bitの型を用意するよりは32bitの型に格納した方が扱い易そうだ。あるいは8bit

    誰がUTF-32が使われてないなんて言ったんだ | κeenのHappy Hacκing Blog
  • 全角チルダ問題

    2019年8月6日に開催されたヤフー名古屋Tech Meetup #3の内容です。 #3 は「Webフロントエンドを支えるノウハウ」をテーマに開催しました。 JJUG CCC 2019 fall g3のセッション資料です。 「ちょっと凝ったことをしようとすると大量のXMLを書かなきゃいけない」「プラグインを並べてもうまく動いてくれない」など、Mavenは誤解され敬遠され、Gradleなどの他のビルドツールにシェアを奪われてきました。 が、依然としてMavenはJavaのデファクトスタンダードなビルドツールに位置づけられており、マスターする価値は十分にあります。そして良く学んでみると、そもそもXMLで過度なカスタマイズしようというのが誤った使い方だったのに気づきます。そこへ至るにも、タスクランナーの延長線上にある他のビルドツールと異なり、Maven独特なライフサイクルとプラグインの関係性もき

    全角チルダ問題
  • u52e5 - GlyphWiki

    u52e5 (国際符号化文字集合・ユニコード統合漢字 U+52E5「勥」) (@10)出典: フリーグリフデータベース『グリフウィキ(GlyphWiki)』

    u52e5 - GlyphWiki
    S0R5
    S0R5 2014/01/05
    これがかの「強力なUnicode」というやつですか
  • 1