タグ

文字に関するatm_09_tdのブックマーク (5)

  • 海外の技術者が日本語の「文字化け」を本気で解説、日本人顔負けの日本通っぷりが披露される

    by Whooym 文字が適切に表示されずに読めなくなってしまう「文字化け」は、海外技術者の間でも「Mojibake」で通用するとのこと。そんな文字化けの種類について、東京で自然言語処理(NLP)の開発をしているポール・オリーリ・マッキャン氏が解説しました。 A Field Guide to Japanese Mojibake https://www.dampfkraft.com/mojibake-field-guide.html マッキャン氏によると、文字化けは作成した時と異なる文字コードで文書を開くことで発生するとのこと。文章が文字化けすると無意味な文字列になってしまうので読めませんが、どのような文字コードが使われたかによって異なるパターンが表れるので、慣れると使われている文字コードの種類を推測することができるそうです。 ◆UTF-8 UTF-8はインターネット上では最も一般的な文字

    海外の技術者が日本語の「文字化け」を本気で解説、日本人顔負けの日本通っぷりが披露される
  • 本当は恐ろしい「〜」記号 : IT翻訳者Blog

    Yahoo Japanの「新型コロナワクチン情報まとめ」を見ていたら、次の画像があった。 アストラゼネカの行に「有効性 〜76%」とあり(赤枠)、私はここが気になってしまった。 (出典:https://news.yahoo.co.jp/pages/20210122、閲覧:2021-07-02) これを見た人は、普通は「最大で76%」と解釈するだろう。日語で「〜」は「数字の範囲」を示すのが一般的である。例えば共同通信社の『記者ハンドブック』でもその意味で使っている。範囲の右側だけに数字があるので「最大」という解釈になる。最大なのだから、有効性は10%かもしれないし60%かもしれない。 しかし日語の「〜」によく似た英語の「~」(チルダ)には別の意味がある。「約」や「およそ」である。この意味を掲載している辞書は実は少ないのだが、たとえばMerriam-Websterの「tilde」には2bに

    本当は恐ろしい「〜」記号 : IT翻訳者Blog
  • MacのGoogle日本語入力でバックスラッシュ(\)を入力する方法 - No Programming, No Life

    「環境設定 -> 一般 -> ¥キーで入力する文字」 で指定可能でした。 真ん中あたりの「¥キーで入力する文字」をクリックして 「バックスラッシュ(\)」に変更 これで、\がさくさく入力できるようになります。 類似記事 (2013-05-30追記) MacGoogle 日本語入力で バックスラッシュを入力する設定 - 集中力なら売り切れたよ しずくくんのAndroidゲームプログラミングしてみたいなblog : Macでバックスラッシュを入力 Google グループ MacEmacsでバックスラッシュ\が使えなくて困っていたら簡単に直せた話 | びーおーぷんどっとねっと Mac Lion Google 日本語入力 | 見なかったことにしてください MacでバックスラッシュをShiftを押さずに入力する - アインシュタインの電話番号☎ Mac でバックスラッシュ入力する方法 |

    MacのGoogle日本語入力でバックスラッシュ(\)を入力する方法 - No Programming, No Life
  • Basic Design Note

    CLOSED This site has been closed. 当ブログは2022年12月30日をもって閉鎖しました。 開設から10年間、ご覧いただきありがとうございました。

    Basic Design Note
  • 外字実態調査の報告

    © 2012 Fuji Xerox Co., Ltd. All rights reserved. 外字実態調査の報告 富士ゼロックス株式会社 富士ゼロックスシステムサービス株式会社 平成24年3月15日 資料4 外字情報収集の概要 総務省から全国の市区町村に対して、外字情報の提出を任意に依頼 1,386の市区町村から、 1,166,536文字の外字情報を収集し、 文字情報基盤漢字と字形レベルでの同定を実施した。 提出外字の種類 外字数 ① 住基ネット残存外字 1,064,660文字 ② 既存住基システム外字 69,142文字 ③ その他システム外字 32,734文字 合計 1,166,536文字 住民基台帳 ネットワークシステム 住基ネット統一文字 ① 住基ネットに標準で搭載されていなかっ た文字で、市区町村が独自に登録、使用し ている文字(住基ネット残存外字) 標準文字 既存住基システ

  • 1