異体字の人気記事 210件 - はてなブックマーク

1 - 40 件 / 210件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

異体字の検索結果1 - 40 件 / 210件

[Webデザイン] 文字組みについて本気出して考えてみた | Stocker.jp / diary
- 2317 users
- stocker.jp
- 暮らし
- 2011/02/16
これはもう何年も前から気になってることなのですが。何故、昔からずっと見出し画像などの文字組みや文字詰めの甘いWebサイトが多いのでしょうか。私はデザインについて偉そうに言える立場でないのは分かっていますが、折角全体的なデザインや背景、写真、Flashなどの動きはとても美しく、文章構成のしっかりしたサイトなのに、ただ一点文字詰めだけが甘いというサイトがあまりにも多くて、そういうサイトが減る様子もないのがずっと気になっています。私は以前、ファッション雑誌やビジネス誌の組版（MacのInDesignやQuarkXPressを使って印刷用のデータを作る仕事。DTPとも言う）の仕事をしていて、見出しは言うまでもなく、本文の文字詰めが少し甘いだけでもものすごく怒られたものですが、Webデザインの世界ではそういうのはあまり怒られることがないのでしょうか。私は、見出しやタイトル画像における文字組み
- webデザイン
- タイポグラフィ
- フォント
- デザイン
- design
- font
- typography
- webdesign
- web
- 文字
ベーシックで高品質で完全にフリーな日本語フォント - yayuguのにっき
- 1828 users
- vector.hateblo.jp
- 暮らし
- 2010/09/26
フリーフォントのまとめなんて腐るほどありますが、大抵商用不可再配布不可収録文字数が少ない変わったデザインのフォントのどれかに当てはまり、ベーシックで何も考えず使えるフォントって少なかったりします。そこで、フツーな形をしている第二水準ぐらいの漢字を収録スライドや商用印刷に使っても恥ずかしくないハイクオリティなフォントをまとめてみましたモトヤLマルベリ3等幅 https://android.git.kernel.org/?p=platform/frameworks/base.git;a=commit;h=4234d40eae54ad9126fbc4b61cbbe8dc78d282bc モトヤのマルベリの軽量版が Android に提供されることになりました。 Android向けですがApacheライセンスで提供されるので、ライセンスに従えば商用使用・改変・再配布なんでもで
- フォント
- font
- フリーフォント
- フリー素材
- 素材
- 商用OK
- フリー
- 日本語
- free
- 無料
Microsoft Virtual PC: Virtual PC 2007
- 1568 users
- www.microsoft.com
- 暮らし
- 2000/02/19
毎日を、もっとシンプルにゲーム、学習、ビジネスの経営、家事。何であれ、Windows 11 がすべてをこなすお手伝いをします。あらゆる働き方、学び方、遊び方に合わせて合理化された新機能をご覧ください。
- windows
- microsoft
- vista
- ie7
- ie
- windows vista
- software
- JIS2004
- font
- Windows7
絵文字がある種のUnicodeバグを世界から一掃しつつある件について｜Rui Ueyama
- 1419 users
- note.com/ruiu
- テクノロジー
- 2017/11/13
UnicodeのUTF-16エンコーディングではほとんどの文字（コードポイント）は2バイトで表現されるが、Unicodeに後から追加収録された文字の多くは4バイトで表現される。4バイト文字がうまく扱えないプログラムというのはわりとよくある。しかし世界中で広く使われるようになった絵文字がよりによって4バイト文字であるせいで、そのような文字が扱えない問題がよいペースで解決に向かいつつある。それについて少し説明してみようと思う。 Unicodeが80年代から90年代初頭にかけてデザインされたときの目標の一つは、Unicodeに含まれる文字数を65536個以内に収めることだった。現代の文章を実用的なレベルで表すためには、漢字などを含めてもそれだけの種類の文字があれば十分だと考えられたのだ。当然これは1文字を2バイトで表すことを念頭に置いていた。つまりコンピュータの揺籃期から当時に至るまで単純に英語
- unicode
- 文字コード
- 絵文字
- emoji
- UTF-8
- プログラミング
- programming
- あとで読む
- 技術
- 文字
UnicodeとUTF-8の違いは？ - Humanity
- 1129 users
- tyru.hatenablog.com
- 暮らし
- 2009/11/29
という2chのスレがかなり勉強になったのでまとめ。少しでも有用だと思ったものは載せてあるので結構長いです。 Unicodeのような文字集合(符号化文字集合？)やUTF-8のようなエンコーディング方式に限らず色んな文字コードにまつわる話があります。たびたび話が繰り替えされますがそれは確認ということで。 (元スレ) 追記：簡単にまとめました。 1 ：デフォルトの名無しさん：2007/04/30(月) 20:02:37 ビッグインディアンとかなんとかかんとか 3 ：デフォルトの名無しさん：2007/04/30(月) 20:05:48 また、頭の悪そうなスレが・・・ >>1 それは魚とマグロの違いを訊ねるようなもんだ。 4 ：デフォルトの名無しさん：2007/04/30(月) 20:06:49 魚と鮪というよりは、魚と刺身の違いのような気がする。 5 ：デフォルトの名無しさん：2007/04/
- 文字コード
- unicode
- プログラミング
- まとめ
- programming
- charset
- utf-8
- 2ch
- tips
- あとで読む
文字コード（UTF-8,Shift_JIS,EUC-JP,ISO-2022-JP）についての俺的まとめ - 今日もスミマセン。
- 1067 users
- snaka72.hatenadiary.org
- 暮らし
- 2010/07/10
「プログラマのための文字コード技術入門」を読んで自分なりに理解した点をザックリとまとめてみる。それほど正確性を求めて書いているわけではないので、間違ってる可能性大です。間違いなどあればコメントなど頂けるとありがたいです。それぞれの文字コードはどう違うのか？日本語の文字コードは大きく以下の２つに分けられる JIS X 0208 文字集合をベースにしたもの Unicode文字集合をベースにしたもの JIS X 0208 文字集合をベースにした文字コードには、EUC-JP, Shift_JIS, ISO-2022-JP がある。 Unicode文字集合をベースにした文字コードには、UTF-8, UTF-16 などがある。上で挙げた「文字コード」とは正確には「エンコーディング（文字符号化方式）」の事を指す。文字符号化方式文字集合って？読んでそのまんま”文字の種類の集まり”。「キャラ
漢字部屋 - 凄い漢字
- 1062 users
- thanks.yahoo.co.jp
- 暮らし
- 2006/11/23
サービス終了のお知らせいつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。お客様がアクセスされたサービスは本日までにサービスを終了いたしました。今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。
- 漢字
- 雑学
- これはすごい
- ネタ
- 日本語
- japanese
- kanji
- 資料
- neta
- language
ぼくたちのかんがえたさいきょうのi18n国家
- 1029 users
- qiita.com/yugui
- テクノロジー
- 2018/08/06
本記事は下記のtweetから始まるスレッドに触発され、@qnighyや@na4zagin3からアイディアを拝借して書いた。 i18n力が最強の国は国内に複数の言語があり、そのうちいくつかは他国でも使われている言語の方言で、1バイト文字での代替表記が困難で、歴史的にISO-2022ベースの文字コードとUnicodeと独自エンコーディングが混在していて、フリガナなどの特殊な組版規則があり、右書き左書き縦書きを併用し、 — Masaki Hara (@qnighy) 2018年8月6日皆さんのおかげで最強のi18n国家が建設されつつある。一瞬で滅びそう — Masaki Hara (@qnighy) 2018年8月6日長い前置きソフトウェアのi18nは難しい。自文化では当たり前と思っていてハードコードしてしまった仮定が崩れて、大幅な再設計を余儀なくされるからだ。気づいて再設計できればまだ良
- i18n
- 言語
- 文化
- あとで読む
- プログラミング
- unicode
- programming
- ui
- 日本語
- 文字
実はメイリオまだ進化中！誕生秘話を河野氏に聞いた－＠IT
- 921 users
- atmarkit.itmedia.co.jp
- 暮らし
- 2010/01/07
2010/01/07 現在ロンドンの地下鉄の案内図や路線図で全面的に使われているアルファベットフォント「New Johnston」をデザインしたのは実は日本人――。こう言ったら驚くだろうか。その日本人とは、イギリス在住のグラフィック・デザイナー、河野英一氏だ。河野氏はまた、Windows Vistaから標準で添付されているフォント「メイリオ」（Meiryo）をデザインしたことでも知られる。 2009年11月5日、来日中だった河野氏の謦咳（けいがい）に接する機会に恵まれた。訥々（とつとつ）とした中にも、デザインに対する情熱がかいま見える氏の語り口は、集まった出版、印刷、組み版、情報処理の専門家らを魅了した。ビル・ゲイツがゴーサインを出した偶然メイリオ――。横書きを前提に欧文・和文が混在するテキストを表示したときに美しく文字が組まれること、ディスプレイで読むことを最優先として液晶ディスプレ
- font
- フォント
- design
- メイリオ
- デザイン
- windows
- 読み物
- これはすごい
- 仕事
- meiryo
Netflixにおける日本語字幕の導入
- 880 users
- netflixtechblog.com
- テクノロジー
- 2018/05/14
(Please note that this article is a localized (to Japanese) version of a corresponding tech blog article in the English language) Netflixでは、2015年9月の日本における配信サービス開始時から日本語字幕を提供しています。今回のブログでは、日本語字幕提供に至るまでの技術的な取り組みについて説明します。字幕ソースファイルの仕様、字幕ソースファイルからNetflix配信用字幕への変換モデル、Netflixにおける日本語字幕の納品モデルなどを取り上げます。さらに、W3C字幕規格Timed Text Markup Language 2 (TTML2)導入に向けた対応についても触れます。 2014年の終盤にかけて、Netflixでは2015年9月に予定していた日
- netflix
- あとで読む
- 字幕
- 技術
- 日本語
- 動画
- webサービス
- 組版
- ruby
- web
製品ロゴなどに使われているおなじみのフォント集 - GIGAZINE
- 790 users
- gigazine.net
- 暮らし
- 2007/06/16
企業ロゴやドリンクのパッケージ・本のタイトルなどで見たことがあるような、なじみ深い字体を模したフォントが大量に集められたサイト。使用は自己責任でお願いします。詳細は以下から。 Famous Fonts at Sharkshock 11種あるカテゴリは以下の通り。印刷物のロゴフォント。 Famous Fonts at Sharkshock- Publications 飲み物や食べ物のロゴフォント。 Famous Fonts at Sharkshock- Food-Drinks 外食系のフォント。 Famous Fonts at Sharkshock- Restaurants 企業ロゴ。 Famous Fonts at Sharkshock- Companies 映画やテレビのフォント。 Famous Fonts at Sharkshock- Movies-TV アニメ関係。 Famous
- font
- フォント
- design
- ロゴ
- logo
- デザイン
- 素材
- gigazine
- webデザイン
- web制作
JavaScript における文字コードと「文字数」の数え方 | blog.jxck.io
- 746 users
- blog.jxck.io
- テクノロジー
- 2017/03/02
Intro textarea などに入力された文字数を、 JS で数えたい場合がある。ここで .length を数えるだけではダメな理由は、文字コードや JS の内部表現の話を理解する必要がある。多言語や絵文字対応なども踏まえた上で、どう処理するべきなのか。それ自体は枯れた話題ではあるが、近年 ECMAScript に追加された機能などを交えて解説する。なお、文字コードの仕組みを詳解すること自体が目的では無いため、 BOM, UCS-2, Endian, 歴史的経緯など、この手の話題につき物な話の一部は省くこととする。 1 文字とは何か Unicode は全ての文字に ID を振ることを目的としている。例えば 😭 (loudly crying face) なら 0x1F62D だ。 1 つの文字に 1 つの ID が割り当てられているのだから、文字の数を数える場合は、この ID
Google Noto Fonts_Noto Sans CJK JP（Googleの日本語フォント）
- 735 users
- fonts.google.com
- テクノロジー
- 2014/07/14
Noto is a collection of high-quality fonts in more than 1,000 languages and over 150 writing systems.
- font
- google
- フォント
- fonts
- Webフォント
- 日本語フォント
- japanese
- design
- noto
- apache
フォント・フリーフォント情報サイト
- 730 users
- font.altosoft.jp
- 暮らし
- 2006/05/23
無効なURLです。プログラム設定の反映待ちである可能性があります。しばらく時間をおいて再度アクセスをお試しください。
- font
- フォント
- design
- 素材
- デザイン
- webデザイン
- フリーフォント
- web
- webdesign
- 便利
「ユニコード」で予期せぬ目に遭った話 - moriyoshiの日記
- 692 users
- moriyoshi.hatenablog.com
- テクノロジー
- 2017/03/13
自分の知らないCJK Ideographのバリエーションがまだあったことに戦慄している pic.twitter.com/kUlyRLDDTM— moriyoshit (@moriyoshit) March 9, 2017 などというツイートをしたところ、思ったより反響があったのでまとめておく。上記ではあいまいに「バリエーション」などと書いたが、Unicodeとそれを扱う環境においては、バリエーションと一口に言っても次のような状況がある。意味論的に等価な異なる字形の集合同じ字形で異なるコードポイントの集合 aは結構なじみ深いと思う。 a-1. 異なるコードポイントにそれぞれ異なる字形が割り当てられているもの例: 「東」(U+6771) ⇔「东」(U+4E1C) 「斉」(U+6589) ⇔「齊」(U+9F4A) 「高」(U+9AD8) ⇔「髙」(U+9AD9) a-2. 同じコードポイ
- 文字コード
- unicode
- フォント
- あとで読む
- 文字
- font
- 技術
- character
- CJK
- programming
絵文字が開いてしまった「パンドラの箱」第1回--日本の携帯電話キャリアが選んだ道
- 651 users
- japan.cnet.com
- 暮らし
- 2009/02/27
Unicodeが携帯電話の絵文字を収録へ絵文字ってなに？そう聞かれても多くの人は、ああ、それはと答えられるはず。そう言えばちょっと前に『メールのハートマークにだまされるな！　8割の女性は「恋人以外にも使う」』（RBB NAVI）なんていうニュースもありました。携帯電話の個人普及率が9割を上回る（平成20年内閣府消費動向調査）この国において、絵文字はごくありふれたものになっている現実があります。 2008年の11月27日、Googleが携帯電話で使われる絵文字を国際的な文字コード規格、Unicodeに収録しようというプロジェクト進行中であることを発表しました。では、このニュースは何を意味するのでしょう。そして私たちに何をもたらすのでしょう。今回から3回に分けて考えてみようと思います。まず歴史を振り返ってみましょう。じつは絵文字を使ったのは携帯電話が最初というわけでありません。先行するもの
- 文字コード
- 絵文字
- mobile
- unicode
- google
- ケータイ
- 携帯
- 携帯電話
- emoji
- モバイル
UnicodeのWAVE DASH例示字形が、25年ぶりに修正された理由
- 646 users
- internet.watch.impress.co.jp
- テクノロジー
- 2015/03/07
- unicode
- 文字コード
- フォント
- font
- 文字
- 歴史
- history
- character
- charset
- あとで読む
アラビア文字を知識ゼロから学んでみよう
- 645 users
- dailyportalz.jp
- おもしろ
- 2021/02/03
海外旅行とピクニック、あとビールが好き。なで肩が過ぎるので、サラリーマンのくせに側頭部と肩で受話器をホールドするやつができない。前の記事：働く大人のためのアドベントカレンダーをつくる＞個人サイトつるんとしている本当はアラビア文字と仲よくなりたいだけなんだアラビア文字の使用者は、全世界で5億人以上。国連公用語の一つであるアラビア語、イランのペルシャ語、パキスタンのウルドゥー語など多言語で使用され、地理的にもアフリカ北部からユーラシア、東南アジアまでを広くカバーするという国際性。これはもうインクルーシブでダイバーシファイドな社会を目指す成員として、「よく知らない」では済まされないだろう。なんて大上段からカマしてみたものの、基本的にウソです。本当のところ、みんなが読めないアラビア文字が読めたらなんかカッコいいじゃないかと。そんな志の低い理由でこのたび、知識ゼロからアラビア文字につ
- 言語
- あとで読む
- 文字
- 文化
- デイリーポータルZ
- dpz
- 言葉
- 世界
- 拙攻
- ことば
コンピューターで全漢字使用可に６万字コード化 | NHKニュース
- 636 users
- www3.nhk.or.jp
- 学び
- 2017/12/24
日本語の漢字は、戸籍などに使われているものも含めると６万字あるのに対し、コンピューターは、実は１万字しか扱うことができません。これに対し、このほど１５年越しの作業の末、６万字すべてが統一の規格にまとめられて、コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。中には、メーカーなどが独自に対応した外字もありますが、コードが無いために、メーカーごとの互換性が無く、データを受け渡してもコンピューターが認識できずに「文字化け」してしまったり、ある人の名前に本名の外字を充てたものと略字を充てたものの２つのデータがあった場合、コンピューター上では、別の人と認識されてしまったりするなどの問題が起きていました。このためＩＰＡ＝情報処理推進機構は平成１４年から、経済産業省とともに外字を含めたおよそ６万字の漢字１つ１つに、コードを割りつける作業を進め
- 文字コード
- 日本語
- 漢字
- pc
- unicode
- あとで読む
- IT
- charset
- 技術
- 文字
新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH（クロステック）
- 616 users
- xtech.nikkei.com
- 暮らし
- 2009/12/10
普段使用する漢字の指針となる「常用漢字表」が、2010年度にも改正される。新たに追加される196文字の中に、文字コード「シフトJIS」にない漢字が含まれているため、情報システムに大きな影響を与えそうだ。最新のJIS規格「JIS X 0213:2004」の改正に委員としてかかわった京都大学人文科学研究所附属東アジア人文情報学研究センターの安岡孝一准教授が、問題の核心を解説する。　　　　　（日経コンピュータ） 2009年11月10日、文部科学省の「文化審議会国語分科会」において、常用漢字表の改正案が承認された。現行の常用漢字表にある1945字から「銑」「錘」「勺」「匁」「脹」の5字を削除し、新たに196字を追加する改正案で、2010年度の内閣告示を目指している。新しい常用漢字表が告示されると、「シフトJIS」や「EUC-JP」といった従来からある文字コードを使用するシステムで大きな問題が生じ
HTML文書は文字エンコーディングUTF-8でなければなりません - 水底の血
- 613 users
- momdo.hatenablog.jp
- テクノロジー
- 2017/10/08
さよならレガシーエンコーディング。文字エンコーディング宣言が存在するかどうかにかかわらず、文書のエンコードに使用される実際の文字エンコーディングはUTF-8でなければならない。 4.2.5.5 文書の文字エンコーディングを指定する - HTML Standard 日本語訳 Require utf-8 when specifying character encoding by sideshowbarker · Pull Request #3091 · whatwg/htmlにより、HTMLで使用できるエンコーディングはUTF-8のみとなりました。これにより、古いHTMLでは許容されていた、Shift_JIS、ISO-2022-JP、EUC-JP、UTF16LEといった文字エンコーディングは適合するHTMLではなくなりました。すでにNu Html CheckerでUTF-8以外の文字エンコー
- HTML
- 文字コード
- UTF-8
- Web
- web制作
- HTML5
- W3C
- あとで読む
- utf8
- webデザイン
「ユニコードは犯罪だからやめてください」の衝撃 - yanok.net
- 545 users
- yanok.net
- テクノロジー
- 2014/01/11
新年早々、大笑いしてしまったこと。下らないといえば下らないので書くまでもないかと思ったのですが、後で忘れた頃に読み返すと面白いかもしれないので書きとめておくことにします。何があったのかは下記のページに詳しく書かれてあります。こちらを読んでいただければ、ぶっちゃけそれ以上のことはないです。「LINEウイルス」の正体とは―LINE内で流行する「ウイルス攻撃」の現状について簡単にまとめていうと、 LINE上で「ウイルス」なるものを送りつけることができるという噂があって、実際にそれを送りつけられるとLINEのアプリが誤動作(重くなる)らしい実際のところ、ここで「ウイルス」と呼ばれているものはある特定の文字列である (プログラムではない。であるからしてウイルスでもない) 特定の文字列を受け取ると動作が極端に重くなる不具合のあるアプリがある、というのが真相らしい問題を引き起こす文字列は、U
- Unicode
- ネタ
- 文字コード
- LINE
- Zenback
- 技術
- IT
- ネット
- M17N
- neta
ギョーザの漢字は？　チコちゃん、それはないよ
- 531 users
- salon.mainichi-kotoba.jp
- 世の中
- 2020/10/03
NHK「チコちゃんに叱られる！」でチコちゃんが「ギョーザ」を漢字で書く問題を出しました。豊川悦司さんが書いたのは「飠」に「交」と「子」。これをチコちゃんは不正解としました。それはないよ。チコちゃん、トヨエツにダメ出ししてんじゃねーよ！「しょくへん」が「飠」ではダメなのかトヨエツこと豊川悦司さんがＮＨＫ「チコちゃんに叱られる！」に出た回。チコちゃんが出演者に正解されて「ボーッと生きてんじゃねーよ！」という決めぜりふを言えない悔しさを紛らすために「ギョーザ」を漢字で書く問題を出しました。豊川さんがボードに書いたのは、おちゃめなことに「飠」の右にギョーザの絵。その下に書かれていたのは「飠」に「交」の「子」でした。これをチコちゃんは不正解としました。正解は「餃子」で、「しょくへん」の下は「二」みたいな横線でなければいけないということです。それはないよ。チコちゃん、トヨエツにダメ出ししてん
- 漢字
- 日本語
- NHK
- 言葉
- 文化
- 言語
- 文字
- デマ
- あとで読む
- メディア
絵文字を支える技術の紹介 - Qiita
- 525 users
- qiita.com
- テクノロジー
- 2017/11/15
絵文字を扱う上で知っておくと良いかもしれないことをまとめてみました。 Ruiさんの記事を見て、「EmojiはSurrogate Pair以外にも、色々とおもしろい技術があるんですよ〜」思って書いてみました。なお、書いた人はAndroidの人間なので、特に表記していない場合は主にAndroid上での動作のことを書いてます。またQiita初めてなので読みにくい部分等がありましてもご容赦ください。サロゲートペア(Surrogate Pairs) このエントリーを書くきっかけにもなったサロゲートペア。なぜこれが導入されたかの経緯は、Ruiさんのブログエントリーに譲るとして、技術的な解説をします。サロゲートペアは、U+0000..U+FFFFに収まりきらなかった範囲のUnicodeコードポイント(U+10000..U+10FFFF)を、なんとか16bitでエンコードしようとして導入されました
なぜふぁぼったーは英語圏で負けたのか - 小野マトペの業務日誌(アニメ制作してない篇)
- 517 users
- ono-matope.hatenadiary.jp
- テクノロジー
- 2009/11/02
前口上今年の7月にリリースされてから、早々に公式サイドバー広告入りするなど英語圏で圧倒的な人気を集めるfavstar.fm。ふぁぼったーは2008年の1月から英語版サービスを展開していたにもかかわらず、なぜ英語圏の制空権を得られなかったのか。たまたま見つけた海外のふぁぼったーユーザーに Twitterで直接インタビューしてみた。インタビューに答えてくれたのはjoshsharpさん、メルボルンのWeb開発者らしい。 Togetter(トゥギャッター) - まとめ「なぜふぁぼったーは英語圏で負けたのか(インタビュー原文)」やりとりはとぅぎゃったーにまとめたので、簡単な和訳を記します。インタビュー ―― こんにちは、私はふぁぼったーの開発者です。海外の方の意見が知りたいので、ふぁぼったーとFavstarについて質問していいですか？ joshsharp: いいですよ、お役に立てれば。 :)
- ふぁぼったー
- twitter
- webサービス
- english
- webservice
- favotter
- 英語
- business
- web
- ビジネス
IPAが無償で提供している文字の検索システムがなかなかイケていると話題に／関連する文字をグラフで表示。異体字の一覧も可能【やじうまの杜】
- 486 users
- forest.watch.impress.co.jp
- テクノロジー
- 2020/04/08
- IPA
- 文字コード
- あとで読む
- 漢字
- 文字
- 検索
- webサービス
- 異体字
- システム
- search
utf8_unicode_ci に対する日本の開発者の見解 - かみぽわーる
- 485 users
- blog.kamipo.net
- テクノロジー
- 2015/03/08
RailsがMySQLのcollationをサーバー側のデフォルトのutf8_general_ciからutf8_unicode_ciにわざわざ変えてるのどうせ大した理由じゃないだろと思って掘ってみたらやっぱり大した理由じゃなかった… https://t.co/6NeetGhTF0— Ryuta Kamizono (@kamipo) April 18, 2014 Railsでcollationとしてutf8_unicode_ci(RailsのDEFAULT_COLLATION)が採用されるのはcharsetが未指定もしくはutf8(RailsのDEFAULT_CHARSET)のときだけで、utf8mb4にすることとかは全く考慮されてない。— Ryuta Kamizono (@kamipo) April 19, 2014 @frsyuki MySQLのcharset utf8のときのデフォルト
- MySQL
- rails
- unicode
- 文字コード
- charset
- DB
- utf8
- Web開発
- ruby
- collation
SoftBank iPhoneのShift_JISがすごいことになっている件 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
- 463 users
- moji-memo.hatenablog.jp
- テクノロジー
- 2012/04/23
下図は、SoftBank iPhoneのMailが用いるShift_JISのIBM拡張文字領域*1。どうだ、驚いたろう。 SoftBank iPhoneのMailは、charset=Shift_JISをよく使う。髙村薫の「髙」や宮﨑あおいの「﨑」などのWindows外字もShift_JISで送るし、絵文字もShift_JISで送る。しかし、WindowsのIBM拡張文字領域とSoftBankの絵文字領域は、もともと衝突しており、共存できない。なので、SoftBank iPhoneのShift_JISでは、IBM拡張文字のうち下図ピンク部分が使えない。だったらその分は、NEC選定IBM拡張文字のほうを使えばいいじゃないですか、どうせダブってるんだから（下図）。というのが、大ざっぱに言えば、SoftBank iPhoneのMailが用いるShift_JISである。その外字領域をまとめると、
- 文字コード
- softbank
- iPhone
- これはひどい
- mail
- iOS
- iPhone
- charset
- font
- ソフトバンク
404 Blog Not Found:perl - Encode 入門
- 428 users
- dankogai.livedoor.blog
- 暮らし
- 2008/04/08
2008年04月09日01:00 カテゴリLightweight Languages perl - Encode 入門すでにOSCONでもYAPCでも、あちこちそちこちでこの基本方針に関しては話したのですが、ここ 404 Blog Not Found でも改めて。 Perl で utf8 化けしたときにどうしたらいいか - TokuLog 改めだまってコードを書けよハゲ入り口で decode して、内部ではすべて flagged utf8 で扱い、出口で encode する。これがすべてです！とにかくこの基本方針をまもっていれば幸せになれます。ここでは、EUC-JPでエンコードされたファイル中の「小飼弾」「こがいだん」「コガイダン」「Kogai Dan」を正規表現で書き換えて標準出力にEUC-JPで出力するプログラムを例にとって説明します。 decode() then encode(
- perl
- encode
- utf8
- 文字コード
- encoding
- dankogai
- programming
- unicode
- tips
- プログラミング
「竜」の字体が「龍」よりも古いというトンデモについて｜nkay
- 421 users
- note.com/nkay
- 暮らし
- 2024/08/13
楷書の「龍」という形は殷墟甲骨文に見られる文字を継承したもので、「竜」という形は早くとも漢代以降に作られたものだが、「竜」が「龍」より古くから存在するというトンデモが存在する。「竜」が「龍」より古いというトンデモには全く根拠がないが、ほとんどの人は漢字の歴史について無知なのと、このトンデモが本当なら意外なので（逆に）、一定数の人が信じているようである。実際には、「竜」が「龍」より古いなどということは無い。これは「最終的には「龍」も「竜」も同じ甲骨文字に由来するのだからどちらかが古いと言うことはできない」というような表現的問題ではなく（それも一理あるかもしれないが、ここではどちらかが古いという表現を受け入れよう）、「竜」が「龍」より古いというトンデモが描いている歴史が決定的に間違っているという意味である。この記事で「竜」「龍」の歴史を再確認することで、トンデモの歯止めになれば幸いである
- 漢字
- 歴史
- あとで読む
- 言語
- 文字
- history
- 研究
- 田中芳樹
- 文化
- language
文化庁指針(漢字のとめ・はねなど)への誤解と早とちり① - マチポンブログ
- 417 users
- shokaki.hatenablog.jp
- 学び
- 2016/02/29
指針への理解文化庁の文化審議会漢字小委員会が漢字に関する指針（案）*1を作成しました。どのような内容か、ちょっと読売新聞を引用して述べますと、漢字の手書き文字について、「はねる」「とめる」など細かい違いで正誤はなく、多様な漢字の形が認められていることを説明する*2 というもので、具体的には画像のようなものです（画像は2.29読売新聞夕刊より）。つまり、「とめ」「はね」など些細な違いで漢字の正誤を判断するのは誤りであるから、それを説明する指針を作ったわけです。また、これは、学校教育などでも柔軟に評価するように求めています。すこし結論めいたことをいうと、漢字を厳しく採点するのは教員間で徐々に出来上がった代物であり、それに全く根拠はありません。実は、細部にこだわらなくてよいということは、文部省時代から60年以上にわたって述べられていたことで、どちらかというと教員の方がそのことを理解せず
- 漢字
- 教育
- 文字
- 日本語
- 文化
- あとで読む
- 言葉
- 言語
- 歴史
- education
文字コード規格の基礎：ITpro
- 402 users
- xtech.nikkei.com
- 暮らし
- 2006/11/22
この記事は，日経ソフトウエア 1999年10月号に掲載したものです。それ以降の情報が盛り込まれていませんので，現在とは異なる場合があります。文字コード規格の基礎を手早く理解したい場合などにお役立てください。文字コードは間違いなく情報を交換するための「決まりごと」なので，正確を期すため厳密な仕様が規定されている。だが，その仕様そのものを実装するプログラムを作る場合を除けば，プログラマが仕様の詳細を隅々まで理解している必要はない。六法全書を読んでいなくても問題なく普段の生活ができるようなものだ。ここでは，通常のプログラミングをするうえで必要と思われる範囲のことを，なるべく簡潔に説明したい。「半角カナ」のような呼び名は正確さを欠くものだが，多くの人に伝わりやすいので説明の中でも使っていく。説明を簡略化するため「正確な仕様を知りたいときは規格書そのものを必ず参照してほしい」と書きたいところだ
絵文字が開いてしまった「パンドラの箱」第4回--絵文字が引き起こしたUnicode-MLの“祭り”
- 374 users
- japan.cnet.com
- 暮らし
- 2009/06/05
普通では考えられない優遇策--「Google提案」を振り返る皆さんこんにちは、毎度おなじみ（？）文字コード漫談の時間がやってまいりました。前回が3月の掲載ですから3カ月ぶりですか。今まで3回にわたって絵文字をUnicode及びISO/IEC 10646（国際符号化文字集合）に収録しようという提案の動きについてご説明してきましたが、今回から2回に分けて完結編をお届けします。どうぞよろしくお付き合いください。ひさしぶりですから、ここまでのポイントを整理しておきましょう。前述した「提案」とは、もともとはUnicodeに収録するためにGoogleがAppleと共同で作成したものです。以下、主唱者の名前をとり「Google提案」と呼ぶことにします。これはこの2月に開かれた最高議決機関、UTC会議で承認されてUnicodeコンソーシアムの総意となりました。ついでGoogle提案はISO/IEC 1
- unicode
- google
- 文字コード
- 絵文字
- mobile
- emoji
- culture
- 読み物
- web
- 文字
絵文字を「符号」として処理する難しさ～日本のモバイルウェブのカオスぶり　バイドゥ「絵文字の意味検索」ができるまで（1）
- 366 users
- internet.watch.impress.co.jp
- 暮らし
- 2010/07/08
- 絵文字
- mobile
- 文字コード
- baidu
- 携帯
- モバイル
- emoji
- 検索
- 携帯電話
- search
asahi.com（朝日新聞社）：日本ＩＴ界の鬼っ子「外字問題」解消を　経産省が着手 - 社会
- 346 users
- www.asahi.com
- 暮らし
- 2011/01/21
「外字（がいじ）」。コンピューターで使う漢字として日本工業規格（ＪＩＳ）が定めた約１万字に含まれない、規格外の文字たち。文字化けや正常なデータ通信ができない原因になり、ＩＴ業界にとって悩ましい、この「外字問題」を一気に解消しようというプロジェクトが始まった。パソコンで文章を書くときの使い勝手は大きく変わるのか――。　例えば「渡辺」の「辺」。ＪＩＳ規格には「邊」「邉」をあわせた３文字しか含まれないが、１００字近い異体字があるとされる。　約５８万人分の戸籍を扱う東京都足立区。区役所のパソコン画面には４９もの「辺」の異体字が現れた。戸籍などを管理するコンピューターシステムに区が登録したものだ。名前に未登録の漢字がある住民が転入するたびに増え、今では外字全体で約５千もある。　外字を作るのは区職員。パソコンで、１文字に３０分ほどかけて点描する。完成後は庁内や出先機関にある千数百台のパソコンに登
- 文字コード
- 外字
- 行政
- 文字
- 日本語
- IT
- 漢字
- 日本
- 言葉
- asahi.com
TechCrunch
- 336 users
- jp.techcrunch.com
- テクノロジー
- 2014/06/16
Having used Journal for a few days now, I feel confident saying that Day One is not staring down an existential threat — at least not yet. Keep in mind we’re talking about Apple has a well-kno
- javascript
- 翻訳
- Web制作
- CMS
- multilingal
- web
- i18n
- 英語
- *webサービス
- webサービス
IPAフォントのダウンロード || OSS iPedia
- 332 users
- ossipedia.ipa.go.jp
- 暮らし
- 2007/10/01
IPAでは2003年末よりIPAが全権利を所有する「IPAフォント*」を公開して参りました。2010年2月には、ドキュメント用日本語フォントの標準的な実装を行った「IPAexフォント（IPAex明朝、IPAexゴシックの2フォント）」をラインナップに加えました。「IPAexフォント」は、和文文字（仮名や漢字など）は固定幅、欧文文字は文字幅に合わせた変動幅を基本とした実装を行い、日本語文書作成の利便性の向上を目指したフォントです。なお、過去のシステムとの互換性を求める場合には、欧文文字、和文文字ともに固定幅の「IPA明朝」と「IPAゴシック」、欧文文字、和文文字ともに変動幅の「IPA P明朝」と「IPA Pゴシック」の4種類のフォントをご利用になることもできます。「IPAexフォント(Ver.001以降)」および「IPAフォント(Ver.003以降)」には、オープンソースライセンスとし
- font
- フォント
- ipa
- IPAフォント
- free
- オープンソース
- fonts
- opensource
- フリー
- download
アメリカ史で注意すべきこと（人名の異綴りについて）：東欧人と日本人など、本来ローマ字を使わない移民（例：「ワタナベ」の綴りは少なくとも22種ある） - Comments by Dr Marks
- 325 users
- drmarks.hatenadiary.org
- 暮らし
- 2011/01/21
昨夜は、たまたま入手したハーヴァード大学燕京研究所の出版物の著者の一人である日系人について調べていたが、恐ろしいことにネットだけで遺族の住所や電話番号までわかってしまった。本人は一応ハーヴァードやエールで教育を受けておりワシントンDCの American University の教授ではあったが（1912年生−1978年没）、著書は、その共著であるものと、単著は学位論文しかない。研究者というよりは、単なる大学教授であるから、普通にはヒットしないのだが、アメリカの国勢調査は70年経つと公開されるので誰でもアクセスできたのだ。（そこから情報を繋いだ。）そのとき思い出したことを書く。東欧から来た人たちは、19世紀から第二次世界大戦後も、多くが自分の名前のローマ字表記で悩み、面倒なので、西欧の該当する名前とか、西欧風の名前に変えてしまった者も多い。前者はヴァッセルマンがウォーターマンなどで、後者
- 言語
- 歴史
- ローマ字
- アメリカ
- 日本語
- 名前
- 言葉
- 移民
- history
- 日本
「Googleでもダメか」　チャットAI「Bard」日本語対応プレゼンに落胆の声　原因はフォント
- 325 users
- www.itmedia.co.jp
- テクノロジー
- 2023/05/11
米Googleが5月10日（現地時間）に日本語対応を発表したチャットAI「Bard」。ChatGPTなどの対抗馬とも目されるサービスで、SNSでも注目が集まっている。一方、発表時のプレゼンテーションに対して「Googleでもダメか」などと、落胆の声も出ている。原因はプレゼン資料で使っていたフォントだ。 GoogleはBardの日本語対応を発表する際、「Japanese」ではなく、大きく「日本語」と書いたスライドを使用。同時に対応を発表した韓国語と合わせ、各国の言語への理解をアピールしていた。ただし、使っていたフォントは中国語繁体字と思しきもの。「語」のごんべんの点がはねており、間違いではないものの、日本語ネイティブからすると少し違和感があるものだった。 Twitterでは「Googleに日本語フォントが理解されていない」「Googleの人、知らない言語のフォントとか興味ないんだね……」とい
- フォント
- google
- font
- あとで読む
- AI
- 人工知能
- Bard
- 日本語
- 文章生成AI
- デザイン
pLaTeX が本格的にやばいかもという話 - Acetaminophen’s diary
- 301 users
- acetaminophen.hatenablog.com
- 政治と経済
- 2021/06/18
最近（この1週間ほど）で LaTeX 周りで起きていることについて，声明を出しておきます。端的に言うと「pLaTeX，本格的にやばい」。 pLaTeX hyperref error with pdfmanagement-testphase 今 LaTeX の世界で何が起きているのか，ざっと説明します。ここ1年ほどの LaTeX は大きく変わっている 2020-02-02 以降，本家の LaTeX2e に多くの変更が入っています。2020 年の2回のリリースについては，Online.tex 2020 での私の講演資料「最近の LaTeX は〇〇」【PDF 直リンク】も参考になるでしょう。 LaTeX2e 2020-02-02: 新 NFSS 導入（シリーズとシェープの多軸化，ファミリ毎の実際のシリーズ値の設定，…），カーネルへの expl3 読込 LaTeX2e 2020-10-01: フ
- tex
- latex
- 日本語
- pLaTeX
- あとで読む
- 言語
- 開発
- 文字コード
- プログラミング
- 国際