タグ

characterと漢字に関するxiaodongのブックマーク (13)

  • 読めない漢字を調べられるiOSアプリ「超漢字検索Pro」発売

    読めない漢字を簡単に検索できる「超漢字検索」のiOS版。「シ束リ」と入力することで「溂」を検索できるといった具合に、部首や画数などの情報を組み合わせて見慣れない漢字を簡単に調べられる。 合計17万字の漢字データベースに対応し、トンパ文字や変体仮名なども含むさまざまな文字情報を参照できる。検索した漢字をTwitterなどの他アプリに貼り付けたり、オンライン辞書でさらに調べる機能なども搭載する。 関連記事 「タブレットでの読書をもっと気持ちよく」――“電子出版用”新フォント、凸版印刷60年ぶりの挑戦 凸版印刷が開発する、電子コンテンツの閲覧に特化した新日フォントの第1弾がこの秋リリースされる。急速に電子化が進む中、活版印刷時代から出版文化を支え続ける印刷会社ならではのこだわりとは。 あのキャラみたいなフィンランド語の名前がほしい、なら「フィンジェネレーター」 政府観光局が作った格派 日

    読めない漢字を調べられるiOSアプリ「超漢字検索Pro」発売
  • 大半がふさがれた「近代デジタルライブラリーの検索の穴」

    「学」と「學」は、どちらでもヒットする。ところが「説」と「說」は、もう一方が拾われない。近代デジタルライブラリーの検索には、こうした穴が生じているとした一連のtweetを、「近デジのテキスト化について、@aobekaさんのつぶやきまとめ」に整理していただいた。そこで指摘した穴の大半はふさがれたと知ったので、あらためてこの問題について。

    大半がふさがれた「近代デジタルライブラリーの検索の穴」
  • サービス終了のお知らせ - NAVER まとめ

    サービス終了のお知らせ NAVERまとめは2020年9月30日をもちましてサービス終了いたしました。 約11年間、NAVERまとめをご利用・ご愛顧いただき誠にありがとうございました。

    サービス終了のお知らせ - NAVER まとめ
  • Chinese Etymology 字源

    E00699 車8ECA → 车8F66 Traditional in your browser 繁体字的浏览器显示: 車 Traditional in Unicode standard 繁体字的Unicode标准: U+8ECA Older traditional characters 旧繁体字/异体字: Not exist Simplified in your browser 简体字的浏览器显示: 车 Simplified in Unicode standard 简体字的Unicode标准: U+8F66 Main pronunciation 主要发音: chē Other pronunciations 其它发音: Original meaning 义: Meaning cart. English senses 英语理解: cart, vehicle; carry in cart U

    Chinese Etymology 字源
  • 『大漢和辞典』よくある質問

    わたしたちが日常使っている熟語の中には、日語の中でのみ用いられるものも少なくありません。『大漢和辞典』は、来、漢籍(中国の古典)を読むために作られた辞典ですので、そのような熟語まで網羅的に収録しているわけではありません。逆に、『大漢和辞典』に出典が明記された形で掲載されていない熟語は、漢籍には出てこない熟語、特に明治以降に日で作られた熟語である可能性が高いのです。 基的には、一般の漢和辞典と同じです。その漢字の読み方がわかっていれば、『索引』巻に収録されている「字音索引」(音読み)「字訓索引」(訓読み)を使って捜します。 読み方がわからない場合には、部首と画数によって捜します。各巻の表見返し(表紙を開けたところ)に部首の一覧表がありますので、まずはそこを見て、目的の漢字の部首が何巻に収録されているかを調べてください。次に、各巻の冒頭に「総文字一覧」がありますので、目的の漢字の部首

  • 漢字データベースプロジェクト

    概要 『漢字データベースプロジェクト』は、Unicode / UCS (Universal Multiple-Octet Coded Character Sets) によって符号化された漢字(CJK統合漢字)の情報交換・検索照合・分析に役立つ様々なデータベースを整備することを目的に、2003年度に日学術振興会科学研究費補助金・研究成果公開促進費(データベース)の援助を受けて開始しました。 各種漢字データファイルは、GitHubにて管理されており、GitHubサーバから取得することができます。 ライセンスについて プロジェクトのデータは、GPLライセンスおよびMITライセンスにて配布しています。 GPLライセンスによる配布 IDSデータ(ids.txt) 説文解字注(六書音均表等を含む)データ 宋廣韻データ 學生字典データ MITライセンスによる配布 上記以外のすべてのデータ(以下を含

  • asahi.com(朝日新聞社):日本IT界の鬼っ子「外字問題」解消を 経産省が着手 - ネット・ウイルス - デジタル

    「外字(がいじ)」。コンピューターで使う漢字として日工業規格(JIS)が定めた約1万字に含まれない、規格外の文字たち。文字化けや正常なデータ通信ができない原因になり、IT業界にとって悩ましい、この「外字問題」を一気に解消しようというプロジェクトが始まった。パソコンで文章を書くときの使い勝手は大きく変わるのか――。  例えば「渡辺」の「辺」。JIS規格には「邊」「邉」をあわせた3文字しか含まれないが、100字近い異体字があるとされる。  約58万人分の戸籍を扱う東京都足立区。区役所のパソコン画面には49もの「辺」の異体字が現れた。戸籍などを管理するコンピューターシステムに区が登録したものだ。名前に未登録の漢字がある住民が転入するたびに増え、今では外字全体で約5千もある。  外字を作るのは区職員。パソコンで、1文字に30分ほどかけて点描する。完成後は庁内や出先機関にある千数百台のパソコンに登

  • 住基コードの「與」 | yasuokaの日記 | スラド

    思うところあって、住民基台帳ネットワーク統一文字の「與」をまとめてみた。 8207 (U+8207) ADCE ADCF ADD0 ADD1 ADD2 ADD5 (U+2B74C) ADD6 ADD9 ADDC ADDD ADDE B8FE (U+2B7CB) B8FF B900 B901 B902 B903 B904 並べて見ると結構カオス。 これらの「漢字」は、2006年11月27日付のJTC1/SC2/WG2/IRG N1251で、CJK Extension Dへの追加が提案されたものだ。しかし、今月11日リリースのUnicode 6.0では、結局、U+2B74CとU+2B7CBの追加にとどまっている。確かにADCEを「漢字」としてISO/IEC 10646に追加するのは非常に難しそうだけど、だとしたらどうやって、こういう字を一般にも使えるようにしていったらいいんだろ…。

    xiaodong
    xiaodong 2010/10/16
    こんな字もあるのですね。
  • 新しいウェブの言語現象~今ウェブ上で起こっている言語変化~ | Baidu Japan Blog

    こんにちは。プロダクト事業部エンジニアの萩原です。 8月11日、東洋大学白山キャンパスにて、文字研究会主催の「第5回ワークショップ:文字―「現実」から見た改定常用漢字表― 」が開催されました。ワークショップにて、「ウェブ上における使用実態統計から改定常用漢字を考える」というタイトルで発表させていただきましたので、今回はそのご報告です。 今回のワークショップの背景として、常用漢字表の改定があります。現行の常用漢字表が制定されたのは29年前の1981年ですが、現在では、情報機器の普及、インターネットの発展によって、漢字をはじめとすることばの使用実態にに大きな変化が起こっています。 新しい言語現象の最先端とも言えるウェブで、どのような変化が起こっているのでしょう。その変化を正確に捉えるために、今回、ウェブ上の言語現象を、正確な時間と共に記録した「高精度時間軸ウェブコーパス」をバイドゥ独自に構築し

  • CJK Type Blog | CJK Fonts, Character Sets & Encodings.

    What in the world could オントロ (ontoro) and グスーム (gusūmu) possibly mean? (If you wait a few seconds, a hint will flash in the animated GIF above.) Continue reading… The UTC #160 meeting took place last week at Microsoft’s HQ in Redmond, Washington. For CJK enthusiasts, the big news is that the UTC accepted CJK Unified ideographs Extension G (aka IRG Working Set 2015), which includes 4,939 characters

    CJK Type Blog | CJK Fonts, Character Sets & Encodings.
  • 康煕字典信仰について - Eskandar d’Esfahan

    HTML関連の話題を追いかけていくと必ず行き着くサイトがある。「言葉 言葉 言葉」というサイトである。ここでは「国語問題」をとりあつかっている。HTMLの文法をどのように日語に適用すべきかを考えていれば、日語の扱い自体を考え始めるのは当然である。「言葉 言葉 言葉」では、おそらくは日語の問題をWebで公表するに当たって、HTMLの問題にぶつかったのであると思う。 さて。そのサイトでは正字正かなを用いている。少々エキセントリックな形での主張の仕方ではあるが、正字正かなを用いるべきという主張は概ね首肯できる。戦後の国語改革が性急に過ぎたのは明かである。漢字制限については、漢字に関する知識の不足を招き、我々の語彙、ひいては教養を薄いものにしている。その結果「世論」の意味合いの考えようもないから「せろん」「せいろん」「よろん」の起源を誤ってしまう。一方のかなづかいについても、原則の不足が一貫

  • 【新常用漢字表(仮)】携帯電話にもUnicode実装を促す「改定常用漢字表」 

  • 【改定常用漢字表試案への意見】テンプレート | yasuokaの日記 | スラド

    『新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能』の読者から、「改定常用漢字表試案への意見」の例を書いてほしい、という依頼がかなりたくさん届いた。しかも、電子メールで送れる形にしてほしい、という人が多いらしい。とりあえず、私(安岡孝一)なりのテンプレートを書いてみることにした。 To: kanzihyo@bunka.go.jp Subject: 【改定常用漢字表試案への意見】 氏名・年齢・性別・職業 住所・電話番号 「叱・填・剥・頬」の4字を、それぞれ対応する常用漢字の許容字体として、角括弧つきで併記することを要望します。また、*が付された「彙・茨・淫・牙・葛・韓・嗅・僅・惧・稽・恣・煎・詮・箋・嘲・捗・溺・賭・箸・蔑・喩」の21字および「羨・蔽・籠」の3字については、これまでの常用漢字と同じ構成要素の字体を、やはり許容字体として併記することを要望します。その上で、「

  • 1