タグ

japaneseに関するterurouのブックマーク (7)

  • Phone 7 で シフトJIS を読みたい

    昨日まで知らなかったのですが Windows Phone 7 というか Silverlight には シフトJIS のエンコーディングが無いそうです。 MSDN にはこんな風に書かれていました。()は適当に意訳 The Encoding class is primarily intended to convert between these three different Unicode encodings. In addition, you can derive from the Encoding class to create a custom encoding that is not supported by the .NET Framework for Silverlight. (Encoding クラスってのは異なるエンコーディング同士の変換してるだけだから、サポートされてないエ

  • GitHub - shogo4405/KanaXS: ひらがな⇔カタカナ。全角英数字⇔半角英数字。全角カタカナ⇔半角カタカナ相互変換ライブラリーのJS、AS3、JavaScript版

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - shogo4405/KanaXS: ひらがな⇔カタカナ。全角英数字⇔半角英数字。全角カタカナ⇔半角カタカナ相互変換ライブラリーのJS、AS3、JavaScript版
  • jlineで日本語を使えるようにする。 — ありえるえりあ

    Recent entries jlineで日語を使えるようにする。 sugawara 2009-12-10 五反田Emacsの資料 sugawara 2009-10-19 trac-ticket.el sugawara 2007-11-19 Emacs Lisp 勉強会(バッファとウィンドウ編) sugawara 2007-10-22 つい最近会社のボスがLuceneに付いてくるlucliというコマンドラインツールで日語が使えないとなげいてました。どうやらこれが使っているjlineというライブラリが日語を通さないからみたいです。というわけで日語を通すパッチを作ってみました。 jline(http://sourceforge.net/projects/jline/)はJavaで書かれたreadlineのようなライブラリです。これを使うとラインエディットしたり補完したりといったのをJa

  • Apache CouchDB: CouchDB プロジェクト - 日本語訳

    CouchDB プロジェクト Apache CouchDB は、RESTful HTTP/JSON API 経由でアクセス可能な、分散型で耐障害性の高い、スキーマ不要のドキュメント指向データベースです。主な特徴として、双方向での衝突の検出・解決が可能な堅牢なインクリメンタル・レプリケーション、JavaScript をデフォルトのビュー定義言語とするテーブル指向のビュー・エンジンを使ってクエリーやインデックス作成が可能なことなどがあります。 CouchDB は Erlang で記述されていますが、HTTP リクエストを実行できる環境なら、どんな環境からでも簡単にアクセスすることができます。さまざまなプログラミング言語・環境でのアクセスをさらに簡単にするためのサードパーティ製クライアント・ライブラリも多数存在します。 詳細については、「はじめに」と「技術概要」を読んでください。 使ってみる C

    terurou
    terurou 2010/01/14
    CouchDBのドキュメント日本語訳
  • 新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH(クロステック)

    普段使用する漢字の指針となる「常用漢字表」が、2010年度にも改正される。新たに追加される196文字の中に、文字コード「シフトJIS」にない漢字が含まれているため、情報システムに大きな影響を与えそうだ。最新のJIS規格「JIS X 0213:2004」の改正に委員としてかかわった京都大学人文科学研究所附属東アジア人文情報学研究センターの安岡孝一准教授が、問題の核心を解説する。     (日経コンピュータ) 2009年11月10日、文部科学省の「文化審議会国語分科会」において、常用漢字表の改正案が承認された。現行の常用漢字表にある1945字から「銑」「錘」「勺」「匁」「脹」の5字を削除し、新たに196字を追加する改正案で、2010年度の内閣告示を目指している。 新しい常用漢字表が告示されると、「シフトJIS」や「EUC-JP」といった従来からある文字コードを使用するシステムで大きな問題が生じ

    新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH(クロステック)
    terurou
    terurou 2009/12/24
    新しい常用漢字表が適用されると、シフトJISやEUC-JPでは扱えなくなる
  • 日本語形態素解析 - Japanese Morphological Analyzer

    Visited: 5294 アルゴリズムによる日形態素解析(Japanese Morphological Analyzer by Algorithm) このプログラムは、テスト・研究用の短いプログラムで、辞書を使わずにアルゴリズムのみで解析しているので、正確な解析はできません。語頭・語末を漢字・カタカナ・平仮名の区別を頼りに解析しているので、平仮名ばかりの文に対応できません。言語解析の困難さがこのプログラムからもお分かりになるでしょう。 正しく解析するには、人間が持っている知識、すなわち日語の規則、辞書、実世界における知識、推論などが必要です。その知識とは膨大な量のものですが、まずは部分的にも妥当な規則、辞書を作ってみることが大切でしょう。アルゴリズムだけからなるこのプログラムとは異なり、今研究中の規則や辞書の構成は言語学的にも妥当と思えるかどうか、という観点から研究しています

    terurou
    terurou 2008/06/24
    辞書なしアルゴリズムのみの形態素解析。
  • Calendar::Japanese::Holidayなるものを触ってみた - Unknown::Programming

    の祝日の名前を取得するモジュールのようです。 僕も前に自分用に同じようなヤツを作りました。 でCalendar::Japanese::Holidayなんですが、実装はさておき、実行結果に少し不満が。 というのも昔の休日が軒並みコケる。 まぁどこまで対応するかは用途によって変わるとは思うけど少なくとも、昭和23年(1948年)7月に制定された「国民の祝日に関する法律」を一番古いケースとして対応したほうがいいかと。 まずそれによると元旦は1949年〜現在の1月1日。 成人の日は1949年〜1999年の1月15日。2000年以降は1月の第二月曜日(ハッピーマンデー) 建国記念の日は1967年〜現在の2月11日。 天皇誕生日、というか4月29日の扱いが少しややこしい。 4月29日は1949年〜1988年の間が天皇誕生日、1989年〜2006年の間がみどりの日、2007年〜現在が昭和の日となる。

    Calendar::Japanese::Holidayなるものを触ってみた - Unknown::Programming
    terurou
    terurou 2008/04/02
    日本の祝日。これは素晴らしいまとめ。
  • 1