エントリーの編集

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
UTF-8のベトナム語から声調記号を落す - elm200 の日記(旧はてなダイアリー)
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
UTF-8のベトナム語から声調記号を落す - elm200 の日記(旧はてなダイアリー)
概要 ベトナム語の文字コードは、最近は UTF-8 へ収束しつつあるようだ。ベトナム語の正書法は、アルフ... 概要 ベトナム語の文字コードは、最近は UTF-8 へ収束しつつあるようだ。ベトナム語の正書法は、アルファベット+声調記号である。だが、携帯電話やチャットなどの非公式の文章では、声調記号を省略することも多い。このプログラムは、声調記号付きのベトナム語 UTF-8 文字列から、声調記号を落としてプレーンなアルファベットにする。 使い方 ソースコードを utf8vn_converter.rb という名前で保存。 require ' utf8vn_converter' UTF8VNConverter.toascii([ベトナム語 UTF-8 文字列]) # => プレーンアルファベット これだけ。 例 UTF8VNConverter.toascii("phát triển") # => phat trien ソースコード class UTF8VNConverter @@map_source =<