Rubyを使ってタイ語の表示文字単位で文字列を区切る - Qiita

テクノロジーカテゴリーの変更を依頼記事元:

qiita.com/tunepolo

2 usersがブックマークコメント

コメント

1

記事へのコメント1件

注目コメント
新着コメント

rochefort 面白い

ruby
unicode

2015/06/20 リンク

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

規約違反を報告

アプリのスクリーンショット

いまの話題をアプリでチェック！

バナー広告なし
ミュート機能あり
ダークモード搭載

アプリをダウンロード

関連記事

Rubyを使ってタイ語の表示文字単位で文字列を区切る - Qiita

タイ語の"พี่ชาย" (日本語で兄の意味)は表示上は4文字ですが、最初の文字"พี่"が3つのUCS("e1e", "e35", "e4... タイ語の"พี่ชาย" (日本語で兄の意味)は表示上は4文字ですが、最初の文字"พี่"が3つのUCS("e1e", "e35", "e48")から構成されており、単純にsplit(//)をしただけでは6文字に分解されてしまいます。いいやり方が思いつかなかったのでいったん全てばらしたものを再度走査して単独で成立しない文字を直前のものにくっつけて処理しました。もっと効率的な書き方・Rubyらしい書き方があればご教授ください。 #!/usr/bin/env ruby # -*- coding: utf-8 -*- ca = "พี่ชาย".split(//) # ["e1e", "e35", "e48", "e0a", "e32", "e22"] ca_length = ca.length i = 0 while i < (ca_length - 1) case ca[i+1] whe

ruby

ブックマークしたユーザー

rochefort2015/06/20

同じサイトの新着

同じサイトの新着をもっと読む

いま人気の記事

いま人気の記事をもっと読む

いま人気の記事 - テクノロジー

いま人気の記事 - テクノロジーをもっと読む

新着記事 - テクノロジー

新着記事 - テクノロジーをもっと読む

設定を変更しましたx