エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント1件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Rubyを使ってタイ語の表示文字単位で文字列を区切る - Qiita
タイ語の"พี่ชาย" (日本語で兄の意味)は表示上は4文字ですが、最初の文字"พี่"が3つのUCS("e1e", "e35", "e4... タイ語の"พี่ชาย" (日本語で兄の意味)は表示上は4文字ですが、最初の文字"พี่"が3つのUCS("e1e", "e35", "e48")から構成されており、単純にsplit(//)をしただけでは6文字に分解されてしまいます。 いいやり方が思いつかなかったのでいったん全てばらしたものを再度走査して単独で成立しない文字を直前のものにくっつけて処理しました。 もっと効率的な書き方・Rubyらしい書き方があればご教授ください。 #!/usr/bin/env ruby # -*- coding: utf-8 -*- ca = "พี่ชาย".split(//) # ["e1e", "e35", "e48", "e0a", "e32", "e22"] ca_length = ca.length i = 0 while i < (ca_length - 1) case ca[i+1] whe
2015/06/20 リンク