タグ

UTF-8に関するni66lingのブックマーク (4)

  • Win/Mac どちらの Excel でも正しく開ける Unicode な csv の出力方法 - Qiita

    2018/11/27 追記 Excel for Mac 2016 のあるアップデートから UTF8-BOM が開けるようになったようです。 https://www.ka-net.org/blog/?p=7764 手元の 16.16.4 で試してみましたが開くことが出来ました。 平和になってよかったですね。 あらまし まず UTF-8 で吐いた csvExcel で開いてみます。化けます。 仕方がないので BOM をつけてみます。 Win だと正しく開けました!でも Mac で化けます。 それならと UTF-16LE で吐いてみましょう。Win/Mac どちらも化けずに表示されました!これで大丈夫かと思いきやなんとカンマ区切りされず A 列に 1 行まるごと収まっています。死にます。 仕方がないので tsv で出力してみましょう。すごい!ちゃんと表示されています!でも .tsv はデフ

    Win/Mac どちらの Excel でも正しく開ける Unicode な csv の出力方法 - Qiita
  • 文字数カウント・チェック|word-tool(ワードツール)

    入力された文章の文字数など調べる「文字数カウント」。 この「文字数カウント」の詳しい情報はこちら 文字数:単純に入力された文章の文字数を表示しています 文字数(改行除く):「改行」を省いた文章の文字数を表示しています 文字数(改行・空白除く):「改行と空白」を省いた文章の文字数を表示しています バイト数(UTF-8):文字コードを「UTF-8」に変換しバイト数を表示しています。 バイト数(Shift-jis):文字コードを「Shift-jis」に変換しバイト数を表示しています。 バイト数(EUC-JP):文字コードを「EUC-JP」に変換しバイト数を表示しています。 バイト数(JIS):文字コードを「JIS」に変換しバイト数を表示しています。 行数:入力された文章の行数をカウントしています。 段落:入力された文章の段落をカウントしています。

  • C++: UTF-8 の文字列の長さを求める (std::string)

    C++: 文字列の一部を取り出す (std::string)C++: Mac OSX で std::wcout を使ってワイド文字を表示させようとするとクラッシュするC++ : wchar_t、char32_t、char16_t 型の文字列の長さを求めるC++: std::wstring、std::u32string、std::u16string を1文字ずつ表示するC++: std::wstring、std::u32string、std::u16string と c_str メソッドの戻り値についてC++: 文字列を連結するC++: 文字列イテレーターのインデックスを求めるC++: UTF-8 の文字列を1文字ずつ表示する (std::string)C++: UTF-8 の文字列の長さを求める (std::string)C++: コードポイントから UTF-8 の文字を生成する (std

    C++: UTF-8 の文字列の長さを求める (std::string)
  • Rubyでinvalidなバイト列を含むUTF-8文字列を扱う - yarbの日記

    Ruby 1.9系ではStringオブジェクトにエンコーディング情報が付加されていて、マルチバイトや複数エンコーディングを扱う日人としては嬉しい限りだけど、時々エンコーディング関連で例外が発生して落ちすぎるぐらい落ちるように感じるときがある。ちょっとイラッと来るけど、考えてみたら、例外を出さずに処理を進めてしまうことの弊害のほうが大きいだろうから、これはありがたいこと。 外部のHTMLを読み込んで正規表現でマッチするコードで、次のようなエラーが出た。 invalid byte sequence in UTF-8これは文字通り、UTF-8的におかしなシーケンスがあるということ。問題のHTMLを調べてみたら、UTF-8HTMLの中に、Shift_JISが混じってしまっていた。どうも、JavaScriptで突っ込んだ文字列らしい……。いかにもありそうなことだ。どの程度の頻度で世の中にそういう

    Rubyでinvalidなバイト列を含むUTF-8文字列を扱う - yarbの日記
  • 1