さて,所有権について何とな〜く分かったところで,目先を変えて文字・文字列・文字列操作について調べていこう。 Rust の「文字列」は Unicode/UTF-8 限定 文字列操作で何が面倒かって複数の文字セットと文字エンコーディングが混在している点である。 そこで今どきのプログラミング言語は「文字列」としての操作対象を Unicode/UTF-8 に限定していることが多い。 Rust もそうした言語のひとつである。 こんにちは,世界! まずは,以下のコードを書いてみる。
![Rust の文字列操作(1)](https://cdn-ak-scissors.b.st-hatena.com/image/square/f561236e7a0b81635d4f70c3fca9ba07d73e9ce2/height=288;version=1;width=512/https%3A%2F%2Ftext.baldanders.info%2Fimages%2Fattention%2Frustacean-flat-gesture.png)
【2017/11/06追記】 現在開発中のPowerShell 6.0からファイル出力に関わるエンコーディングの扱いが変わり、BOM無しUTF-8をより簡単に扱える様になっています。 詳細は以下のエントリを見てください。 blog.shibata.tech 【追記ここまで】 なんとなく思いついて試したら意外といい感じになったので。 はじめに PowerShellのUTF8はBOM付きUTF8 PowerShellにはOut-File等といったファイルを簡単に扱うためのコマンドレットがいくつか存在します。 たとえばOut-FileでUTF8のファイルを出力する場合は以下の様に-Encodingパラメーターを指定してやればOKです。 "ファイルの内容" | Out-File ".\UTF8なファイル.txt" -Encoding utf8 ただし、PowerShell(とその基盤である.NET
先日、C言語向けのパッケージマネージャ clib を紹介したのですが、その後 Windows で使えそうなパッケージを3つ程書きました。 Big Sky :: clib の使い勝手にマジ感動した C言語でアプリケーションを書くのは他の言語と比べて少し気合が必要ですよね。例えば HTTPからデータを取得する 取得したデータを json パースする 結果の一部を色付きで表示する こんな場合、C言語... http://mattn.kaoriya.net/software/lang/c/20140627222830.htm locale-string.c 最近のライブラリは文字列が utf-8 前提で書かれている物が多く、Windows だと「それ、ツライわー(汗)」だったりするのですが、かと言ってこれだけの為に変換ライブラリを入れるのはアレですし、iconv 入れちゃったら GPL(LGPL)
アシマネくん(assimane)のほんわか日記です。ITや日常の出来事、料理などを紹介します。よろしくね。 Twitter @assimane 今回はCygwinにnkfをインストールします。 Cygwinでは文字コードをEUCやUTF-8で使っていますが、たまにSJISのファイルを扱うことがあります。日本語を含むSJISのファイルを扱うと、EUCでは文字化けしてしまいます。 SJISからEUCやUTF-8に変換するには、nkfが必要です。 1.nkfのソースコードをダウンロードします。 nkf-2.1.2.tar.gzをここからダウンロードします。 2.nkfのソースコードを展開します。 % tar -xvzf nkf-2.1.2.tar.gz nkf-2.1.2/ nkf-2.1.2/dll.rc nkf-2.1.2/nkf.1j nkf-2.1.2/nkf.mak nkf-2.1.2
前回からの続き。 改行コードの違いを体感してみる - ザリガニが見ていた...。 文字エンコードとロケールを体感する - ザリガニが見ていた...。 改行コードの違いも知った。文字コードとロケール、ターミナルの言語環境との関係も知った。これで文字にまつわる悩みとはおさらばできると思ったら、まだダメだった...。 実験環境 OSX 10.8 Mountain Lion以前((OSX 10.9 Mavericksでは、Mac仕様なNFDのUTF-8を表示しようとするとエラーになってしまったため、10.8以前の環境で実験した。Assertion failed: (width > 0), function conv_c, file /SourceCache/shell_cmds/shell_cmds-175/hexdump/conv.c, line 137. ** ** Abort trap: 6
前置き おはミルキィ! ChromeFullFeedが公開停止になった話を前置きとして書いていたのですが, あまり関係がないのと, 長くなりそうになってきたので, 別の記事に分けました. http://d.hatena.ne.jp/Constellation/20110530/1306701693 概要 という前置きで. ECMAScriptと切っても切れない文字コード, UTF-16. iv / lv5はUnicode変換のためにICUに依存していたのですが, UTF-8 <=> UTF-16なら何とか自分でも書けるのではないかと思い, Unicode Converterを書きました. これでlv5の依存はlibboost, libgc (Boehm GC)に減りましたー. Unicodeの変換の教授, bugつぶしにおいて, id:masa141421356 さんに非常にお世話になりま
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く