#VBAは標準ではShift-JISかUTF16LEのみ マクロを使ってHTMLの出力をする際にUTF-8で書き出したかったのですが、WriteLine()関数などでは基本的にShift-Jisになるようです。 #UTF-8を書き出すにはADODB.Streamを使う(設定が必要) Visual Basic Editor のメニューから[ツール]→[参照設定]を選び,[参照可能なライブラリファイル]の中から "Microsoft ActiveX Data Objects x.x Library" にチェックを入れます。 バージョンは最新のものでOK? #サンプルコード ##書き出し用オブジェクトの準備
本稿で紹介する「テキストファイルの操作」は、UTF-8形式のテキストファイルを対象にしています。Shift-JIS形式のファイルを扱うときは、下記ページをご覧ください。 テキストファイルを操作する 正確には「UTF-8形式のファイル」ってのも、ちょっと変な表現なんですけどね。ファイルの形式じゃなくて、そこで使われている文字コードが"UTF-8"だよってことなんですが。まぁ、細かいことはいいとして。ここでは面倒なので「UTF-8形式のファイル」「Shift-JIS形式のファイル」という呼び方をします。 UTF-8の文字コードが記録されたテキストファイルを、上記「テキストファイルを操作する」で解説した方法で読み込むと、望んだ結果になりません。ちょっと、やってみましょう。 UTF-8の文字コードで書かれたデータを読み込むときは、ADO(ActiveX Data Objects)という仕組みを使い
エクセルVBAでCSVの取り扱いをしていると、必ず出くわすと言ってもよい「UTF-8問題」。 これまでの方法ではUTF-8のCSVファイルは取り込むと文字化けを起こしてしまいます。 今回は、ADODB.Streamオブジェクトというものを使ってエクセルVBAでUTF-8のCSVファイルを取り込む方法についてお伝えします。 前回のおさらい 前回のおさらいとしてこちらのプログラムをご覧ください。 Sub getCSV_camma() Dim ws As Worksheet Set ws = ThisWorkbook.Worksheets(1) Dim strPath As String strPath = "C:UsersNoriakiDropbox40_ブログvba-csvtestラーメン店アンケート_dq & comma.csv" Dim i As Long, j As Long Dim
require 'csv' # Convert to CSV def self.to_csv CSV.generate do |csv| csv << csv_headers all.each do |my_model| csv << my_model.csv_column_values end end end # Select headers # Write as you like def self.csv_headers [ "タイトル", "ユーザ名", "作成日時", "更新日時" ] end # Select values # Write as you like def csv_column_values [ title, username, created_at.strftime("%-Y/%-m/%-d %H:%M"), updated_at.strftime("%-Y/%-
コマンドラインで実行するJScriptをUTF-8で書きたいという、どうかしてる欲求が湧き上がりました。 とりあえずやってみようと、ファイルのエンコードをUTF-8にしてスクリプトを書いてみます。 test.js WScript.Echo("ほげ"); 実行結果:Microsoft JScript コンパイル エラー: 終了していない文字列型の定数です。 ダメです。マルチバイトを上手く解釈してくれません。弱った。 そういえば、wsfならエンコードを指定できます。試してみましょう。 test.wsf <?xml version="1.0" encoding="utf-8" ?> <package> <job> <?job error="True" debug="True" ?> <runtime/> <script language="JScript"> <![CDATA[ WScript.
Windows上でEclipseを使ってプログラムを書いていて、全体的にSJISというかCP932で通していれば特に困ることもなかったのだけれど、RspecのStoryはどうもSJISで書くとうまく動かなそう。。という感じになってきたので、プログラムを全体的にUTF-8に変更して、ひとまず普通に単体テスト(rspec)したら、どうもコンソールに出てくる日本語が中途半端に化ける。 ○○の場?? #本当は○○の場合と出したい という感じ。 おかしい。ちゃんとコンソールの文字コードはUTF-8にしているのに・・。 と悩むこと数時間。他にも悩んでいる(た)人を発見したが、けっこう力技で解決している・・。 UTF-8でも文字化けさせずにコンソールでデバッグする方法 - プログラムメモ しかしなんかあるはず!ということで調べて行くと、Eclipseのデフォルト文字コードをiniファイルで設定すればよい
Last Updated 2011/09/21 私は当初、サロゲートペアに興味がありませんでしたが、XPS の研究を始めてみると無視できないことが分かりました。そこで、XPS のページに含めることにしたのですが、.Net Framework 全般に関わる問題であることは言うまでもありません。 【注意】 このページの一部の文字はサロゲートペアを使っていますので、IE(インターネットエクスプローラ)でなければ正しく表示されない場合があります。 サロゲートペアとは何か サロゲート "surrogate" の英語としての意味は、「代理人」とか「代用物」です。これだけでは何のことかサッパリですが、日本語にしにくい言葉ではあります。 2009 年に「サロゲート」というタイトルの、ブルースウイルス主演のアメリカ映画が公開されました。そこでは、人間の代わりに仕事をするロボット(いわゆる、ミュータント)の意
この記事は「 Javaでファイルオープン:文字コードや追加モードなど」の補助記事です。 JavaでBOM付きUTF-8ファイルを読む 媒体上の文字コード規格、UTF-8には、規格策定者の迷いのため 一時期、先頭に3バイトのBOMと呼ばれる、バイト並び識別マーク を置く仕様がありました。 現在はBOMはまず使われることはありませんが、Windows付属の「メモ帳」という 簡易エディタでUTF-8ファイルをうっかり作成してしまうと、ファイル先頭に BOMが付いてしまいます。 残念なことにJavaではBOM付きのUTF-8ファイルをまともに 読むことができません。 先頭がBOMの場合スキップする方法 対処法は色々考えられますが、ここでは、BufferedInputStreamを被せ、 先頭がBOMの場合スキップし、BOMでない場合先頭まで巻き戻す形を 示します。 import java.io.*
ページ内リンク 美乳テーブルとは 各文字エンコーディングの事情 それでは本題 探索 その文字は ちなみに 付録 EUC-JP 固有の文字 0208 0212 0213-1 0213-2 Shift_JIS 固有の文字 UTF-8 固有の文字 美乳テーブルとは 「美乳テーブル」という物がある。 「EUC-JP の文章を Shift_JIS だと誤認識されない様に、EUC-JP 固有のバイト値を文章先頭付近に埋め込んでおく」という物。 具体的に、Shift_JIS には 0xFD と 0xFE が現れず、EUC-JP にはそれが現れるので、その値を含む文字コードを書いておこうという事で、その文字の集合に付いた名前。 “美” = 0xC8FE、“乳” = 0xC6FD。 各文字エンコーディングの事情 但し、これは EUC-JP での話。 一応、文章の先頭付近に日本語の文字を書いておくのは、他の
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く