[B! 文字コード] [9ページ] iwwのブックマーク

iww id:iww

文字コードに関するiwwのブックマーク (277)

GitHub - eth0jp/iconv_guess
iww 2014/04/30
文字コード自動判定iconv関数らしい

文字コード

プログラム

ライブラリ

C
リンク
よしだ on Twitter: "iconvで文字コード自動判別するもの作った。その名も「iconv_guess」。これの強みはiconvに対応している文字コード全てに対応している事。nkfには文字コード推測機能があるけどiconvにはなかったから多分便利。 https://t.co/nCpTWHGo"
iconvで文字コード自動判別するもの作った。その名も「iconv_guess」。これの強みはiconvに対応している文字コード全てに対応している事。nkfには文字コード推測機能があるけどiconvにはなかったから多分便利。 https://t.co/nCpTWHGo
iww 2014/04/30
文字コード

twitter
リンク
MySQLのPK・UNIQUEのフィールド長制限に立ち向かう - 文系プログラマによるTIPSブログ
なんとかして制限を超えないといけない時ってありますよね。 MySQLで、InnoDBでPK・Uniqueをはるカラムには、フィールド長の制限があります。俗に言う767byte問題です。 MySQLの767byte問題１，テーブルの文字コードをシングルバイトにする２，カラムの文字コードをシングルバイトにする３，カラムを分割する総評 MySQLの767byte問題プリフィックスは最高で1000バイトの長さまで可能です。(InnoDB テーブルは767バイト)非バイナリ　データ　タイプ(CHAR、VARCHAR、TEXT)では CREATE INDEX ステートメントのプリフィックス長は文字数で解釈される一方、プリフィックス　リミットはバイトで計算されるという事を覚えておいて下さい。マルチバイトの文字セットを利用するカラムのプリフィックス長を指定する時にはこれを考慮に入れておいて下さ
iww 2014/04/24
MySQL

TABLE

文字コード
リンク
UTF-8で4バイトになる文字 at softelメモ
JIS X 0213の第3・4水準漢字の一部が4バイトとなる。マイナーな文字ですね。例えば、第1・2水準漢字だけ対応していればよい案件などでは考慮しなくてよいでしょう。 MySQLではこのUTF-8で4バイトになる文字を扱えないのだとか（MySQL6なら対応したそうだ）。数値文字参照で全部書いてみた。（パッチのあたっていないWindowsXPなどでは表示されないです。）𠀋𡈽𡌛𡑮𡢽𠮟𡚴𡸴𣇄𣗄𣜿𣝣𣳾𤟱𥒎𥔎𥝱𥧄𥶡𦫿𦹀𧃴𧚄𨉷𨏍𪆐𠂉𠂢𠂤𠆢𠈓𠌫𠎁𠍱𠏹𠑊𠔉𠗖𠘨𠝏𠠇𠠺𠢹𠥼𠦝𠫓𠬝𠵅𠷡𠺕𠹭𠹤𠽟𡈁𡉕𡉻𡉴𡋤𡋗𡋽𡌶𡍄𡏄𡑭𡗗𦰩𡙇𡜆𡝂𡧃
iww 2014/04/21
UTF-8

文字コード

MySQL
リンク
HugeDomains.com
Captcha security check stack3.com is for sale Please prove you're not a robot View Price Processing
iww 2014/04/18
utf8_general_ci安定

MySQL

選択

データベース

文字コード
リンク
Acme::Text::Glitchでテキストをぐちゃぐちゃにしよう - Articles Advent Calendar 2011 Acme
初日に続き、新潟Perl人のneko_gata_s(shinpei)です。猫型さんとかしんぺいさんとかぺーちゃんとかいろんな呼ばれ方をしてるので好きに呼んでください。今日は拙作のAcme::Text::Glitchというモジュールの紹介をさせていただきます。CPANにはあがっておらず、GitHubに置いてあるのでインストールは $ cpanm https://github.com/Shinpeim/p5-Acme-Text-Glitch/tarball/master からどうぞ。何をするモジュールなのか/どう使うのかその名のとおり、テキストをグリッチします。つまり、たとえば"Glitch"という文字列をAcme::Text::Glitchに掛けると、̦̩̲ͩ́͘G̬̤̱̈́͜l̠̺͑͟ỉ͓͚̹̓͊͟͞t̛͇̙̩̟̐ͪͣchとなります。なんだがぐちゃぐちゃになりましたね。使い方は以下の
iww 2014/04/17
perl

文字コード
リンク
改行コードが CR+LF のシェルスクリプトを Cygwin で実行できるようにする。 - 量産メモ帳
Cygwin を久しぶりにインストールしてシェルスクリプトを実行したら、キャリッジリターン(CR)を単なる文字列として認識してしまい、以下のようなエラーメッセージが表示されるようになっていた。 '\r': コマンドが見つかりません解決方法としては、ホームディレクトリの直下にある .bash_profile に以下の2行を追加すれば良いみたい。 export SHELLOPTS set -o igncr Bash を再起動してシェルスクリプトを実行したら、正常終了した。参考資料： Cygwin CR/NL probl ems
iww 2014/04/09
set -o igncr

Cygwin

裏技

文字コード
リンク
第08回「ロケールを正しく設定する」
今更だが、Localeを正しく設定し、/share 以下にある日本語ファイル名が Windowsとdebian環境、双方の環境で文字化けしないようにする。初めに、デフォルトでは、locales がインストールされていないのでapt-get しておく。次に、debian 環境で使用するデフォルトのlocale をEUC-JP にするのか、UTF-8 にするのかを選択する。これは、samba の/etc/samba/smb.conf で設定したコーディングの設定と同じにする必要がある。筆者の場合は、以下のようにUTF-8に設定してある。LANDISKのデフォルトでは、SJIS でファイルを書き込むので、debian 環境の samba でcharset を UTF-8に設定して起動しているとWindowsからもdebian 環境からも文字化けが発生する。なので、この文字化けを修正するためには
iww 2014/03/13
locale-gen

UTF-8

設定

Debian

環境

文字コード

Linux
リンク
vimの文字コード自動認識
トップページに戻る vimの文字コード自動認識最終更新日：2013. 3.31 vimは非常に軽量で多機能なエディタですが、多くの文字コードを扱う場合、標準設定のままではシステムのデフォルト文字コードのUTF-8以外の文字コードのファイルを開いた場合に文字化けを起こすことがあります。これを回避するための設定を行いましょう。設定 (1)設定ファイル.vimrcを開きます。 $ vi ~/.vimrc (2)設定ファイル.vimrcに以下のように記述します。 set encoding=utf-8 この設定はvimの内部で使われる文字コードで、複数の文字コードを扱う可能性がある場合は端末のデフォルトの文字コードに設定しておく事を推奨します。最近のバージョンのLinuxであればUTF-8が標準の文字コードになっているはずです。この値には、編集するファイル内の全ての文字を表せるエンコーデ
iww 2014/03/05
文字コード

vi

設定
リンク
文字コードの脆弱性はこの3年間でどの程度対策されたか?
2019/01 JSUG勉強会の資料です。この資料でDisっているのはJPAではなく、・何も考えずに「標準だから」というだけでJPAを選ぶ人・OSSに全くコントリビュートせずにフリーライドする人です。
iww 2014/02/26
攻性ユニコード問題

文字コード

セキュリティ
リンク
yumi-ii: 2005-06-15 URLエンコードされた日本語文字列のデコード
2005-06-15 URLエンコードされた日本語文字列のデコード＜お急ぎの方は後半の「まとめ」をご覧ください＞概要 Perl5.8のEncodeモジュールを使って，URLエンコードされた日本語文字列をデコードする方法をお話します。＜対象＞ HTTPのGET要求に含まれるURLエンコーディングをデコードしたい人サーチエンジンの検索文字列をデコードしたい人あらまし最初にバージョン5.8より古いPerlのお話です。URLエンコードされた日本語文字列をデコードするにはどうしたらよいのでしょうか。私が調べたいくつかの書籍では， $str =~ tr/+/ /; $str =~ s/%([a-fA-F0-9]{2})/pack( 'C', hex($1) )/eg ; というコードで最後に文字コードを合わせればよい，なんて記述をよく見かけました。文字コードの変換にはJcode.plがよ
iww 2014/01/19
ぜんぜんわからんのでuse utf8をやめた

UTF-8

文字コード

perl
リンク
https://osksn2.hep.sci.osaka-u.ac.jp/~taku/osx/perl/perl_utf.html
iww 2014/01/19
UTF-8

文字コード

スクリプト

perl

エラー
リンク
プログラムの文字コードにUTF-8を使用する
これで Perl のプログラムが UTF-8 を使って記述されていることを宣言することができます。テキストエディタなどでプログラムを記述した時に、文字コードを UTF-8 を指定して保存して下さい。ただし Windows 環境の場合であれば、何かキーボードから文字を入力したり、画面に出力する時には Shift_JIS を使用するため合わせて次の設定が必要となります。
iww 2014/01/18
文字コード

プログラム

perl
リンク
Ubuntuで圧縮File解凍時の文字化け解決方法！ - したっけらーめん　おやじのブログ：楽天ブログ
2010.02.27 Ubuntuで圧縮File解凍時の文字化け解決方法！カテゴリ：Ubuntu Ubuntuを使用していて、圧縮Fileを解凍する際、文字化けが気になっていた。たとえば、zipファイルを書庫マネージャーで開こうとすると、となり、文字化けする際は、Win側に圧縮Fileを受け渡して解凍していた。なんかいい方法はないかと調べたところ、Ubuntuのフォーラムに答えが載っていた。コマンド操作は、苦手なので、とった方法はパッケージマネージャーを使う方法。 p７で検索をかけます。p7zip-fullが文字化けの原因です。 7zipを解凍したいひとは残しておきましょう。 p7zipを削除指定します。p7zip-fullで右クリックですよ。アンインストール指定ができるとボックスに×マークがつくので、適用をクリックします。これで、p7zip-fullは、アンインスト
iww 2014/01/12
圧縮

ubuntu

文字コード
リンク
「ユニコードは犯罪だからやめてください」の衝撃 - yanok.net
新年早々、大笑いしてしまったこと。下らないといえば下らないので書くまでもないかと思ったのですが、後で忘れた頃に読み返すと面白いかもしれないので書きとめておくことにします。何があったのかは下記のページに詳しく書かれてあります。こちらを読んでいただければ、ぶっちゃけそれ以上のことはないです。「LINEウイルス」の正体とは―LINE内で流行する「ウイルス攻撃」の現状について簡単にまとめていうと、 LINE上で「ウイルス」なるものを送りつけることができるという噂があって、実際にそれを送りつけられるとLINEのアプリが誤動作(重くなる)らしい実際のところ、ここで「ウイルス」と呼ばれているものはある特定の文字列である (プログラムではない。であるからしてウイルスでもない) 特定の文字列を受け取ると動作が極端に重くなる不具合のあるアプリがある、というのが真相らしい問題を引き起こす文字列は、U
iww 2014/01/11
犯罪

文字コード
リンク
ものすごい笑ってるっぽい新種の「w」が発見されるʬʬʬʬʬʬʬʬʬʬʬʬʬʬʬʬʬʬʬʬʬʬ - ねとらぼ
今や国語辞典にも「笑うことをあらわす文字」として載っているという「ｗ」（関連記事）。そんな「ｗ」に新種が見つかったと2ちゃんねるで話題になっています。「w」がタテに2つつながったもので、並べるとこんな感じに。 LINEで編集長に送ってみた 2ちゃんねるの「ｗが縦に二つ重なった文字の出し方教えて」スレッドで発見され、たちまち「すげえʬʬʬʬʬʬʬ」「なんだこれʬʬʬʬʬʬʬʬʬʬʬʬʬʬʬʬʬʬʬʬʬʬʬ」と話題に。「半芝（w）単芝（ｗ）に変わる双芝誕生」といった声も見られました。この「ʬ」はもともとラテン文字で「バイラビアル・パーカッシブ（両唇衝撃音）」というのだそう。コピペなどを使えばスマートフォンでも出せますが、環境によっては化けてしまうのでちょっとだけ注意が必要です。元スレではこんな活用例も関連キーワード 2ちゃんねる | 文化 advertisement 関連記事 2ちゃんね
iww 2014/01/10
翻訳

文字コード
リンク
Unicodeを送られてLINEを初期化されたんですけど、強力なUnicodeありませんか？お願いします。 - リクエスト... - Yahoo!知恵袋
リクエストありがとうございます。過去に私が答えた回答に相手をバグらせるUnicodeがあるので、コピペしてお使いください。 http://m.chiebukuro.yahoo.co.jp/detail/q11115690096 また、このような行為はサーバーに負荷を与える妨害行為としてLINEの利用規則12に違反するので、自己責任でお願いします。追加: iPhoneには効かないかもしれません
iww 2014/01/04
戦争

文字コード

セキュリティ
リンク
URLエンコードとURLデコード webzoit.net
URLエンコード・URLデコードとは CGIスクリプトなどでデータを送受信する際に使用されるもので、極力、文字化けを回避してどんな環境でも同じ結果を得るための手法です。特に多バイト文字(マルチバイト文字、日本語、韓国語、中国語等)を0と1からなる数字の並び(ビット・ビットパターン)で様々なことを処理する事ができるコンピュータが理解するにはいくつかの段階が必要です。この時、データを送信する側、仲介する側、受け取る側などそれぞれウェブサーバやOSを含め様々な環境に対応する事から一般に文字コードと言われるEUC、ASCII、JISなどの標準規格で定められた文字体系もそれらの環境で基本として使われるものも共通とは限りません。 ※URLはURIに含まれる定義でURIが公式の呼び方です(IRI/URI/URL/URN) こうした事からHTML、XHTMLからscript(スクリプト)に送信する際な
iww 2013/12/04
URLデコード

文字コード

エスケープ

perl
リンク
CGI.pmに起因するHTMLの文字化け - すぎゃーんメモ
CGIで掲示板を作ってみた。 http://www.sugyan.dynalias.com/~sugi/cgi-bin/cheapbbs.cgi どうも送信後にフォームの文字が化ける。おかしいなぁ。・・・と思ってググってみると、やっぱり情報があった！！ CGI.pm の textfield(), popup_menu(), checkbox_group() などを使ったときに HTML が文字化けするときの対処方法 - 刺身☆ブーメランのはてなダイアリーこれは、 CGI::escapeHTML() のエスケープ処理が原因 (textfield() などは内部で escapeHTML() を呼んでいるため、影響を受ける）。いろいろなパターンを検証したわけではないが、ソースコードの文字エンコーディングは UTF-8 出力する文字エンコーディングも UTF-8 のときに、文字化けがおこっ
iww 2013/11/09
$cgi->charset("utf-8");

UTF-8

エスケープ

perl

文字コード

FAQ
リンク
【第392回】謎の書名『Programmer痴 Guide』 : イジハピ！
2013年07月16日23:30 【第392回】謎の書名『Programmer痴 Guide』カテゴリ文字コード【プチ】研究 query1000 Comment(0)Trackback(0) またしょうもない文字化け話。 Unicodeが一般的になる前、日本語のマニュアルは当然Shift_JISで作ることが多かった。 WindowsだけではなくMacもそうだった。一方、翻訳するもとになる英語のマニュアルはWindows 1252でエンコードされていた。ふつう英語はASCIIで書かれていると思われているが、実際にはISO 8859-1で書かれている、と思われているが、実際にはWindows 1252で書かれている。 ASCIIは1文字1バイトであるが0x00～0x7Fの領域しか使っていない。よって7ビットコードである。 ISO 8859-1は0x80～0xFFのうち0x80～0x9F
iww 2013/11/09
文字コード

雑学
リンク
前のページ 5 6 7 8 9 10 11 12 13 14 次のページ