タイトル「UTF8」を検索 - はてなブックマーク

1 - 20 件 / 20件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

UTF8の検索結果1 - 20 件 / 20件

「ASCIIをUTF-8にして」それが『できない』ことを理解してもらえなかった話 - Qiita
- 565 users
- qiita.com/heeroo_ymsw
- テクノロジー
- 2021/04/03
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
- 文字コード
- あとで読む
- programming
- プログラミング
- 技術
- IT
- Qiita
- IT業界
- ascii
- 仕事
UTF-8のテーブル(MySQL5.6)に竈門禰󠄀豆子が格納できない問題を調べてみた - Qiita
- 546 users
- qiita.com/ykami
- テクノロジー
- 2022/02/01
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
- 文字コード
- mysql
- データベース
- あとで読む
- 開発
- UTF-8
- プログラミング
- UTF8
- db
- Qiita
BOMなしUTF-8によってWindowsでもたらされる困惑 (1/2)
- 516 users
- ascii.jp
- テクノロジー
- 2021/06/13
かつてWindowsでテキストファイルといえばシフトJIS形式のものが大半だった。しかし最近では、UTF-8形式のテキストファイルも普通に見かけるようになってきた。世の中はUTF-8が主流になりつつあると言っていいだろう。しかし、WindowsでUTF-8を使うと、ちょっと困ったことがある。それは、エクスプローラーの検索欄などで用いるWindows Searchが、UTF-8にはしっかり対応していないのである。正確に言うと、Windows Searchはファイル先頭に「BOM」のあるUTF-8は認識して正確にインデックス化し、ファイルの全文検索が可能になるが、BOMのないUTF-8では正しくインデックス化できず、ファイルの全文検索はASCIIコードのみ可能で、日本語などの非ASCII文字では全文検索ができない。同じ内容のテキストをUTF-8、UTF-8 BOM付き、UTF-16ビッグエ
- windows
- 文字コード
- あとで読む
- unicode
- UTF-8
- Windows 10
- microsoft
- tips
- PC
- システム
「ASCIIをUTF-8にして」それが『できない』ことを理解してもらえなかった話 - Qiita
- 317 users
- qiita.com/heeroo_ymsw
- テクノロジー
- 2021/04/03
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
- 文字コード
- プログラミング
- あとで読む
- 技術
- qiita
- unicode
- UTF-8
- programming
- IT
- 仕事
Python 3.15からデフォルトのエンコーディングがUTF-8になります - methaneのブログ
- 264 users
- methane.hatenablog.jp
- テクノロジー
- 2022/04/26
Pythonがファイルを開くときなどに使われるエンコーディングはロケール（WindowsではANSIコードページ）依存でした。 Unixの世界ではどんどんUTF-8ロケールが一般的になっている一方、WindowsのANSIコードページはなかなかUTF-8になりません。そのために、Unixユーザーが open(filepath) のようにエンコーディングを指定しないままUTF-8を仮定するコードを気軽に書いてしまって、Windowsユーザーがエラーで困るといった問題が発生します。また、Windowsでもメモ帳（Notepad.exe）やVSCodeはすでにUTF-8をデフォルトのエンコーディングで使用しています。ANSIコードページがUTF-8になるのを待っていたらどんどん周りの環境から置いていかれ、レガシー化してしまいます。 Pythonがデフォルトで利用するエンコーディングをWind
話題の「Telnet」電子公告、「平文やんけ」という指摘に応えて「over SSL」版を追加／文字コードも「UTF-8」に、ただし超長文の反論付き【やじうまの杜】
- 214 users
- forest.watch.impress.co.jp
- テクノロジー
- 2023/09/06
- telnet
- あとで読む
- ネタ
- SSL
- セキュリティ
- ネット
- 資料
- security
- 技術
誤解の多い「NFD問題とUTF-8-MAC問題」を解説する - macOSの濁点を含むファイル名の扱い - Qiita
- 211 users
- qiita.com/ko1nksm
- テクノロジー
- 2025/06/12
はじめに macOS では濁点や半濁点が含まれるファイル名でたびたび問題が発生しています。この問題は NFD 問題と言われたり UTF-8-MAC 問題と言われることがありますが、必要な情報が正確に書かれているところは少なく、正しく解説してある所でも情報が古く（主に HFS+ 時代の話に）なっており、読むと逆に混乱してしまう場合があります。 macOS 標準アプリや誰かが作ったアプリであればバグが修正されるまで待つだけですが、自分が作ったアプリやシェルスクリプトなどではこれがどういう問題なのかを理解しなければバグが修正できません。この記事ではそれらを整理し直して、（可能な限り正確に）解説したいと思います。検証は macOS 15.3（補助的に 15.5）で行っています。この問題は、Mac で作成した zip ファイルを Windows で展開したときに、濁点や半濁点を含むファイルに Wi
- mac
- 文字コード
- unicode
- macOS
- あとで読む
- unix
- language
- UTF-8
- filesystem
- development
MySQLのutf8mb4と戦った話 - Uzabase for Engineers
- 177 users
- tech.uzabase.com
- テクノロジー
- 2023/04/28
皆様こんにちは、NewsPicksエンジニアの米澤です。先日 2023/03/30は、こちらでアナウンスしていた通り、サービスの停止を伴うシステムメンテナンスを実施させて頂きました。 NewsPicksをご利用頂いている皆様には、ご迷惑おかけいたしました。今回はこのメンテナンスの中で行われたDBテーブルのmigrationについてお話ししたいと思います。ことの始まりやったこと方針決め utf8mb4に対応していないテーブルを調べる migrationを作成する影響範囲を調べる開発環境でリハーサルを行うメンテナンスの日最後にことの始まり NewsPicksではバグの検知にBugSnagを利用しています。ある時、BugSnagにこんなエラーが通知されてきました。 org.springframework.orm.hibernate4.HibernateJdbcExcepti
- mysql
- db
- あとで読む
- 文字コード
- utf8mb4
- 環境
- unicode
- 開発
- システム
- development
awkが新しくなる！？本家AwkがUnicode (UTF-8)とCSV対応に！ - Qiita
- 173 users
- qiita.com/ko1nksm
- テクノロジー
- 2023/09/16
はじめに 2023年、長い時を経て awk がとうとう Unicode (UTF-8) と CSV に対応しました 🎉🎉🎉 awk で日本語がうまく扱えない（場合がある）、Excel が出力する CSV ファイルが扱えない（場合がある）、といった問題が解決に向けて一歩に進みます。去年、本家 awk (One True Awk, nawk) に Unicode サポートが Brian Kernighan の手によって追加されたと話題になった（参照）ことを覚えているでしょうか？ Brian Kernighan が誰だか知らない方がいるかもしれないので説明すると、オリジナルの awk の開発者の一人で awk の頭文字、Alfred Aho、Peter Weinberger、Brian Kernighan の一人です。通称「K＆R」の「プログラミング言語C」や「プログラミング言語AWK」
- awk
- あとで読む
- linux
- unix
- Qiita
UTF-8で動くRailsがShift_JISな外部システムと通信する方法 - BOOK☆WALKER inside
- 168 users
- developers.bookwalker.jp
- テクノロジー
- 2022/09/02
こんにちは。メディアサービス開発部Webアプリケーション開発課のフサギコ(髙﨑)です。部署名が変わりました。 Ruby on Railsによるバックエンドの実装運用と、AWSによるサービスインフラの設計構築を中心とした、いわゆるテックリードのような立ち位置で働いています。本記事では、UTF-8環境下で動くRailsがShift_JISな外部APIと通信する方法についてお話しします。前提知識文字コード UTF-8環境下で動くRailsがShift_JISな外部システムと通信するには Shift_JISな外部APIに対してPOSTリクエストするべた書きとしては Railsにおいては Shift_JISで使用できない文字が混ざっていないかをバリデーションする Shift_JISな外部システムからPOSTリクエストを受けるおまけ: ユーザのブラウザにShift_JISでPOSTさせる
- rails
- 文字コード
- あとで読む
- unicode
- ruby
- プログラミング
- 通信
- API
- programming
国産のWikiソフト「PukiWiki」が2年ぶりにバージョンアップ、「PHP 8.0/8.1」に対応／EUC-JP版をUTF-8へ変換するツールも用意
- 150 users
- forest.watch.impress.co.jp
- テクノロジー
- 2022/03/31
- wiki
- php
- あとで読む
- PukiWiki
- ツール
- tech
- ソフト
- フリーソフト
- ソフトウェア
RDS Blue/Green Deployments を使ってシュッと utf8mb4 にマイグレーションした話 - カミナシエンジニアブログ
- 139 users
- kaminashi-developer.hatenablog.jp
- テクノロジー
- 2023/07/03
こんにちは。ソフトウェアエンジニアの坂井 (@manabusakai) です。カミナシでは RDB に Amazon Aurora MySQL 2（MySQL 5.7 互換）を使っています（以下 Aurora MySQL と略します）。ある日、社内の Slack で「𠮷」などの文字列が登録できないのではないかという話が出ました。これを聞いて「あー」と思った方も多いでしょう。 MySQL で有名な UTF-8 の 4 バイト文字問題で、歴史的な理由から MySQL 5.7 以前では utf8 の文字セットは utf8mb4 ではなく utf8mb3 を指しています。 dev.mysql.com カミナシのアプリケーションは 4 バイトの文字列が入力された場合はシステムエラーを返す実装になっていますが、エラーの内容をユーザーにわかりやすく伝えることは難しいためユーザー体験としても良くない
- mysql
- aurora
- aws
- db
- あとで読む
- rds
- マイグレーション
- software
Java 18正式リリース。デフォルトのCharsetが「UTF-8」に、シンプルWebサーバ搭載など新機能
- 90 users
- www.publickey1.jp
- テクノロジー
- 2022/03/23
Java 18正式リリース。デフォルトのCharsetが「UTF-8」に、シンプルWebサーバ搭載など新機能 Javaの新バージョン「Java 18」が正式にリリースされました。 Java 18 is now available! #Java18 #JDK18 #openjdk Download now: https://t.co/hTJU1ZzAWQ Release notes: https://t.co/Xdkj5TObNP API Javadoc: https://t.co/izFBPlYkd9 Features: https://t.co/3z0l5sXyDX pic.twitter.com/Ct1BvYmDYs — Java (@java) March 22, 2022 Javaは6カ月ごとに「フィーチャーリリース」と呼ばれるバージョンアップが行われ、そのなかの1つのバージョンが
- java
- api
- あとで読む
- web
- Software
- 開発
- 未分類
- サーバ
UTF-8 の文字列をできる限り Shift_JIS に変換したい - きりきりやま
- 82 users
- kirikiriyamama.hatenablog.com
- テクノロジー
- 2020/08/05
Shift_JIS の CSV で連携する外部サービスがあり、DB では UTF-8 でテキストを持っていたため文字コードを変換する必要が生じた。ところが UTF-8 に存在する多くの文字は Shift_JIS に対応がないため変換することができない1。そこで、事前に NFKC 形式で Unicode 正規化することで変換可能な文字を増やすことを試みた。まずは Unicode 正規化の前提として、Unicode の正準等価と互換等価について説明する。以降の U+16進数という表記は Unicode のコードポイント (文字に ID のようなものが割り当てられている) を示す。また、コードポイントに対応する文字の詳細は https://codepoints.net/ といったサイトで確認することができる。正準等価例として、ひらがなの「が」について考える。Unicode では「
1999年をテーマとしたものに繝ｦ繝九さ繝みたいな文字化けが描かれており、UTF-8はまだそんなに普及してないだろ！当時っぽさならﾎ･ﾆ･ｭ･ｹ･ﾈ､ﾎﾊｸｾﾏみたいなやつだろ！とか反射的に老害ムーブをした
- 75 users
- posfie.com
- おもしろ
- 2025/06/08
Kenji Iguchi @needle English Account:@needle_e 腱鞘炎と戦うVRエンジニア。GREE、Oculus(現Meta)を経てフリーランス。興味範囲はインタラクション・VR・AI・EV・ローカリゼーション・知的財産権・表現規制等。 @needle@misskey.io / Unrelated to Needle Inc. heistak.com Kenji Iguchi @needle 1999年をテーマとしたものに繝ｦ繝九さ繝みたいな文字化けが描かれており、UTF-8はまだそんなに普及してないだろ！当時っぽさならﾎ･ﾆ･ｭ･ｹ･ﾈ､ﾎﾊｸｾﾏみたいなやつだろ！とか反射的に老害ムーブをした 2025-06-07 00:15:40
- 文字コード
- Twitter
- misc
- あとで読む
- 技術
- 歴史
- ネタ
`<meta charset="UTF-8">` を書く必要性があるケースとデメリット
- 73 users
- blog.w0s.jp
- テクノロジー
- 2021/02/09
HTML 文書内に <meta charset="UTF-8"> を書いていますか? 書いているとしたら、その必要性を問われた時に理由を説明できますか? 実は私も勘違いしていた部分があり[1]、改めてまとめてみました。まず基本的なおさらいをします。<meta charset="UTF-8"> は HTML5 で登場した新しい記法で、 HTML4 以前は <meta http-equiv="Content-Type" content="text/html; charset=UTF-8"> などという長くて覚えにくい書き方をしていました。さらに遡ると、黎明期の HTML には meta 要素そのものが存在しません。 HTML が考案された当初、 meta 要素はありませんでした。 home of the first website(info.cern.ch) 世界最初の Web ページ。ソー
IT エンジニア的にとても困る名前のアイドルグループがデビュー→「狙ってますねこれは」「検索汚染が起きる」「姉妹グループはUTF8」
- 67 users
- posfie.com
- テクノロジー
- 2024/07/23
リンク音楽ナタリー全員日本人のK-POPグループUNICODEが日本デビュー、MV＆インタビュー映像公開（動画あり） K-POPガールズグループ・UNICODE（ユニコード）が、本日7月23日に日本デビューシングル「HELLO WORLD」を配信リリースした。 25 users 154
UTF-8 の文字列をできる限り Shift_JIS に変換したい(実践編) | うなすけとあれこれ
- 59 users
- blog.unasuke.com
- テクノロジー
- 2020/08/17
先日、きりきりやままさんがこのような記事を公開していました UTF-8 の文字列をできる限り Shift_JIS に変換したい - きりきりやまそれでは実際にそのような文字列変換を行うにはどうすればよいのか、またコメントでiconvについて触れられていたので、この記事ではUnicodeにおけるNFKC正規化をどうやって行うのか試してみることにしました。追記 GoとPythonとJavaScriptでの例を足しました。またいくつかのscriptにおいてブラウザ上で実行できるURLを添付しました。 (2020-08-17 16:22) “Go” に表記を統一しました。 (2020-08-17 17:00) Ruby 僕にとって文字列処理といえばRubyなので、まずは以下のようなscriptを書いてみました。 puts "\u304c" puts "String#encode('Shift_
CSVファイルを読み込むときはBOM付きUTF-8に気をつける - Pepabo Tech Portal
- 57 users
- tech.pepabo.com
- テクノロジー
- 2021/03/19
EC事業部エンジニアのharashoです。この記事はEC事業部ブログリレーの13日目の記事で、12日目は@ku00さんによるカラーミーショップの一機能をAngular Elementsで実装しましたでした。タイトルがこの記事の結論になりますが、私が遭遇したCSVファイルの読み込み処理で起きた不具合と原因、対応方法について書きます。 CSVファイルの読み込み処理で起きた不具合不具合の原因 BOMについて対応方法: BOMを取り除くおわりに CSVファイルの読み込み処理で起きた不具合私が開発に携わったカラーミーリピートの一括発送アプリには、注文に対する発送リストをCSVファイルから一括登録して、発送処理を行う機能があります。以下はその機能の簡単な流れと、CSVファイルのイメージです。
UTF-8 の BOM について - 将棋プログラミング
- 52 users
- ykakinoki.hateblo.jp
- テクノロジー
- 2024/06/14
１．はじめに UTF-8 の文字コードのファイルには、BOM (Byte Order Mark) がある場合とない場合がある。 Unicode の規格では、BOM は、推奨されないが、許容されている。 ja.wikipedia.org 今回、必要があり、色々な OS や言語で、UTF-8 の文字コードのファイルを作成した時、BOM が記録されるか、されないか、を調べた。２．色々な OS や言語での BOM 2.1　Windows 10, Visual Studio, C++, _wfopen (_tfopen) // Visual Studio 2005 以降保存 FILE *fp = _wfopen(name, _ L"w, ccs=UTF-8"); if (fp == NULL) { // エラー処理 } fwprintf_s(fp, L"ABC漢字123\n"); fclose(