並び順

ブックマーク数

期間指定

  • から
  • まで

321 - 360 件 / 442件

新着順 人気順

文字コードの検索結果321 - 360 件 / 442件

  • PHPでSJISのデカイCSVデータを扱った時に困ったこと - Qiita

    第39回関西PHP勉強会 のスライドです。 (おことわり) スライド上では全て文字エンコーディングのことを「文字コード」と表記していますので、ご了承ください。 やりたいこと 郵便局が提供している郵便番号一覧データをDBに入れる 文字コードが「SJIS」 文字コードの変換が必要 データ件数が約12万件と大きい ファイル操作に工夫が必要 1つめの困りごと:文字コードが「SJIS」 【SJIS(Shift_JIS)】 日本語を含む文字列を表現するために用いられる文字コードの一つ SJISとSJIS-winがあり、SJIS-winの方が対応文字数が多い(①②、はしご高など) ガラケーなどの用いられている 扱いにくい... [参考] PHPの文字コードではSJISじゃなくてSJIS-win、EUC-JPじゃなくてeucJP-winを 【UTF-8】 表示範囲が広く、どの国の文字も文字化けしない 世界

      PHPでSJISのデカイCSVデータを扱った時に困ったこと - Qiita
    • Shapecatcher: Draw the Unicode character you want!

      You need to find a specific Unicode character? With Shapecatcher.com you can search through a database of characters by simply drawing your character into a box. It can find the most similar character shapes for your drawing.

      • 【改良版】シフトJISをUTF-8に変換するバッチ - シーゴの Excel 研究室

        以前の記事で公開した「シフトJIS⇒UTF-8変換」バッチを改良しましたので再度公開します。 バッチを書き直しました 【本記事のバッチは非推奨です】 本記事のあとにさらに改善された UTF-8 変換バッチを公開しました。 本記事の一部バッチにあった不具合を解消したうえ、信頼性、使い勝手もよくなっていますので、今後はこちらのご利用をよろしくお願いいたします。 www.shegolab.jp 以前、当ブログの記事で「シフトJIS⇒UTF-8変換」バッチを紹介しました。 シフトJISのテキストファイルをUTF-8に変換するバッチ - シーゴの Excel 研究室 実はこのバッチ、入力ファイル名に半角カッコ「()」など特定の記号が含まれていると、そのファイルを処理できない問題があることが最近判明しました。これは Winodow バッチの限界に起因する問題で手の打ちようがなく、困っていました。 そん

          【改良版】シフトJISをUTF-8に変換するバッチ - シーゴの Excel 研究室
        • C# XmlSerializerの使い方 - け日記

          XMLでリクエスト/レスポンスするAPIへアクセスする機会がありましたので、XmlSerializerの使い方を備忘録にしておきます。 XMLをシリアライズ/デシリアライズする まずはC#オブジェクト(ここではBook)とXML形式の文字列でシリアライズ/デシリアライズさせる方法です。 Bookクラス用のXmlSerializer(System.Xml.Serialization名前空間)を定義して、Serializeメソッドでシリアライズできます。 publicのフィールドまたはプロパティがXML要素になりますが、XmlRootAttribute、XmlElementAttributeで要素名を指定しています これらの属性が無い場合は、フィールド名・プロパティ名がそのまま要素名になります XMLの繰り返し構造を定義することもでき、その場合はXmlArrayAttributeで親要素名、X

            C# XmlSerializerの使い方 - け日記
          • GB18030-2022が来た!詳細編—内容から読み取る本質〈エリックの多言語文字散歩〉|ヒラギノフォント公式note

            前回の概要編では、じっくりとGB18030-2022の表紙を見ながら、中国におけるGBの定義、GB18030規格改定の概要、製品への搭載義務などについて解説しました。今回は、いよいよ表紙をめくって更新された内容について詳しく解説していきます。 漢字はとにかく多いGB18030-2022の規格書の実物を見ると、まずその厚みに圧倒されるでしょう。700ページを超えるページをパラパラとめくってみてわかるのは、本文はわずか8ページ程度で、残りのほとんどは付属書である長い文字コード表ばかりです。 文字コードの国際標準としてISO/IEC 10646があります。そして業界規格のUnicodeとおおむね互換しています。一方でGB18030は中国独自の規格です。GB18030は策定当初から国際標準の存在を意識して設計され、膨大な量のコードポイント(符号位置)と、各文字コードを相互変換するための対応表を用意

              GB18030-2022が来た!詳細編—内容から読み取る本質〈エリックの多言語文字散歩〉|ヒラギノフォント公式note
            • Perl のユーザ定義文字特性 - ┗┐<(՞ਊ՞)>┌┛

              めっちゃ久々に Perl5系 書いたのですが、そのときに今更 Perl にはユーザ定義文字特性というものがあることを知りました。 perlunicode - Perl における Unicode サポート - perldoc.jp ユーザ定義文字特性によって、例えば半角のカタカナだけヒットさせるのを作ろうとなった場合、半角カタカナの範囲をユニコードの表で確認して https://unicode.org/charts/PDF/UFF00.pdf `ヲ`である `FF66` から `゚` の `FF9F` までヒットさせようと試みる場合、以下のような文字特性をかけます package Experopero::Sample; use utf8; use strict; use warnings; ... # 半角カナ文字 `ヲ` ~ `゚` を指定したユーザ定義文字特性 # see: https:

                Perl のユーザ定義文字特性 - ┗┐<(՞ਊ՞)>┌┛
              • Windows のコンソール端末と Unicode の相性

                MacType が効いている MSYS2 の mintty は、雪だるまと令和合字の字送りの幅が半角扱いなことを除けば、概ね合格です。 サロゲートペアを扱えないのは、マルチバイトの文字コードを扱えない、シングルバイト圏のソフトウェアのような話です。 FontLinkレジストリの FontLink で欧文フォント等に和文フォント結び付けていると、意図しない形で FontLink と異なるフォントになることがあります。メモ帳で先ほど同様に試してみると、次のように。 どうやらコードポイントによって、FontLink のフォントでなく、システムの他のフォントで描画されてしまうようです。 ☃ U+2603 が Segoe UI Emoji𠮟 U+20B9F や 𠮷 U+20BB7 が 游明朝しかも、混入した 游明朝 の文字は、なぜか一回り大きな文字サイズです。標準の Segoe UI や Tah

                  Windows のコンソール端末と Unicode の相性
                • PHPカンファレンスの過去14+3回の登壇を振り返る - Qiita

                  PHP Advent Calendar 2023の18日目の記事です。 PHPカンファレンスに登壇した記録を書きたいと思います。数えてみますと、2009年から昨年(2022年)までのPHPカンファレンス14回と、北海道2回、関西1回の合計17回登壇したことになります。 最初の登壇は14年前ですので、私の考えも当時からは変化していますので、そのあたりも触れながら紹介していきたいと思います。 PHP カンファレンス 2009 最初の登壇は2009年のPHPカンファレンスでした。この年はビジネスデイとテックデイに分かれていまして、ビジネスデイで登壇依頼を頂きましたので、当時温めていた「ウェブサイトを発注する際のセキュリティ」についてお話しました。 スライドの中で「脅威分析やってもあまり意味ない」みたいな物騒な意見が書いてあります。当時はそのように考えていたわけですが、これは当時のサイトがECサイ

                    PHPカンファレンスの過去14+3回の登壇を振り返る - Qiita
                  • フォントファミリーに係るルビの文字化けについて|InDesign|ぼんぷろぐ

                    新しいブログに引っ越しました。 こちらのブログはもう更新しませんが、コメント欄は生きてますので疑問、ご指摘などありましたらどうぞ。 (2022/12/30追記) 例の沼関係で来られた方はこちらツイートのスレッドもご覧ください。 お、再現できた pic.twitter.com/j7Z5jPEnJL — あるふぁ(仮) (@peprintenpa) December 28, 2022 InDesignでダイナフォントDF平成明朝体W9の文字にルビを振ると…文字化けするという話を、このブログで2015年に書いてたんですけど、その後の経過というか考察というかがツイッターに書き捨てただけになってたのでこの際まとめておきます。 結論としてはアドビが悪いので、DF平成明朝体が悪いともとられかねないような記事を放置していてダイナフォントさんごめんなさい。 上記ブログを書いたあと、フリーのTrueTypeフ

                    • 「Unicode 15.0」が公開 ~新しい絵文字20種を含む4,489の新たな文字が追加/「Noto Emoji」や「Last Resort Font」もさっそく対応

                        「Unicode 15.0」が公開 ~新しい絵文字20種を含む4,489の新たな文字が追加/「Noto Emoji」や「Last Resort Font」もさっそく対応
                      • 念のためもう一度トルコ語(等)で起こる問題について整理する - Qiita

                        Qiita Advent Calendar 2020のJava Advent Calendarの12月7日のエントリです。12月9日付けで追記と内容修正あります。 トルコ語問題については、ご存知の方はご存知だと思いますが、聞いたことがない人にはなかなか理解できない問題なので2020年の今、もう一回おさらいしておくのもいいかと思い書いています。(ほかにネタがなかった、とも言う。) トルコ語の何が特殊なのか トルコ語(とアゼルバイジャン語)には、dotted-iとdotless-iの二つのアルファベットがあります。 通常私たちは「i」の大文字が「I」であり、「I」の小文字が「i」であると理解しています。しかし、トルコ語ロケール(とアゼルバイジャン語ロケール)では「I」はドットなしIであるとみなされ、その小文字は「ı」になります。逆に「i」の大文字はドットありの「İ」なのです。 このため、以下の

                          念のためもう一度トルコ語(等)で起こる問題について整理する - Qiita
                        • Go言語のorderedmapパッケージを改善した - プログラムモグモグ

                          Go言語で書かれたorderedmapというサードパーティパッケージがあります。 github.com Goのmapには順序がなく、JSONをデコードすると順序が失われ、それをエンコードするとオブジェクトのキーの順序にソートされます。 これに困る人はそこそこいるようで、順序を保持するmapはいくつか実装されてきました。 その中の一つが、orderedmapというパッケージです。 シンプルなインターフェイスが気に入っています。 orderedmapパッケージの利用例 package main import ( "encoding/json" "fmt" "log" "github.com/iancoleman/orderedmap" ) func main() { src := `{ "z": 1, "x": 2, "y": 3 }` fmt.Println("# map[string]in

                            Go言語のorderedmapパッケージを改善した - プログラムモグモグ
                          • 「多様な肌色の絵文字」を開発した黒人女性はそのアイデアをアップルに盗まれた | アップルは外部のアプリ開発者に不利な条件を課し、利益を巻き上げる

                            スマートフォンなどの絵文字では、多様な人種を表すために肌の色が変えられるようになっている。このアイデアを初めに形にし、推進したのはあるアメリカの黒人女性だったが、アップルにアイデアを盗まれ、彼女は充分な対価を得られなかった。そのため、著作権侵害でアップルを起訴し、現在裁判が進行しているという。 インクルーシブなアプリのアイデア カトリーナ・パロットには、それは夢のようなことだった。自分の考案したアプリのプレゼンテーションをするため、カリフォルニア州クパチーノのアップル本社に招かれたのだ。テキサス州のNASAに解雇されて1年も経たたない今、自分が先駆けて開発した「肌の色を選べる絵文字」について、あのiPhoneメーカーと事業提携の話し合いをするのだ。

                              「多様な肌色の絵文字」を開発した黒人女性はそのアイデアをアップルに盗まれた | アップルは外部のアプリ開発者に不利な条件を課し、利益を巻き上げる
                            • UnicodeとUTF-8の違い。UTF-8・UTF-16・UTF-32とは

                              インターネットが世界中で普及している現代では、世界中のコンピュータが相互にデータを授受できるように、文字コードの統一が必須です。 そこで,考案されたのがUnicode(ユニコード)と呼ばれるコード体系です。 UnicodeはISO(国際標準化機構)規格となり、国際的に認められています。 文字コードに関する記事はこちら 文字コードとは?コンピュータの文字コードの種類 私たち人間は、 数字(10進数:0 〜 9) 文字 平仮名(あ 〜 ん) 片仮名(ア 〜 ン) 漢字 アルファベット(A ~ Z) 音 色 等々 を認識出来ますが、コンピュータは 数字(10進...

                                UnicodeとUTF-8の違い。UTF-8・UTF-16・UTF-32とは
                              • 第4回 神話と楔形文字と、ときどきUnicode | gihyo.jp

                                【話し手】 ゆー(Yu)楔形文字検索ツールqantuppi、クルヌギアを開発。技術同人誌『楔形文字とユニコードの出会いにまつわるエトセトラ』で技術書典「第3回 刺され!技術書アワード」エポックメイキング部門受賞。家にねこがいます。 GitHub:uyumyuuy Twitter:@uyum 本コーナーでは技術へのタッチポイントを増やすことを目標に、各分野で活躍されている方をお迎えします。 今回のテーマは文字コードです。楔形文字(くさびがたもじ)に詳しくなってしまったゆーさんに古代文字の符号化の議論、Unicodeが世界のすべての文字を収録する意義を技術と文化の両面から紹介いただきます。 楔形文字との出会い 日高:Unicodeをはじめとした文字コードって普段は意識しない領域だと感じています。いろいろ教えてもらいながら話せればと考えています。 ゆー:よろしくお願いします。私もこの分野を専門に

                                  第4回 神話と楔形文字と、ときどきUnicode | gihyo.jp
                                • Ultimate Unicode Input Device

                                  Just one more thing To make the experience fit your profile, pick a username and tell us what interests you.

                                    Ultimate Unicode Input Device
                                  • 文字コード is なに? What is a character code?

                                    共創のための地域基盤としての非公式組織の形成 / Informal community as an infrastructure for co-creation

                                      文字コード is なに? What is a character code?
                                    • 文字情報基盤検索システム

                                      本検索システムはMJ文字情報一覧表 Ver.006.01に基づいています。 Internet Explorerでは動作しません。 本検索システムでは文字関連グラフの提供予定はありません。 本検索システムは現状有姿でご利用下さい。

                                      • GitHub - qntm/base2048: Binary encoding optimised for Twitter

                                        You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                          GitHub - qntm/base2048: Binary encoding optimised for Twitter
                                        • CyberChef 超入門 (例題付き) - 午前7時のしなもんぶろぐ

                                          お久しぶりです。しなもんです。 今回は最近日本でもファンを増やしている便利ツール、"CyberChef" をご紹介します。 CyberChef とは? 豊富な機能 使い始めるのが簡単 直感的に操作可能 処理を繋げて表現できる ブラウザだけで機能する 隔離された環境でも使える Recipe をセーブ/ロードできる 処理速度が微妙・大きなファイルが苦手 初めての CyberChef:〇〇などない 例題1:Coin Challenge! 例題2:Et tu, Brute? 例題3:dots&dushes 例題4:reversible hash 例題5:X-channel light rays 応用編:Emotet ダウンローダからの通信先の抽出 重要な注意点 前提 解析! まとめ 参考資料 CyberChef とは? CyberChef (サイバーシェフ) とは、英国政府通信本部 (GCHQ)

                                            CyberChef 超入門 (例題付き) - 午前7時のしなもんぶろぐ
                                          • Unicopedia Plus - ユニコードや絵文字を調べる開発者用ツール

                                            絵文字の登場によってユニコードが幅広く使われるようになりました。合字によって、肌の色を変えたり、年々絵文字の種類が増えています。また、アジア圏の文字では似ていても微妙に違う文字もあります。 そんなユニコードの文字をチェックしたり、調べられるのがUnicopedia Plusです。 Unicopedia Plusの使い方 同じ字に見えますが、日本語や中国語(簡体字、繁体字など)によって微妙に違うのが分かります。 十二支を並べたところ。これも違うのが分かります。 絵文字を調べる機能も。 一覧での確認。 より詳細に絵文字を調べる機能。 Unicopedia Plusを使うことで、どの絵文字がどの段階から利用できるのか、各文字の違いなどを細かくトラッキングできます。ユニコードを開発者の視点から調べる際に役立つことでしょう。 Unicopedia PlusはElectron/JavaScript製の

                                              Unicopedia Plus - ユニコードや絵文字を調べる開発者用ツール
                                            • Encodeモジュール - 日本語などのマルチバイト文字列を適切に処理する - Perlゼミ|Perlの基礎をインストールからサンプルで丁寧に解説

                                              日本語などのマルチバイト文字をPerlで適切に扱うにはEncodeモジュールを使用します。次の3つのことを覚えておけば多くの場合適切に日本語を扱うことができます。 外部から入力された文字列はEncodeモジュールのdecode関数でデコードする 外部へ出力する文字列はEncodeモジュールのencode関数でエンコードする ソースコードはUTF-8で保存しutf8プラグマを有効にする この解説での用語 この解説では外部から入力された文字列のことを「バイト文字列」と呼ぶことにします。Perlの内部表現に変換された文字列を「内部文字列」と呼ぶことにします。また「バイト文字列」が特定の文字コードで記述されている場合は「UTF-8バイト文字列」「Shift_JISバイト文字列」などと呼ぶことにします。 プログラミングで日本語を扱う場合にその文字列がバイト文字列であるのか内部文字列であるのかを明確に

                                                Encodeモジュール - 日本語などのマルチバイト文字列を適切に処理する - Perlゼミ|Perlの基礎をインストールからサンプルで丁寧に解説
                                              • matplotlibの日本語文字化けを解決する - Qiita

                                                matplotlib の日本語の文字化け(豆腐)問題解決方法 matplotlib を使っていて日本語の文字化け(豆腐)の解決に苦労したので手順をメモ。 環境 Python 3.7.1 macOS Mojave 10.14.1 日本語の文字化け(豆腐)問題 下のグラフのX軸とグラフタイトルが文字化け(豆腐:◻︎◻︎◻︎◻︎)になっています。 この問題を解決したい。 matplotlibの設定ファイルの場所を探す 僕の環境では以下っぽい。 ******/lib/python3.7/site-packages/matplotlib/mpl-data/matplotlibrc 日本語フォントをダウンロード IPAexフォントをダウンロード。 ダウンロードして解凍するとipaexg.ttfというファイルがあるはず。 それを、さっき調べたmatplotlibの設定ファイルが置いてあるフォルダ内のfo

                                                  matplotlibの日本語文字化けを解決する - Qiita
                                                • SQLServer日本語コードの確認方法 - Qiita

                                                  SQLServerに作成したデータベースの文字コード(コードページ)が何なのか実機から調べた際の方法を紹介します。 環境 SQL Server 2014 対象のデータ型 今回調査対象としたのは、文字列型のデータ型であるchar(varchar)、nchar(nvarchar)で定義された列とします。 文字コードの設定箇所 SQLServerには文字列の区別、ソート順を決定する照合順序という定義がありますが、文字コードはそれと同一箇所で設定します。 設定する箇所は以下となります。 1.サーバに設定(SQLServerインストール時に指定) 2.データベースに設定(CREATE DATABASE句で指定) 3.テーブルに設定(CREATE TABLE句で指定) 4.列に設定(CREATE TABLE句で指定) 優先順位 列に定義 > テーブルに定義 > データベースに定義 > サーバに定義 と

                                                    SQLServer日本語コードの確認方法 - Qiita
                                                  • Grapheme Clusters and Terminal Emulators

                                                    Copy and paste "🧑‍🌾" in your terminal emulator. How many cells forward did your cursor move? Depending on your terminal emulator, it may have moved 2, 4, 5, or 6 cells1. Yikes. This blog post describes why this happens and how terminal emulator and program authors can achieve consistent spacing for all characters. Character Grids, Historically Terminals operate on a grid of fixed size cells. Thi

                                                    • エジプト・ヒエログリフ Egyptian Hieroglyphsの文字一覧 - 1 Unicode U+13000~U+133FF(77825文字目~78848文字目) (ユニコード) 0g0.org

                                                      エジプト・ヒエログリフ Egyptian Hieroglyphsの文字一覧 - 1 Unicode U+13000~U+133FF(77825文字目~78848文字目)

                                                      • Unicode絵文字の仕組みをみてみる

                                                        Unicode絵文字で使われている仕組み、特に、複数の文字を組み合わせて1つの絵文字を組み立てる「Emoji Sequences」のことは意外と知られていないかもしれません。Unicode絵文字がどのように成り立っているか、ひととおり大雑把に紹介してみます。 例えば: ❤️‍🔥 (heart on fire) ← ❤️ + ZWJ + 🔥 ❤️‍🩹 (mending heart) ← ❤️ + ZWJ + 🩹 🏳️‍⚧️ (transgender flag) ← 🏳️ + ZWJ + ⚧️ 🏳️‍🌈 (rainbow flag) ← 🏳️ + ZWJ + 🌈 🏴‍☠️ (pirate flag) ← 🏴 + ZWJ + ☠️ 🐕‍🦺 (service dog) ← 🐕 + ZWJ + 🦺 🐈‍⬛ (black cat) ← 🐈 + ZWJ + ⬛ 🐦‍

                                                          Unicode絵文字の仕組みをみてみる
                                                        • 文字エンコードを指定してファイルを開く

                                                          Visual Studio Code ではファイルの文字エンコードとして UTF-8 がデフォルトで設定されています。その為、 Shift_JIS など UTF-8 以外の文字エンコードで保存されたファイルを開くと文字化けして表示されます。ここでは Visual Studio Code で文字エンコードを指定してファイルを開く方法について解説します。 文字エンコードを指定してファイルを開きなおす Visual Studio Code ではデフォルトで文字エンコードとして UTF-8 を使用します。その為、文字エンコードとして UTF-8 を使用して保存されたファイルを開いた場合は問題なく表示されます。 それに対して例えば文字エンコードとして Shift_JIS を使用して保存されたファイルを開いた場合、文字化けが発生します。 UTF-8 以外の文字エンコードで保存されたファイルを開くには、

                                                            文字エンコードを指定してファイルを開く
                                                          • [Unicode]スペース以外の見えない空白文字の一覧 | 404 motivation not found

                                                            目次 はじめにスペースや全角スペースのような空白文字一覧参考にしたサイトはじめに スペースや全角スペース以外にもいくつか存在する目に見えない Unicode の文字の一覧です。 スペースや全角スペースのような空白文字一覧 ブラウザや環境によっては表示されない場合があると思います。 Unicode 実体 説明 description

                                                              [Unicode]スペース以外の見えない空白文字の一覧 | 404 motivation not found
                                                            • エチオピアでモチモチした文字が発見されて「X」(Twitter)でちょっと話題に/「オフチョベットしたテフをマブガッドしてリットにする様子」の元ネタもこの言語【やじうまの杜】

                                                                エチオピアでモチモチした文字が発見されて「X」(Twitter)でちょっと話題に/「オフチョベットしたテフをマブガッドしてリットにする様子」の元ネタもこの言語【やじうまの杜】
                                                              • 文字情報基盤整備事業 | 一般社団法人 文字情報技術促進協議会

                                                                文字情報基盤整備事業は、平成22年度電子経済産業省推進費(文字情報基盤構築に関する研究開発事業) によりスタートした、行政で用いられる人名漢字等約6万文字の漢字を整備するプロジェクトです。令和2年8月に一般社団法人 文字情報技術促進協議会に信託譲渡されました。詳しくはこちらから。

                                                                • 絵文字をスクリーンリーダーに読み上げさせてみた | アクセシビリティBlog | ミツエーリンクス

                                                                  以前に同僚と少し絵文字に関する話をしていたこともあり、ふと、絵文字はスクリーンリーダーでどう読み上げられるのかということが気になって、ごく簡単に読み上げさせてみましたという話です。 筆者の自宅の環境がWindowsとAndroidであることから、読み上げのテストにあたっては、NVDA、Windowsのナレーター、TalkBackで試してみました。以下にテスト環境を記しておきます。ブラウザーによる違いは見られなかったので、これについては省いています。 Windows バージョン 1909(OS ビルド 18363.836) NVDA 2020.1jp Android 10 TalkBack バージョン 8.2.0.303936097 以下が4つの絵文字について読み上げテストを実施した結果になります。言語については、lang属性を付与して読み上げさせました。 笑顔を表す絵文字と各スクリーンリー

                                                                    絵文字をスクリーンリーダーに読み上げさせてみた | アクセシビリティBlog | ミツエーリンクス
                                                                  • IntelliJ IDEA でエラーメッセージが文字化け

                                                                    Windows 10は、マイクロソフト社がリリースしたOSです。Modern UIを標準画面にした8.1から、10では再びデスクトップ主体に戻され、UIも変更されています。PCやスマホ、タブレットなど様々なデバイスに幅広く対応していることが特徴です。 Javaは、1995年にサン・マイクロシステムズが開発したプログラミング言語です。表記法はC言語に似ていますが、既存のプログラミング言語の短所を踏まえていちから設計されており、最初からオブジェクト指向性を備えてデザインされています。セキュリティ面が強力であることや、ネットワーク環境での利用に向いていることが特徴です。Javaで作られたソフトウェアは基本的にいかなるプラットフォームでも作動します。

                                                                      IntelliJ IDEA でエラーメッセージが文字化け
                                                                    • PowerShellで外部コマンドの出力が文字化けする場合の対処法 (1/2)

                                                                      PowerShellで文字化けが生じる場合がある 直接実行すると問題なく表示されるのに、PowerShellの変数に格納する、あるいはファイルに出力すると文字化けする外部コマンドがある。 具体的には、wsl.exeやwinget.exeなどだ。文字化けするのは、PowerShellの変数への格納や、cmd.exeでファイルにリダイレクトしたあと、変数やファイルを表示したときである。 先に結論から言えば、wsl.exeとwinget.exeの場合、標準出力にはバイトマークなしのUnicode(UTF-16LE)エンコードされた文字列が出力されているため、そのままでは文字化けしてしまう。 画面に出力したときに文字化けしない理由は、標準出力とは異なる方法で画面表示しているからだと思われる。ソースコードを調べたわけではないが、たとえば、コンソールAPIなどを使って画面出力しているのではないかと思わ

                                                                        PowerShellで外部コマンドの出力が文字化けする場合の対処法 (1/2)
                                                                      • SwiftUIで日本語テキストが不自然に改行される | DevelopersIO

                                                                        SwiftUIのTextビューで日本語を表示する際、意図しない箇所で改行が入ることがある。改行コードを使わずに改行位置を調整する方法を紹介する。 日本語テキストが不自然に改行される SwiftUIのTextビューで日本語を表示する時、意図しない箇所で改行が入ることがある。たとえば「あなたに寄り添う究極のイノベーション」というフレーズが、「あなたに寄り添う\n究極のイノベーシ\nョン」と不自然に改行されることがある。 例図では以下のように表示されている。 あなたに寄り添う 究極のイノベーシ ョン あなたの未来を形 作る最上のガジェ ット 英語圏で作られたWebサイトでの日本語の改行問題 英語圏で作られた後に日本語に翻訳されたサイトの例では、「今すぐダウンロード」というフレーズが「今すぐダウンロー\nド」と表示されることがあった。日本人の感覚からするとこれには強い違和感がある。他にも禁則処理が

                                                                          SwiftUIで日本語テキストが不自然に改行される | DevelopersIO
                                                                        • U+301C from UTF-8 to Windows-31J (Encoding::UndefinedConversionError) に対応する - ESM アジャイル事業部 開発者ブログ

                                                                          こんにちは。ima1zumi です。 私の開発している Rails アプリでは、Excel で読み込めるように 文字コードを Windows-31J に変換して CSV を出力する機能があります。 先日、CSV 出力にて Unicode の波ダッシュ 〜 を Windows-31J に変換しようとして Encoding::UndefinedConversionError が発生して CSV 出力に失敗したことがありました。なぜエラーになるのか、どうやって対応するのかをまとめました。 まとめ encode メソッドの fallback オプションを使って未定義文字の変換先を定義することで変換できます。 str = "\u{2014 301C 2016 2212 00A2 00A3 00AC}" undefined_signs = { "\u2014" => "\x81\x5C".force_

                                                                            U+301C from UTF-8 to Windows-31J (Encoding::UndefinedConversionError) に対応する - ESM アジャイル事業部 開発者ブログ
                                                                          • Unicode IVS/IVDについて | 一般社団法人 文字情報技術促進協議会

                                                                            IVS(Ideographic Variation Sequence/Selector)は、文字符号としては同一視される漢字の、細かな字形の差異を特別に使い分けるための仕組みです。IVSは文字符号の国際規格であるISO/IEC 10646(2008年版以降)に規定されています。また、IVSと、それに対応する字形の一覧は、UnicodeコンソーシアムからIVD(Ideographic Variation Database)として公開されており、ISO/IEC 10646から正規の規格として参照されています。 文字符号(文字コード)を定める日本工業規格のJIS X 0213(以下、JIS)やISO/IEC 10646 Universal Coded Character Set(以下、UCS)などでは、複数の字形に対して一つの共通な符号(コード)を与える場合があります(「同一の符号位置に複数の字

                                                                            • 「iOS 16.4」で新たに使えるようになった絵文字はこれだ! Androidスマホに送ったらどうなる?

                                                                                「iOS 16.4」で新たに使えるようになった絵文字はこれだ! Androidスマホに送ったらどうなる?
                                                                              • GitHub - tc39/proposal-regexp-v-flag: UTS18 set notation in regular expressions

                                                                                You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                                                  GitHub - tc39/proposal-regexp-v-flag: UTS18 set notation in regular expressions
                                                                                • Office アシスタント「クリッパー」が絵文字として復活へ | スラド idle

                                                                                  Office アシスタントの「クリッパー」が Microsoft 365 の絵文字として復活することになったようだ(Microsoft のツイート、 The Verge の記事、 The Next Web の記事、 On MSFT の記事)。 クリッパー (英: Clippy) はゼムクリップに目玉を付けたような外見で、かつて Microsoft Office 英語版デフォルトの Office アシスタントだった。最も嫌われた Microsoft のキャラクターといわれる一方で、たびたび復活を遂げてきた。今回は Microsoft 公式 Twitter アカウントがクリッパーの画像を投稿し、「いいね」が 2 万件を超えたら Microsoft 365 のクリップの絵文字をクリッパーに置き換えると宣言。設定値が低すぎる気もするが、投稿から 2 時間 15分後には既に 3 万件を超えていたとい