タグ

ブックマーク / note.com/kazushinakamura (7)

  • いろいろな言語での書式指定子たち#4 - Java言語|kzn

    プログラムを作れば結局のところ何らかのアウトプットが必要なわけで、文字としてアウトプットする際に必ずお世話になるのが print 関連の関数で使われる書式設定です。前回はC言語についてまとめましたが、今回はJavaです。 いろいろな言語での書式指定子たち#3 - C言語 Javaは比較的新しい言語ですし、この時代になるとコンソール画面というよりはGUIに何かを出すことも増え、GUIとなると文字の幅も一定ではなくなるので書式で頑張っても限度が出てくるのですが、テキスト形式でデータをファイルに書き出したりするには、まだまだ書式指定が活躍する場所も残っています。JavaでもC言語とほぼ同じ仕様の printf が使えますし、オブジェクトに出す場合には VB にもありましたが format 関数を使って文字列を作って、それを渡します。いずれも書式指定子はほぼC言語と同じなのですが、ちょっとだけ異な

    いろいろな言語での書式指定子たち#4 - Java言語|kzn
    Guro
    Guro 2024/08/05
  • いろいろな言語での書式指定子たち#3 - C言語|kzn

    さて、FORTRANに続きBASICでの書式指定文字列についてまとめてきましたが、今回はお待ちかねのC言語です。C言語の printf などで使われる書式指定子については、まだまだ現役でよくご存知の方も多いですよね。 いろいろな言語での書式指定子たち#2 - BASIC printf は、書式指定文字列に続いて必要なだけ変数を並べます(実は定数も書ける)。書式指定文字列の中に”%”が出てくると、その後ろに続く文字で指定された書式で値が埋め込まれます。ですから”%”の数と同じだけ変数などを並べないとエラーになるわけです。 %c 文字 %s 文字列 %d (符号付き)整数 %u 符号なし整数 %f 小数 型指定文字ここまでが基です。”%”を出力したいときは”%%”とします。それ以外の文字列はそのまま出力されますが、”\”によるエスケープは有効なので、改行コードを”\n”と書くわけです(”\r

    いろいろな言語での書式指定子たち#3 - C言語|kzn
    Guro
    Guro 2024/07/08
  • 妄想新幹線 - 敦米連絡新幹線|kzn

    この春に北陸新幹線が敦賀まで延伸され、東京からは大阪までと同じくらい(ちょっと長めでひかりくらい?)の時間で敦賀まで乗換なしに行けるようになりました。 この先の大阪までの区間はまだ着工には至っておらず、計画では日海側をそのまま進み小浜から京都に向かってから大阪に到達することになっています。ルートの詳細はまだですが、基的にはこのルートで建設されることは「決まっている」ことになっていますが、新幹線建設には政治が関わってくるので、一筋縄ではいきません。 北陸新幹線・金沢~新大阪延伸 - 鉄道計画データベース もともと敦賀~大阪は、どの場所を経由してどこに駅が出来るのかはいろいろな案があり、有力な案として敦賀から米原に向かうというものがありました。これは在来線でのルートに近いですし、建設区間が短い、即ち建設費が抑えられるというメリットがあります。これに対する反対理由のうちの大きなものとして、米

    妄想新幹線 - 敦米連絡新幹線|kzn
    Guro
    Guro 2024/06/24
  • NEC特殊文字とIBM拡張文字 - 機種依存文字の扱い|kzn

    この頃は、ネットも無いですし大型機が絡めば当然、同じメーカーで囲われているので、独自の文字が問題になるとすれば、他社のプリンタで出力すると該当文字が出ない場合があるという程度でした。そもそもアプリで使っている限り、どの文字が機種依存文字であるかという判断が出来るわけもなく、当然のように機種依存文字が蔓延していったわけです。 IBM 拡張文字・NEC 選定 IBM 拡張文字・NEC 特殊文字 実はパソコンに限らず、日語ワープロなどにおいても機種依存文字は、むしろ自社の製品ではより多くの漢字や記号が使えるとアピールしていたくらいで、必ずしもJISの未定義領域コードに文字を割り当てるとは限らず、いろいろな手段を使って文字を増やしていました。ワープロに関しては、文字だけではなく書式なども変換が必要だったので、いわゆる変換ツールと呼ばれるソフトを使って、これらの非互換性に対処していたのですが、MS

    NEC特殊文字とIBM拡張文字 - 機種依存文字の扱い|kzn
    Guro
    Guro 2024/06/04
  • EUC - UNIXと共に普及した文字コード|kzn

    語の文字コードとしてポピュラーだったシフトJISの話あたりは以下に書いたのですが、それ以外にもUNIXな世界で標準であったEUCという文字コードがありました。 シフトJISって何が凄いの? EUCという名前から想像できるかはわかりませんが、UNIXにおける拡張文字コードという意味で、1984年頃、当時、商用UNIXをライセンスしていたAT&Tが日でのビジネスにあたり、日語の文字コードを決める必要があって制定された文字コードです(日が最初だったんですね、欧州諸国はどうしていたんだろう)。 Extended Unix Code 基的には由緒正しいISO/IEC 2022の国際的な仕組みに準拠したもので、日語だけではなく中国韓国の文字に対しても同じ方法で拡張できるように決められています。シフトJISと同じように文字セットの切り替えコードを必要とせず、日語に対する拡張方法としては

    EUC - UNIXと共に普及した文字コード|kzn
    Guro
    Guro 2024/06/04
  • Windowsコードページの謎|kzn

    語が格的に使えるようになりだした頃、そのコードはJISコードを巧妙に細工してモード切替を不要にしたシフトJISと呼ばれるものが使われました。当時は英語のみが使える環境でプログラムが作られることが殆どだったので、これを移植して日語を扱えるようにすれば充分だということだったのです。 文字コード 最初に使われたのはCP/M-86という説もありますが、一般的に使われるようになったのはMS-DOS(PC-DOS)が最初です。これはWindowsにも引き継がれ、Macintoshも日主導で日語化が行われたという経緯もありシフトJISが使われました。 さてシフトJISの問題は米国標準であるASCIIに対する拡張であって、それ以外の国のローカルコードのことを考えていないことです。例えば英国では一部の記号がポンド記号に置き換わっているコードが使われていましたし、他のヨーロッパ諸国の言語でもいろい

    Windowsコードページの謎|kzn
    Guro
    Guro 2024/06/04
  • ¥を巡る不都合な真実 - モディファイド・シフトJISという化石|kzn

    パソコンの世界で漢字を含む日語を扱えるようにするために、処理が煩雑になるJISコードをそのまま扱うのではなく、文字コードセットの切り替え処理が不要になるシフトJISというコードが発明されました。 このコードがどのような経緯でMS-DOSなどで採用されたのかは、あまり詳しくわからないのですが、この文字コードは規格ではなくあくまで実装に過ぎなかったので、メーカー独自の判断で構わないと思われていたようです。 MULTI16 - 遂に三菱電機もパソコンを出した この文字コードが身近に使われるようになったのは、MS-DOSが日語に対応した1983年にリリースされた「日語MS-DOS Ver2.x」からだと思います。この段階で階層化ディレクトリもサポートされ、CP/Mから継承したコマンドオプションは”/”で始まるというルールが仇となりパスの区切り文字がUNIXなどで使われていた”/”の代わりに”

    ¥を巡る不都合な真実 - モディファイド・シフトJISという化石|kzn
    Guro
    Guro 2024/06/04
  • 1