タグ

textとTextに関するseuzoのブックマーク (26)

  • 「タブ区切りは CSV じゃなくて TSV だろ」問題がついに解決した

    CSV ありますね。カンマ区切りのデータ形式。 なんか根強いファンがいて、どうしてもこの形式のファイルをダウンロードしたりアップロードしたりしたいという要望をよく聞きます。 CSV がほしい理由 これをやりたい理由のひとつとして、Microsoft Excel からエクスポートしたデータを読み込ませたいとか、逆にシステムにあるデータをエクセルで見たいとかいうのがあると思います。あると思いますっていうかほとんどそれじゃないかな。 けどこの場合、カンマ区切りである必要はないんですよね。要するにエクセルとやりとりできさえすればいいわけで。 だったらカンマじゃなくてタブですよタブ。 カンマ区切りをやめてタブ区切りにすると、いろいろいいです。 何もエクスポートしなくても、エクセルの画面で「すべて選択」して「コピー」したら勝手にタブ区切りになってるからそのまま貼っつけるだけでいい。 テキストエディタな

    「タブ区切りは CSV じゃなくて TSV だろ」問題がついに解決した
    seuzo
    seuzo 2015/12/02
  • 老舗テキストエディター「サクラエディタ」v2.2.0.0が公開、ミニマップ機能などを追加

    老舗テキストエディター「サクラエディタ」v2.2.0.0が公開、ミニマップ機能などを追加
  • 縦組みにおける英数字正立論―まとめ | 電子書籍、電子出版のCAS-UBブログ

    1月11日以来随時ブログで紹介してきましたUTR#50関係の話を「縦組みにおける英数字正立論」として整理しました。 「縦組みにおける英数字正立論1~18」としてストーリー化しましたが、これをCAS-UBでPDFとEPUBにしたバージョンもあります。 こちらからダウンロードしていただくことができます。 http://www.cas-ub.com/project/verticalwriting.epub http://www.cas-ub.com/project/verticalwriting.pdf 「英数字正立論」を思いついたのはUTR#50(ドラフト)を読んで「これではだめだ。」と感じたからなのです。では、なぜ、そう感じたかと言いますとCAS-UBを開発する過程で、全角文字と半角文字を使い分けて縦組みのときの正立・横倒しを区別するという現状のやり方にいろいろと壁を感じていて解決策を模索し

  • 縦組みにおける英数字正立論18―参考文献 | 電子書籍、電子出版のCAS-UBブログ

    1.Unicodeで縦組みの文字の向きの標準を決める新しい仕様案 UTR#50 (http://unicode.org/reports/tr50/) 2.パブリックコメント:http://unicode.org/forum/viewforum.php?f=35 3.日語での議論は「EPUB仕様についての情報・意見交換」でもhttp://groups.google.com/group/epub-spec-discussions 4.Twitter ハッシュタグは #UTR50 5.参考ブログ記事 5-1 CSSの縦組みとUnicodeの縦組みの文字の向き(UTR#50)の話題(CSS組版ブログ)http://blog.antenna.co.jp/CSSPage/2012/02/cssunicodeutr50.html 6.「PDFインフラストラクチャ解説」http://www.cas-ub

  • 縦組みにおける英数字正立論17―英数字正立論の課題 | 電子書籍、電子出版のCAS-UBブログ

    英数字正立論はまだラフなアイデアのレベルです。これを精緻なものにするには検討すべきことがあります。 さしあたっては次のような批判が考えられます。 プレーン・テキストへの適用 【批判】プレーン・テキストのレベルではマークアップが使えない。すべて正立してしまうと困ることがあるだろう。 【対応】全角文字を使うというのは、XHTMLでは文字単位のマークアップにほぼ同じです。全角文字を廃止してしまうと、プレーン・テキストの段階では横倒しする文字と正立する文字を区別する方法がなくなり、結果として英語の文章などを横倒しさせることもできなくなります。従って、プレーン・テキストの中で横倒ししたい範囲を示したいときは、Unicodeに制御用コードを導入するなどの方式をとること必要があるでしょう。これと類似の方法はラテン文字とアラビア文字が混在したときの方向を制御するために、Unicodeでは古くから採用されて

  • 縦組みにおける英数字正立論16―HTML+CSSによる縦組みと英数字正立論 | 電子書籍、電子出版のCAS-UBブログ

    HTMLCSS3による縦組み 前章のプレーン・テキストをXHTMLにすればCSS3 Writing Modesを使って縦組み表示することができます。CSS3 Writing Modesには、文字の方向を決めるtext-orientationというプロパティがあります。 現在のWorking Draftではtext-orientationの仕様は次の通りです。 text-orientationのデフォルトは、‘upright-right’なので、text-orientationになにもしない指定ときは‘upright-right’である。 ‘upright-right’:縦組みのとき、横組み専用のsriptの文字は横倒しになる。すなわち、標準の方向から時計回りに90度回転する。縦組みの記法がある文字は固有の方向となる。 ‘upright’:縦組みでは、横組み専用のsriptの文字は直立で可

  • 縦組みにおける英数字正立論15―縦組みのプレーン・テキストの表示 | 電子書籍、電子出版のCAS-UBブログ

    Webのページや電子メールなどで横組みの文字を比較しますと、Webページでは文字に大きさやフォントの種類などの様々な指定がなされています。一方、これに対して電子メールを読むときは飾りのない文字を読んでいます。この飾りのない文字をプレーン・テキストと言います。 プレーン・テキスト そこで、「日語のプレーン・テキストを縦組みするとき、その中のアルファベットや数字をどう表示すべきか。」を考えて見ます。まず、横組みでは、日語の中にアルファベットやアラビア数字があったときは、次のように表示します。 図:横組み中の英数字 現状の英数字の縦組み このテキストをそのまま縦組みにすると、UTR#50の草案ではラテンアルファベットや英数字は横倒しにすることになりますので、次の(A)のようになります。これではまずいので正立させたい文字を全角文字に直します(ここでは話を簡単にするために縦中横は使わない前提です

  • 縦組みにおける英数字正立論14―CSS Writing Modesでは | 電子書籍、電子出版のCAS-UBブログ

    CSS3のエディターズ・ドラフト CSS3 Writing Modesの新しいEditor’s Draftでは、UTR#50を利用して縦組みのときの文字の挙動を指定しようとしているようです。 CSS Writing Modes Module Level 3 Editor’s Draft 5 January 2012([[http://dev.w3.org/csswg/css3-writing-modes/#vertical-typesetting-details]]) 次は、http://dev.w3.org/csswg/css3-writing-modes/#vertical-typesetting-detailsの抄訳です((この文章はエディターズ・ドラフトというものであって、CSS3の正式なワーキング・ドラフトではありませんので注意してください。))。これを読むとCSS3の新しい草稿

  • 縦組みにおける英数字正立論13―UTR#50著者の考え方 | 電子書籍、電子出版のCAS-UBブログ

    UTR#50の仕様についてはForumなどでいろいろ議論がされていますが、UTR#50が提案されたことで、いままで混乱していた全角英数と半角英数の使いわけを解消するチャンスが来ているのも確かです。 エディタの意識 UTR#50のエディターはEric Muller氏(Adobeの人)ですが、UnicodeのForumでこんなことを言っています。 「DTP/Web users have taken advantage of the existence of the fullwidth characters, in the following way: they use the ASCII code points when they want a cl-27/sideways in vertical treatment, and they use the fullwidth code point

  • 縦組みにおける英数字正立論12―UTR#50の概要 | 電子書籍、電子出版のCAS-UBブログ

    UTR#50は、草稿なので今後さらに変わる可能性がありますが、それを前提にした上で原案を検討します。 狙い この文書は、特に、「日語組版処理の要件」(JLREQ)を参照して、二つのこと、つまり日語の(1)文字と文字の間の空き量をどう変えるべきか、(2)縦組みのときの字の方向と字形をどうすべきかを決めようとしています。 [疑問点 日語組版における文字間の空きの調整の問題は縦組みだけではなく、横組みにも適用されるものなので、なぜ縦組みの文脈で提示しているのか理解できません。また、文字の方向性と空きを単一の文書で論議するのは少し無理があるように感じます。しかし、そのことはここでは問いません。とりあえず、論では(2)だけ取り上げることにします。 ] 適用範囲 この仕様はプレーン・テキストにも適用可能としています。従って、この仕様は日語の縦組みを特別なマークアップなしで表示するときの文字の

  • 縦組みにおける英数字正立論11―CSS3 Writing ModesとUnicodeの動き | 電子書籍、電子出版のCAS-UBブログ

    CSS3のWriting Modesで縦組みを指定できるようになって、EPUB3がそれを採用してEPUBで縦組み指定ができるようになった、というのは昨年(2010年~2011年)の話です。 CSS Writing Modes Module Level 3(最新版はhttp://www.w3.org/TR/css3-writing-modes/ --W3C Working Draft 1 September 2011) これによってWebやEPUBでも縦組みを指定できることになったと思われたのです。ところが、CSS3のWriting Modesのみでは文字単位で正立させるか横倒しにするか規定されていないため挙動が不統一になってしまいます。 そこで、これを統一化しようということで、Unicodeで文字のコードポイント毎に方向の特性を定義するTR#50という仕様が提案されました。 Unicode

  • 縦組みにおける英数字正立論10―現在の問題点 | 電子書籍、電子出版のCAS-UBブログ

    しかし、英数字の方向の使い分けを全角文字正立、半角文字横倒しという方法に頼るのは問題が多くあり、中には解決が困難な問題もあります。 第一に、著者が原稿を書くときに横組みにするか縦組みにするかを予め決めなければなりません。そして縦組みでは、文字を入力するときに文字を立てるか、寝かすかを意識して原稿を用意しなければなりません。ところが、原稿を書くツールの多くは横組みが基になっています。例えば、横組みのテキストエディタでは、縦組みを意識して文字が立つか寝るかを想像しながら文字を入力・編集することになります。出版社の編集部ではおそらくそのようなガイドを作っているはずです。 第二に、電子書籍で読者が縦組みにするか横組みにするかを決定できるとすると、著者や編集者の意図とは異なる組方向で表示される可能性があります。 第三に、昔のような固定幅のフォントだけの時代であれば、全角文字と半角文字を見た目で容易

  • 縦組みにおける英数字正立論9―製品の実装と使い方 | 電子書籍、電子出版のCAS-UBブログ

    現在、Microsoft WordやInDesignをはじめとして日語組版を行なう製品の多くは、全角文字と半角文字を別の文字として扱い、縦組みでは全角文字を正立させ、半角文字を横倒しするという方法を採用しているようです。 アンテナハウスのXML組版ソフトの最新版である「Antenna House Formatter V6.0」も例外ではありません。このため縦組みでは半角英数字を横倒し、全角英数字は正立となります。 日語の著者や編集者は、こういったツールを前提に仕事をすることになります。従って、著者または編集者は、縦組みの書籍の原稿を整理する段階で、正立させる文字は全角文字、横倒しする文字は半角文字で用意することになります。 ただし、こういったことを知らないIT専門家も多いようです。あるセミナーで著者が「AH Formatterでは縦組みで正立させたい英数字は全角文字で入力する必要があり

  • 縦組みにおける英数字正立論8―文字コード | 電子書籍、電子出版のCAS-UBブログ

    の国内規格 日の国内文字コードには、古くからJIS X0201(1バイト)とJIS X0208(2バイト)があります。英数字はJIS X0201とJIS X0208の両方の文字集合に収容されています。 JIS X0201とJIS X0208を一つにしたのがシフトJISです。シフトJISでは英数字は重複してしまいます。その時代には1バイトは半角文字、2バイトは全角文字と呼ばれていました。 1980年代から2000年頃まではシフトJISが主流でした。ただし、シフトJISを採用していないワープロ専用機も多く使われていました。 Unicode 1980年代の終わり頃にはUnicodeが開発されました。現在は多くのアプリケーションがUnicodeを用いており、文字コードの主流はUnicodeになっていると見られます。 Unicodeは各国の国内コードとの互換性を保つことを優先課題のひとつとして

  • 縦組みにおける英数字正立論7―縦組みにおける英数字の扱いまとめ | 電子書籍、電子出版のCAS-UBブログ

    語の縦組みの中で英数字がどのように表記されるかの実態についてはさらに詳しい調査が必要です。しかし、とりあえず簡単に整理しますと次のようになります。 ラテンアルファベット 縦組みの書籍や新聞・一般向け雑誌では外国の地名や人名等を原文のままアルファベット表記する例は比較的少なく、カタカナで表します。ラテンアルファベットを使うのはAさんやA型のように1文字の記号として使うか、頭文字を連ねるケースが多く、文字の方向は正立が多いと言えます。 但し、英文をそのまま引用する場合、あるいは、著書を紹介するときの著者名、原著名などで英語をそのまま縦組みの行中に含める場合は、文字列単位で右に90度回転して行に収めます。新聞表記の例では、計測単位などに小文字を使いかつ桁数が多い(3文字以上)は横倒しが見られます。 アラビア数字 縦組の書籍では、アラビア数字は次のようなところに出てきます。 目次のページ番号

  • 縦組みにおける英数字正立論6―縦組みパソコン雑誌における英数字 | 電子書籍、電子出版のCAS-UBブログ

    縦組みのパソコン雑誌における英数字の使われ方を調べてみます。調査対象としたのは、日経BP社発行の「日経PC21」2012年3月号です。この雑誌は、ビジネスマンがパソコンを使うためのハウツー情報誌ですので技術とビジネスの接点に位置しています。ハウツーの図版が多いのが特徴です。図版の部分にキャプションと説明文が多くありますが横組みと縦組みが混在しているのも誌面の特徴です。 雑誌の誌面 肝心の英数字の使い方ですが、サンプルとして誌面の一部を紹介します。 図:日経PC21の誌面の一部 (「日経PC21」2012年3月号、66頁の一部) 図を見ると一目瞭然ですが、ラテンアルファベットは正立、アラビア数字も正立が基です。もう少し詳しく見るために、先頭(9頁)から33頁までの記事の中の縦組みになっている部分の方向を確認してみます。 ラテンアルファベット ラテンアルファベットは103箇所でてきますが、そ

  • 縦組みにおける英数字正立論5―新聞方式縦組みの英数字 | 電子書籍、電子出版のCAS-UBブログ

    編集者や記者のためのガイドブックとして、「記者ハンドブック 第12版」(共同通信社編著、2011年10月11日、ISBN978-4-7641-0619-2)を調べてみます。 まず、このの構成ですが、全体740頁のうち、先頭から630頁までが縦組みで、資料編110頁が横組みです。外国の地名・人名の表記、新聞略語集などが資料編に収容されています。縦組みで表記しにくいラテンアルファベットの英語表記は横組み頁を設けているのです。 ラテンアルファベット 正立(2-a.) WHEN、WHERE、WHO、WHAT、WHY、HOW、5W1H、もうひとつのW、WORTH (10頁)、A欄、A+B、など(110頁)、GK、MFなど(125頁)、ウイリアム・J・クリントン(126頁)、AからBまで(127頁)、SLのかま(202頁)、CD(236頁、256頁)、DVD(256頁、276頁)、B5版(383頁)

  • 縦組みにおける英数字正立論4―小説の中の英数字 | 電子書籍、電子出版のCAS-UBブログ

    の代表的な小説の中で英数字がどのように使われているかを調べてみます。 「昭和史発掘」 「昭和史発掘9」(松清張、文春文庫、2005年11月10日新装版第一刷)では、外国人名、国名・地名、外国語由来の単語はカタカナで表しています。そして、文の中のアルファベットは「A行動記」「B仙台発見遺書」(順序記号)(P.231)「Y判士」(p.294)のように1文字の記号として使っているだけです。もちろん正立で使っています。 横倒しのアルファベットは文には登場しません。 年号、日にち、年齢、人数などの数字はすべて漢数字で表記しています。縦組み中のアラビア数字は次の使われ方だけです(この他に、ページ番号、奥付けにもアラビア数字が使われていますが、これらは横組みなので除外します。以下同様に横組み部分は除外。)。 表紙の「9」という巻数 節番号(1,2,・・・) 箇条書きの項目番号(p.63) 目次

  • 縦組みにおける英数字正立論3―英数字は正立・横倒しの扱いが厄介 | 電子書籍、電子出版のCAS-UBブログ

    ところが、縦組みするときにラテンアルファベットやアラビア数字(以下、総称して「英数字」といいます)を正立させるか横倒しさせるかを決めるのは厄介です。 ラテンアルファベット 日語の中には、ラテンアルファベットを使うことができます。例えば、A氏、NHK、ISOといった文字列の中のアルファベットは記号であり、縦組みでは一字一字正立させなければなりません。しかし、同じラテンアルファベットでも縦組みする日語の文章の中に”International Standard Organization”というような文字列があるとき、これを一文字づつ正立して縦に並べますと大変読みにくいものとなります。従って、縦組みの中では文字列全体を右に90度回転して行に収めます(「日語組版処理の要件」2.3.2 縦組と横組の主な相違点のb-1-ii)。これは1文字毎にみますと右に90度回転、つまり横倒ししているように見え

  • 縦組みにおける英数字正立論2―縦組みするときの字形の変更 | 電子書籍、電子出版のCAS-UBブログ

    印刷や制作に携わっている人にとっては横組みと縦組みでは扱いを変更しなければならない文字があることは常識に近いと思います。しかし、これから著者自身が電子書籍を制作することになると、著者にもこういう知識が必要となります。 横組み縦組みで共通の文字 日語の表記に使う文字の中で漢字やひらがな(の多く)は、通常、正方形の枠の中にデザインされており、横組みか縦組みかを意識することなく使うことができます。 縦組みと横組みで方向・形を変える文字 次にあげる文字は、横組みから縦組みに変更するとき、回転させたり、文字の形を変える必要があります。 括弧類は横組みでは正立していますが縦組みでは横になります。この場合は、時計回りに90度回転することになります。 句読点の場合は、ひとつの文字を囲む矩形の中で、横組みでは左下におきますが、縦組みでは右上におきます。この位置関係の変更は回転では実現できませんので、文字の