タグ

XMLとxmlに関するfunaki_naotoのブックマーク (98)

  • XML文書をバイナリ化する新仕様「EXI」がW3Cで勧告候補に

    XML文書を効率的にやりとりするために、テキストのXML文書をバイナリ化し、より効率的な処理を可能にするための仕様Efficient XML Interchange (EXI) Format 1.0が、昨年の12月8日に勧告候補になっています。W3Cでは、複数の実装による相互運用の検証を経て勧告となる予定です。 XMLの処理性能向上を図るEXI W3Cが公開しているEfficient XML Interchange (EXI) Format 1.0のドラフトのAbstractでは、EXIを次のように説明しています。 EXI is a very compact representation for the Extensible Markup Language (XML) Information Set that is intended to simultaneously optimize p

    XML文書をバイナリ化する新仕様「EXI」がW3Cで勧告候補に
  • OPF 2.0 v1.0 日本語訳 [Open Packaging Format (OPF) 2.0 v1.0]

    See related links to what you are looking for.

  • セマンティック・マイクロブログ

    ソーシャルメディアとマイクロブログ SNSとソーシャルメディア SNS:個人のプロフィールや関心事などを(範囲を限定して)公開し社会的ネットワークを構成 ソーシャルメディア:社会ネットワークとコンテンツ・メッセージ共有の組み合わせ Ambient Intimacy(何気なくそこにあるような親しみ)の感覚 データの互換性、共有が課題 マイクロブログ(Microblogging) 限られた字数の最小限の=気軽に書けるコンテンツ ゆるやかで手軽なコミュニケーション Why We Twitterの考察では、日常会話+情報探索/共有 フットワークの軽さとモバイルとの相性 携帯端末からも簡単に読み書きできる → 発信する位置という新たなメタデータ マイクロブログのデータモデル コンテンツのモデル ポストの内容(文) ポストのメタデータ(タグ、返信など) サービスによってさまざまな形態 ポスト文中に

  • 電子出版の先駆的フォーマット JepaX について中の人に聞いてみました - 08th Grade Syndrome

    JepaX を知ったきっかけ 昨年僕は個人的な興味から、書籍をデータ化するのにどのような形式あるのか調べていたことがあるのですが、多くは仕様が公開されていないプロプライエタリなものであることが不満でした。そんな中、日電子出版協会(JEPA)さんのサイトで見かけた JepaX は XML に準拠した仕様書が公開されており、定義できる情報の豊富さ、構造の簡潔さ、HTML から採られた要素のわかり易さ、文字組やルビなど日語の表現への対応が強く印象に残ったのでした。 紙の出版物をディジタル化して蓄積し、様々な電子出版形式(配布フォーマット)に変換するための標準交換フォーマット。 1999(平成11)年に出版データフォーマット標準化研究委員会(JEPA)によって提案された。 XML 1.0に準拠し、文書型はDTDによって定義される。出版業界内部でのテクストの蓄積と変換を目的とした中立的なフォーマ

  • IBM Developer

    IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.

    IBM Developer
  • X-plus:

    Digital PublishingやXMLの実用的で(Useful)洗練された(Smart)をお届けする、日ユニテックの新技術ポータルサイト、「X-Plus」

    funaki_naoto
    funaki_naoto 2009/08/06
    「XMLをきれいに印刷する目的で自動組版を行う方法」
  • はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知

    はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28

    はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知
  • XHTML の今後に関する FAQ

    この文書は、XHTML の今後について寄せられた質問をまとめたものです。W3C が今後どのように XHTML と関わっていくのかを、コミュニティや W3C Member が理解を深められるように作成されました。 XHTML 2 Working Group はどうなりますか? 2007 年 3 月に、W3C は HTML Working Group と、XHTML 2 Working Group という、ふたつのグループを設立しました。この際、私達は XHTML 2 の市場価値などを見ながら、今後について検討すると表明していました。 私達は、何年にもわたる XHTML 2 Working Group の活動と貢献をとても評価しています。しかし、参加者と話した結果、W3C は、2009 年末で失効する XHTML2 WG の憲章を改正しないことを決定しました。 HTML Working Gro

  • kmuto’s blog

    View this post on Instagram A post shared by kmuto (@mutokenshi) View this post on Instagram A post shared by kmuto (@mutokenshi) View this post on Instagram A post shared by kmuto (@mutokenshi) View this post on Instagram A post shared by kmuto (@mutokenshi) View this post on Instagram A post shared by kmuto (@mutokenshi) View this post on Instagram A post shared by kmuto (@mutokenshi) View this

    kmuto’s blog
  • 自動組版とバリアブルとWebCMSの根は同じ - JAGAT

    構造化文書をWebCMSやバリアブル印刷と同時に始めるのは大変かもしれないが、これら3つは計画としてはひとつのロードマップの中で考えるべきものになってきたのだろう。 20年前のSGML登場時を思い起こさせるような、ディータ(DITA)への熱い注目が感じられる今日この頃である。SGMLがXMLになりインターネットやMSOfficeなど身近な存在になったものの、そもそもの構造化文書は忘れ去れたのかと思われたが、ゾンビのように復活したというか、進化したのがDITAともいえる。構造化文書とは、文書の構造をデータ化することと、その要素を部品化して切り離し、構造を変更すると部品の配列はそれに自動的に従うというものだ。これで、文書の多目的利用だとか、更新管理を容易にすることを狙っている。 人がすべきは、部品作りと、構成やレイアウトなどの構造の定義に専念して、組み立ては自動化するのが理想で、構造の定義を何

  • 印刷・出版物とXML

    印刷物や出版物をXMLにすることを考えたとき、 どこでつまずくかというと、DTPデータの中で、構造化されない、しにくい部分があるから。 そもそもXMLがレイアウト情報などの一過性の情報をできるだけ排除したデータ重視であることに対して、DTPはレイアウトを含んだデータでこそ意味があり、その性格が違う。 DTPデータを無理矢理構造化しても手数が増えるだけで、生産性が上がらない。 生産性の低いDTPは、コストが増加するからやってはいけない。そして無理矢理の構造化はその場限りであって意味を持たない。意味の無いことは仕事としてやってはいけない。お互いの損になる。 印刷物や出版物は構造化されない部分が多い。むしろ構造化されている方が少ない。 上記の理由からも同等に見ることはできない。 DTPのデータを何らかの形で吸い出して、保持したいのであれば、 構造化されたXMLで考えるよりも、平面的に考えて、その

  • DTPとXML

    この関係は、一度、忘れてしまった方がいいと思う。 InDesignを使って、エレメントとオブジェクトをマッピングするときぐらいにしかXMLは必要ないように思う。 現存するDTPアプリケーションにXMLを取り込みたいときには、大半はXSLTやDOM操作でそれぞれのアプリが取り込める形式のデータに変換している。これはXML以外のタグ付きテキストでも同じです。ということはXMLである必要がない。 変換するときのことを考えるとXMLの方が面倒だと思う。 閉じタグがしっかり入っているから間違いなく引っこ抜けるよね、というぐらいかなと。 それよりも、XMLであるということは、そのXMLの仕様を決めたり、実際データを作る作業が大変だと思う。だったら、簡易タグでよいです。 汎用的に使うために作ったXMLならいいんですが、まず、手作業でXMLを作るのは、なんだかわざと回りくどいことをしているように見える。

  • XMLパブリッシングの現状と今後の展開 - JAGAT

    XMLは印刷物だけではなくWebやその他のデジタルメディアに使うためのコンテンツ記述データとして適しており、印刷会社として必須の技術と言えるだろう。 XMLはドキュメントフォーマットか? 出版社や印刷会社の多くは、XMLをドキュメントフォーマットと考えているのではないか。もし、ドキュメントを印刷するため、印刷データを作るための手段としてXMLを捉えているのであれば、DTPのように自由が利かないとか、使いこなすには専門知識が必要ということがデメリットとなり、印刷物製作には使えないという結果となる。 しかし、印刷物だけではなく、Webやその他のデジタルメディアに使うためのコンテンツ記述データとして考えると、非常に適しており、印刷会社として、必須の技術と言えるだろう。 コンテンツのXML化が有効な分野 辞書や法令集、製品マニュアルなどの分野では、データ構造を定義してXMLデータベースを構築し、X

  • Leo's Chronicle: XML時代の終焉 ~ XMLから再びCoddへ

    先日、ACM SIGMODの日支部大会に招いていただいて、「Relational-Style XML Query (ACM Portal http://doi.acm.org/10.1145/1376616.1376650)」について講演をしてきました。Relational-Style XML Queryは、XMLという複雑な構造をもったデータに対して、SQLのようなテーブルデータへの検索に使われる言語で問い合わせする手法です。 この研究の肝は、木構造データといわれるXMLでも、実はそのほとんどがリレーション(Microsoft Excelのようなテーブル形式のデータ)の組み合わせと考えることができ、そのテーブル構造の情報(スキーマ)を使うと、検索が非常に簡単に書けるという点です。

    funaki_naoto
    funaki_naoto 2008/12/22
    「データを扱うのは「人間」という視点」
  • XMLを利用した辞書・書籍組版ソリューション - JAGAT

    広辞苑の印刷データと電子辞書データはXMLデータベースから制作された。 *** 1998年にW3CによってXMLが規格化されて、10年が過ぎた。 コンテンツをXML化することは、印刷物やデジタルメディアでの活用に適しているだけでなく、将来の陳腐化リスクの少ない方法と言える。 テキスト&グラフィックス研究会では、モリサワの枝順三郎氏にXML技術を活用して広辞苑などの辞書や書籍出版ソリューションの事例について話を聞いた。 ■書籍制作とXML技術 印刷利用という観点からXMLを見ると、XMLでは、見出しだからと言って書体や文字サイズを指定するのではなく、「見出し」というタグで囲む。具体的な体裁ではなく、抽象化することによって文章をデータベース化する技術である。体裁情報を含まないので、2次利用が可能になる。外部から体裁情報を与えることにより、ほかの媒体での利用も可能になる。これらが、印刷分野、特

  • IDMLがやってくる - 名もないテクノ手

    IDML(InDesign Markup Language)っていうのは、InDesign CS4に搭載されるXMLベースのドキュメントフォーマット(らしい)。くわしくは、Adobe SystemsのTim Coleさんのブログを参照してください。 The Most Important New Feature Programmatically create .INX outside InDesign, i.e., create InDesign document files using a database or some other application (InDesignを使わないでプログラミング的に.INXを作成します。すなわち、データベースやさまざまなアプリケーションを使ってInDesignドキュメントを作成します。) Edit or transform document. (ド

    IDMLがやってくる - 名もないテクノ手
  • XMLが変えるオブジェクト技術

    この表から分かるのはXMLがすべての項目で要件をクリアしていることです。逆にHTMLとSGMLは項目ごとに得意・不得意がはっきりしています。PDFは表示以外の項目にあまり良い点数がついていませんが、これはフォーマットの目的の違いによるもので優劣という形で判断すべきことではないことは言うまでもありません。 XMLのアーキテクチャ XMLの言語仕様は32ページの非常にシンプルなものですが、もちろんこれだけでXMLの世界を理解することはできません。XMLを中心とした数多くの機能から構成されるアーキテクチャ全体が重要なのです。 稿では便宜上XMLのアーキテクチャを以下の4つに分類してみました。(図(XMLのアーキテクチャ) ) 基仕様 アプリケーション言語 インタフェース 応用 節では、基仕様、アプリケーション言語、インタフェースについて説明します。応用は次節「XMLの用途」で取り上げます

  • ISO、OOXMLの標準化に対する各国の異議申し立てを退ける

    国際標準化機構(ISO)は、Microsoftの文書フォーマット「Office Open XML(OOXML)」の批准に対する4件の異議申し立てを却下した。 異議申し立てを行ったのは、南アフリカ、ブラジル、インド、ベネズエラの4カ国。これらの国々は申し立て理由として、OOXMLの投票プロセスに不適切な点が認められること、複数の技術的問題が未解決であること、の2点を主に挙げている。ISOは米国時間8月15日に次のような声明を発表している。「ISOと国際電気標準会議(IEC)の共同技術委員会であるISO/IEC JTC 1の標準化作業について定めたISO/IEC規則では、プロセスを続行する要件として、ISO Technical Management BoardとIEC Standardization Management Boardの全委員の3分の2の賛成が必要と定められている。しかし、いずれ

    ISO、OOXMLの標準化に対する各国の異議申し立てを退ける
  • 電子リテラシー入門 (HitoshiYamada) | 版元ドットコム

    編集者K氏の死を悼み、電子データのリテラシーについて考える 先月、これまで長年にわたり(個人的な部分も含め)お世話になって来た編集者K氏の通夜に参列した。彼は業界では有名な編集者で、屈指のデータ処理を誇り、日の辞書産業を支えてきた編プロの代表的人物であった。 私個人としては、編プロ時代からお世話になっていたし、現在の会社に移ってからも、というより移ってからのほうが何かとお世話になることが多かった。編プロ時代は、彼の会社の下請けとして、データ処理のお手伝いをしたこともあったし、データの処理をお願いすることもあった。例えばだが、複数の辞書データを組み合わせて一つの辞書用の下データを作ったり(これは言ってはいけないことか…)、一行の例文を複数個の問題に分岐させるプログラムを開発したりと、いろいろなことに挑戦させてもらっていた。 当時、それは特別な体験だった。これからはデータの2次利用、3次利用

    funaki_naoto
    funaki_naoto 2008/07/30
    「辞書は時間をかけて作るものではない」
  • Google、XMLより20〜100倍速いデータ構造化ツールを公開:MarkeZine(マーケジン)

    『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day

    Google、XMLより20〜100倍速いデータ構造化ツールを公開:MarkeZine(マーケジン)