xmlに関するlevaのブックマーク (38)

  • yohei-y:weblog: 疎結合と XML

    疎結合(loosely-coupled)って何でしょう? 僕自身、適当に疎結合という言葉を使ってしまいがちですが、 ちゃんとした説明なり定義なりが必用だと感じています(自分のために)。 いいかげんな定義で話をはじめると、 各人の方向性がずれまくって議論ができないですよね。 Web サービスしかり、 SOA しかり、REST しかり。 ということで今回は僕なりに疎結合ってこんなもの、 というのを考えてみます。 ものすごく一般化してしまうと、 疎結合というのは複数のコンポーネント間の結び付きが ゆるいことを指すんでしょうね。 たぶん、ここまでは誰でも同意してくれるはず。 ただこれだけでは議論ができなくて、 このコンポーネントに何をもってくるかを決めて、 はじめて具体的な話ができます。 僕がここで話したいのは Web サービスの文脈での「疎結合」ですから、 コンポーネントは Web サービスにな

    leva
    leva 2008/03/27
    とりあえず、ここでは疎結合のイメージを理解しておくだけで問題なさそう。SOAとかアスペクト指向とかは後日。
  • 気象情報をXML形式で提供、気象庁とXMLコンソーシアムが仕様策定開始

    Windows SQL Server 2005サポート終了の4月12日が迫る、報告済み脆弱性の深刻度も高く、早急な移行を

    leva
    leva 2008/02/02
    運用が順調に進めば、ウェブアプリ(例えばGoogle Maps)との連携がスムーズになるかもしれないな。他の国ではWML(WeatherML)とかって決められてたりするんだろうか。
  • HTML5が持つ本当の意味 ― @IT

    2008/01/25 ウェブ関連技術の標準化団体「W3C」(World Wide Web Consortium)が「HTML5」の策定に向けて活動を格化しました。1月22日には「HTML5」の最初の草案を公開。2010年9月に正式な勧告としてリリースする予定だと発表しました。 普段からウェブ関連技術をウォッチしている方は別として、「なぜ今ごろ?」と、この突然のW3Cの動きに驚かれた方が多いのではないでしょうか。「そもそもW3Cがやる意味があるの?」という疑問の声も聞こえてきそうです。 標準化団体としてのW3Cのプレゼンスは、近年あまりに高いとは言えません。かつて1990年代後半から2000年ごろにかけて、誰もがW3Cの一挙手一投足に注目していた時期がありました。彼らの出してくる標準技術仕様こそが、インターネットを形成する共通言語だと、多くの人が信じていました。 ところが、現在広く使われて

    leva
    leva 2008/01/26
    HTML5がXHTML2.0およびそれ以降の標準仕様にどのような影響を与えるのかが気になります
  • PHP5、未整形HTMLをSimpleXMLへ変換 - goungoun技術系雑記帳

    PHP5でのスクレイピングについて調査してみた。 正規表現でやってもいいのだけど。 PHP5でやるのだからSimpleXMLでやってみたい。 となると、いかに未整形HTMLを整形済にしてSimpleXMLとするかが 課題となる。これについて調べてみた。 ↓これが答え。なるものを見つけました。 HTMLParser(PEARのXML_HTMLSax3使用)orTidyで整形してるそうです。 HTMLをXML化してDOMやXPathで操作するWebスクレイピングPHPクラス : Under Construction, Baby: # SimpleXML+HTMLParser or Tidy+HTTP_Request+Cache_Lite http://www.rcdtokyo.com/ucb/contents/i000851.php これで調査終了。というのも寂しいので。 もう少しお手軽にで

    leva
    leva 2007/12/23
    DomDocumentにまかせてXPathで処理するか、SimpleXMLで処理するかは悩みどころかな。
  • Wikipedia Thesaurus Beta

    243,843,623 association relations extracted from 3,815,513 concepts in Wikipedia. More detailed information for Wikipedia Mining Project is avairable on Wikipedia-Lab. Powered by Wikipedia  Contact: Kotaro Nakayama (IST, Osaka-Univ.)

    leva
    leva 2007/10/29
    Wikipediaを利用してシソーラス検索を行うサイト、なかなか興味深いね。Webサービスとして、→のURLから利用できるらしい。http://wikipedia-lab.org/ja/index.php/Wikipedia_API
  • GRDDL で広がる XHTML の可能性

    XHTML (XMLも) から XSLT (じゃなくてもいいんだけど) によって汎用的にメタデータを抽出するための仕様、GRDDL (Gleaning Resource Descriptions from Dialects of Languages) が 11日に W3C 勧告として公開されました。同時に W3C のプレスリリースにも GRDDL についての発表がされています。 GRDDL の公開について (W3C 勧告) : W3C プレスリリース(日語) 基的に (X)HTML は人間様向けの言語であって、アプリケーション等、機械から利用するには微妙な存在。機械向けのメタデータを提供する手段としては RDF (Resource Description Framework) が存在するわけですが、人間向け、機械向け別々のデータが必要な場合、今までは両方とも制作者が用意するのが普通だっ

    GRDDL で広がる XHTML の可能性
    leva
    leva 2007/09/19
    これいいなぁ。データの汎用性が増して、余計なスクレイピングをかけなくてもより正確・低コストに内容を持ってこれるって事か。近々実装してみようかな‥
  • Compound microformat のプロパティ一覧 - 2xup.org

    2006-07-24T01:30:00+09:00 最近雑誌を見ていても、microformats に関する記事が増え、microformats に関する様々な意見を目にする機会が増えたような気がします。同じように様々なブログや実際に Web クリエイターな方にお会いしてお話している中でも microformats に関する様々な意見を耳にする機会が増えました。意見の中には大きな未来を感じているというものや、ブラウザの独自実装と大差ない。といったものまで多種多様です。僕自身はといえば、もちろん大きな未来を感じているのですが、チョット触れた程度で意見を言うのはあとで自分の首をしめそうだし、実際に導入してみたり Wiki や Blog, ML をチェックしたり、様々な人の意見を吸収したりしていると、様々なフォーマットがごっちゃになってきました。一度ここらあたりで Draft のものも含めて各フ

    leva
    leva 2007/06/17
    microformatsのプロパティについて。とりあえずhAtomだけチェキ。細かいことだがmicroformatなのかmicroformatsなのかわからん。
  • XHTML2.0標準において注意すべき要素 | Tech de Go

    leva
    leva 2007/03/16
    主な変更点@XHTML2 WD 2006/07
  • 指向性メモ::2006-07-07::W3Cが構想するXHTML2.0の方向性の話

    ページ情報 制作日 2006-07-07T18:22:33+09:00 最終更新日 2006-07-07T18:22:33+09:00 ページ内目次 Navigation Comments Trackbacks Post a comment 突如としてCDF(XML複合文書)のことを思い出したので、消えつつある記憶を掘り起こしてみる。去年のORFで行われた、XHTML2.0のEditorの1人である石川氏のプレゼンテーションが元ネタ。 CDFとは早い話、複数のXML語彙をまぜまぜして作られたXML文章のことだ(名前空間は素晴らしい)。わかりやすい例ではXHTML+SVGなどが挙げられるが、プレゼンテーションでは応用例としてXHTML2.0+MathML2.0+SVG1.1+XForms1.0+EGIX+ContactXMLによるサンプルまで用意されていた。W3Cとしては今後はこういった方向

    leva
    leva 2007/03/16
    XHTML 2.0 goes CDF (CDR+CDI)
  • RDFとメタデータの相互運用

    (メタ)データ相互運用の課題 データモデルと名前の相互運用 どんなモデル(データ構造、スキーマ)を採用するか プロパティ(関係記述語彙)はどの程度詳細に設計すべきか、独自語彙か汎用語彙か 人物などの典拠、主題などの語彙(ノードの名前)をどうやって共有するか 記述対象をどのように識別するか(リソースの同一性) (※稿では、最初の2つ、モデルとプロパティについて検討します) 相互運用のスコープ データの共有:統合レポジトリの構築や横断検索の実現 データの交換:AのデータをBが取り込みたいとき データ相互運用とRDF/OWL なぜRDF/OWLか 柔軟性:シンプルで柔軟なグラフ構造でさまざまなモデルを表現できる 意味論:グラフの意味論が定義されており、予備知識のないデータも共通の解釈ができる 語彙の連携:語彙間の関係を記述することができ、その関係を利用した基的な推論ができる 識別と統合:UR

    leva
    leva 2007/03/09
    RDF/OWLでの書籍の表現における留意点。See Also http://www.kanzaki.com/works/2006/pub/0923nal.html
  • 5W1H のマークアップ 1: When(日時) - 我的春秋

    ちょっと思い立って、5W1H の XHTML マークアップの手段について、少しずつ整理してみることにしました。 理由や意義については、また別エントリーを立てるとして、とりあえず今日のところは、When?(いつ?)...つまり、日時のマークアップ手段から。 (X)HTML meta name="date" syntax <meta name="date" content="[W3C-DTF]" /> [W3C-DTF]: YYYY-MM-DDThh:mm:ssTZD(≒ ISO 8601。必要に応じて、秒・分・時・日・月は省略可。) [TZD]: ±hh:mm | Z(タイムゾーン。日なら "+09:00"。UTC 協定世界時なら "Z"。) 追記: W3C-DTF のバリアントと (X)HTML における %Datetime について 北村さんよりご指摘をいただきまして(→ はてブ コメ

    5W1H のマークアップ 1: When(日時) - 我的春秋
    leva
    leva 2007/03/08
    WhenとWhereが規定できれば時空間が表現できるね。
  • Feed Rinse 2.0 is Coming

    We’re currently reworking everything that Feed Rinse is (and can be) to give you the performance and features you expect. Stay tuned. Launching soon.

    leva
    leva 2007/03/01
    RSSフィルタリングサービス。広告を削除したい場合、一部の記事だけ見たい場合に使えます。
  • スクレイピングはもっと簡単にならなければいけない - bits and bytes

    スクレイピングをやったことがあるひとならばわかると思うけど、スクレイピングはとてもつまらない作業だ。 HTMLの中から抜き出したい部分を見つけて、その周辺にある特徴的な部分に着目して正規表現を書いたりして抜き出す。あるいはHTMLからDOMを生成して特定のクラスがついているエレメントを抜き出したりする。HTMLをXHTMLに整形、変換してXPathで抜き出す方法もある。どの方法もやることは単純で簡単なことだけれど、極めてめんどくさい。 そういうものだと思って数年間過ごしてきたけれど、去年の夏に出てきた Dapper: The Data Mapper は、そんな退屈な常識をモダーンなajaxでもって吹き飛ばした。もしDapperがどんなのなのか知らなかったら、ちょっと長くてはじめ退屈なんだけど デモムービー を見てみてください。 Dapperが教えてくれたことは、スクレイピングなんて、欲し

    leva
    leva 2007/02/27
    コレすごい簡単。やっぱこういう地味な作業はGUIに限るね。
  • 進化する“Webスクレイピング”技術の世界 ― @IT

    2007/02/20 WebサービスAPIRSSフィードを使って複数サイトのサービスや情報をマッシュアップ――。これはWeb2.0が包含するいくつかの概念のうち、最も重要なものの1つだ。Amazon.comやGoogleYahoo!楽天といった大手Webサイトは、RESTやSOAPを用いたAPIを公開しており、さまざまなサービス提供者や個人がAPIを通して各種サービスを利用している。その一方、世の中のWebサイトの大多数はWeb1.0的なHTMLCGIフォームしか提供していないのが現実だ。こうした背景からWeb1.0サイトから構造化されたデータを引っ張り出す“Webスクレイピング技術が急速に発展してきているようだ。 HTMLをXML化し、XPathで関連データだけを抽出 例えば価格情報サイトでは製品名から価格が簡単に調べられるが、Webサーバから提供されるのは、製品名や価格にレ

    leva
    leva 2007/02/22
    Plaggerぽい
  • はてなブックマークAtomAPIとは - はてなダイアリー

    ドキュメントははてなブックマークにおける AtomAPI 実装を解説するものです。主にはてなスタッフがその作成と更新を行っています。 Atomプロジェクトが定めるAtomAPI仕様 http://www.ietf.org/html.charters/atompub-charter.html (英語)は現時点でドラフト段階です。それに伴いドキュメントおよびはてなブックマークの AtomAPI 実装は変更される可能性があります。

    はてなブックマークAtomAPIとは - はてなダイアリー
    leva
    leva 2007/02/21
    はてブを操作するためのゲートウェイ。問題はドキュメントなどがあるhetena.comが死んでいることなんですが…
  • XSLTライブラリ

    序文 この標準仕様書(TS)は,2000~2001年度における(財)日規格協会 情報技術標準化研究センター(INSTAC)の電子出版技術調査研究をもとに工業標準化の促進に関連して特に重要と判断される技術情報をまとめたTR X 0059:2002に対して,さらに2003年度の電子出版技術調査研究において機能追加を施し, 標準仕様書(TS)タイプⅡとして公表するものである。 1. 適用範囲 この標準仕様書(TS)は, XML文書に対する変換処理を共有する手段としてのXSLTライブラリを規定する。変換対象のXML文書における文書構造要素はXPathによって制限し, 変換先はXML文書又はHTML文書とする。 2. 引用規定 次に示す規格等は, この標準仕様書(TS)に引用されることによって, この標準仕様書(TS)の規定の一部を構成する。 TR X 0048:2001, XSL変換(XSLT)

    leva
    leva 2007/02/19
    文字列やタグの検索・置換・削除、あるいは日本語処理に関するXSLTライブラリ
  • はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知

    はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28

    はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知
    leva
    leva 2007/02/17
    SHOULD NOTからSHOULD (Also)へ。いずれにしろ、勧告ではっきり明示してくれるのはよいことです
  • BI@K:writings:法令XML文書化計画(目次)

    オープンに法令(憲法、法律、政令及び各府省庁令。 告示は含まない)用のXMLのサブセットをとりまとめることなどにより、平成16年度年金制度改正において見られたような法案作成ミス(チョンボ)をつぶす作業を容易にするなどの効率化につながっていくこと目指すのが企画、法令XML文書化計画である。 各ファイルを見て趣旨に賛同いただける方々におかれては、ページ(やその他企画に関わるページ等)の内容やURI"http://bewaad.com/hourei2XMLdocument/index.html"を広めていただいたり、様々な意見をお寄せいただいたりするなどのご協力を賜ることができれば、これに勝る喜びはない。 bewaad<webmaster@bewaad.com>

    leva
    leva 2007/02/15
    法令用のXMLのサブセットをまとめる計画
  • XQueryの分かるDBエンジニアは高給取り?(1/2) - @IT

    Database Watch 2月版 Page 1/2 XQueryの分かるDBエンジニアは高給取り? 加山恵美 2007/2/13 そろそろかな、いやどうかな、と気に掛けていましたが、ついにXQueryがW3Cで勧告になりました。XMLデータベース普及の追い風になりそうですね。XMLデータベースとRDBMSはうまく使い分けていきたいものです。 ■祝・XQuery 1.0勧告 1月23日、W3Cは新たな勧告を発表しました。勧告になったのは主にXQuery 1.0、XSLT 2.0、XPath 2.0で、合計で8つの文書が勧告になりました。近年にない大規模な発表です。 今回の発表には2つの要点があります。まず1つはXSLTとXPathがバージョンアップしたことです。XSLTはXML文書の変換規則、XPathはXML文書のノード特定を行うもので、両者は互いに密接な関係にあります。加えてXMLで

    leva
    leva 2007/02/13
    やっぱりXMLDBが業務面で主になることは当分なさそう。
  • XUL Apps > Documentations > 拡張機能開発の基礎知識 - outsider reflex

    概要 Firefox Developers Conference 2006において、Firefox用アドオン開発のワークショップ形式の発表を行わせていただきました。以下のプレゼン資料では、Firefox体の構造とアドオンの仕組みを紹介した上で、実際にアドオンを開発する手順を解説しています。 プレゼンテーション 3部構成になっています。以下のプレゼンテーションは全てMozilla Suite、Mozilla Firefox、その他のGeckoエンジン使用ブラウザ専用です(プレゼンテーションは高橋メソッド in XUL リターンズで作成しています)。 Part1 全体セッション:データファイル Part2 個別セッション:データファイル Part3 個別セッション:データファイル セッション中で実際に作成した拡張機能「closealltabs」 セッション中で実際に作成した拡張機能「open

    leva
    leva 2007/02/12
    Firefox周辺技術の紹介と拡張機能製作のチュートリアル by 高橋メソッド in XUL リターンズ