タグ

XMLに関するpmakinoのブックマーク (48)

  • ITmedia エンタープライズ:第2回 RSSフィードの料理はLWPとXML::RSSにおまかせ (1/2)

    第2回 RSSフィードの料理はLWPとXML::RSSにおまかせ:作って学ぶ、今どきのWebサービス(1/2 ページ) 今回から、いよいよPerlプログラミングの世界に入っていきましょう。手始めに、PerlにおけるWebプログラミングの要ともいえるLWPを用いた、HTTPコンテンツをPerlでHackする手法を解説します。 前回は、CPANモジュールのインストールを説明しました。今回から、いよいよPerlプログラミングの世界に入っていきましょう。手始めに、PerlにおけるWebプログラミングの要ともいえるLWP(Lib WWW Perl)を用いた、HTTPコンテンツをPerlでHackする手法を解説します。せっかくなのでXMLの扱い方も少々、ということで、比較的扱いやすいRSSも題材にミックスしたいと思います。 LWPの役割 プログラムの中から、あるWebサイトで公開されているコンテンツを

    ITmedia エンタープライズ:第2回 RSSフィードの料理はLWPとXML::RSSにおまかせ (1/2)
  • Wikiのように独自タグでHTML整形を行う:CodeZine

    はじめに Wikiやさまざまなblogツール、CodeZineの投稿では、記号を使って文章を整形できるようになっています。整形用の記号はHTMLタグよりも少ない打鍵数で入力できる上に、見た目と修飾内容が結びついているので分かりやすく、文章デザインの統一も図りやすいというメリットがあります。 稿では、Wikiやblogの投稿だけではなく、HTML文章の作成に「記号による整形」(以下、Wiki整形)を使用するためのXSLTスクリプトを紹介します。対象読者 HTML文章の作成やXMLに興味のある方を対象とします。必要な環境 このサンプルはInternet Explorer 6.0+msxslを使用して動作確認をしています。スクリプト中でmsxslの独自拡張である<msxsl:script>を使用しているため、実行にはmsxslが必要になります。 msxslはMicrosoftが配付している、M

  • IE で UTF-8 の含まれる XML が表示されなかったら - Ceekz Logs (Move to y.ceek.jp)

    Simple FON Maps の XML を生成するときに、なぜか IE でエラーが出る場合がありました(日語以外のマルチバイト文字が含まれる場合)。 テキストの内容に無効な文字が見つかりました。 IE で XML を表示しようとすると、このようなエラーが出ました。律儀なことに JavaScript 経由でもデータを読み込んでくれません。他のブラウザ Firefox, Opera では、何のエラーも出ずに読み込めたのですが…。 サポートページを調べてみると、出力データに言語仕様によって定義された有効な XML 文字範囲を超えた内容が含まれるようです。すなわち、制御文字などが混ざっているようです。 utf8::decode($str); utf8::encode($str); このように UTF-8 フラグを ON にしてから OFF にすれば解決しました。不要なバイナリを除去してるのだ

  • PHP一行で書けるRSSリーダー : 管理人@Yoski

    これだけ (PHP5)。 <?php foreach(simplexml_load_file('http://www.flickr.com/services/feeds/photos_public.gne')->entry as $it) echo $it->content ?> すいませんすいません via 5-second RSS parser。 開発合宿でも simple_xml 便利!という話しがでていたのですが、もはや RSS って PHP serialize と同じくらい手軽に扱えるようになってきていますね、という趣旨のエントリということで。 もういいかと思いますが、RSS 2.0 だとこんな感じ。 <?php foreach(simplexml_load_file('http://blog.myrss.jp/index.xml')->channel->item as $it)

  • Office2007インストール前に新ファイル形式だけ試してみる - なみかわみさきの日記

    すでにあちこちで取り上げられているMicrosoft Office 2007で気で採用されるOpenXMLについて思うところをメモしておきます。 この辺が参考になるかな。 ○2007 Office Systemの新機能 - MS-IMEとOpen XMLの詳細(MYCOMジャーナル) http://journal.mycom.co.jp/articles/2006/05/31/office/001.html Office2007からは、よく使うWordやExcelのファイルの拡張子がこんな感じで変わるんですけど、 ソフト名 今まで 2007の標準 Word .doc .docx Excel .xls .xlsx おしりにxがついているやつは、今までのバイナリ形式(メモ帳につっこんでもぐちゃぐちゃでわからん)ではなく、OpenXML形式だそうです。 OpenXML形式のひみつ−−実はzip

    Office2007インストール前に新ファイル形式だけ試してみる - なみかわみさきの日記
  • http://japan.internet.com/webtech/20061128/1.html

    pmakino
    pmakino 2006/11/29
  • 東芝ソリューション、自然言語処理機能に対応したXMLデータベース新版

    東芝ソリューション株式会社は11月28日、XMLデータベース「TX1」の新版「同 V2」を発表した。自然言語処理機能を搭載して、検索の精度と速度を向上したほか、リレーショナルデータベース(RDB)やNotesなどさまざまな形式のデータをXML形式に変換し登録する機能が追加された。同日より販売を開始する。 TX1は、XMLデータの階層構造をそのままの形式で格納・管理できるXMLデータベース。テラバイト級の大容量データの高速に検索できる特徴を持つ。今回の新版では、コンテンツ管理システムやデータ統合システムに適した2つの機能を新たに追加した。 1つ目は「自然言語処理機能」で、単語の意味に着目した検索により、探したいデータの素早い抽出を可能にする。またもう1つは、RDBNotesをはじめとするデータ形式をXML形式に変換してTX1に登録する「データ連携機能」。元データからXML形式へのデータ変換

    pmakino
    pmakino 2006/11/29
  • 東芝ソリューション、XML DB最新版に形態素解析の検索機能などを搭載

    印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 東芝ソリューションは11月28日、XMLデータベース(DB)の最新版「TX1 V2」の販売を開始した。新たに、形態素解析方式の検索が可能な自然言語処理機能と、さまざまな形式のデータをXML形式に変換して登録するデータ連携機能を搭載している。 TX1 V2は、「テラバイト級の大容量データを高速に検索できる」(東芝ソリューション)既存製品に、コンテンツ管理システムやデータ統合システムに適した2つの新機能を追加したという。 一つ目の自然言語処理機能は、形態素解析方式の検索処理により、単語の意味に着目した検索を可能とする。旧版に搭載されていたNグラム方式の検索機能と使い分け、処理対象データに合った検索方式を利用することで、検索の精度と速度を向上

    東芝ソリューション、XML DB最新版に形態素解析の検索機能などを搭載
    pmakino
    pmakino 2006/11/29
  • 東芝のXMLデータベースは、コンテンツ管理やデータ統合に合う - @IT

    2006/11/28 東芝ソリューションは11月28日、XMLデータベース「TX1」の最新バージョンであるV2を発表した。自然言語処理機能を搭載し、検索性能を向上、RDBNotesなどさまざまな形式のデータをXML形式に変換し、登録する機能を追加した。 適用例としては、ドキュメントや電子メールなど非定型データをXML形式で表現し、管理する「コンテンツ管理システム」の領域がある。もう1つは、システムごとにRDBNotesなどで個別に運用しているデータをXMLデータに変換し、システムをまたがった一元的な検索や分析を可能にする「データ統合システム」の領域である。いずれの領域も、大量のデータを高速に検索できること、さまざまな形式のデータでもXMLデータとして扱えることという要件を満たす必要があった。 TX1 V2の大きな特徴として、形態素解析方式の検索が行える自然言語処理機能を搭載した点が挙げ

    pmakino
    pmakino 2006/11/29
  • 窓の杜 - 【NEWS】Microsoft、フリーのXMLエディター「XML Notepad 2007」を公開

    Microsoft Corporationは21日、XMLデータをツリーで編集できるXMLエディター「XML Notepad 2007」v1.0 英語版を公開した。Windows XP/Server 2003/Vistaに対応するフリーソフトで、現在同社のダウンロードセンターからダウンロードできる。なお、動作には.NET Framework 2.0が必要。 「XML Notepad 2007」は、3ペイン型のXMLエディター。左側にはXMLデータの構造をツリー形式で表示し、右側には各要素の編集画面、下部には文法エラーなどのチェックリストが表示される。 ツリー上では、要素や属性といったノードを挿入できるほか、ノードの切り取り・コピー・貼り付けが可能。またドラッグ&ドロップでノードの階層を移動できる。XMLデータの編集中は、リアルタイムでエラーチェックが行われ、文法エラーが発生した場合は、画面

  • 第九回XML開発者の日

    第九回XML開発者の日 画像電子学会VMA研究会 企画: 村田真(国際大学)、山口琢(株式会社ジャストシステム)、山陽平(株式会社リコー)、丸徹(有限会社ウィザシステム) XML開発者の日を再び開催します。microformatなどを取り上げます。 前回については、詳細な議事録があります。多くの方のblog(ブックマークにある)でも感想が公開されています。 日時: 2006年11月24日(金) 10:00-18:00 会場: 日印刷会館(東京都中央区新富1丁目16番8号) 参加費: 2000円(消費税込み) 申し込み方法 終了しました。発表のときに使用した資料へのリンクを追加 してあります。詳細な議事録があります。多くの方のblog(ブックマークにある)でも感想が公開されています。 画像電子学会の主催であり、事前に参加申し込みが必要です。 満員になれば申し込みを締め切ります。申 し込

  • 完璧なXHTMLの利点はなんでしょうか? CSSでデザインや、CSS外部ファイル化は別にXHTMLでなくてもできますし、SEO対策もそうです。…

    完璧なXHTMLの利点はなんでしょうか? CSSでデザインや、CSS外部ファイル化は別にXHTMLでなくてもできますし、SEO対策もそうです。 なんちゃってXHTMLやそれ以下でも上記は満たせます。 <br />←半角で と書く意味はわかりますが、目的がわかりません。 http://www.seo-equation.com/html/xhtml1/merit このサイトも見ましたが、これも完全なXHTMLである必要とはちょっと違う気がします。 携帯やDS、PSP対応が確実というような条件でもあればやる気もでるのですが、メリットがなんなのか教えてください。

  • Web2.0ナビ: SQL-DESIGNERがスゴイ

    いいね! 0 ツイート B! はてブ 447 Pocket 2 データベースの設計時にER図をかくことが多いと思いますが、SQL-designerというウェブベースのツールが非常に使いやすいく、デザイン的にも綺麗で便利。 MSproject等のデータベース設計を行う専用ソフトは非常に多くあるが、どれもインストールが必要だったり、設定ファイルが必要だったり、ソフトが重かったり、環境依存が激しかったりして、使いにくい。 使いかたは簡単で、 1.ウェブページにいって 2.テーブルやフィールドを追加する 3.プリントアウトorXMLエクスポート だけ。 データの型なども選択できて、設計が終わったら、SQL文をそのまま発行したり、作ったEQ図をXMLでエクスポートやインポートすることも可能。Javascriptベースなので、めんどくさいインストールや環境依存もなし。 ウェブ上でやるのは、セキュリティ

  • IBM Developer

    IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.

    IBM Developer
  • naoyaのはてなダイアリー - Perl で CSS セレクタ

    rubyスクレイピングして web の情報を取得するのには、今まで正規表現か xpath でやってたので、わりと面倒でした。で、ふと scrAPI というスクレイピングツールキットを知ったのですが、これがかなり便利そう。 このツールキットを使うと、CSS3 なセレクタを記述することで、要素を取得することができます。 という Ruby の scrAPI での CSS セレクタがいい感じでございますなあと指をくわえて見てたんだけど、 Per discussions in CSS Selector in Perl, I made a quick perl module HTML::Selector::XPath, which is available at http://svn.bulknews.net/repos/public/HTML-Selector-XPath/trunk/ now.

    naoyaのはてなダイアリー - Perl で CSS セレクタ
  • 中里一日記: XMLの「本当のメリット」ってなに?

    XMLの「当のメリット」ってなに? この記事は一応は「XMLのプロ」による記事なのだと思うのだが、それで改めてメリットを紹介するのに、この程度のメリットしか出てこないというのはどういうことなんだか。 では私が答えよう。 私は6つの言語(C++JavaVBAPythonJavaScript、C#)でXMLを触ったことがある。サンプル程度ならもっと増えるが、実用的なものを書いたのは上の6つだけだ。まともにプログラミングなどしたこともない糞コンサルの皆様は、今日のエントリをコピペしておくといいだろう。 まずは弱点から。 1. パースが遅い 構造的な区切りを探すために1文字ずつ文字をチェックする必要があるので遅い。XMLを使うという観点からは、ここが一番のボトルネックになる。 2. データの格納形式を規格の基盤にしている RDBMSが内部でどのようにデータを格納しているかは、RDBMS

    pmakino
    pmakino 2006/08/22
  • XMLのメリット、デメリット

    << 2006/08/ 1 1. [OSS] 「Rubyのメッカに」と松江市長,研究・交流拠点「オープンソースラボ」開設 2. U-20プロコン作品応募数 3. 第39回情報科学若手の会 2 1. [Ruby] Ruby Book Sales Pass Perl 2. 「自分だけは大丈夫」,セキュリティ対策を妨げる「正常化の偏見」 3 1. svk(1:21:41) 4 1. [原稿] 日経Linux 2006年10月号 2. [Ruby] Pickaxe2 8/25発行 3. [Ruby] SciRubyInterviews/BilKlebAndBillWood 5 1. [教会] 岡山 2. 「しばらく待て」 3. 「there must be a reason」 6 1. 日曜 7 1. 早朝、ラジオ体操 2. [原稿] オープンソースマガジン 2006年10月号 3. [OSS]

    pmakino
    pmakino 2006/08/20
  • 指向性メモ::2006-08-18::XMLの屍を超えていく――セマンテックウェブの挑戦

    データ構造の記述を統一する段階を超え、情報(それ自身)へのアクセスを統一する為の土台が整いつつある。 すでに多くの人が気がついているように、実のところXMLには大した再利用性が無い。もちろんただのCSVに比べればDOMやXSLTなどの統一されたAPIが用意されている分、データの扱いは楽だ。しかし、たとえば様々なXMLデータを自分の所に持ってきて、適当に混ぜ合わせて新しい物を作るといった用途には、XMLは向かない。言い換えれば、XMLはマッシュアップには不向きである。 CSVからXMLになって何が1番変わったかと言えば、データ構造へアクセスするためのAPI、――つまりDOMやXSLT、SAXなど――が統一されたことにある。それまでみんなで好き勝手にデータ構造を定義していた時代に比べれば、1回XSLTやDOMを覚えるだけでJavaでもPHPでもAdaでも同じ方法でデータ構造にアクセスできるよう

  • Web ページをダウンロードする方法〜 MSHTML 編〜

    概要 サイトには、すでにWeb ページをダウンロードする方法〜 MSXML 編〜という類似トピックが存在します。 そちらでは、WebBrowser コントロールを使用せずに、Web ページをテキストファイルとして取得し、正規表現を使用してソースを独自解析することで情報を取得する方法について解説しています。 これはこれで、有効です。特に目的のデータの位置をキーワードなどで容易に特定できる場合は、最も効率的でしょう。 しかし一方で、対象データが遍在しているような場合では、複雑なソースの解析に HTML DOM (HTML Document Object Model) が威力を発揮する場合も有ります。 だったら最初から WebBrowser コントロールを使用すればよい話なのですが、ここにジレンマが存在します。 DOM は使いたい。 でも表示したいわけではないから、WebBrowser コント

  • Moved

    This URL was moved The requested URL http://web.sfc.keio.ac.jp/~t03792sh/archives/2006/07/dir2xml_ver01.html was moved to http://web.sfc.keio.ac.jp/~shokai/archives/2006/07/dir2xml_ver01.html.