タグ

HTMLとhtmlに関するTAKESAKOのブックマーク (61)

  • 秋元@サイボウズラボ・プログラマー・ブログ: 960 Grid System 固定幅ベースのWebデザイン手法

    フレームワークというのは制約を設けることで生成物の最低レベルを上げる効果だとも思うけれど、960 Grid Systemが提唱したのは幅960pxを等間隔で分割することで、方眼紙上でデザインするようにサイトをデザインする手法。 960という数字は、2, 3, 4, 5, 6, 8, 10, 12, 15, 16, 20, 24, 30, 32, 40, 48, 60, 64, 80, 96, 120, 160, 192, 240, 320, 480で割ることができるということとユーザのブラウザ環境として幅1024px以上は期待できるということから決まった数だという。 幅何分、というスタイルが提供されているので、それを指定していくだけで、昔のテーブルレイアウトに似た配置ができるということだ。 これがいいことなのかどうかは、ちょっとわからないなあ。 via del.icio.us/popul

    秋元@サイボウズラボ・プログラマー・ブログ: 960 Grid System 固定幅ベースのWebデザイン手法
  • 不正なXML/HTMLもパース可能 - ShaniXmlParser | エンタープライズ | マイコミジャーナル

    The ShaniXmlParser projectは8日(米国時間)、ShaniXmlParserの最新版となるShaniXmlParser version 1.4を公開した。ShaniXmlParserはJavaで開発されたXML/HTML DOM/SAXパーサ。不正なフォーマットであってもパースできる点に特徴がある。 ShaniXmlParserはGNU GENERAL PUBLIC LICENSE Version 2のもとで公開されているオープンソースソフトウェア。ShaniXmlParser 1.4における主な変更点は次のとおり。 メモリ使用の改善 SoftReferenceキャッシュに関するドキュメントを削除 DOM 3 Core Test Validation suite試験パス数: 649(722のうち) DOM 2 Core Test Validation suite試験

  • plucore.jp リニューアルにおいての変更点 (plucore.log(プラコア ブログ))

    今さらですが、今年から plucore.jp がリニューアルしました。以前のサイトは自分が入社する前にあったので、ほとんど手をつけていませんでしたが、今回のリニューアルは少し CTO に手伝ってもらいながらほぼ全てを自分で制作しました。 さて、今回のリニューアルに際し、いろいろと実験的にやってみました。 画像に幅と高さを指定していない 去年の半ばから、画像(img 要素)に幅(width 属性)と高さ(height 属性)は必要でない気がしてきて、どこかで試してみたい気持ちがあったので、これを期に plucore.jp は画像に一切幅と高さを指定していません。なので Another HTML-lint gateway では軽微なエラーとして警告されますが、基的には Valid なのでとりあえずは問題ないかと思ってます。 そもそもこの問題については imgにwidthとheightを指定し

    TAKESAKO
    TAKESAKO 2008/02/22
    興味深いポリシー
  • https://www.openvista.jp/archives/note/251/?251/

  • Beautiful Soup documentation

    Beautiful Soup Documentation by Leonard Richardson (leonardr@segfault.org) 这份文档也有中文版了 (This document is also available in Chinese translation) Этот документ также доступен в русском переводе. [Внешняя ссылка] (This document is also available in Russian translation. [External link]) Beautiful Soup 3 has been replaced by Beautiful Soup 4. You may be looking for the Beautiful Soup 4 documentation Bea

  • クライアントのブラウザを識別することでボット判定するコメントスパム対策のアイデア - モーグルとカバとパウダーの日記

    年末に、サイボウズ・ラボの竹迫さんとメールでお話しさせてもらって浮かんだアイデアです。 メールでのスパム対策として、botの判定にパケットの特徴を見て、Windowsクライアントかそれ以外かを見分ける、p0fという手法があります。 Webの場合、接続してきたブラウザは自分のブラウザ名を言ってくるんですが、これは自己申告なので当然ながら騙ることができるため信用できません。 しかし、竹迫さんのブラウザの癖からブラウザの判定する手法 TAKESAKO @ Yet another Cybozu Labs: diggは大変なアクセスを残していきました を使うことで、自己申告に頼らずにそのブラウザが何かを判定させることができます。 例えばIE6ならこの画像、FireFoxならこの画像、というようにブラウザがそのブラウザ種ごとにアクセスを残してくれることになります。 そこで、apacheの特定ファイルへ

    クライアントのブラウザを識別することでボット判定するコメントスパム対策のアイデア - モーグルとカバとパウダーの日記
  • HTML5 における HTML4 からの変更点

    この文書「HTML 5 における HTML 4 からの変更点」は、W3C の HTML ワーキンググループ による「HTML 5 differences from HTML 4 (Working Draft 22 January 2008)」の日語訳です。 規範的な文書は原文のみとなっています。この日語訳は参考情報であり、正式な文書ではないことにご注意ください。また、翻訳において生じた誤りが含まれる可能性があります。 原文が勧告 (Recommendation) ではなく、策定途中の草案 (Working Draft) であることにご注意ください。 原文の最新版 は、この日語訳が参照した版から更新されている可能性があります。また、この日語訳自身も更新されている可能性があります。日語訳の最新版は、W3C 仕様書 日語訳一覧 から参照することができます。 更新日: 2008-09-

    TAKESAKO
    TAKESAKO 2008/01/24
    100% pure HTML
  • HTML - meta タグの仕様詳細まとめ :: Drk7jp

    前エントリ - Internet Explorer のイメージツールバーを無効化する meta タグ で予告したとおり meta タグについて生まれて初めてまじめに調べてみました。改めて調べてみると知らなかったこと満載です。っていうか Web エンジニアたるもの一度は W3C勧告 くらいは一通り目を通しておかなくてはダメだなと思ったりしました。面倒なくらい分量があるけど。ひとまず meta タグ情報としての自分にとって永久保存版まとめという位置づけです。 まずは参考になったサイトの紹介から。 W3C勧告HTML4.01 :: The global structure of an HTML document W3C勧告HTML4.01 私的日語訳 :: The global structure of an HTML document(ja) rfc2616.txt Another HTML

    TAKESAKO
    TAKESAKO 2008/01/21
    めっためた
  • Internet Explorer のイメージツールバーを無効化する meta タグ

    恥ずかしながら Windows Vista に乗り換えてから1年ほど経つので Internet Explorer 6 (IE6) のイメージツールバーって存在を忘れていました。というか見たことはあっても名前で言われても何なのかわかりません。しかものイメージツールバーを無効化する方法も知りませんでした。 イメージツールバーってのは Internet Explorer 6 (IE6) 上で表示されている画像にでてくるコイツのことです。 この左端と右端のヤツ。原寸サイズでみるとこいつらのことです。こいつらはイメージツールバーっていうらしいです。 このイメージツールバーってのは IE6 にのみ実装されているある意味邪魔者で IE7 にはしっかりと機能削除されているヤツなんですが、200 x 200 ピクセル以上の画像を表示する際に表示されます。画像の保存、印刷、メール添付のほか、マイピクチャフォル

    TAKESAKO
    TAKESAKO 2008/01/20
    知らんかった... <meta http-equiv="imagetoolbar" content="false">
  • あなたのマークアップのどこがどう正しくないかを具体的に指摘してくれる『xhtml-css』 | 100SHIKI.COM

    似たようなツールはいくつかあるが、やっぱり便利なのと、きれいなインターフェースなのでご紹介。 xhtml-cssではCSSHTMLの文法チェックを行ってくれる。自分でサイトやブログを持っていたら一度試してみるといいだろう。 診断結果はかなり具体的なのでどこをどう直せばいいかが一目瞭然だ。 ウェブは厳密に正しくなくてもなんとなく表示されるものだが、やっぱり検索エンジンのこととか、メンテナンスのことを考えると正しい文法であるに越したことはない。 また何がどう正しくないかを知ることによって自分が何を勉強すればよいかもはっきりするだろう。こうした勉強欲を高めてくれるツールはいいですな。

    あなたのマークアップのどこがどう正しくないかを具体的に指摘してくれる『xhtml-css』 | 100SHIKI.COM
  • HTMLのVideo要素 | Torisugariの日記 | スラド

    スラッシュドットの「HTML5策定におけるOgg Vorbis/TheoraとDRMの扱いを巡る攻防」他について。 http://srad.jp/mac/article.pl?sid=07/12/11/1950248 これは、議論が変な方向に行っていて、 などと納得している人がいますが、削ったのはOgg系が候補から外れた事実を内外に示すためで、上のような曖昧な責任回避の結論で収まる気配はありません。現実的には、TheoraとH.264のいずれかしかあり得ないので、現在は、仕様内にH.264云々を盛り込む直前である、とも言えるでしょう。Nokiaの論文にしても、前後を知らなければ如何様にも解釈できるでしょうが、この文脈で言っているのは、「H.264以外は認めない」ということだけで、他意はないと見るべきです。どうにも混沌とした状況ではありますが、おおまかに次のような3つの勢力に図式を単純化する

  • HTML5策定におけるOgg Vorbis/TheoraとDRMの扱いを巡る攻防

    家/.の記事(その1、その2)より。数年前にAppleやMozilla、Operaを中心としたグループWHATWGが提案し、現在W3Cで検討中の次世代HTML標準、HTML5だが(/.Jの記事)、その基ビデオコーデック標準を巡って議論が紛糾しているようだ。 数か月前、W3CはAppleの強硬な反対を押し切って、HTML5の基ビデオコーデック標準としてフリーな音声/動画フォーマットとして知られるOgg Vorbis/Theoraを採用した(Vorbis/Theoraの使用が強制されるわけではない)。これに対し、今度はNokiaがOggはDRMをサポートしないので「プロプライエタリ」であるとするポジションペーパー(PDF)を発表し、反対を明らかにした。結局AppleとNokiaの圧力により、Oggへの言及は現在のHTML5ドラフトからは削除されたようだ(Manuel Amador氏のブロ

  • HTMLのドキュメントから繰り返し部分をみつける - bits and bytes

    RSSを生成していないページからRSSを生成するなんでもRSS 0.1bは、公開されているJSAI2005: なんでもRSS - HTML文書からのRSS自動生成によると、日付情報を目印にしてそのHTMLドキュメントの構造を推測して、各エントリ(item要素)のタイトルと文を単語の統計的に処理して決定し、フィードを生成していると書かれています。 ウェブ上にあるHTMLドキュメントは Ask.jp : "xml" Search results. のように、RSSitem要素に相当する部分に日付が含まれていないものもあります。 その中でも、大量のデータを複数のページにわけて表示しているHTMLドキュメントを対象に、ドキュメント中に含まれる繰り返し部分のXPathを生成するブログラムをjavascriptで作りました。 アプローチ 大量のデータを複数のページわけて表示しているドキュメントを

  • HTML::Feature - 重要部分を抽出するモジュール - - ダウンロードたけし(寅年)の日記

    以前からCPANで公開していたモジュールがあるんですが、日語での解説ドキュメントがなかったのと、最近大幅にブラッシュアップしたので、せっかくなので紹介記事を書きます。 HTML::Feature - Extract Feature Sentences From HTML Documents 「えいちてぃえむえる::ふぃーちゃー」と読みます。 ブログやニュース記事など様々なHTML文書から「重要部分」を推測して抽出してくれる perl モジュールです。 「重要部分」とはいわゆる「文」のことですね。文抽出とか焦点抽出とか色々な言い方があるかと思いますが、まぁ要するに特徴的な部分を推測して抽出するわけです。 どういうものか。 例えばブログ記事からヘッダーやフッター、その他のナビゲーションブロックを除いた「記事らしき部分」だけを切り取りたい、とします。 ぱっと思いつくのは「特定のコメントタグ

    HTML::Feature - 重要部分を抽出するモジュール - - ダウンロードたけし(寅年)の日記
  • SGML の短縮タグ機構 | 鳩丸よもやま話

    SGML には短縮タグ機構と呼ばれる仕組みがあって、タグを書くときにいろいろな省略をすることが許されています。ただし、それには「SGML宣言」の FEATURES - MINIMIZE の項目で SHORTTAG YES と指定されていることが条件となります。HTML でも SHORTTAG YES となっていますから、短縮タグ機構を利用することができます。 ※ただし HTML+ では SHORTTAG NO です。また XHTML は XML のルールに従いますので、SHORTTAG NO と同じ扱いです。これらでは、以下の省略記法は全く使うことができません。 引用符の省略特定の条件を満たしている場合、属性値の引用符は省略することができます (厳密な言い方をすると、「属性値表記」の代わりに「属性値」をそのまま使用できます)。その条件とは、属性値が「名前字句(name token)」である

    TAKESAKO
    TAKESAKO 2007/10/09
    【これらをきちんと解釈できるブラウザはほとんどありません(SGMLパーサーでさえ解釈できないことがあるらしいですし)】
  • alt属性はいかに決定されるべきか | Takazudo Clipping*

    画像を閲覧できないユーザーでも内容を把握できるようにalt属性をつけましょうとは言うが、実際にはどのようにつけたらよいのかが実はかなりわからない。さらに納品前になんじゃこのalt!と突っ込まれる・・・。色々話し合ったりググったりした末にでた自分結論はこんなの。 前提 画像OFFのユーザー・音声ブラウザのユーザーが、画像の代わりにそのaltテキストが表示されても、ページ内容が分かる。但し、100%の情報を伝える必要があるわけでもない。そこに何の画像があるのかが伝わり、ページ内容を把握できる。 画像の中に文字がある場合

  • Embedded Finance in the US: Customer Experience and Business Models

    Embedded Finance in the US: A Game Changer for Customer Experience and Business Models In recent years, fintech and new technologies have significantly disrupted the financial sector. These changes have resulted in the creation of new financial products and services that are more accessible, affordable, and suited to customers’ needs. The rise of embedded finance or embedded financial services is

    TAKESAKO
    TAKESAKO 2007/09/28
    JavaScriptやCSSを使わないブラウザ判別手法。10/1のshibuya.pm#8では、この解説を日本語で詳しくしようかと。 参考文献: http://d.hatena.ne.jp/hasegawayosuke/20070927/p1
  • ブラウザによって異なる画像を表示する - 葉っぱ日記

    世間では史上空前の参考文献記述ブームだそうですが、そんなことは気にせずにとりあえずhoshikuzuさんの出題された『詰めHTML』で遊んでみました。 ちょっと思い出したのでクイズを書いてみます。 以下の条件で、IEでは、imgie.gif、 Firefoxでは、imgfx.gif、その他多くののブラウザでは、imgother.gif ノミを表示するHTMLを作ってください。 JavaScriptなどのスクリプトは使わない CSSを通じてハックしない HTMLの書き方のみで勝負するが、validでなくても良い 書いてみたのはこれ。 http://openmya.hacker.jp/hasegawa/test/hoshikuzu20070925.html IEだとモヒカンの人が、Firefoxだと今夜わかる人が、それ以外のブラウザだと危険文字メタ文字の中の人が表示されると思います。「それ以外

    ブラウザによって異なる画像を表示する - 葉っぱ日記
    TAKESAKO
    TAKESAKO 2007/09/28
    7bit JIS hacks すげぇぇ / 「参考文献:私信」って、タンポポ吹いたwww
  • JavaScriptを使わないでブラウザ別に画像を振り分けて表示するHTMLを書く

    ちょっと思い出したのでクイズを書いてみます。 以下の条件で、IEでは、imgie.gif、 Firefoxでは、imgfx.gif、その他多くののブラウザでは、imgother.gif ノミを表示するHTMLを作ってください。 JavaScriptなどのスクリプトは使わない CSSを通じてハックしない HTMLの書き方のみで勝負するが、validでなくても良い ※最新のブラウザで実現できなかったらすみません。なんだお、とか叱らないでくださいませ。 このテクで、ブラウザごとにJSファイルや外部スタイルシートとかを分別できないのかなぁと昔、妄想したことがあります。 hasegawayosukeさんへ http://d.hatena.ne.jp/hasegawayosuke/20070927/p1 なんと申しますか、すごいものを拝見させて頂きました。ある意味勉強になります。ありがとうございます。

    JavaScriptを使わないでブラウザ別に画像を振り分けて表示するHTMLを書く
    TAKESAKO
    TAKESAKO 2007/09/26
    ieとfirefoxの判別はHTMLだけでできるけど、その他のブラウザをどうするか・・・気が向いたらあとで試す / 試してみた→ http://wafful.org/2007/09/27/new-browser-detection-web-20-html-hacks/
  • Webページの本文抽出 (nakatani @ cybozu labs)

    Webページの自動カテゴライズ の続き。 前回書いたとおり、パストラックで行っている Web ページのカテゴライズでは、Web ページの文抽出がひとつの鍵になっています。今回はその文抽出モジュールを公開しつつ、使っている技法をざっくり解説などしてみます。 モジュールの利用は至極簡単。require して analyse メソッドに解析したい html を与えるだけ。文字コードは UTF-8 です。 【追記】大事なこと書き忘れ。モジュールは Ruby1.8.5 で動作確認していますが、特別なことはしていないので、1.8.x なら動くと思います。 $KCODE="u" # 文字コードは utf-8 require 'extractcontent.rb' # オプション値の指定 opt = {:waste_expressions => /お問い合わせ|会社概要/} ExtractCont

    TAKESAKO
    TAKESAKO 2007/09/13
    本文抽出モジュール 【セクションターゲットに対応しているサイトであれば 100% に近い精度で本文が抜けます】