[B! html] nahetaのブックマーク

HTML - meta タグの仕様詳細まとめ :: Drk7jp

前エントリ　-　Internet Explorer のイメージツールバーを無効化する meta タグ　で予告したとおり meta タグについて生まれて初めてまじめに調べてみました。改めて調べてみると知らなかったこと満載です。っていうか Web エンジニアたるもの一度は W3C勧告くらいは一通り目を通しておかなくてはダメだなと思ったりしました。面倒なくらい分量があるけど。ひとまず meta タグ情報としての自分にとって永久保存版まとめという位置づけです。まずは参考になったサイトの紹介から。 W3C勧告HTML4.01 :: The global structure of an HTML document W3C勧告HTML4.01 私的日本語訳 :: The global structure of an HTML document(ja) rfc2616.txt Another HTML

naheta 2008/01/21

リンク

Beautiful Soup: We called him Tortoise because he taught us.

You didn't write that awful page. You're just trying to get some data out of it. Beautiful Soup is here to help. Since 2004, it's been saving programmers hours or days of work on quick-turnaround screen scraping projects. Beautiful Soup is a Python library designed for quick turnaround projects like screen-scraping. Three features make it powerful: Beautiful Soup provides a few simple methods and

naheta 2008/01/19

リンク

Pythonで簡単なウェブスクレイパーを書く - builder by ZDNet Japan

デジタル時代のITインフラ構築術仮想化統合、クラウドを経て今「マルチ」へ ITインフラの最適化と継続的進化への道筋体験から学んだ成功への知見マネーフォワード×エム・フィールド対談 Fintechプラットフォーム開発の「鍵」さあ、その想いをカタチにしよう。 Google Cloud が企業の未来に向けた生産性向上とコラボレーション実現のヒントを解説結果に差がつくウェビナーへの投資デジタル営業時代における見込み顧客獲得へウェビナーの運用・集客・フォローの最適化高まるゼロトラストの気運妥協のない安全のために適材適所で組合せトップ4社によるゼロトラストセキュリティ単純なインフラ製品の販売ではない DX、コンテナプラットフォームの実証など自社の取り組みで得られた知見を顧客に提案企業DXのヒントに！ SAPとMSとインテルのタッグがもたらす新たな価値について3社キーマンが

naheta 2008/01/19

リンク

Webページの本文抽出 (nakatani @ cybozu labs)

Webページの自動カテゴライズの続き。前回書いたとおり、パストラックで行っている Web ページのカテゴライズでは、Web ページの本文抽出がひとつの鍵になっています。今回はその本文抽出モジュールを公開しつつ、使っている技法をざっくり解説などしてみます。本モジュールの利用は至極簡単。require して analyse メソッドに解析したい html を与えるだけ。文字コードは UTF-8 です。【追記】大事なこと書き忘れ。本モジュールは Ruby1.8.5 で動作確認していますが、特別なことはしていないので、1.8.x なら動くと思います。 $KCODE="u" # 文字コードは utf-8 require 'extractcontent.rb' # オプション値の指定 opt = {:waste_expressions => /お問い合わせ|会社概要/} ExtractCont

naheta 2008/01/12

リンク

はてなブックマーク

タグ

関連タグで絞り込む (9)

htmlに関するnahetaのブックマーク (4)

お知らせ

今週のはてなブックマーク数ランキング（2024年7月第1週）

月間はてなブックマーク数ランキング（2024年6月）

今週のはてなブックマーク数ランキング（2024年6月第5週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス