タグ

tokinonamidaのブックマーク (422)

  • 「Googleを支える技術」に載っていない日本語検索エンジンの技術 - nokunoの日記

    Web検索エンジンは、大きく分けて次の2つからなります。利用者からのクエリーを直接受ける検索サーバ検索サーバから利用されるインデックス世界中のWebサイトを集めてきて解析し、インデックスに登録するクローラインデックスというのは、利用者から検索される単語をあらかじめ列挙しておいて、単語からWebサイトのURLを引くのに必要なデータ構造のことです。検索エンジンはGoogleを支える技術にあるように、「下準備があればこその高性能」なわけです。 インデックスを作成するためには、あらかじめWebページの内容を単語に分割する必要があります。英語では単語と単語の間をスペースで区切るため、この作業はさほど難しくありません。しかし日語では、単語の境界はそれほど自明ではないため、日語特有の処理をする必要があります。 日語の文から単語に分解するには、形態素解析を使う場合と、N-gramを使う場合があり、そ

  • Geekなぺーじ : 学生のうちにしておくべきこと

    自分の過去を振り返りながら、学生時代にしておけばよかったことや、学生時代の経験で自分の糧になったと思われることを列挙してみました。 以下、学生のうちにしておくべきと私が勝手に思っていることです。 1. 大失敗 様々な事に挑戦しましょう。 そして、失敗しましょう。 恐らく失敗をしようとして失敗をする人は、あまりいません。 しかし、経験がない事に挑戦すると初めは誰でも失敗します。 背負っている物が少ないうちにする失敗は、その後の財産になります。 成功よりも失敗からの方が多くを学べます。 また、成功よりも失敗の方が理由を分析しやすい傾向があると思われます。 (成功の分析結果は単なる勘違いである場合もあるかも知れません) ただし、人生を台無しにしてしまうような取り返しのつかない失敗はやめましょう。 失敗し過ぎない程度に多くの失敗を重ねましょう。 2. 恥ずかしいおもいをする 知らずにしでかして、恥

  • WEB製作者の為のSEOチートシート[to-R]SEOmozで配布されているSEOチートシートが素敵ですので日本語にしてみました

    WEB製作者の為のSEOチートシート SEOmozで配布されているSEOチートシートが素敵ですので日語にしてみました。 重要なHTML要素 title要素にキーワードを含みましょう。 h1,h2,h3要素にキーワードを含みましょう。 b要素、strong要素でキーワードを包みましょう。 img要素のalt属性、ファイル名にキーワードを含みましょう。 a要素のtitle属性、アンカーテキストにはキーワードを含ませましょう。 a要素のnofollowを上手に使いましょう。 インデクシングに関する限界 ページのファイルサイズは150KB以下にしましょう。 ページ内のリンクは100個以内にしましょう。 title要素は70文字(半角)以内にしましょう。 meta要素のdescriptionは155文字(半角)以内にしましょう。 URLの含まれるパラメーターは2個以内にしましょう。 ディレクトリの

    WEB製作者の為のSEOチートシート[to-R]SEOmozで配布されているSEOチートシートが素敵ですので日本語にしてみました
  • ベンチャー企業の経営危機データベース(METI/経済産業省)

    多くのベンチャー企業が起業後に、同じような失敗、トラブル、ヒヤリとした経験をしており、成長に伸び悩む企業が多いと言われています。そこで、ベンチャー企業の経営者が様々な場面で決断を下す際の「転ばぬ先の杖」として、将来起こりうるリスクを予見できるような失敗、トラブル、ヒヤリとした経験の事例を収集・データベース化しました。ベンチャー企業の成長に向けた経営判断の材料としてご利用いただければ幸甚に存じます。 データベースには、平成19年度にベンチャー企業にインタビュー調査を実施して収集した83の失敗、トラブル、ヒヤリとした経験に関する事例を掲載しています。事例は、ベンチャー企業の成長ステージや失敗、トラブル、ヒヤリとした経験の原因及び結果といった分類項目をもとに検索が可能となっています。

  • http://miranca.com/entry/article6

  • プログラミングファースト開発 - ひがやすを技術ブログ

    プログラミングファースト開発とは、ドキュメントを書いてからソースコードを書くのではなく、動くソースコードを書いてユーザに実際に触ってもらうということを何度も繰り返して、仕様を固める開発手法です。ドキュメントは仕様が固まった後に書きます。 テストサミットでは、極力ユニットテストを書かずに品質を確保する方法ということで、テストに重点を置いて話をしたのですが、今回のクロスコミュニティカンファレンスでは、「プログラミングファースト開発」そのものについて、会場の方々と一緒にディスカッションしました。 熱い(暑い?)ディスカッションになったので、思わず途中で泡のあるスポーツドリンクを飲まないといけなくなったほどです(笑)。 プログラミングファースト開発の開発手順は次のようになります。 実装してユーザに使ってもらうということを仕様が固まるまで繰り返す レビューの結果はその場で反映させる 仕様を決めながら

    プログラミングファースト開発 - ひがやすを技術ブログ
  • 便利なCSSテクニック30選:phpspot開発日誌

    30 Exceptional CSS Techniques and Examples | Six Revisions In this article, I’ve pieced together 30 excellent CSS techniques and examples 便利なCSSテクニック30選ということでエントリがまとまっていたので紹介。 特に気になったものを以下にまとめました。 Hoverbox Image Gallery - 画像ギャラリー上でマウスホバー時に画像拡大 デモはこちら CSS Photo Zoom - 文書に添付の画像にカーソルを合わせると画像拡大。テキスト位置も自動調整 デモはこちら whatever: hover - windowsのスタートメニュー風の階層メニュー デモはこちら Content Overlay with CSS - オーバーレイでdescr

  • 第2回 なぜ、楽天の商品ページはものすごく縦に長いのか? | gihyo.jp

    みなさんはオンラインショッピングモールの「楽天市場」に出店しているの店舗の商品ページをご覧になったことがありますか? その中で「何で、楽天のお店の商品ページは、こんなに縦長いんだ?」と思われたことはありますか? おそらく、楽天市場を利用したことのある方のほとんどは、「⁠ものすごく縦長い商品ページ」を見たことがあるのではないかと思います。 ではなぜ、このように縦長いページが多いのでしょうか。そこにはネットショップで売上を上げるためのポイントが多く含まれていたのです。 ショッピングモールの商品ページが「ものすごく縦長い」理由 前回の記事「ネットショップに訪れるお客様の意識」にて、楽天市場やYahoo!ショッピングなどのオンラインショッピングモールを利用するお客様は「お買い物がしたい」という気持ちが強い、と解説しました。 モールに出店している店舗は、このお客様の高い購入意欲をより一層高め、商品を

    第2回 なぜ、楽天の商品ページはものすごく縦に長いのか? | gihyo.jp
  • JVNVU#162289: ある種の範囲チェックを破棄するC コンパイラの最適化の問題

    C コンパイラの中には、最適化処理において、ポインタ演算のオーバーフローチェックを行うコードブロックを省略することがあります。従って、こうしたコンパイラを使ってコンパイルしたアプリケーションは、バッファオーバーフローの影響を受ける可能性があります。 gcc 4.2 およびそれ以降のバージョンで問題が確認されていますが、他のベンダが提供するコンパイラにも同様の問題が存在する可能性があります。 C 言語で次のような型が与えられたとき char *buf; int len; C コンパイラの中には buf+len >= buf が成立すると仮定するものが存在します。その結果、次に示すような長さチェックを行うコードがコンパイラの最適化によって省かれてしまうことがあります。 len = 1<<30; [...] if(buf+len < buf) /* 長さチェック */ [...オーバーフローに

  • パソコンを業務用途にも耐えうる高性能ブロードバンドルータにしてしまう「Vyatta」

    オープンソースで作られているエンタープライズ用ソフトウェアルーター「Vyatta」は最初から個人向けと言うよりは業務用途目的で開発されており、Cisco 7200よりも価格やパフォーマンスなどで10倍のアドバンテージがあると豪語、実際に第3者機関によるテストでもそのことがある程度証明されており、コストを75%削減できるとしています。 確かにそれ相応の機能があるようで、ルーター、ファイアウォール、VPNなどが可能。また、XenやVMwareの仮想ネットワーク内でも動作。オープンソースで無料版の「Community Edition」であってもコンパイル済みのバイナリの提供やバグフィックスなどは6ヶ月ごとに必ず行われると明言しており、ほかにもRedhatのような有償による手厚いサポートもちゃんと提供しています。 というわけで、実際にこのVyattaを使ってPPPoE接続のブロードバンドルーター

    パソコンを業務用途にも耐えうる高性能ブロードバンドルータにしてしまう「Vyatta」
  • MOONGIFT: » Java製のクローリングシステム「InfoCrawler」:オープンソースを毎日紹介

    Webサービスを作る上で、外部のデータを取得して何かしたいといったことは良くある。いや、外部に限ったものではない。ローカルのデータであっても取得して、それを検索したいという要望は良くあるものだ。 ユーザ側の検索画面 そうした時にクローラーを自作したりすると思うのだが、robots.txtの解釈や効率的なクローリング法を習得するのは大変なことだ。そこで試してみたいのがこれだ。 今回紹介するオープンソース・ソフトウェアはInfoCrawler、Java製のWebクローラーだ。 InfoCrawlerは設定項目も数多く、クローリングシステムとして優秀なものになると思われる。複数サーバ設置して分散化もできるようだ。HTMLや画像、各種バイナリ等ファイル種別を指定してクローリングを行うか否かを指定できる。 インデックスするファイルを指定する画面 認証が必要なサーバにも対応し、言語によってフィルタリン

    MOONGIFT: » Java製のクローリングシステム「InfoCrawler」:オープンソースを毎日紹介
  • 「Firefoxを使い続けるための“お勧め”設定」 , NoScriptを組み込んでいないFirefoxは使用停止に

    「Firefoxを使い続けるための“お勧め”設定」 , NoScriptを組み込んでいないFirefoxは使用停止に 最近,ある企業のシステム管理者から「Webページを不正に改ざんされる事件が最近特に増加し,その改ざんされたサイトをWebブラウザで閲覧した場合,ウイルスを送り込まれることが多いと聞く。Webブラウザを使用する時に,利用者側で行うべき対策をアドバイスしてほしい」との相談を受けました。 確かに,3月に入ってから国内の数多くのWebサイトが改ざんの被害にあっています(関連記事)。痛ましいのは,被害者であるはずのWebサイトが不正な改ざんにより,一般の閲覧者への加害者に仕立てられることです。Webサイトの管理者は,当然ながら今回の攻撃で主な手口として使用されたSQLインジェクション対策などの不正アクセスに耐えうる対策を施すべきです。しかし,このように多数のWebサイトが改ざんされる

    「Firefoxを使い続けるための“お勧め”設定」 , NoScriptを組み込んでいないFirefoxは使用停止に
  • OpenSocialアプリケーション作成のための基礎知識

    前編の「Google OpenSocialによってSNSで何ができるのか?」では、OpenSocialの歴史や登場の背景、ソーシャル・アプリケーションとしてどんなものが考えられるかについて説明しました。後編となる今回は、具体的にアプリケーションを開発しながら、OpenSocialの可能性を探っていきましょう。 OpenSocialアプリケーション作成のための準備 SNS市場は非常にエキサイティングになってきています。つい先日、SNS大手の「MySpace」もOpenSocial対応のアナウンスを出し、2008年3月末にサイトもオープンしました(参考「MySpace日版、開発者向けプラットフォーム公開」)。SaaS企業である米セールスフォースも加わり、エンターテインメント以外のソーシャル・アプリケーションも登場しています。 OpenSocialアプリを試すには、それを動かす環境が必要です。

    OpenSocialアプリケーション作成のための基礎知識
  • XHTMLでやりがちな8個の間違い | ブログが続かないわけ

    最近、XHTMLのValidationに恋してます。 Validationチェックをするのに便利なのは、やっぱり家のW3CのMarkup Validation Service。単一のページをチェックするにはこれが一番いい。 Markup Validation Service サイト全体をまとめてチェックする場合はこちらが便利(手前味噌でごめんなさい)。 Site Validator ただ、これらのサービスは詳細のエラーを見てもどこが間違いかわからないことがある。慣れないと難しい。まず、英語だと言うのも問題かもしれないが、微妙に問題点とエラーメッセージの内容がずれていることも多いからだ。プログラマであればエラーメッセージとエラー内容がずれているなんてことは慣れっこかもしれないが、これらのツールを使うのは非エンジニアであることも多い。HTMLのコーダーとかディレクターとか。 Site Val

    XHTMLでやりがちな8個の間違い | ブログが続かないわけ
  • jQueryサンプル集 | DesignWalker

    jQueryサンプル集 | DesignWalker
  • 日本語版 : IBM Bluemix

    IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.

    日本語版 : IBM Bluemix
  • Sambaサーバ構築、5つのべからず:2008年版(1/2)

    - 若葉マーク管理者に捧げる - LinuxやUNIXをWindowsのファイルサーバ/プリントサーバとしてしまうことができる「Samba」は、手軽にファイル共有環境を構築することができ、サーバ管理入門にもぴったりです。インターネット上の関連情報も豊富ですが、しっかり出所を確かめないと誤った設定を招く恐れがあります。 オープンソース・ソリューション・テクノロジ株式会社 代表取締役 チーフアーキテクト 小田切 耕司 2008/4/22 Windowsとのファイル交換を手軽に実現するSamba Sambaは、LinuxやUNIXをWindowsのファイルサーバ/プリントサーバとしてしまうことができるオープンソースソフトウェア(OSS)です。Sambaの導入によって、LinuxWindowsが混在する環境で、手軽に情報共有を行えるようになります。 Sambaは、大きく以下の4つの機能を提供しま

  • Command Technica:はじめてrsyncを使う方が知っておきたい6つのルール (1/2) - ITmedia エンタープライズ

    Linuxなどを利用する上で、「これはどうやったら実現できるのだろう」と思うことは数知れない。連載では、ユーザーがひんぱんに遭遇するであろう問題と、その解決方法を解説する。上級者には新たな発見を、初心者には上級者への道の手引きとなるだろう。 ファイルやディレクトリをバックアップ/同期するためのツールは幾つも存在していますが、rsyncはとりわけ大きな人気を誇っているといってよいでしょう。変更分を検出して差分のみを転送することで、ネットワーク経由でも効率的にバックアップ/同期が行える点や、sshなどのリモートシェル経由での利用が可能な点など、機能の洗練度はさすがに登場から10年以上たっているだけのことはあります。バックアップやミラーリングなどの用途であれば、基的にはコピー元とコピー先でわずかな違いしか発生しないはずで、ファイルの相違部分だけを転送するrsyncは効率的に機能します。 そん

    Command Technica:はじめてrsyncを使う方が知っておきたい6つのルール (1/2) - ITmedia エンタープライズ
  • SQLインジェクション検出ツール「iLogScanner」を機能強化:IPA 独立行政法人 情報処理推進機構

    なお、iLogScannerでSQLインジェクション攻撃が検出された場合や、特に攻撃が成功した可能性が検出された場合は、ウェブサイトの開発者やセキュリティベンダーに相談されることを推奨します。 iLogScannerは簡易ツールであり、ウェブサイトの脆弱性を狙った攻撃のアクセスログが無ければ脆弱性を検出しません。また、実際の攻撃による脆弱性検査は行っていません。攻撃が検出されない場合でも安心せずに、ウェブサイトの脆弱性検査を行うことを推奨します。 IPAとしては、ウェブサイト運営者が、この脆弱性検出ツールを利用することにより、自組織のウェブサイトに潜む脆弱性を確認するとともに、ウェブサイト管理者や経営者に対して警告を発し、セキュリティ監査サービスを受けるなど、脆弱性対策を講じるきっかけとなることを期待しています。 また、ウェブサイトの開発者やセキュリティベンダーが、ツールを取引先等に紹介

  • ke-tai.org > Blog Archive > 端末IDを設定でき、ケータイサイトの開発に便利なFirefoxアドオン「Modify Headers」

    端末IDを設定でき、ケータイサイトの開発に便利なFirefoxアドオン「Modify Headers」 Tweet 2008/4/17 木曜日 matsui Posted in ソフト紹介 | 5 Comments » 日は、ケータイサイトの開発に便利なFirefoxアドオン「Modify Headers」をご紹介します。 ケータイ向け開発を行っていると、ログイン部分のプログラム作成などで、端末IDを取得したいケースがあります。 エミュレータには端末ID出力のための機能がついていたりするのですが、そのためにいちいちエミュレータから操作するのは面倒です。 「Modify Headers」を使うことで、HTTPヘッダを指定の通りに書き換えることができるため、携帯電話になりすまし端末IDを出力することができます。 → FireFox Add-ons Modify Headers [mozill