タグ

ブックマーク / gihyo.jp (8)

  • 第16回 テキスト情報の抽出[その3] | gihyo.jp

    今回は、Windows環境のテキスト抽出方法の代表格といえるIFilterについてとりあげます。 IFilterの構造 現在、さまざまなWindowsのシステム上では、Windows Indexing Service, Windows Desktop Search, SharePoint Server 2003/2007, Microsoft Search Server 2008などのMicrosoftの全文検索エンジンが動作します。これらのソフトウェアでは、各ファイルからテキスト情報を抽出するためにIFilterと呼ぶフィルタを用いています。最近では、Microsoft SQL ServerのフルテキストインデックスもIFilterを利用しており、IFilterは多くのMicrosoft製品で利用されています。 また、Microsoft以外の多くのベンダの開発する検索エンジンや、文書管理

    第16回 テキスト情報の抽出[その3] | gihyo.jp
    katow
    katow 2012/01/19
  • 連載:検索エンジンを作る|gihyo.jp … 技術評論社

    運営元のロゴ Copyright © 2007-2024 All Rights Reserved by Gijutsu-Hyoron Co., Ltd. ページ内容の全部あるいは一部を無断で利用することを禁止します⁠。個別にライセンスが設定されている記事等はそのライセンスに従います。

    連載:検索エンジンを作る|gihyo.jp … 技術評論社
  • 第7回 プラットフォームは乗るものではなく担ぐもの | gihyo.jp

    乱立するプラットフォームとどう向き合うか 先日、開発中のiPhoneアプリからDropboxへファイルをアップロードするしくみを作っていたのだが、そのAPIがよくできていることに気がついたので、それについてTwitterでつぶやいた。すると、すぐに知り合いの開発者から「DropboxってAPIを使うとそのアーキテクチャの優秀さがわかるよね」というリプライが返ってきた。 ほんの少し前にFacebook APIを使ったアプリを作っていたときにも同じことを感じたのだが、「⁠デファクトスタンダードになる可能性のある」プラットフォームに出会ったときのワクワクした感じは、自分自身のモチベーションを上げるためにも、そして常に時代の先端を走り続けるためにもとても大切だと感じている。 この手のプラットフォームの類いは「乱立」と呼んでよいほど毎年たくさん出て来るので、「⁠どれを勉強すべきか」「⁠どれに賭けるべ

    第7回 プラットフォームは乗るものではなく担ぐもの | gihyo.jp
    katow
    katow 2011/05/21
    私が未だ担いでいるのは.NET Framework…でもいいもん。
  • diffの動作原理を知る~どのようにして差分を導き出すのか | gihyo.jp

    UNIXの基的なコマンドの1つであるdiff。 これに実装されているアルゴリズムは実に興味深い世界が広がっています。 稿では、筆者が開発した独自ライブラリ「dtl」をもとに「diffのしくみ」を解説します。 はじめに diffは2つのファイルやディレクトリの差分を取るのに使用するプログラムです。 ソフトウェア開発を行っている方であれば、SubversionやGitなどのバージョン管理システムを通して利用していることが多いかと思います。稿ではそのdiffの動作原理について解説します。 差分の計算の際に重要な3つの要素 差分を計算するというのは次の3つを計算することに帰結します。 編集距離 2つの要素列の違いを数値化したもの LCS(Longest Common Subsequence) 2つの要素列の最長共通部分列 SES(Shortest Edit Script) ある要素列を別の要

    diffの動作原理を知る~どのようにして差分を導き出すのか | gihyo.jp
  • 第14回 DataMapperの使い方 | gihyo.jp

    DataMapperのコンポーネントは、基的にクラスではなくモジュールとして提供されているため、アプリケーションで利用するモデルクラスにインクルードして使います。 Resourceモジュールをインクルードすると、自動的にModelモジュールがextendされ、PersonクラスはModelクラスとして振る舞うようになります。これは図1のPersonに相当します。 図1のPerson Mapperに相当する仕組みはRepositoryです。Repositoryは、create, update, delete, read_one, read_manyなどの、データストアに対する基的な操作のインターフェイスを規定します。Modelクラスは、Repositoryへの参照を持っていて、 Modelクラスによるデータストアへのアクセスは、全てRepositoryを介して行われます。この際、データス

    第14回 DataMapperの使い方 | gihyo.jp
    katow
    katow 2011/01/12
    これが出来ると、何回でもお決まりのデータ編集アプリ(サービス)が書けるかしら。
  • 第1回 テスト管理システムとは何か? | gihyo.jp

    はじめに TestLinkとは、オープンソースのテスト管理システムです。TestLinkは、Francisco Mancardi氏、Andreas Morsing氏、Martin Havlat氏を中心としたコミュニティで開発されています。元々は海外で作られていたソフトウェアでしたが、最近は日でも徐々に浸透してきているようです。 連載では、TestLinkの日語化に携わっているTestLink日語化部会の私たちが、このTestLinkの基機能について順次ご紹介していきます。 今回はTestLinkのご紹介する前準備として、「⁠テスト管理システムとは何か」「⁠では、そもそもテスト管理とは?」といったことについて考えてみましょう。 テスト管理システムとは何か 「テスト管理システム」と言う言葉を聞いたことはありますか? もしかしたら、「⁠バージョン管理システムやバグ管理システムなら聞いた

    第1回 テスト管理システムとは何か? | gihyo.jp
    katow
    katow 2009/01/23
    テスト管理システムという考え方があることをはじめて知った。
  • 第4回 Railsで作るOpenID対応アプリケーション実践(前編) | gihyo.jp

    はじめに 今回はいよいよ、アプリケーションを作りながら、OpenIDの実践的な使い方を解説します。サンプルとして作成するアプリケーションは、ミニブログと呼ばれるつぶやきブログです。いわゆるTwitterクローンです。利用者はミニブログにログインして、一言つぶやきます。ブログの一種ですので、当然ユーザ認証が必要になります。普通はパスワードを用いた認証が一般的ですが、今回はOpenIDを用いてユーザを認証するようにアプリケーションを作成していきます。 さて、認証と簡単に言いましたが、認証に必要となる機能をもう少し具体的に列挙してみましょう。 ユーザ登録 サービスを利用するために必要な情報(IDやメールアドレスなど)を利用者に入力してもらい、データベースへ登録する。 ログイン(認証) 利用者が入力した認証情報(パスワードなど)を元に利用者を認証し、ログインの可否を判定する。ログインに成功した利用

    第4回 Railsで作るOpenID対応アプリケーション実践(前編) | gihyo.jp
    katow
    katow 2009/01/11
    Railsでミニブログを作る例を探していたら、OpenIDや最近の認証プラグインまとめ情報もあってうれしい。
  • 連載:エンジニアのためのSoulHacks | エンジニアマインド … 技術評論社

    SoulHack #11 「世間」からの離脱というオプションを予め評価しておこう 中島拓 2009-03-16

    連載:エンジニアのためのSoulHacks | エンジニアマインド … 技術評論社
    katow
    katow 2008/10/26
  • 1