タグ

ブックマーク / www.moongift.jp (3)

  • クライアントサイドの全文検索エンジン·lunr.js MOONGIFT

    lunr.jsはJavaScript製のオープンソース・ソフトウェア(MIT License)です。 Webサイトを運営していて、煩雑な仕組みになりがちながらも実装を考えなければならないのが全文検索エンジンです。もし作ろうとしているのがWebアプリケーションであれば、いっそのことクライアントサイドで提供してみるのはいかがでしょう。lunr.jsを使えば手軽に実現できます。 デモアプリケーションです。左上に検索ボックスがあるのが分かるかと思います。 検索はインクリメンタルに行われます。ただし全文と言ってもタグとして指定された文字だけに限定されるようです。 インデックスの作り方です。まずindexとしてフィールドを作り、その後addメソッドを使ってオブジェクトを追加していきます。 lunr.jsではテキスト処理部分を別で設ける事ができますので非英語圏では別途分かち書きを行ってインデックス化でき

    クライアントサイドの全文検索エンジン·lunr.js MOONGIFT
  • 科学系論文/出版物の解析に特化·LA-PDFText MOONGIFT

    LA-PDFTextは科学系出版物のPDFを解析してテキストを抽出するソフトウェアです。 PDFは色々な出版物に対して使われています。今回は特に科学的な出版物のために使われているPDFのテキスト読み取るためのソフトウェア、LA-PDFTextを紹介します。 元のPDF。 実行中。 出力されたXMLファイルです。 サンプルとして幾つかのPDFがダウンロードできますが、段組みが使われていたり、複雑なレイアウトのものが多いようです。さらに解析に際してブロックの分類のためのルールを独自に作ることもできます。大量の論文などから情報を抜き出すのに良さそうです。 LA-PDFTextはWindows/Mac OSX/Linux用のオープンソース・ソフトウェア(GPL v3)です。 MOONGIFTはこう見る 学術の分野においてオープンソース・ソフトウェアは積極的に利用、開発されています。どこの研究所にお

    科学系論文/出版物の解析に特化·LA-PDFText MOONGIFT
  • Adobe AIRでコードスニペットを管理する·Snippely MOONGIFT

    SnippelyはAdobe AIR製のオープンソース・ソフトウェア。システム開発やデザインを行っていると残しておきたいコードが生まれることが多々ある。元々書かれていたコードの場合、コメントアウトして残しておくことも考えられるが見栄えは良くない。またTips的なテクニックでよく使い回すコードが生まれることもある。 ちょっとしたコードのTipsを貼付けておく そのような時に使えるのがコードのスニペット(断片)を管理するソフトウェアだ。Webベースでも幾つかサービスが存在するが、業務用など見せられない場合も多い。またOSが入り交じった環境下でみんなで使うにはAdobe AIRを使うのがお勧めだ。それがSnippelyだ。 Snippelyはメーラーのような3ペイン構成になっているソフトウェアで、一番左にグループ、右上がコードのタイトル、右下が実際のコードと言う構成になっている。デフォルトはテキ

    Adobe AIRでコードスニペットを管理する·Snippely MOONGIFT
    chalcedony_htn
    chalcedony_htn 2009/11/02
    まだ触ってないけど、シンプルそうでいいかも。あとで見る
  • 1