タグ

2008年11月30日のブックマーク (6件)

  • DataImportHandler - Solr - Apache Software Foundation

    Data Import Request Handler Solr1.3 Most applications store data in relational databases or XML files and searching over such data is a common use-case. The DataImportHandler is a Solr contrib that provides a configuration driven way to import this data into Solr in both "full builds" and using incremental delta imports. Also see the DataImportHandlerFaq page. For simple usecases visit the DIHQuic

    Hayato
    Hayato 2008/11/30
    HttpDataSource Exampleとか見ると、とても面白い。wikipediaを取得してインデクスにぶち込んだりとか。
  • HTMLのマークアップを除去する...HTML文書からテキストファイルを作成(Javaを使用) - Object Design

    Home > Index > HTMLのマークアップを除去する...HTML文書からテキストファイルを作成(Javaを使用) HTMLのマークアップをJavaで除去する簡単な方法はないか、と調べてみると、 javax.swing.text.html.HTMLEditorKit.ParserCallback という 標準のJavaのクラスライブラリに含まれているクラスでできることが判明。 関連エントリー XSLTを使えばもっと簡単に処理できることが判明。ただし、対象となるファイルは well-formed な XML,XHTML。 XMLのマークアップを除去する...XML文書からテキストファイルを作成 STEP1 HTMLEditorKit.ParserCallback を拡張したHTMLParser を書く HTMLParser.java import javax.swing.text.

    Hayato
    Hayato 2008/11/30
    htmlのデタグ
  • Linux チューニング - Ext3 のパフォーマンスを最大化させる

    じつは自宅サーバのロードアベレージが上がり続けています。分析の結果、ボトルネックは I/O 処理でした。CPU は Athlon64 X2 4400+ ですが、まだまだ当分この CPU で間に合いそうです。HDD は当時は 7200 回転で最速だった HITACHI Deskstar T7K250 SATA2 250GB を RAID1 構成にしたのですが、今思えば速度優先で RAID0 にしておけば良かったと少しだけ後悔。 I/O がボトルネックに成っている理由ですが、Drk7jp が公開しているサービスの全てがキャッシュファイルを利用した高速化手法を取っているのですが、単純にそれらファイルの write 処理が追いついていません。常に何らかのプロセスで I/O 待ち状態が発生しているような状況です。抜的な解決方法としては disk を高速なものに交換する以外ありません。 というわけで

    Hayato
    Hayato 2008/11/30
    writebackでパフォーマンスチューニング。ただし電源をいきなり切った場合などにタイムスリップする可能性あり。キャッシュ領域などはこの方がよさそう
  • Filesystem in Userspace - Wikipedia

    Filesystem in Userspace (FUSE) はUnix系コンピュータオペレーティングシステム用のソフトウェアインタフェースである。権限を持たないユーザがカーネルコードを修正することなく独自のファイルシステムを作成できる機能を提供する。これは、ファイルシステムのコードをユーザ空間で実行することでなされるもので、その際FUSEモジュールは実際のカーネルインタフェースへの「橋渡し」しか提供しない。 FUSEはフリーソフトウェアであり、GNU General Public LicenseとGNU Lesser General Public Licenseに基づきリリースされている。FUSEのシステムは元々A Virtual Filesystem (AVFS) の一部だったが、SourceForge.net上で独立したプロジェクトとして分離された。 FUSEはLinux、FreeB

    Filesystem in Userspace - Wikipedia
  • James Shore氏「アジャイルの衰退と凋落」

    Spring BootによるAPIバックエンド構築実践ガイド 第2版 何千人もの開発者が、InfoQのミニブック「Practical Guide to Building an API Back End with Spring Boot」から、Spring Bootを使ったREST API構築の基礎を学んだ。このでは、出版時に新しくリリースされたバージョンである Spring Boot 2 を使用している。しかし、Spring Boot3が最近リリースされ、重要な変...

    James Shore氏「アジャイルの衰退と凋落」
    Hayato
    Hayato 2008/11/30
  • 第7回 表計算ツールCalcを使いこなす(その3)

    OpenOffice.orgの表計算ツールである「Calc」について,「基操作と数式の入力」「書式設定と日付入力」を説明した。今回は,罫線の引くなどして表を仕上げてみよう。 罫線を引く Calcの印刷プレビューを見ると分かるように,そのままではマス目は印刷されない(これはMicrosoft Excelでも同じである)。そのため,ユーザーが罫線を描く必要がある。罫線を引く操作は,Writerとほぼ同じだ。ドラッグで罫線を引いたり消したりする機能はないが,Writerとは違って斜め線を引くことができる。 全体に罫線を引く それでは,選択した範囲全体に線を引いてみよう(写真1)。 (1)罫線を引きたいセルを選択する (2)「書式」ツールバーの「外枠」ボタンをクリックする (3)「外枠」ダイアログが表示されたら,「田」を選択する 外枠を設定する 続いて,外枠だけを太線にしてみよう。ここでは,複数

    第7回 表計算ツールCalcを使いこなす(その3)
    Hayato
    Hayato 2008/11/30
    表を用紙サイズに収める