タグ

2012年11月2日のブックマーク (4件)

  • Account Suspended

    Account Suspended This Account has been suspended. Contact your hosting provider for more information.

  • 科学系論文/出版物の解析に特化·LA-PDFText MOONGIFT

    LA-PDFTextは科学系出版物のPDFを解析してテキストを抽出するソフトウェアです。 PDFは色々な出版物に対して使われています。今回は特に科学的な出版物のために使われているPDFのテキスト読み取るためのソフトウェア、LA-PDFTextを紹介します。 元のPDF。 実行中。 出力されたXMLファイルです。 サンプルとして幾つかのPDFがダウンロードできますが、段組みが使われていたり、複雑なレイアウトのものが多いようです。さらに解析に際してブロックの分類のためのルールを独自に作ることもできます。大量の論文などから情報を抜き出すのに良さそうです。 LA-PDFTextはWindows/Mac OSX/Linux用のオープンソース・ソフトウェア(GPL v3)です。 MOONGIFTはこう見る 学術の分野においてオープンソース・ソフトウェアは積極的に利用、開発されています。どこの研究所にお

    科学系論文/出版物の解析に特化·LA-PDFText MOONGIFT
  • IT系でも活用しなければ損。論文を読んで広がる知見 - @IT

    Java News.jp(Javaに関する最新ニュース)」の安藤幸央氏が、CoolなプログラミングのためのノウハウやTIPS、筆者の経験などを「Rundown」(駆け足の要点説明)でお届けします(編集部) 論文は、難しくない 読者の皆さんの中には、「論文」と聞くと身構えてしまう方も多いのではないでしょうか? 論文というと、書くのも読むのも大変で何だか小難しいことが書いてあるもののように思えるものです。それどころか、「論文とは縁がない」「プログラムがすべてだ」と思う方もいるかもしれません。しかし、ある特定分野の技術や研究を詳しく知るためには、論文は手軽で確実な情報源です。 よく論文が持つ意味について「巨人の肩の上に立つ」と例えられることがあります。これは、万有引力の研究で知られるニュートンも好んで引用していた言葉だそうです。「現代の学問は多くの研究の蓄積の上に成り立っている」ことを示す言葉

    IT系でも活用しなければ損。論文を読んで広がる知見 - @IT
  • 新着記事

    『フォトショップ・ブイアイピー』の新着記事です。フォトショップやデザインをたのしむウェブサイト。2009年3月創刊以来、3800を超えるコンテンツを更新しています。フリーフォントなどの無料デザイン素材/配色やWeb制作といった最新トレンドも公開中。

    新着記事