タグ

2014年2月27日のブックマーク (2件)

  • 多言語索引ライブラリ I18n Index Library

    アンテナハウスは2月6日 I18n Index LibraryV2.2をリリースしました。 DITA DocBookのコンテンツから多言語索引を作成するための多言語索引で海外では人気商品です。国内でもDITAの普及に伴い、主にグローバル企業より問い合わせが多く、ご利用いただくお客様が増えてまいりました。このライブラリをDITA OT (Open Toolkit)に組み込んで、PDF, HTML, EPUB プラグインと共にご利用いただけます。PDF5を使ってDITAからXSL-FOへの変換処理を行いAH Formatterで最終的にPDF出力を行います。 PDF5はアンテナハウスが DITA-OT用に開発したプラグインです。DITA 1.2のindex 機能をほとんど実装しており、こちら(http://dita-ot.github.io/)から入手可能です。 DITA-OTはDITAのパブ

    多言語索引ライブラリ I18n Index Library
  • twitterのデータをSPAMとHAMに分けてみる - Qiita

    動機 前々からtwitterのデータを使って何かやってみたいな、と思っていました。そこで、MeCabとcabochaを入れるところから、SQLiteを活用した簡単な分類器を作るってみた次第です。 (遊びでやってみただ(ry ) 以下、やったことを適当にまとめていきます。 インストールしたもの MeCab 0.996 mecab-python-0.996 Virtual C++ 2008 Express Edition(vcvarsall.batが必要なためです) Cabocha(今回は使いませんので説明も全くしませんが、今後のために...) インストール方法などに関してはWindowsにmecab-pythonを導入を参考にして下さい。 このサイトでも太字で書いてあるのですが、mecab.hを書き換える時は必ず管理者権限で開いて変更を行って下さい。でないと、変更されたと認識されません。僕も

    twitterのデータをSPAMとHAMに分けてみる - Qiita