タグ

Perlに関するkatowのブックマーク (5)

  • perl や PHP で Excelファイル(xlsファイル)を簡単に出力する方法 | perl/CGI | 阿部辰也のブログ――人生はひまつぶし。

    perlPHP で、Excelファイル(拡張子が「.xls」のファイルとか)を出力するために、色々とライブラリみたいなものがあるみたいなんですが、裏技的でちょっと邪道な、もっと簡単な解決方法があります。 Excel で作った文書を保存する際に、「Webページとして保存」というメニューがあることからも想像できますが、Excelhtml文書を開いたら、普通に Excel 文書として読めるんですよね。 なので、 perlCGI や PHP で、Excel 形式で出力しようと思ったら、perlCGI や PHP でよく出力する Content-type ヘッダ一覧 (MIME-type)を参考に、以下のようなヘッダを出力。 #-- perl の場合 print qq|Content-type: application/vnd.ms-excel\n\n|; #-- PHP の場

    katow
    katow 2011/04/28
    ExcelファイルのダウンロードCGI
  • MeCab: Yet Another Japanese Dependency Structure Analyzer

    スクリプト言語のバインディング $Id: bindings.html 161 2008-02-03 09:58:46Z taku-ku $; 概要 各種スクリプト言語 (perl, ruby, python, Java) から, MeCab が提供する形態素解析の機能を利用可能です. 各バインディングは SWIG というプログラ ムを用いて, 自動生成されています. SWIG がサポートする他の言語も 生成可能だと思われますが, 現在は, 作者の管理できる範囲内ということで, 上記の4つの言語のみを提供しております. インストール 各言語バイディングのインストール方法は, perl/README, ruby/README, python/README, java/README を御覧下さい. とりあえず解析する MeCab::Tagger というクラスのインスタンスを生成し, pa

  • Windows用テキストマイニングツール"termmi"

    はじめに "termmi"はWindows上のテキストファイルの専門用語を複数ファイル間で比較するシステムです。Windows専門用語抽出システム"termex"を用いても複数ファイル間の比較は行えますが、重要度の比較が行いにくいなどの問題がありました。テキストマイニング専用に作成した"termmi"を使うことにより複数ファイル間の重要度の数値比較を有意に行えるだけではなく、各文献の共通部分などさまざ まな比較結果を求めることができます。 機能と使い方 1.複数のテキストファイル(Shift-JIS)を入れたフォルダを、termmiのアイコンにドラッグ&ドロップします。 (和文の場合は「専門用語分析(和布舞)」アイコン、 英文の場合は「専門用語分析(英文)」アイコンになります) 2.termmiの各サブフォルダに処理結果が保存されます。内訳は次のとおりです。 (1)outputフォルダ 処

    katow
    katow 2009/06/26
    termmiというテキストマイニングツール
  • ”専門用語(キーワード)自動抽出システム”のページ

    とりあえず使ってみる方はこちらから! 「言選Web」 "Gensen-Web" (Western Europe language) 「言選Web」(中文版) メインメニュー 1.専門用語(キーワード)自動抽出システムとは? 2.基システム New! 3.応用システム New! 4.関連文献 5.利用統計 2022.12.14 専門用語抽出Node.jsライブラリ termextract-nodejs のβバージョン(0.01b)をリリースしました。 2022.3.9 Python版TermExtractについて、Windows環境に合わせインストール手順を修正しました。python setup.py installからpip install .に変更します。ドキュメントの修正に合わせバージョンを0.02にアップしました。 2023.10.23 "言選Web" 静的サイト(JavaScri

    katow
    katow 2009/06/26
    キーワード抽出処理
  • 2行に渡るメールヘッダの正しい処理

    問題発生 長いメールヘッダの規定 MIMEの規定 正しいメールヘッダ復元の実装 問題発生 ある方より、メール投稿利用時に長い日語タイトルを付けると、途中に半角スペースが入ってしまうというバグ報告を受けました。 Subject: =?ISO-2022-JP?B?GyRCPmFHKz5hRys+YUcrPmFHKz5hRys+YUcrPmFHKz5hGyhC?= =?ISO-2022-JP?B?GyRCRys+YUcrPmFHKz5hRys+YUcrPmFHKz5hRys+YUcrPmFHKz5hGyhC?= のようにMIMEエンコードが長くなり空白が入ったときに、この空白がデコードされてもそのまま残ってしまうことが原因です。やっつけならこの空白を除去するだけで良いのですが、やっつけプログラムは最低なのできちんと調査してみました。 長いメールヘッダの規定 RFC 2822「Internet

    2行に渡るメールヘッダの正しい処理
    katow
    katow 2009/03/29
    MIMEエンコードの特殊な場合(2行に渡る場合)の対処例。
  • 1