タグ

オープンソースに関するemihalのブックマーク (3)

  • MOONGIFT: » タイトル・本文抽出クローラー「Webstemmer」:オープンソースを毎日紹介

    これはやばい!凄すぎる。 現在進めようと思っているプロジェクトでは、サイト上の文抽出が重要な技術になっていた。だが、それを一から開発していたのではあまりに時間がかかってしまう。さらに重要な技術ではあるが、それが売りと言う訳ではなかった。 そこで見つけたのがこのソフトウェアだ。まさに理想的な方法かも知れない。 今回紹介するオープンソース・ソフトウェアはWebstemmer、タイトル・文抽出クローラーだ。 WebstemmerはPythonで作られたクローラーで、Webクローラー/レイアウト分析/テキスト抽出/URL DB操作/簡易的なテキスト抽出の5つの機能が提供されている。 動作原理については公式サイトを参考にして欲しいが、個人的にも考えていた(考えていただけ)方法に近い。学習時間が長いのが難点だが、複数台のPCで分散化できれば問題なくなるだろう。 特徴的なのは、特定の言語に左右される

    MOONGIFT: » タイトル・本文抽出クローラー「Webstemmer」:オープンソースを毎日紹介
  • オープンソース市場を席巻する新たなビジネス・モデル | “ビジネスの論理”がオープンソースの基本理念を破壊する? - CIO Online

    オープンソース市場を席巻する新たなビジネス・モデル “ビジネスの論理”がオープンソースの基理念を破壊する? 関連トップページ:ベンダー・マネジメント | オープンソース/Linux | 【特別企画】Technology Update オープンソース・ソフトウェアは、ユーザー企業にとっては大いに魅力的なものである。だが、ユーザー企業が注目すればするほど、そこにビジネス・チャンスを見いだそうとする動きが活発化することも確かだ。実際、すでに市場には、オープンソース・プログラムを“利用”した新たなビジネス・モデルが生まれつつある。もし、CIOがこうした動向を知らずに不用意にオープンソース製品を導入すれば、後で高額の請求書を突きつけられるおそれもある。稿では、急速に“ビジネス色”に染まりつつあるオープンソース市場の最新事情を紹介しながら、企業におけるこれからの「オープンソース戦略」のあり方を考察

  • 「会社に閉じこもらず交流しよう」---びぎねっと CEO 宮原徹氏

    いくつものオープン・ソース関連コミュニティのスタッフを務めるなど,コミュニティの“盛り上げ役”として知られる宮原氏。自らの企業「びぎねっと」で初心者のためのコミュニティ運営やセミナー開催など,オープン・ソース・ソフトウエアとネットワーク・ユーザーの輪を広げる活動を行っている。宮原氏に,これからオープンソースを使ってみようとする人へのメッセージなどを聞いた。(聞き手はIT Pro 高橋 信頼) この会社を始めたのは,オープン・ソース・ソフトウエアをもっと多くの人に使ってもらいたいと思ったからです。オープン・ソースやネットワークって,分かる人にとってはたくさん情報があるんですけど,分からない人にはハードルが高い。まだ手が届いていない人をステージに上げるお手伝いをしたい。そのために,セミナーを開催したり,無料で参加できて,初心者が気軽に相談できるメーリング・リストを運営したりしています。 セミナ

    「会社に閉じこもらず交流しよう」---びぎねっと CEO 宮原徹氏
  • 1