IGA-OSのブックマーク / 2007年6月22日

MOONGIFT: » Googleが手がけるOCR「Tesseract OCR」:オープンソースを毎日紹介

新しいサービス（といっても大層なものではない）を作ろうと思った時に、画像の中の文字列を読み取る仕組みが必要な事に気づいた。いわゆるOCRだ。オープンソースのOCRはごく僅かだが存在する。今回はその中の有力なものを紹介しよう。今回紹介するオープンソース・ソフトウェアはTesseract OCR、Googleが手がけるOCRエンジンだ。 Tesseract OCRは元々、HPが開発していたもので、それをGoogleが開発を引き継ぐ形でオープンソース化されたソフトウェアだ。英語圏のソフトウェアなので日本語の読み込みには対応していないが、性能自体は高い評価を受けている。実際試してみた限りでは、変換率50%を越えているだろう。一段の文章であれば問題なく変換できるが、多段組になっている文章やグレースケール等はうまく解析することはできない。 GoogleはGoogle Book Searchなどで

IGA-OS 2007/06/22

やっぱり英語向けのOCR

リンク

オープンソースOCR·GNU Ocrad MOONGIFT

昨日に引き続きOCRソフトウェアのご紹介。このOCRと言う分野は今後のデジタル化推進の上で重要な技術になり得るのだが、どうもオープンソースではあまり流行っていない。そんな中、数少なくも存在するOCRエンジンがこれだ。今回紹介するオープンソース・ソフトウェアはGNU Ocrad、CUIベースのOCRエンジンだ。 GNU Ocradは画像を使って文字抽出が可能だが、その形式はPBM、PGM、PPM、PNMに限定される。通常の画像（PNGなど）であれば、ImageMagick等を使って変換する必要がある。実際に認識させてみた限りでは結果は良好だ。手書き等ではあまり良くないだろうが、コンピュータ出力の文字列を認識させたり、新聞や雑誌などの文字であればまずまずなのではないかと思う。もちろん、日本語の解析はできないので、運用される場面は限られてしまうだろう。だが、英文の文書や写真などの解析では

IGA-OS 2007/06/22

日本語OCRソフト

software

リンク

プチプチを無限につぶし続けられる「∞(むげん）プチプチ」発売

荷物を送るときなどに衝撃から物を守るために緩衝材として使われる「プチプチ」。この「プチプチ」の気泡をつぶしたときの感触があまりに心地よいため、衝撃を守るための本来の目的ではなく、ただひたすらつぶすために購入する人もいると言われるアレが、キーチェーン型玩具になってバンダイから販売されるそうです。発売予定は9月下旬で価格は税込819円。主要なターゲットは20代～30代の男女らしいですが、プチプチ好きはこの年齢層の人が多いのでしょうか。詳細は以下から。～何回つぶしてもなくならない！？無限につぶせる「プチプチ」が登場！～『∞(むげん)プチプチ』９月下旬発売バンダイプレスリリースカラーはホワイト・ブラック・ピンク・オレンジ・ブルーの5色。ボタンが8つ付いており押すたびに、あの独特の感触が味わえるようです。「プチプチ」の発売元である川上産業株式会社のお墨付きとのことで再現度の高さはかなり

IGA-OS 2007/06/22

goods
gadget

リンク

TechCrunch | Startup and Technology News

The best known mycoprotein is probably Quorn, a meat substitute that’s fast approaching its 40th birthday. But Finnish biotech startup Enifer is cooking up something even older: Its proprietary single-cell…

IGA-OS 2007/06/22

にぎやかなことです

mac

リンク

「無料で手軽だから」――マツダ、Twitterをキャンペーンに活用

マツダが、Twitterをキャンペーンに活用している。「MazdaRotary」のアカウント上で、40周年を迎えたロータリーエンジンについてのファンからのコメントを、1日5本程度更新中だ。Twitterのビジネス利用は一部で始まっているが、日本の大手企業がマーケティングに利用するのは珍しい。「『Twitterを使ってマーケティングを』と真剣に考えたというよりは、こういうのがあるからやってみようという軽いノリでした」と、同社の樋笠順子さん（広報渉外本部グローバル広報企画部企画・経営グループアシスタント・マネージャー）は言う。キャンペーンでは、40周年記念日までをカウントダウンできるブログパーツを配布。ブログパーツの“おまけ”機能として、ファンがロータリーエンジンについての思い出などを、25文字までのテキストで書き込んで他ユーザーと共有できるブログパーツを配布した。Twitterに投稿して

IGA-OS 2007/06/22

おもしろい～

twitter

リンク

小粋空間: Movable Type が WordPress に負けた本当の理由

Movable Type と比較して WordPress が人気なのは、「再構築が不要」とか「インストールが簡単」とか「デザインが豊富」とか、国内ブロガーの評価を頼りにしていましたが、下記の記事の一文を読んで、米国で Moovable Type の人気が急激に落ち、WordPress にシェアを明け渡した本当の理由を知りました。 Movable Type 4.0 ベータ、ローンチ―第3四半期にもオープンソース化へ MTユーザーとSixApartの間には波乱の歴史がある。Movable Typeは決してオープンソースプラットフォームではなかったのだが、MT 3.0のリリース以前は多くのユーザーがMTをオープンソースであるかのように扱っていた。2004年のMT 3.0のリリースと同時にライセンス契約が強制されるようになったことでユーザーコミュニティーからは激しい非難の声（私の声もかなり声高に混

IGA-OS 2007/06/22

良い分析ですね。確かにライセンス形態が変わって使う気が萎えたのは本質としてありますね・・・

blog
mt

リンク

【年金問題】なぜだ！社保庁、ボーナス満額…３４．６歳で６２万円 : 痛いニュース(ﾉ∀`)

【年金問題】なぜだ！社保庁、ボーナス満額…３４．６歳で６２万円 1 名前：☆ばぐた☆ ◆JSGFLSFOXQ ＠☆ばぐ太☆φ ★ 投稿日：2007/06/21(木) 17:39:24 ID:???0 「消えた年金」問題で、国民の怒りが津波のごとく押し寄せている社会保険庁。次々とデタラメぶりが暴露されているが、何と、同庁職員は今年夏のボーナスを満額受け取る方向であることが分かった。その額、平均３４．６歳で約６２万円といい、単純計算で総額約１０５億円。民間企業では考えられない非常識で恥知らずな対応。この組織はどこまで国民をバカにするのか。「責任の所在が明らかになっていないので、期末・勤勉手当（＝民間でいうボーナス）については、返納するかどうかも含めて方向性は決まっていない」社保庁職員課の担当者は夕刊フジの取材にこう答えた。同庁職員がボーナスを受け取るのは、毎年６月と１２月のそれぞれ月

IGA-OS 2007/06/22

どうせ解体だし？国民感情としてはゆるせんけどね

リンク

TechCrunch Japanese アーカイブ � Skitchの画像編集、共有ツール: デスクトップ、オンラインアプリの完璧な融合

Silo, a Bay Area food supply chain startup, has hit a rough patch. TechCrunch has learned that the company on Tuesday laid off roughly 30% of its staff, or north…

IGA-OS 2007/06/22

Windowsはない・・・残念なり

リンク

西田宗千佳のPostscript: Googleデスクトップ検索とOneNote

6/14の記事で述べたように、私はほとんどの情報をパソコン上に集約しています。こんな使い方をするには、優秀な検索技術が必要になります。以前はアプリケーション毎の検索を使うことの方が多かったのですが、いまはすっかり「Google デスクトップ検索」（GDS）に依存しています。パソコン内を横断検索するツールとしては、すでにおなじみのものですから、詳細は省きます。 GDS登場以来、様々な検索ツールが登場しました。MSも、MSNツールバーの最新版にて、IEへのタブ機能と検索機能（Windows Desktop Search）の両方を追加しました。英語版ですが、日本語環境でも問題なく動作し、検索も行えます。動作も比較的機敏だし、操作性も悪くないので、ブラウザとしてIEをメインに使っている人ならば、十分使えるツールです。（ただし、日本語文書の場合、文字コードがUTF-8であるものでは文字化けが起こる

IGA-OS 2007/06/22

OneNote使いがGoogle Desktopを使うための設定がある。

google

リンク

はてなブックマーク

タグ

2007年6月22日のブックマーク (9件)

MOONGIFT: » Googleが手がけるOCR「Tesseract OCR」:オープンソースを毎日紹介

オープンソースOCR·GNU Ocrad MOONGIFT

プチプチを無限につぶし続けられる「∞(むげん）プチプチ」発売

TechCrunch | Startup and Technology News

「無料で手軽だから」――マツダ、Twitterをキャンペーンに活用

小粋空間: Movable Type が WordPress に負けた本当の理由

【年金問題】なぜだ！社保庁、ボーナス満額…３４．６歳で６２万円 : 痛いニュース(ﾉ∀`)

TechCrunch Japanese アーカイブ � Skitchの画像編集、共有ツール: デスクトップ、オンラインアプリの完璧な融合

西田宗千佳のPostscript: Googleデスクトップ検索とOneNote

お知らせ

今週のはてなブックマーク数ランキング（2024年8月第1週）

月間はてなブックマーク数ランキング（2024年7月）

今週のはてなブックマーク数ランキング（2024年7月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス