miabiのブックマーク / 2007年11月2日

miabi id:miabi

2007年11月2日のブックマーク (3件)

Macを買ったらすぐに入れるアプリたち（Mac OS X 10.5対応版） - @i2kのブログ
Mac OS X 10.5（Leopard）が発売されたということで、さっそくMacBookにインストールしてみました。せっかくなので（？）クリーンインストール。そうするとアプリは全部入れ直し。ちまちまとインストール作業をしながら、前に書いた「Macを買ったらすぐに入れておかなければならないアプリの一覧」を更新しておきます。（追記）ぼちぼち情報を足したり直したりしています。インストールの前にアップグレードインストールの場合アップグレードインストールの場合、自分で入れたアプリやシステム拡張はそのまま引き継がれます。そのため10.5で立ち上がらなかったりシステムに悪影響を与える可能性があります。とくにトラブルが多いのはApplication Enhancer関係。事前のアンインストールをおすすめします。新規インストールの場合これは実体験。新規インストールの際にハードディスクのフォーマ
miabi 2007/11/02
mac

software

tool

まとめ
リンク
画像内の文字をコピー＆ペーストする
資料をもらったら画像だった──。そんなときもあきらめず。無償の「クセロReader ZERO」を使えば、画像をPDFに変換してOCRをかけ、テキストデータを抜き出すことができる。資料を引用したいのだが、手元にあるのは画像ファイル。ここから文字を抜き出すにはどうしたらいいか。画像を見ながら、手で打っていくしかないのか。クセロが新しくリリースする「クセロReader ZERO」を使えば、画像ファイルをドラッグ＆ドロップで読み込ませて、OCRをかけることが可能だ。これを使えば、画像内の文字を簡単にテキストデータに変換できる。あとは、Adobe Readerなどで開いて、コピーすればいい。この機能は、11月初旬に無償配布を開始するクセロReader ZEROに新機能として盛り込まれたもの。画像からPDFファイルを簡単に作成する機能や、画像PDFファイルにOCRをかけてテキストの透明レイヤーを
miabi 2007/11/02
pdf

ocr

tool
リンク
Google Japan Blog: 大規模日本語 n-gram データの公開
突然ですが、穴埋めクイズです。下線部に入る単語はなんでしょう? グーグルで_____ おそらく、「検索」「調べる」「探す」といった単語を思いつくのではないでしょうか？実際に、Webにあるドキュメントをくまなく調べ、「グーグルで」の後にくる単語を調べると、「検索」が1位であるとがわかります。一般に、直前の(N-1)個の単語を見て、次の単語を予測するモデルをN-gram言語モデルといいます。さきほどは、「グーグル」と「で」の2単語から次を予想しているので、3-gram言語モデルの例となります。現時点の単語が、直前の(N-1)個のみに影響を受けるという仮説は、一見現実離れしているようですが、実際には非常に有効な場合も多く、かな漢字変換、OCRのエラー訂正、機械翻訳、音声認識などに広く用いられています。たとえば、音声認識の場合、ノイズ等で現時点の単語をシステムが聞き取れなくても、言語モデル
miabi 2007/11/02
日本語
リンク
- 2007年11月8日
- 2007年11月2日
- 2007年10月31日