タグ

2010年11月17日のブックマーク (3件)

  • Python による日本語自然言語処理

    はじめに この文書は、 Steven Bird, Ewan Klein, Edward Loper 著 萩原 正人、中山 敬広、水野 貴明 訳 『入門 自然言語処理』 O'Reilly Japan, 2010. の第12章「Python による日語自然言語処理」を、原書 Natural Language Processing with Python と同じ Creative Commons Attribution Noncommercial No Derivative Works 3.0 US License の下で公開するものです。 原書では主に英語を対象とした自然言語処理を取り扱っています。内容や考え方の多くは言語に依存しないものではありますが、単語の分かち書きをしない点や統語構造等の違いから、日語を対象とする場合、いくつか気をつけなければいけない点があります。日語を扱う場合にも

  • EPUB仕様策定の当事者たちが語る。EPUBとは何か、歴史的経緯と最新の進捗状況

    電子書籍フォーマットの1つとして注目が高まっているのがEPUBです。EPUBは、HTMLCSSといったWeb標準によって構成されているのが最大の特徴ですが、現在の使用ではまだ縦書きやルビといった日語対応が十分ではありません。 しかし来年5月に制定予定のEPUB3ではそれらに対応する予定で、それがEPUBに注目が集まっている大きな理由でもあります。 11月15日に行われたWebデベロッパーのためのイベント「Web Directions East 2010」において、このEPUBの仕様策定に関わっている当事者たちが登壇し、EPUBとは何か、そしてその現状がどうなっているのかを解説するセッションが行われました。 この記事では、そのセッションの内容を紹介しましょう。 EPUBの概要 村田真氏は、電子書籍のフォーマットを策定する米国の団体IDPF(International Digital Pu

    EPUB仕様策定の当事者たちが語る。EPUBとは何か、歴史的経緯と最新の進捗状況
  • PDF文書でのテキストの折り返し

    デスクトップのモニタサイズが限られたユーザでも文書が読みやすいように、Adobe® Acrobat®のウィンドウ内で任意のサイズに合わせて折り返しできるAdobe PDF文書を作成することができます。折り返された文書では、ウィンドウサイズが変化してもテキストの元の大きさは保持されるので、読みやすくなります。また、ウィンドウサイズが小さいときは、画像のサイズがウィンドウサイズに応じて小さくなるので、一目で全体を見渡すこともできます。 ここでは、Windows®版 Microsoft® Office 2000 の文書から折り返し可能な Adobe PDF文書を作成する方法を学習します。 WindowsMicrosoft Office 2000アプリケーションで、文書を開きます。Acrobat/変換設定の変更を選択します。「Office」タブをクリックします。「PDF内にタグを埋め込む」オプ