タグ

textに関するdzd12061のブックマーク (2)

  • @IT:Windows TIPS -- Tips:ファイルの文字コードを変換する

    Windows OSや、UNIX/Linuxなど、マルチプラットフォーム環境で作業を行っている場合、文字コードの差異に悩まされる状況は少なくない。例えば、Windows環境で作成したソース・コードをUNIX/Linux環境で動作させるようなケースでは、いちいちShift_JISで記述したコードをEUC-JPに変換するなどの必要がある。 しかしサンプルを用いることで、特定のフォルダ配下に納められたテキスト・ファイルの文字コードを一括で変換することができる。フォルダ配下のサブフォルダまで再帰的に処理されるため、対象ファイルの指定もシンプルだ。あるプロジェクトに属するファイル一式を、一気に変換したいという場合などに威力を発揮するだろう。 なおTIPSを利用するには、Basp21という、メール送信/コード変換用の追加コンポーネントがコンピュータにインストールされていることが条件となる。コンポー

  • ヤフー、文章を解析できるAPI「日本語形態素解析Webサービス」を公開ニュース - CNET Japan

    ヤフーは6月18日、開発者向けサイト「Yahoo!デベロッパーネットワーク」において、日語の文章を解析できるAPI「日形態素解析Webサービス」を公開した。 日形態素解析Webサービスは、ヤフーの日語処理技術部がYahoo! JAPAN研究所と共同で開発を進めてきた形態素解析エンジン「Web MA」を社外の開発者向けにAPIとして公開するもの。このエンジンは、ヤフーのブログ検索や商品検索などのテキスト処理、ブログ検索の「評判検索機能」、「まとめ検索機能」などのテキストマイニング処理にも利用されている。 このAPIを利用することで、開発者は解析対象となる日語の文章を形態素に分割し、品詞や読み、基形を取得できるほか、対象となる文章に多く含まれている単語、その文章を構成する特徴的な単語などを把握することが可能だ。 また、すでに公開済みのAPIから取得したデータを解析することもでき

    ヤフー、文章を解析できるAPI「日本語形態素解析Webサービス」を公開ニュース - CNET Japan
  • 1