タグ

2011年8月28日のブックマーク (5件)

  • Wikipediaのデータからコーパス作成

    SIMPLE 用の学習コーパスを作成する方法について書いています. SIMPLEとは,統計的仮名漢字変換の学習用に作成された,単語と読みの組を単位とする1-gramモデルベースの変換エンジンのことです.ここで書かれているコーパス作成方法はWikipediaのデータに限らない一般的なデータに対して適用可能です. 流れ WikipediaのデータからWP2TXTを利用して日語テキストを抽出 KyTeaによって抽出した日語テキストを単語分割し,単語の読みを付与 準備する物 Wikipedia:データベースダウンロード の jawiki-latest-pages-articles.xml.bz2 WP2TXT 0.1.0 WP2TXT: Wikipedia to Text Converter Wikipediaの圧縮データから日語テキストを抽出するために使用します ここではコマンドラインで作

  • gistコマンドよりちょっと便利なgisty - SWDYH

    メモやちょっとしたスクリプトなどをペーストするとgitのリポジトリとして管理してくれるgistというサービスがあります。そのgistにコマンドラインから投稿するツールがあって、それは前に少し紹介したんですが、それをもうちょっと便利にしたものを作りました。 swdyh's gisty at master ― GitHub http://github.com/swdyh/gisty/tree/master gistコマンドとの違いはこんな感じです。 ポストするときにファイルを指定。ファイル名、拡張子つきでアップされる。 ポスト時に複数ファイルを指定できる。 ポスト後、ブラウザで開く。(Macのみ) ポスト後、ローカルにcloneする。 過去のgistにアップしたのを全部のclone、またはpullする機能 gistyを使うと簡単にファイル名と拡張子つきでポストできて、そのままローカルにclon

    gistコマンドよりちょっと便利なgisty - SWDYH
    hrstt
    hrstt 2011/08/28
  • Macでフォント描画のアンチエイリアシングが効かない問題を解決する

    会社から仕事用マシンとしてMacBook Pro (13 Early 2011)が支給されて、非常に快適に仕事をしている。今までのWindows機は外部モニタを2枚つないで体は閉じていたのだが、Macになってからは体のモニタ+外部モニタ構成にしたので、机の上もだいぶ省スペースにできた。 ところが、更なる快適さを求めてプライマリモニタを体から外部モニタに変えてみたら、微妙な落とし穴にハマってしまった。 Twitterで嘆いたら幸いにもすぐ反応をいただき、しかもそれがドンピシャ。見事翌日には解決したので、経緯をメモとして残しておく。 現象フォントのアンチエイリアシングがおかしい。かかってはいるが、なにかかすれている感がある。 こんな感じ。 いろいろ検証した結果、「外部モニタが接続され、そのモニタがプライマリ(メニューバーがあるほう)に指定されている」状態で起動したアプリケーションがこの現

    hrstt
    hrstt 2011/08/28
  • 小規模Webサービス向け安上がりシステム構成と開発フロー(怖話.jp) - Fjord, Inc(株式会社フィヨルド)

    こちらのエントリーが大変参考になったので、僕らが作ってる怖話.jp(kowabana.jp)のシステム構成や開発方法についても公開していこうと思います。 怖話.jpはスマホ向けWebサービスなのでPC向けとはPVとかの傾向がちょっと違うかも知れません。 怖話.jpとは スマホで17,000話以上のサウンドノベル風の怖い話が閲覧・投稿できるサイト(アプリではありません)です。詳しくは下記エントリーを参照してください。 スマホでサウンドノベル風怖い話投稿サイト | FJORD, LLC(合同会社フィヨルド) 7月16日にRubyKaigi2011に合わせて無理矢理ベータテストオープンして、8月9日に正式オープンしましたので正式オープンからは1ヶ月経ってないまだまだのサイトです。開発期間は約1ヶ月ぐらいです。 サイト情報 (これAnalyticsを直接貼るのはどうやればいいんだろう?) 直近一ヶ

    小規模Webサービス向け安上がりシステム構成と開発フロー(怖話.jp) - Fjord, Inc(株式会社フィヨルド)
  • Librato Silverline

    "We love the graphs!" - Ryan Tomayko, Dev and Systems Workload Management Take control of server resources with application level, container-based SLA management. Build policies and get metrics on the state or your system. Prevent crashes with policy based application containers. Learn More... Application Monitoring Track individual application resource consumption or group multiple applications u