タグ

2012年1月4日のブックマーク (6件)

  • N-gram 漢字<=>かな変換 - アスペ日記

    @gologo13さんの言語モデル配布ページのデータを利用して簡単な漢字->かな/かな->漢字変換ができないかなーと思って作ってみた。 言語モデルの作成には SRILMを使用。 配布中のデータを SRILM で扱うには多少加工しないといけないので、その変換スクリプトも作った。 GitHub リポジトリは https://github.com/hiroshi-manabe/ngram-converter 。 [追記]最新のバージョンでは、4-gram のかな漢字変換用辞書をあらかじめリポジトリに入れてある。 marisa-trie モジュールさえ入れてあれば、 ./converter_sample.py --dicname-prefix=dics/bccwj4_rev_dic --order=4 --interactiveですぐにかな漢字変換が実行できる。 まず、@gologo13さんの言語

    N-gram 漢字<=>かな変換 - アスペ日記
  • 第7章 言語モデル

    Julius は認識のための言語制約として,いくつかの種類の言語モデルをサポー トしている.統計モデルである単語 N-gram モデルに基づく認識,記述文法に基づく認識,および単語リストのみによる孤立単語認識を行うことができる. また,ライブラリとして他のアプリケーションに組み込まれるとき,アプリケー ション側から何らかの言語制約を提供するユーザ関数を与えることで,その言語制約を直接駆動して認識処理を行うことができる. 言語モデルは,言語モデルインスタンスごとに個別に指定できる.一つの言語モデルインスタンスには一つのモデルしか指定できない(ただし文法については一つのインスタンス内で複数の文法を使うことができる).複数の言語モデルインスタンスに対してそれぞれ異なるタイプのモデルを指定することで,複数の異なるモデルを同時に用いて認識することもできる. 章では,各言語モデルで共通である単語辞書

  • 健康ナレッジ

    ダイエットにトライしてはみたものの、欲に打ち勝てずにあきらめてしまう」とため息をついている人には、酵素ドリンクを有効利用しながら実行するプチ断ダイエットがおすすめです。 生活習慣病というのは、ご想像の通りいつもの生活習慣が元凶となる病気です。常日頃より健康に良い事や簡単な運動、熟睡を意識すべきでしょう。 筋肉疲労にも精神疲労にも必要なのは、栄養の補充と適切な睡眠だと言えます。我々人間は、事で栄養を補給してしっかり休息すれば、疲労回復するようにできているというわけです。 血圧が気に掛かる人、内臓脂肪が気に掛かる人、シミが気に掛かる人、腰痛に苦しんでいる人、それぞれ入用な成分が違いますので、入手すべき健康品も異なることになります。 便秘になって、滞留していた便が腸壁にしっかりこびりついてしまうと、大腸内部で腐敗した便から吐き出される毒性物質が血液を伝って全身を巡り、皮膚炎などを引き

  • 佐々木俊尚「キュレーションの時代」特集 - ブクログ

    キュレーション【curation】とは、無数の情報の海の中から、自分の価値観や世界観に基づいて情報を拾い上げ、 そこに新たな意味を与え、そして多くの人と共有すること。ー 文より 著者 佐々木俊尚さんからのメッセージ この「キュレーション」という言葉がいま、インターネットの世界を席巻しようとしています。情報の膨大なノイズの海の中から、どうやってキラリと光るあなただけに重要な情報を取り出すのか。劣化したマスメディアでなければ、無味乾燥な検索エンジンのアルゴリズムでもない。情報と人を結びつけ、そこに人と人のつながりをも生み出す新たな概念「キュレーション」。このでは、芸術や音楽、茶道、陶器、歴史などさまざまな文化的エピソードを紹介しながら、21世紀の新たな情報共有圏の世界を明らかにしていきます。

    佐々木俊尚「キュレーションの時代」特集 - ブクログ
  • 急がばまわれ式・堅実で一番効率的な英語の勉強法

    急がばまわれ式・堅実で一番効率的な英語勉強法 はてな界隈では、定期的に英語の習得法が話題になるが、俺もそろそろ参入してみようかな、と。 ■自己紹介 俺の英語力は、TOEIC975点、実用書・平易なペーパーバックなら辞書なしで速読できるレベル。 CNN/BBCが字幕なしで理解できて、それなりに気のきいたことも英語で話せる。 語彙力は、http://www.wordengine.jp/vcheckで測定してみたところ、約20000語。 海外経験なしで、毎朝コツコツと勉強してきた。 ■趣旨 英語力を身につける=ピラミッドを構築する作業である。 だが、巷にあふれかえる英語勉強法は、基礎力がないのにいきなり実践を勧めるものが多い。 例えば、臆せずに何でもいいからしゃべってみろだの、辞書をひきながらを読めだの。 この手の勉強方法は、学習者のコンフォート・ゾーン(快適な領域)を外れることが多く、大

    急がばまわれ式・堅実で一番効率的な英語の勉強法
  • こう言い換えろ→論文に死んでも書いてはいけない言葉30

    Author:くるぶし(読書猿) twitter:@kurubushi_rm カテゴリ別記事一覧 新しいが出ました。 読書猿『独学大全』ダイヤモンド社 2020/9/29書籍版刊行、電子書籍10/21配信。 ISBN-13 : 978-4478108536 2021/06/02 11刷決定 累計200,000部(紙+電子) 2022/10/26 14刷決定 累計260,000部(紙+電子) 紀伊國屋じんぶん大賞2021 第3位 アンダー29.5人文書大賞2021 新刊部門 第1位 第2の著作です。 2017/11/20刊行、4刷まで来ました。 読書猿 (著) 『問題解決大全』 ISBN:978-4894517806 2017/12/18 電書出ました。 Kindle版・楽天Kobo版・iBooks版 韓国語版 『문제해결 대전』、繁体字版『線性VS環狀思考』も出ています。 こちらは10刷

    こう言い換えろ→論文に死んでも書いてはいけない言葉30