ドットインストール代表のライフハックブログ
統計的自然言語処理エンジンStaKK を開発しました。nokuno’s stakk at master - GitHub 以下、READMEからの引用です。 現在の機能 かな漢字変換 予測変換 または サジェスト スペル訂正 形態素解析 HTTPによるAPIサーバ Trieの直接操作現在は、StaKK は辞書として Mozc (Google日本語入力のOSS版)のデータを使っています。 リバースモードについてStaKK はノーマルモードとリバースモードの2つのモードを持っています。 ノーマルモードでは、かなを入力し、単語(主に漢字)を出力します。 リバースモードでは、単語を入力し、読みや品詞を出力します。これらの2つのモードの応用例をまとめると、次の表のようになります。 機能 ノーマルモード リバースモード Convert かな漢字変換 形態素解析 Predict 予測変換 検索ワードのサ
道端で出会った植物や生き物の名前を知りたい時、また動物園や植物園に出かける際のおともにも便利な「図鑑」。ただ眺めているだけでもわくわくしますよね。今回は、ネットで見られる動物や植物の「図鑑」を集めてみました。 ■動物、魚、虫、植物…「生き物全般」の図鑑 まずご紹介するのは、生き物全般について調べられるサイトです。 ▽http://www.tbs.co.jp/seibutsu/zukan/ ▽インターネット図鑑『自然界』 これらのサイトでは、ほ乳類、鳥類、魚類といった種類や見た目、生息している地域などから、様々な生き物を検索できます。 ■「植物」の図鑑 続いては花や野菜、キノコなど「植物」について学べるサイトです。 <花> ▽HugeDomains.com - Shop for over 300,000 Premium Domains こちらの「花図鑑」では科名や50音順、分類や季節で花を検
フランス・パリ(Paris)で撮影した古い辞書(2003年11月27日撮影、資料写真)。(c)AFP/JEAN-PIERRE MULLER 【5月15日 AFP】「サイホン」に関する誤った定義が世界中の辞書に掲載されていると、オーストラリアの物理学者が指摘した。 オーストラリア・クイーンズランド大学(University of Queensland)の物理学者スティーブン・ヒューズ(Stephen Hughes)氏は「インターネット上も含めて手当たり次第にいろいろな辞書をあたったが、サイホンの原理を正しく説明している辞書はひとつもなかった」と語る。 サイホンは多くの場合U字またはV字型をした管で、日常生活では魚の水槽の水の交換や、ガソリンをタンクから別のタンクへ移し変えるときなど、ある容器から別の容器に液体を移す際に使われる。サイホンの管内を液体が移動するのは「大気圧」の力によるものだとさ
Google 日本語入力用の辞書を探してたら、結構な数が公開されていたので、まとめておきます。 Apple用語辞書 林檎塾: Google日本語入力のApple用語辞書1.2に更新 郵便番号辞書 郵便番号辞書(for Google 日本語入力) 2009.11.30更新版 登録方法 with 根性 NADのカタカナ英語/顔文字辞書(Microsoft IME/Shift JIS で取り込み) Vector:NADのカタカナ英語/顔文字辞書(GoogleIMEβ) (データ / 文書作成) - ソフトの詳細 2ちゃんねる顔文字辞書 2ちゃんねる顔文字辞書 MatsuCon 和英辞書 google-ime-user-dictionary-ja-en - Project Hosting on Google Code 英語辞書 もにーそんぐ: Google日本語入力の辞書ファイルで英語辞書を作って
有害ワードを監視し問題を早期解決 暮らしを脅かす危険性のある隠語やアダルト、センシティブなどの危険用語 コミュニケーションにおいて、相手を不快にさせてしまう可能性のある不快語とともにデータセットにてご提供いたします
『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day
MeCabは形態素解析のためのソフトウェアです。日本語を分かち書きするために使われるものとしては最も人気の高いものだと思われますが、チャットや掲示板に書き込まれるような崩した日本語や、正しく書かれた日本語でも新語を期待した通りに分かち書きしてくれないことがあります。これはMeCabの内部で使われている辞書が一般的な言葉を情報源としているわけではないことに関係があります。MeCabというか、より一般的な話ですが以下のような認識が一般的かと思われます。 というのも、一番広く使われているであろう自然言語処理技術は形態素解析(単語分かち書き、と言ったほうがいいのかもしれない)であろうが、これは現在99%くらいの精度になっていて、すでに人間がやるより遙かに高精度で行えるのだが、これだけ高い精度が出せるのは新聞記事を相手にしたときだけであって、それは新聞記事をコーパスとして用いる機械学習により形態素解
Nikon D40 / Kyoto. パソコンで使えるポップアップ辞書環境についての続報です。以前記事を書いたように、かつてはDokopop+PDICを愛用していたけれど、Firefox3ではDokopopが使えないため、Fast Look up Alcに移行したという話を前回書きました。しかし、辞書を引くためにいちいち単語を選択反転させなければならないのは煩わしく萎えてしまうので、Fast Look up Alcはほぼ利用しなくなりました。あれからいろいろと試行錯誤した結果、現在自分はこのようなポップアップ辞書環境に落ち着いています。1.Firefox3で利用する場合、2.PDFファイルを読むときに利用する場合という二つのケースを想定し、Dokopop+PDIC、Mouseover Dictionary、Babylon、Lingoesという4つの手軽に利用できるポップアップ辞書ソフトをあ
ユーチューブの面白動画を使って、ミニ・テストを出題しています。 日本人向けに作られた教材ではなく、ネイティブの生の会話を聞くことで、より実践的なヒアリング力が身に付きます。英会話・TOEIC・TOEFLの準備にも。 英語学習の初級者から脱却するためのアイテムの一つに英英辞典があります。英語をマスターする上で「英語を日本語に直さず、英語のまま理解する」のが大事だと、お聞きになったことがある方もいらっしゃると思いますが、英英辞典を使うことは正にそれを実行することです。 最近の電子辞書には英英辞典を搭載しているものも多く出回っていますが、載っていない単語に出会うこともあると思います。またパソコンで英語を読んでいる時は、そのままコピー&ペーストで単語を引きたいですよね。 今日は私が使ってみて便利だなと思う英語の各種オンライン辞典をご紹介してみたいと思います。(2012.2.24 アップデート) G
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く