You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
Mouseover dictionaryの辞書登録をPythonを用いて直接行ってみました。流れとしてはCSVファイル(PDIC)を読み込んでSQLiteのDBを作成し、Firefoxのフォルダに放り込んだだけです。rubyでやっておられる方がいたので真似してpythonの勉強がてらやってみました。 PDICでCSV形式の辞書ファイルを作成 エンコードをUTF-8に変換 下記のプログラムでSQLiteのDBを作成 /.mozilla/firefox/default.*/に出来たmoseoverdictionary.sqliteを入れる。 こんな流れで適用しました。PDICを使ってしまっているので邪魔くさいだけのような気がしますが、趣味なので仕方ありません。 #!/usr/bin/env python #-*- coding:utf-8 -*- import sqlite3 import c
今日は『Seinfeld』Season6のEpisode4"The Chinese Woman"から、 英語表現をお届けします。 →The Chinese Woman(公式サイト予告編動画) 今回の予告編では、Georgeの両親に離婚の危機が・・・。 両親の離婚を心配するGeorgeのセリフに着目しました。 (動画の中盤に出てきます) George: If you think I'm going to two Thanksgivings, you're out of your mind. ジョージ:僕が感謝祭の日にそれぞれの家を訪れると思ったら、 どうかしてるよ。 *今回はかなり意訳しています。Georgeのセリフにある、 I'm going to two Thanksgivingsは、厳密には、 「(離婚した場合)感謝祭の日に父と母、両方の家に行くこと」を 指していると思います。 [単語
突然ですが,mecabの辞書 (mecab-ipadic) をデフォルトのまま使って,mecab意外と使えねぇとか文句言ってる悪い子はおらんかね? mecab-ipadic は比較的お行儀のよい日本語をベースに作られているので,そのままでは web上の口語文体のテキストはうまく扱えないことがあります。本来は教師データを用意し,学習させるといった手法を使うのが正攻法だと思いますが,とりあえず名詞を充実させるだけでも実用度はだいぶ上がるでしょう。 人間の話す言語には,動詞の語幹や名詞には日々新しく語彙が増えるけど,助詞や活用のルールは簡単には変化しない,という特性があります。特に「いま最もつぶやかれている単語ランキング」といった集計をするような場合は,名詞の範囲の切り出しさえ間違えなければそれなりの結果を出せることも多いのです。 ただ,辞書への単語追加はここにある通り簡単にできるのですが,単語
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く