タグ

日本語に関するDustOfHumanのブックマーク (8)

  • Google 日本語入力 for ATOK | スラド IT

    ATOK 2011 から Google 日本語入力の変換候補を利用できるプラグイン「Google 日本語入力 for ATOK」がリリースされた (窓の杜の記事より) 。 といっても JustSystems からリリースされたわけではなく、cherrypy 氏により公開されたフリーソフト。動作には Python 2.5.4 と simplejson が必要。「Google 日本語入力」をインストールしていない環境でも利用でき (ただしインターネットへ接続していない環境では利用できない)、IME をむやみに増やしたくない人に歓迎されそうだ。WindowsATOK 2011 の他、Mac OS 用 ATOK 2010 / 2009 対応β版 (ただし動くかどうかは作者未確認とのこと) もリリースされている。 それにしてもこのソフトウエアタイトル、シンプルながらもインパクト大である。

    DustOfHuman
    DustOfHuman 2011/02/21
    これは面白いと思う。
  • 「ネットやIT技術に弱いブロガー」を1秒で見分ける方法!?:けんじろう と コラボろう!:オルタナティブ・ブログ

    デジタルネイティブなどという言葉が闊歩する時代だが、それにともなって、日語文章のしきたりも変わってきている(らしい)。 先日の飲み会で 「吉田さん、実はITもネットも弱いでしょう」 と言われた。 プログラミングやインストールなどには確かに弱いけど、それがどうかしたか? と少しカチンときて開き直ったが、彼の話ではブログ記事の中身ではなく記事の書き方で,ネット慣れしていない人が見分けられると言うのだ。その方法だが、 ネットやに弱いブロガー」は、ブログ記事で 「文章の最初で字下げする」 のだそうだ。 日ごろからネットに触れていれば、ネットでの記事は英語に合わせて字下げをしないのが当然だということに自然に気がつくはずなのだが、慣れていないブロガーは昔の日文化そのままに字下げしてしまうのだという。(このブログ記事が典型だ、、) 私は小学校時代から”文書の最初は、読みやすいように一文字あけましょう

    「ネットやIT技術に弱いブロガー」を1秒で見分ける方法!?:けんじろう と コラボろう!:オルタナティブ・ブログ
    DustOfHuman
    DustOfHuman 2010/03/12
    そういや字下げしなくなったなあ。なんでだろ。売ってる本とかだと大概字下げしてるよね。横書きでも。
  • Manyoshu

    The Text of Manyoshu (86K+) Acknowledgements Editorial Note Note on Creation of the E-Text Unavailable Kanji in the E-Text Interactive Searching of the Japanese Texts Note: Displaying or inputting Japanese characters requires software that can read and input Japanese software. To the Japanese Text Initiative home page Last revised October 29, 1998

    DustOfHuman
    DustOfHuman 2010/01/24
    海外の大学の万葉集サイト?
  • MeCabの辞書にはてなキーワードを追加しよう - 不可視点

    MeCabは形態素解析のためのソフトウェアです。日語を分かち書きするために使われるものとしては最も人気の高いものだと思われますが、チャットや掲示板に書き込まれるような崩した日語や、正しく書かれた日語でも新語を期待した通りに分かち書きしてくれないことがあります。これはMeCabの内部で使われている辞書が一般的な言葉を情報源としているわけではないことに関係があります。MeCabというか、より一般的な話ですが以下のような認識が一般的かと思われます。 というのも、一番広く使われているであろう自然言語処理技術形態素解析(単語分かち書き、と言ったほうがいいのかもしれない)であろうが、これは現在99%くらいの精度になっていて、すでに人間がやるより遙かに高精度で行えるのだが、これだけ高い精度が出せるのは新聞記事を相手にしたときだけであって、それは新聞記事をコーパスとして用いる機械学習により形態素解

    MeCabの辞書にはてなキーワードを追加しよう - 不可視点
  • MeCab: 単語の追加方法

    $Id: dic.html 161 2008-02-03 09:58:46Z taku-ku $; 概要 辞書への単語追加には, 二つの方法があります. システム辞書への追加 ユーザ辞書への追加 システム辞書への追加 辞書更新が頻繁でないときや, 解析速度を落としたくない時は, 直接 システム辞書を変更するのがよいでしょう. mecab-ipadic があるディレクトリに移動 foo.csv というファイルを作成 (拡張子が .csv なら何でも可) foo.csv に単語を追加 辞書の再コンパイル + インストール % /usr/local/libexec/mecab/mecab-dict-index -f euc-jp -t euc-jp % su # make install -f charset: CSVの文字コード -t charset: バイナリ辞書の文字コード 例: u

  • jbanner

    このドキュメントの版数は $Revision: 1.1 $ です。 要旨 jbanner は, 日語を含む文字列を拡大し, バナーとして画面に表示するコマン ドです。以下の出力例を見れば何をするコマンドなのかは一目瞭然でしょう。 [491] ~/WORK/jbanner/src: ./jbanner -c 漢 漢字 漢     漢   漢           漢 漢 漢漢漢漢漢漢漢漢漢漢漢        漢 漢   漢   漢    漢漢漢漢漢漢漢漢漢漢漢漢漢漢漢 漢             漢 漢    漢漢漢漢漢漢漢漢漢  漢             漢 漢   漢   漢   漢     漢漢漢漢漢漢漢漢漢 漢  漢漢漢漢漢漢漢漢漢            漢 漢               漢 漢漢漢漢漢漢漢漢漢         漢漢 漢      漢             漢

    DustOfHuman
    DustOfHuman 2009/12/15
    Linuxのbannerコマンドみたいな表示をさせるツール。Windows用。
  • MergeDoc Project

  • 現代中国語の中の日本語「外来語」問題 - 閾ペディアことのは

    現代中国語の中の日語「外来語」問題(现代汉语中的日语“外来语”问题/現代漢語中的日語“外来語”問題) 王彬彬(日語訳:松永英明) ※見出しの( )内の部分は訳者が付けたものである。 一(中国語の中に非常に多い“日語「外来語」”) 日中間の文化交流史上、非常に興味深く、また意義深いことがある。その中でも二つの時期の状況が特別に注目を引くものである。一つは中国唐代で、一つは近代である。唐代においては、日は貪欲に中国から学習した。中国文化と接触した後、大和民族は初めて文字と遭遇したのであり、このときから書写を学び始めたのであった。日語の仮名は漢字の変形にすぎない。近代にあっては、中国は必死で日から学習した。他の分野はともかく、言語・文字の分野でいえば、近代には、逆に日が漢語の輸出国となったのである。日の「漢語」は東アジア各国の言語システムに衝撃を与え、中国の漢語の中に大量に侵入し

    DustOfHuman
    DustOfHuman 2008/08/30
    読みたいけど、読むのかね・・・?
  • 1