タグ

日本語に関するntaooのブックマーク (18)

  • 接続辞書と日本語入力 - 増井俊之

    増井俊之.icon はMacでもAndroidでもChromeOSでも自前の日本語入力システム(IME)を使ってるのだが、「接続辞書」を使う単純なアルゴリズムを利用している。 世の中で広く使われているモダンな日本語入力システムは高度な自然言語処理によってかな漢字変換を行なっているが、実は高度な自然言語処理を利用しなくても効率的に日本語入力することは可能である。たとえばSKKという日本語入力システムは単純な辞書とアルゴリズムしか使っていないにもかかわらず高速な日本語入力が可能だったりする。(SKKはもともとEmacs上での日本語入力用に開発されたもので、増井俊之.icon も結構使っていたのだが、キーボードの利用が前提でありモバイル機器では使いにくいとか日語でしか使えないという制約がある) 接続辞書というのは「単語の次にどのような単語が続くか」を記述した辞書である。単語ごとに、読み/カテゴ

    接続辞書と日本語入力 - 増井俊之
  • 文賢(ブンケン)- 文章の完成度を高める校正・推敲・校閲支援ツール

    読みやすくわかりやすい文章や、人を傷つけない文章を書くためには、多くの人のチェックが必要です。 文賢(ブンケン)は、独自に研究を続けた「100を超える視点」を用いて、あなたの文章をチェックします。 そして、より良い文章を書くための改善点を提案します。 文賢は、人の気持ちに寄り添う、新しい文章作成アドバイスツールです。

    文賢(ブンケン)- 文章の完成度を高める校正・推敲・校閲支援ツール
  • エピソード - 視点・論点

    外国人比率が1割を超える新宿区の大久保図書館。38言語の外国語資料を所蔵、絵読み聞かせなどを行っている図書館の館長を迎え、多文化共生社会のこれからを考えます。

    エピソード - 視点・論点
  • 大和言葉はどこまで幅を広げられるか

    言葉語義種別実在備考もふもふ副詞○もふやかもふもふとした趣である形容動詞:(ナリ活用)×もふやぐもふもふとした趣を醸し出す動詞:ガ行五段×もふめくもふもふとした趣を徐々に醸し出す動詞:カ行五段×もふめるもふもふとした状態に移行させる動詞:マ行下一段×もふむもふもふとした状態に(みずから)移行する動詞:マ行五段×もふまるもふもふとした状態に(おのずと)移行する動詞:ラ行五段×もふましいもふもふとした状態に移行するべきである形容詞:(シク活用)×もふいもふもふとした状態である形容詞:(ク活用)○もふげもふもふとした状態のようである形容動詞:(ナリ活用)×もふみもふもふとした状態の要素名詞×「もふむ」の連用形ではない。「深み」「高み」の「み」もふたいもふもふとした状態である形容詞:(ク活用)×「もふい」と「もふたい」は、「けむい」「けむたい」と同様の対立。もふたげもふもふとした状態のようである形

    大和言葉はどこまで幅を広げられるか
  • 漢字廃止論 - Wikipedia

    実用的な側面として、漢字が活字印刷の活用、とりわけ、活版印刷で決定的な障害となっていたことが挙げられる。 1980年代以降、日はワープロ・パソコンといった情報機器の普及によりタイプ印字がたやすくなったが、そこにいたるまでの長い活字文化で印刷技術の活用に漢字が大きな障害となっていた。印刷技術は近代文明誕生における三大発明のひとつに並べ挙げられる[1]ほど重要性を認められていたが、漢字文化圏は文字数が膨大であることから文章を活版印刷するには非常に手間がかかり、活字の保管にも大きなスペースを必要とした。 それに比べてアメリカやヨーロッパは活字印刷のさらなる技術革命として登場したタイプライターの発明によって文書の即席印刷が可能となり、ほとんどすべての書類が迅速に活字印刷され、熟練者は1分あたり100単語、日語は約50文字、の速さで文書を作成できた。秘書に速記で口述筆記させたのち、即タイプで清書

    漢字廃止論 - Wikipedia
  • Private Site

  • Private Site

  • Private Site

    Build a website. Sell your stuff. Write a blog. And so much more.

  • 「間髪をいれず」が殺された日 - アスペ日記

    最近、マイナビウーマンが「日語を貧しくしようキャンペーン」を展開しているようです。 じつは読み間違ったことのある漢字1位「貼付」 間違っている読み方が定着していると知らずに使っていた日語1位「輸入(ゆにゅう)【正】しゅにゅう」 「正しい日語」ネタはPVが稼げるのでしかたないのでしょうが、日語が金儲けのネタにされるのを見ると悲しくてなりません。 この中で、見逃せないのは次の部分です。 ■番外編:これは明らかな間違いです ・間髪を容れず(かんぱつをいれず)【正】かん、はつをいれず「これだけは知っていた」(26歳男性/学校・教育関連/事務系専門職) ■間髪をいれず(×かんぱつをいれず→○かんはつをいれず) こういうのは、いい大人が見たらあきれてしまうところです。 「何をバカなことを言っているんだ、『かん、はつをいれず』なんて聞いたことないよ」と。 もちろん、中国語や漢文をやっている人であ

    「間髪をいれず」が殺された日 - アスペ日記
    ntaoo
    ntaoo 2013/12/01
    私は重複はちゃんとじゅうふくと発音している。元の読みがじゅうふくであることと、不規則変化をいたずらに増やすのは嫌いなので。時々、ちょうふくと発音しろと言われるのが鬱陶しかったが最近は少なくなってきた。
  • 実例に見る実用文のスタイル - アスペ日記

    印刷の日語は、非常に質が高い。編集者や校正者によってチェックされているからだ。 それに対して、ネットの日語は質がバラバラだ。書くことのプロでない一般人が日語を書くので、どうしてもそうなってしまう。 かといって、お金をもらうわけでもない文章にそんなに手間はかけられない。自分で気をつけるのが精一杯だ。 ここでは、気をつける時*1に参考になるようなことを、「森のくまさんの謎」を例として、特に「漢字と平仮名の使い分け」を中心に書いてみる。 ここでは、解説記事などの実用文を想定している。 また、この記事は「森のくまさんの謎」のようなスタイルを身につけたい人を対象としているので、もちろん誰かに強制するつもりはない。 漢字と平仮名の原則 大きな原則として、「意味の重いところは漢字で書き、軽いところは平仮名で書く」というものがある。以下では、それを具体的に解説する。 形式名詞は平仮名で書く また、娘

    実例に見る実用文のスタイル - アスペ日記
  • 身の振り方を考えるついでに、日本語について考えた - アスペ日記

    Google を辞めてから、頭を冷やすためにゆっくり休んで、その間にいろいろ考えた。 辞めた時に勢いで書いた記事には「IME の会社を受けてみたい」と書いたけれど、それでいいのか確信もなかった。 だって、IME の会社というと、某国産 IME *1を作っている*2徳島の会社ってことになるんだけど、はっきり言うと…斜陽の匂いがするっていうか…。 一方で、ネットの日語表記に対する違和感のようなものが、だんだんと自分の中でふくらんでいた。やたらと漢字が増えててムカツク…。 自分で N-gram かな漢字・漢字かな変換のような実験的なものは書いてみたけど、頑張って IME にしたところで ATOK ほどの使い勝手にならないのはわかってるし…。 頭の中で、こうしたゴチャゴチャした思いが渦巻いていた。こういう時に行動を起こしても、いい結果にならない。Google に行ってしまったのは不幸なミスマッチ

    身の振り方を考えるついでに、日本語について考えた - アスペ日記
  • 日本語 WordNet (wn-ja)

    語 WordNet リリース * 画像 * ダウンロード * 今後の予定 * 参考文献 * リンク * English プロジェクトでは、 Princeton WordNet や Global WordNet Gridに 着想をえて、日語のワードネットを構築し、オープンで公開します。 独立行政法人情報通信研究機構(NICT)では、自然言語処理研究をサポー ト する一環として、2006年に日語ワードネットの開発を開始しました。最初の 版、version 0.9は、2009年2月にリリースされました。このversion 0.9は、 Princeton WordNetのsynsetに対応して日語をつけています。もちろん、 Princeton WordNetにはない日語synsetを付与する必要があり、また、 Princeton WordNetにみられるsynsetの階層構造に、

  • ピジン言語 - Wikipedia

    ピジン言語(ピジンげんご、pidgin language、または単にpidgin)とは2ヶ国語が混合することにより生み出された通用語を指す名称。 現地語を話す現地人と、現地語の話せない外国語を話す貿易商人などとの間で異言語間の意思疎通のために互換性のある代替単語を用い自然に作られた接触言語で、共通言語が無い複数の集団が接触する際にコミュニケーション手段として形成される。 英語と現地の言語が混合した言語を「ピジン英語」といい、英語の“business”が中国語的に発音されて“pidgin”の語源となったとされている。フランス語をベースにそれ以外の言語と混成したものは、「ピジンフランス語」と呼ばれる。 例えば、“Long time no see.”(「お久しぶり」)は明らかに英語来の構造とは異なっているが、それなりに意味が伝わる(中国語の很(very) 久(long time) 不(not)

    ntaoo
    ntaoo 2013/05/12
    ピジン日本語の例 「私、中国人あるね。」
  • 岩瀬順一の「日本語のわかち書きについて」

    文章を単語に分解せよと言われた場合、 自立語の先頭を指定することはむずかしくない。 なぜなら、辞書でその単語を探すことはむずかしくないからだ。 もしもそれがむずかしければ、日語は、 それを母語としている人にとっても辞書をひくのが極めてむずかしい言語、 ということになろう。しかし、そういう話は聞かない。 それに対し、付属語はむずかしいことがある。 例えば「考えられない」は「考え+られ+ない」だが、 日語を母語とする人の中にも、 このような分解のできない人、忘れてしまった人がおおぜいいるだろう。 自立語は、たくさん存在する。 大きな辞書になればなるほど、たくさん載っている。 付属語は、それほど多くなく、 大きな辞書でも小さな辞書でも、載っている数はそれほど変わらないと思われる。 付) 形容動詞については、それを認めず、 名詞+「だ」、あるいは「に」とする流儀もある。 しかし、あとで述べるよ

  • ことばの「けんいしゅぎ」

    やねごんの にっき(やねごん) ブログのほとんどを漢字をつかわず「かな」で書いている。そこには深い発信者の思いがある。社会のおかしな部分を指摘し分析するその内容も鋭い。http://d.hatena.ne.jp/lever_building/ 「さいきんの わかものわ ことばを しらない」という ことが よく いわれます。「にほんごの みだれ」という ことも よく してきされます。しかし、「にほんご」の せかいでわ いつも、ことばを「しらない」あるいわ「みだれている」ことを とがめられるのわ、わかい ひと、とくに わかい じょせいです。 「にほんご」についての けんい(オーソリチィ)を にぎって いるのわ、おもに ねんぱいで こうがくれきの にほんじん だんせいです。 わたしわ 10だい こうはんの わかい ひとたちと せっする きかいが あります。わたしから みて わかものが「ことばを 

    ことばの「けんいしゅぎ」
    ntaoo
    ntaoo 2013/05/07
    よめる よめるぞ よみやすいじゃ ないか。
  • プログラミング言語「日本語」

    ■ はじめに 日語は約1万年前、古代縄文人によって考案された世界的にも最も古い部類のプログラミング言語の一つである。(※) 日語の起源は、古代の北方系言語と南方系言語であり、それぞれの特徴、即ち、強力なマクロ機能と柔軟な音節構造を共に持ち合わせているかなり珍しい言 語である。 更に、日語はその後、約1万年の間にわたって仕様の変更や拡張が幾度も行われ現在の形に至っている。その過程で日独特の固有な機能を有するように なった。 これらの特徴は日語の利点であると同時に、習得する上での障害ともなっている。 書はプログラミング言語としての日語を習得する上で、比較的良く使われる構文を主に取り上げ解説したものであり、これから日語プログラミングを始 める人を対象として書かれている。 ※念のために書いておくと、書は日語をプログラミング言語のように解説することによって、普段意識 しないで使っ

    ntaoo
    ntaoo 2013/02/27
    IDEはExcelか
  • 2009年02月03日の記事 | Manachan's World-東京下町日記 - 楽天ブログ

    お気に入りブログ 2024年8月16日(金) New! duke3さん 志望校別得点力シミ… ねむdododoさん THE GAME OF LIFE むかついてきましたさん こあらオヤヂblog こあらオヤヂさん ドタバタ珍道中@し… caramelatteさん

  • サービス終了のお知らせ

    サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

    ntaoo
    ntaoo 2012/10/29
    こんなのあったのか!
  • 1