言語に関するtomerunのブックマーク (17)

  • 上質の言語パズル!言語学の知識不要,「国際言語学オリンピック」が面白い - のらんぶろぐ X

    パズル好きの人に,ぜひ「国際言語学オリンピック」の過去問をおすすめしたい.(リンク先から,問題と解説が全てダウンロードできる.) この大会では,世界のさまざまな言語に関する問題が出題される.たとえば2014年の問題は,第1問がベナベナ語の動詞について,第2問がカイオワ語の名詞の変化について等々といった具合だ.しかしこの大会のポイントは,これらの言語についての知識(僕は名前すら知らなかったが)が問われているわけではないという点だ.ベナベナ語の動詞の問題には,ベナベナ語の動詞(1語だけで主語や目的語などを含む文になる)とその訳のリストが与えられている.それを元にベナベナ語の規則を見ぬいて,リストにない動詞の活用を訳したり,あるいは日語で書かれた文をベナベナ語訳したりせよという問題なのだ.言語学の知識を問うのではなく,言語学に題材をとったパズル問題なのだ. パズル好きの人は既にここまでで興味を

    上質の言語パズル!言語学の知識不要,「国際言語学オリンピック」が面白い - のらんぶろぐ X
  • 日本語バランス文ートップ1000

    語バランス文トップへ これは日語の代表的な表現を含む1000文です。最初の111文だけで、日Wikipediaのテキストに現れる代表的なn-gram(n=1-4、1-4単語からなる短い単語列)の50%をカバーします。 それだけのことではありませんか。 しなくてもいい、というものではないと思います。 地下鉄システムの整備によってこれらの問題が解決することが期待されている。 開拓地を開いていくためには、労働力が必要だった。 国立感染症研究所「重症急性呼吸器症候群(SARS) に関する情報」 皆様のご意見をお待ちしております。 どちらが先に手を出したのかはわからない。 ヨハネ・パウロ2世 間違いは誰にでもあるのですから。 だから、なかなか覚えられないんだ。 また建築全体の形状が翼を広げた鳥の姿を思わせることから,江戸時代以降鳳凰堂の名で呼ばれるようになった。 九月十一日 ここで質問なの

  • ATOK の辞書をつくる - 武蔵野日記

    @klmquasi さんのお勧めで 電脳日語論 作者: 篠原一出版社/メーカー: 作品社発売日: 2003/03/01メディア: 単行購入: 1人 クリック: 8回この商品を含むブログ (11件) を見るを読んでみる。これはジャストシステムの開発者の人から辞書を作っていた人、そして ATOK 監修委員会のできるまでとできてから、などなどをまとめたであり、日本語入力や計算機上の日語処理に興味のある人が読むと、とてもおもしろいだろう(2003年ので新し目だし、これはお勧め)。後述するが、これはぜひみなさんに買って読んでもらいたい。 Google 日本語入力ができてから、日本語入力は規範的であるべき(たとえば「ら抜き表現」は日語として「間違っている」ので変換できないようにするとか)か記述的であるべき(実際言語は変わりうるものであり、使う人がそう書きたいのであれば、変換できるべき)かと

    ATOK の辞書をつくる - 武蔵野日記
  • ぶっこ抜き? [Google日本語入力の功罪]

    [PR] ブログの商品紹介リンクには広告が含まれています お仕事で四国から飛んで帰っている間にGoogle様が「Google日本語入力」をリリースしていました(Google様のブログ参照)。 ATOK とか MS IME とかと同じ役割をする、かな漢字変換エンジン。WindowsMac の両方揃って、どちらも無料です。 まだ現物は試していないのですが、上記のブログの説明や Twitter に流れている試した人の感想を読む限りでは、かなりすごい。破壊的にすごい。 Google が蓄積している Web 上のテキストの膨大なデータを辞書に使っていて、Web から機械的・自動的に辞書を生成することで、人手ではカバーしきれないような、新語、専門用語、芸能人の名前などを網羅的に収録しています。高い変換精度を実現するために、Web 上の大量のデータから統計的言語モデルを構築し、変換エンジンを構成

  • 「いい加減」と「適当」という単語は、両方ともそれぞれに反対の意味で使われていますが、そういう使い方 - 「いい加減」と「適... - Yahoo!知恵袋

    一つの文(語)が複数の意味を表すとき、その文を両義文(語) といいます。 ご質問の「いい加減」「適当」も、そういった両義語の一つです。 語源をたどれば、一方の意味から始まっているのは確かですが、 今では、二つの意味を表すのが、それらの語の来の姿です。 よって、複数の意味に使い分けてかまわない、というより、 そもそもそういう性質の言葉なのです。 同じように、全く相反する二つの意味を表す言葉に、 「いい」「ない」「よろしい」「けっこう」などがあります。 曖昧といえばその通りですが、これらは、きわめて日語(日人) らしい言葉だということもできます。 「いい加減」や「適当」の場合は、書き手(話し手)は前後の内容 (文脈)によって意味を表し、読み手(聞き手)はまた文脈から 意味を類推します。 それに対し「いい」「けっこう」などは、他の語との間に一拍置い たり、イントネーションを換えたりして使い

    「いい加減」と「適当」という単語は、両方ともそれぞれに反対の意味で使われていますが、そういう使い方 - 「いい加減」と「適... - Yahoo!知恵袋
  • 等号使用適切化運動

  • そのブログを、少しだけ読みやすくする方法 - makitani.com

    そのブログのエントリー記事を、少しだけ読みやすくする方法。 読み返して読み返して、文章を手直しすること。 と一行で終わらせてしまっては伝わらないので、続けてみます。「文章の一行目は、二行目を読みたくなるように書く」というエントリーを書いて、じゃあ僕はどんなことに気をつけて文章(このブログ)を書いているんだろうと考えてみたのですが、結局は「読み返して手直し」を繰り返しているだけなんですね。 他人の目になって、必ず変な箇所があるという意識で読み返す 読み返すときにポイントが2つあります。 他人の目になって、できるだけ客観的に冷静に読む 誤字や脱字、言い回しのおかしいところ、無駄に長い文章といったものが、必ずどこかにがある、という意識で読む そのままだらりと読み返しても、何も気がつきません。読み返すときは自分を殺して、他人の文章を読むような感じで読みます。 そして、「必ず変な箇所があるぞ」という

    そのブログを、少しだけ読みやすくする方法 - makitani.com
  • 『正しい文章の書き方』

    私は、主語と述語はいつも一致しなければならないという事は大切です。 ふさわしい日語があるケースでは外来語を使わないようにしましょう。 古風なる表現を避ける事此れ筆者の義務なり。 誇張法を使ってはなりません。あなたには百万年早いのです。 横っ腹で笑ってしまう陳腐な表現は避けましょう。 比喩がいくつも使ってあると、はらわたが煮えくり返り、頭から湯気が出ます。 常に辞書で調べて、謝りのない言葉を使いましょう。 慣用句の誤用を避ければ、文章表現においてあなたの右に立つものはいなくなります。 文章に使用する用語を使用する際に冗長な表現を使用しないようにしましょう。 同じ内容を繰り返したり、前述した内容を再度述べたりしないようにしましょう。 受動態は使用されるべきではありません。 二重否定でない表現を避けないようにしましょう。 ほかに言い方があるかどうか、注意深く文章を再設計しましょう。 言葉を正し

  • 文章の書き方 - あどけない話

    2006年に IIJ の新人研修で「文章の書き方」という講義を担当しました。そのときの資料を何人もの人に個別に差し上げていたのですが、それも面倒になってきました。新人研修の担当者に問い合わせたところ、公開しても問題ないとのことでしたので、資料を公開します。 「文章の書き方」の資料

    文章の書き方 - あどけない話
  • 誤字等(ごじら)の館

    ようこそ、「誤字等の館(ごじらのやかた)」へ。 世の中には、様々な誤字が満ち溢れています。 メジャーな勘違いから、単なる誤変換、ウケ狙いのネタもあれば、どうやったらこんな誤字ができるのか理解不能なものまで。 こういった誤字たちを総称して、「誤字等(ごじら)」と呼ぶことにしてみました。 WEBサイトを何気なくながめているだけで、誤字等はたくさん見つけることができます。 そういった誤字等を検索エンジンにかけてみて、どれくらいヒットするかを調べて考察を加えたものがこの「誤字等の館」です。 考察といっても、そんな大層なものではなく、適当な推論です。 当方、言葉の専門家でも研究者でもありませんので。 このサイトでは、誤字等の生みの親達を責めているわけではありません。 笑うつもりも、馬鹿にするつもりもありません。 ただ、どうしてこんな誤字等が生まれてくるのか、その理由には興味があります。 気の向くまま

  • テキストに知性があるかないかを見分ける10のポイント - ハックルベリーに会いに行く

    面白いとは何だろう?「知識」のプライオリティは下がっている町山智浩さんのブログを読んでいたら、興味深い一節に突き当たった。 オイラはものをあまりよく知らない。昔はそれを恥ずかしく思っていたし、よくバカにされてきた。でも、今はなんとも思わない。なぜなら、ネットの時代、知識は誰でも簡単に拾えるようになったので、知識そのものに価値がなくなったからだ。いや、それは言い方が違うな。当に物知りなのか、ネットで拾っただけの知識なのか見分けることが困難になったからだ。ちょこちょこっと検索して、それを散りばめれば物知りに見える文章は作れる。「鎮」という漢字が読めない知ったかぶり「雑学王」 - ベイエリア在住町山智浩アメリカ日記 なるほどこれは確かにそうかも知れない。インターネットやIT機器の発達で、情報というものはこれまでと比べて格段と調べやすく、また引き出しやすい環境になった。だから、以前のようにそれを

  • 日本語形態素解析 - Japanese Morphological Analyzer

    Visited: 5294 アルゴリズムによる日形態素解析(Japanese Morphological Analyzer by Algorithm) このプログラムは、テスト・研究用の短いプログラムで、辞書を使わずにアルゴリズムのみで解析しているので、正確な解析はできません。語頭・語末を漢字・カタカナ・平仮名の区別を頼りに解析しているので、平仮名ばかりの文に対応できません。言語解析の困難さがこのプログラムからもお分かりになるでしょう。 正しく解析するには、人間が持っている知識、すなわち日語の規則、辞書、実世界における知識、推論などが必要です。その知識とは膨大な量のものですが、まずは部分的にも妥当な規則、辞書を作ってみることが大切でしょう。アルゴリズムだけからなるこのプログラムとは異なり、今研究中の規則や辞書の構成は言語学的にも妥当と思えるかどうか、という観点から研究しています

  • ヤフー、日本語入力API「かな漢字変換API」を公開 | ネット | マイコミジャーナル

    ヤフーは27日、Yahoo!デベロッパーネットワークを通じて日本語入力プログラム「VJE」のWeb API「かな漢字変換API」を公開した。同APIでは、かな漢字変換/推測変換/辞書指定などの機能を利用できる。 かな漢字変換APIは、ローマ字/かな入力、文節の区切り変更、推測変換といった機能を備えるほか、人名/地名/顔文字/郵便番号辞書の指定利用が可能。基辞書は月1回更新される。同社は同APIの利用によって、「日本語入力環境を持たない海外仕様のパソコンなどの機器向けのWEBサービス」「郵便番号から住所への変換、入力文字から顔文字への変換を利用したWEBサービス」などの構築が可能になるとしている。 Yahoo!デベロッパーネットワークではこのほかにもテキスト関連Web APIを公開。校正支援Webサービス形態素解析Webサービスなどのテキスト解析Webサービスも利用することができる。

  • ネットで使用される言語、中国語の割合が増加

    Windows SQL Server 2005サポート終了の4月12日が迫る、報告済み脆弱性の深刻度も高く、早急な移行を

    tomerun
    tomerun 2008/05/12
    予想以上に英語以外の割合が多い
  • 日本語組版処理の要件(日本語版)

    0.1 このドキュメントの目的 書記システムは,言語,文字と並び,文化を構成する重要な要素である.それぞれの文化集団には独自の言語,文字,書記システムがある.個々の書記システムをサイバースペースに移転することは,文化的資産の継承という意味で,情報通信技術にとって非常に重要な責務といえよう. この責務を実現するための基礎的な作業として,このドキュメントでは,日語という書記システムにおける組版上の問題点をまとめた.具体的な解決策を提示することではなく要望事項の説明をすることにした.それは,実装レベルの問題を考える前提条件をまず明確にすることが重要であると考えたからある. 0.2 このドキュメントの作成方法 このドキュメントの作成は,W3C Japanese Layout Task Forceが行った.このタスクフォースは,次のようなメンバーで構成され,ユーザーコミュニティーからの要望と専門家

    日本語組版処理の要件(日本語版)
  • 詭弁のガイドラインとは - はてなキーワード

    例:「犬ははたして哺乳類か」という議論をしている場合 あなたが「犬は哺乳類としての条件を満たしている」と言ったのに対して否定論者が…

    詭弁のガイドラインとは - はてなキーワード
  • 「泣き顔」 - 会話表現に入り込むメール表現:ケータイ時代のスタンダード

  • 1