タグ

日本語に関するnano_001のブックマーク (21)

  • ○×△の起源は?

    人としては、 ○=よい、Yes   ×=だめ、No というのは水や空気のように自然な事実。そして △=○と×の中間 というのも当然のことと考えがち。つまり、いい順に○→△→×ですね。 しかし、これ全くアメリカを初めとした英語圏では通用しないんですよねぇ。それ以外の国はよく知らないが、まず通じないのではないかと。どれくらい通用しないかと言って、たとえば日人が 「★ ※ ♪ の3つをいい順に並べろ」 と聞かれても呆然とすると思うが、それくらい通じない。つまり、○=よい、×=だめ、も通じなければ、△がその間に位置するということも通じないのでした。 当地(やオーストラリア)では、テストの「マルをつける」時も、Vの右側が長めの「チェック」をするだけ。日風にマルをつけると何のことかわからないか、または 「えっ、零点?」 と思われる可能性あり。 同じ流れで、電化製品のスイッチはマルと縦棒、つまり

    ○×△の起源は?
    nano_001
    nano_001 2011/06/12
    「○=Yes、×=No」は日本独自の表現。プレステでも海外製のゲームだと○がキャンセルで×が決定になってたりするね。
  • 首都圏方言 - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "首都圏方言" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2024年1月) この記事には独自研究が含まれているおそれがあります。問題箇所を検証し出典を追加して、記事の改善にご協力ください。議論はノートを参照してください。(2012年1月) 首都圏方言(しゅとけんほうげん)は、現代の東京都とそのベッドタウンを中心とした地域で広く使われている日語の新方言である。新東京方言や東京新方言などとも呼ばれる。共通語(標準語)、東京方言および西関東方言が融合して成立した、この地域の地域共通語である。 首都圏方言の使用地域は、東京中心部および東京への

    首都圏方言 - Wikipedia
    nano_001
    nano_001 2011/03/21
    『首都圏方言(しゅとけんほうげん)または新東京方言(しんとうきょうほうげん)とは現代の東京とそのベッドタウンを中心とした地域で広く使われている日本語の新方言である。』
  • 漢字部屋 - 凄い漢字

    サービス終了のお知らせ いつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。 お客様がアクセスされたサービスは日までにサービスを終了いたしました。 今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

  • ニコ動での入力を便利で快適にしよう!みんなでつくる「ニコニコ日本語入力poweredbyATOK」

    ・最初の4文字程度で推測候補が表示されます。 またスペースキーでの変換も可能です。 ・最初の数文字を入力して[Tab]キーを押しても表示されます。 ニコニコ動画で書き込んだりするとき、あの言葉やキーワードが一発変換できたらいいのになあと思ったことはありませんか? 「ニコニコ日本語入力 powered by ATOK」に搭載されている「ニコニコ大百科かんたん入力 for ATOK」は、「ニコニコ大百科」の最新(2010年1月現在)8万語以上を収録! だからこれを利用すれば、最初の数文字を入力するだけでニコニコ動画でよく使われる言葉やフレーズが出てきます! ●「ニコニコ日本語入力 powered by ATOK」は、「ニコニコ動画」向けに推測変換機能を強化した「ATOK」を90日間使えるATOK無償試用版です。 ●すでに「ATOK 2010 for Windows」をお持ちの方も「ニコニ

    nano_001
    nano_001 2010/02/06
    入れた。
  • 日本語の方言の比較表 - Wikipedia

    この記事は検証可能な参考文献や出典が全く示されていないか、不十分です。出典を追加して記事の信頼性向上にご協力ください。(このテンプレートの使い方) 出典検索?: "日語の方言の比較表" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL(2018年4月) 日語の方言の比較表(にほんごのほうげんひかくひょう)は、様々な地域の日語の方言の特徴を比較した表である。 近畿から関東にかけて(東海道)[編集] 大阪弁・京言葉・伊勢弁・名古屋弁・西三河弁・東三河弁・遠州弁・静岡弁・相州弁・首都圏方言の比較表 大阪府 京都府 三重県 愛知県 静岡県 神奈川県 山城 伊勢 尾張 三河 遠江 駿河・伊豆 相模 近畿方言(関西弁) 東海東山方言 西関東方言 大阪弁 京言葉 伊勢弁 名古屋弁(尾張弁) 西三河弁 東三河弁

    nano_001
    nano_001 2010/01/17
    面白い。
  • MeCabの辞書にはてなキーワードを追加しよう - 不可視点

    MeCabは形態素解析のためのソフトウェアです。日語を分かち書きするために使われるものとしては最も人気の高いものだと思われますが、チャットや掲示板に書き込まれるような崩した日語や、正しく書かれた日語でも新語を期待した通りに分かち書きしてくれないことがあります。これはMeCabの内部で使われている辞書が一般的な言葉を情報源としているわけではないことに関係があります。MeCabというか、より一般的な話ですが以下のような認識が一般的かと思われます。 というのも、一番広く使われているであろう自然言語処理技術形態素解析(単語分かち書き、と言ったほうがいいのかもしれない)であろうが、これは現在99%くらいの精度になっていて、すでに人間がやるより遙かに高精度で行えるのだが、これだけ高い精度が出せるのは新聞記事を相手にしたときだけであって、それは新聞記事をコーパスとして用いる機械学習により形態素解

    MeCabの辞書にはてなキーワードを追加しよう - 不可視点
  • MeCab: Yet Another Japanese Dependency Structure Analyzer

    MeCab ライブラリ $Id: libmecab.html 161 2008-02-03 09:58:46Z taku-ku $; C ライブラリ仕様 C ライブラリは以下の関数を提供しています. mecab_t *mecab_new (int argc, char **argv) mecab のインスタンスを生成します. 引数には, C 言語の, main 関数で使用される argc, argv スタイルの引数を与えます. この引数は, mecab コマンドと同じ方法で処理されます. 成功すれば, mecab_t 型のポインタが返ってきます. このポインタを通して解析 を行います. 失敗すれば NULL が返ってきます. mecab_t *mecab_new2 (const char *arg) mecab のインスタンスを生成します. 引数には, 一つの文字列として表現した

    nano_001
    nano_001 2009/04/05
    C/C++から形態素解析器のMeCabを使う方法。
  • 日本語係り受け解析APIとマッシュアップ

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog サービス統括部のS・Kと申します。 前回お送りしました「日形態素解析APIとマッシュアップ」に続きまして、Yahoo! JAPANが提供するWeb APIの中でも難解であろう「日語係り受け解析API」を前回と同様、皆様のマッシュアップにお役立ていただけるようなじみの薄い自然言語処理用語の解説と共に分かりやすくお伝えできればと思います。 まずは、前回のおさらいです。 形態素解析は日語の文を言語として意味を成す最小単位の「形態素」に分ける解析処理でした。そして、日形態素解析APIは「形態素」に分け、合わせて「品詞」情報が取得できましたね。 係り受け解析は、その形態素解析処理を元にさらに一歩踏み込んだ情報の解析をします。 そ

    日本語係り受け解析APIとマッシュアップ
    nano_001
    nano_001 2009/03/22
    形態素解析に加え、どの文節がどの文節にかかっているかがわかる。ブログのような整っていない文章に強いのがウリらしい。
  • 人工無能の作り方

    書いた人 INA 人工無能とは? 人間っぽく話すプログラムのこと。会話を理解しているというよりは、なんかそれっぽいことを話すだけのものが多い。 今回は「日語のようなものを話す人工無能」を作ってみたので、その簡単な仕組みと工夫した点について少し書いてみることにする。 動機 うちのサークルのメンバーがよく集まってるチャット。とてもマニアックな どうしようもない 会話が繰り広げられているわけだが、ちょっと物足りない。 そうだ! 萌キャラがいないじゃないか! 「ないなら作ればいいじゃない?」 材料 MeCab 形態素解析エンジン 難しいことは知らなくても問題ない。 「私は変な人ではない」 ↓ 私 名詞,代名詞,一般,*,*,*,私,ワタシ,ワタシ は 助詞,係助詞,*,*,*,*,は,ハ,ワ 変 名詞,形容動詞語幹,*,*,*,*,変,ヘン,ヘン な 助動詞,*,*,*,特殊・ダ,体言接続,だ,

    nano_001
    nano_001 2009/03/20
    形態素解析エンジンを使った人工無脳の作り方の基本。
  • テキスト解析:日本語形態素解析API - Yahoo!デベロッパーネットワーク

    指定されたURLは存在しません。 URLが正しく入力されていないか、このページが削除された可能性があります。

    テキスト解析:日本語形態素解析API - Yahoo!デベロッパーネットワーク
    nano_001
    nano_001 2009/03/20
    形態素解析のWebサービス。
  • ChasenとKakasiとMeCabの形態素解析・わかち書きの比較

    Chasen(2.3.3)とKakasi(2.3.4)とMeCab(0.91)の形態素解析の結果を比較できます。Chasenはここに書いてある設定をしてあります。処理の比較等はMeCabのページ等に載っています。MeCabも近いうちに追加いたします。 04.7.8 - MeCabを追加しました。 形態素解析するテキスト 解析するテキストを入力して送信ボタンをクリック >>

    nano_001
    nano_001 2009/03/20
    一括で解析させて比較できる。
  • 形態素解析の茶筅

    ChaSen -- 形態素解析器 はじめに 形態素解析器とは、入力文を単語単位に分割し品詞を付与するツールである。 新着情報 2011-11-16 (wed) See JPCERT Report. 茶筌の配布 ダウンロード あらかじめ iconvと Darts-0.31のインストールが必要です。 chasen-2.3.3 辞書は別配布になっています。 ipadic-2.7.0 日語辞書 UniDic 日語辞書 NAIST-Japanese-dic 日語辞書(奈良先端大より公開予定) NAIST-Chinese-dic 中国語語辞書(奈良先端大より公開予定) 著作権および仕様条件について 茶筌システムは,広く自然言語処理研究に資するため無償のソフトウェアとして開発されたものである.茶筌の著作権は,奈良先端科学技術大学院大学情報科学研究科自然言語処理学講座(松研究室)が保持する.ソフ

    nano_001
    nano_001 2009/03/20
    形態素解析器。今から使うならこれよりも新しいMeCabを選んだほうがいいのかな?
  • MeCab: Yet Another Part-of-Speech and Morphological Analyzer(形態素解析エンジン)

    MeCab に至るまでの形態素解析器開発の歴史等はこちらをご覧ください メーリングリスト 一般ユーザ向けメーリングリスト 開発者向けメーリングリスト 新着情報 2008-02-03 MeCab 0.97 マルチスレッド環境で辞書を開くときの排他制御がうまくいっていなかったバグの修正 Windows版でインストール時に辞書の文字コードを指定できるようになった 一部のコンパイラで正しくコンパイルできなかった問題の修正 部分解析モードを変更するAPI の追加 (Tagger::set_partial()) ラティスの生成レベルを変更するAPI の追加 (Tagger::set_lattice_level()) 温度パラメータを変更するAPIの追加 (Tagger::set_theta()) 全候補出力モードを変更するAPIの追加 (Tagger::set_all_morphs()) 2007-

    nano_001
    nano_001 2009/03/20
    オープンソースの形態素解析エンジン。文章を解析して品詞分解する。
  • 学校で漢字辞典を引いたら「糎」という漢字の読み方に「センチメートル」のが付いたんですけど他にもメートルとかリットルにもそういう... - Yahoo!知恵袋

    「米(メートル)」、「立(リットル)」、「瓦(グラム)」です。 分=0.1、厘=0.01、毛=0.001 度:「粉(デシメートル)」、「糎(センチメートル)」、「粍(ミリメートル)」 ― 「籵(デカメートル)」、「粨(ヘクトメートル)」、「粁(キロメートル)」 量:「竕(デシリットル)」、「竰(センチリットル)」、「竓(ミリリットル)」 ― 「竍(デカリットル)」、「竡(ヘクトリットル)」、「竏(キロリットル)」 衡:「瓰(デシグラム)」、「甅(センチグラム)」、「瓱(ミリグラム)」 ― 「瓧(デカグラム)」、「瓸(ヘクトグラム)」、「瓩(キログラム)」。「瓲(トン)」はおまけ。

    学校で漢字辞典を引いたら「糎」という漢字の読み方に「センチメートル」のが付いたんですけど他にもメートルとかリットルにもそういう... - Yahoo!知恵袋
    nano_001
    nano_001 2009/03/20
    粉(デシメートル)、糎(センチメートル)、粍(ミリメートル)、籵(デカメートル)、粨(ヘクトメートル)、粁(キロメートル)
  • 人を惹きつけ人を動かす文章を書く方法 初心者にもわかるコピーライター養成講座 ~言葉で世の中を動かそう - プログラマーkkの勉強/成長ブログ@ライブレボリューション(モバイル広告�

    先日、宣伝会議のコピーライター養成講座の特別体験講座を受けてきた。 そのまとめ。 目次 言葉で世の中を動かそう コピーライターへの道 課題 解説 宣伝会議のコピーライター養成講座の宣伝 この講座で得られること コピーライターが求められている理由 コピーライターにはどうすればなれるか・・・その決心と、努力 キョロキョロしよう・・・観る フムフムする・・・聞く ワイワイする・・・話す ムチャクチャする・・・熱中 ウンウンする・・・書く コピーライターのためのコラム 感想 参考書籍 最近書いたまとめ記事 言葉で世の中を動かそう コピーライターへの道 講師は、理論派コピーライターの谷山雅計氏。 まず最初に課題が出された。 課題 『古屋を若者にもっと利用してもらうためにキャッチフレーズを書いてください』 15分で3つ書くように言われた。 全員分を回収し、30分後谷山さんが戻ってきた。 解説 なぜこ

    人を惹きつけ人を動かす文章を書く方法 初心者にもわかるコピーライター養成講座 ~言葉で世の中を動かそう - プログラマーkkの勉強/成長ブログ@ライブレボリューション(モバイル広告�
    nano_001
    nano_001 2009/03/19
    『悪いコピーは、古本自体を変えようとせず、若者が古本に合わせるようにしている。こちらの都合で相手を変えることはできない。相手の都合で、こっちのいい点をアピールしていく。こういう視点を持つことが必要。』
  • 徒然草を現代語訳してみる 働くモノニュース : 人生VIP職人ブログwww

    1 名前:愛のVIP戦士@全板人気トナメ開催中:2008/06/20(金) 21:58:25.79 ID:efdoNEKd0 【序段】 暇だから書いてみた。反省はしていない。 2 名前:超絶望的引籠惰眠怠惰怠慢憂生活型駄目人間 ◆akj/jpWknk :2008/06/20(金) 21:58:56.19 ID:2vlaWje20 ?2BP(900) ふむふむ。 5 名前:愛のVIP戦士@全板人気トナメ開催中:2008/06/20(金) 22:01:55.71 ID:AeA7++N10 元の文章も併記してほしい 7 名前:愛のVIP戦士@全板人気トナメ開催中:2008/06/20(金) 22:03:22.83 ID:efdoNEKd0 【第1段】 生まれた以上、望みは多いよね。 天皇になりたい! ってこれは言いすぎだよね。第一血統的にムリ。 総理大臣くらい? が一番の理想くらい。そこまで行

  • 日本語は滅ぼすべき。(なるべく計画的に) - 小学校笑いぐさ日記

    短期的な利点。 なんかひところはてな界隈でえらく有名だった「日語が滅びるとき」「日語が亡びるとき」。 私は読んでないし読む気もないんですが。 国語科出身の私ですが、実はもうそんなにがんばって日語を保護しなくてもいいのではないかな、と思うのです。正直なところ。 いや、今すぐ英語を公用語に! とか言われると私個人は困るんですが。 しゃべれないし。 ただ、今後英語教育に力を入れ、段階を踏んで 「日語・英語併記」 ↓ 「英語のみ」 ……というように公用語を英語に移行するのはアリではないかと。 英語単独表記の看板とか、すでにけっこうあるじゃないですか? 英語公用語化の論拠としては、はてな界隈では 「その方がビジネスに有利だから」 というのを挙げる人が多いようです。 また、故アイザック・アシモフは、 「主要な科学論文は英語で書かれている(誰もが英語を理解できれば科学の進歩が促進される)」 と

    日本語は滅ぼすべき。(なるべく計画的に) - 小学校笑いぐさ日記
  • 文章の書き方 - あどけない話

    2006年に IIJ の新人研修で「文章の書き方」という講義を担当しました。そのときの資料を何人もの人に個別に差し上げていたのですが、それも面倒になってきました。新人研修の担当者に問い合わせたところ、公開しても問題ないとのことでしたので、資料を公開します。 「文章の書き方」の資料

    文章の書き方 - あどけない話
  • 正確な文章の書き方

    このページでは、正確な文章を書くための秘訣をまとめてみようと思います。それほど文章がうまいとはいえない私が、文章の書き方について述べるのですから、むこうみずな行為であることは百も承知です。しかし、数年に渡って探求した正確な文章の書き方が、少しでもみなさんの役に立てばという思いを自分への励ましに代えて筆をとります。 ここでお話するのは、「文章をいかに正確に書くか」や「自分の考えをどうやったら適切に表現できるか」であって、決して「どうやったら人を感動させる名文句が書けるのか」ではありません。 このページを読んだら「科学技術文献」を書くための技術が少しは身に付くのではないかと期待しています。しかし、 人はいさ 心も知らず ふるさとは 花ぞ昔の 香ににほひける (紀貫之) などのような心に残る文章が頭に浮かぶようになるわけではありません。 絵の書き方に例えて言うなら、ここで述べる内容は、色彩や調和

    nano_001
    nano_001 2008/09/27
    正確な文章の書き方。
  • テキストに知性があるかないかを見分ける10のポイント - ハックルベリーに会いに行く

    面白いとは何だろう?「知識」のプライオリティは下がっている町山智浩さんのブログを読んでいたら、興味深い一節に突き当たった。 オイラはものをあまりよく知らない。昔はそれを恥ずかしく思っていたし、よくバカにされてきた。でも、今はなんとも思わない。なぜなら、ネットの時代、知識は誰でも簡単に拾えるようになったので、知識そのものに価値がなくなったからだ。いや、それは言い方が違うな。当に物知りなのか、ネットで拾っただけの知識なのか見分けることが困難になったからだ。ちょこちょこっと検索して、それを散りばめれば物知りに見える文章は作れる。「鎮」という漢字が読めない知ったかぶり「雑学王」 - ベイエリア在住町山智浩アメリカ日記 なるほどこれは確かにそうかも知れない。インターネットやIT機器の発達で、情報というものはこれまでと比べて格段と調べやすく、また引き出しやすい環境になった。だから、以前のようにそれを