タグ

日本語に関するskozawaのブックマーク (50)

  • はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知

    はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28

    はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知
  • 「ないべき」の話についてちょっとだけ補足(+否定に関する読書案内第2弾) - dlitの殴り書き

    ほとぼりが冷めたようなので(?)、少し補足を書いておく。 現象自体は下記のツイートにまとまっているので、リプライ等も参考にして下さい。 昨日の研究会でいちばん盛り上がったのはモダリティ要素と否定の作用域関係のところで(特に)若年層では「ない」が「べき」の節内に生起するパターン(例:リンゴはべないべきだ)を完全に許容するという話を紹介して教員陣に衝撃が走った瞬間でした 一方で学生陣は「何が問題なのかわからない」と— Takumi TAGAWA (@dlit) 2017年2月2日 けっこう多くの人に衝撃が走ってるようなのでもう一つ報告しておくとこれを許容する話者の多くは形容詞のイ形も「べき」の節内に生起可能なようです(例:教師は賢いべきだ) https://t.co/YtdZ75tg1Y— Takumi TAGAWA (@dlit) 2017年2月2日 あと、丁寧に説明するとたいへん長くなる

    「ないべき」の話についてちょっとだけ補足(+否定に関する読書案内第2弾) - dlitの殴り書き
  • 国語辞典編纂者・飯間浩明さんが語る「ことばが通じない人」の判断基準

    飯間浩明 @IIMA_Hiroaki 1967年10月21日、香川県高松市生まれ。国語辞典編纂者(出版社社員ではありません)。『三省堂国語辞典』編集委員。著書『日語はこわくない』PHP、『日語をもっとつかまえろ!』毎日新聞出版、『知っておくと役立つ 街の変な日語』朝日新書、『ことばハンター』ポプラ社 他。『気持ちを表すことばの辞典』ナツメ社 も監修。 asahi-net.or.jp/~QM4H-IIM/ 飯間浩明 @IIMA_Hiroaki ことばというものは通じないものです。あなたの頭の中で考えたことを、100%相手に理解してもらうことはそもそも不可能。それでも、何とか伝える方法を考えたい、というのが私の希望です。ただ、社会生活上、「ことばが非常に通じにくい人」を見極めることも必要です。その判断基準を挙げてみます。 2017-01-05 13:58:54 飯間浩明 @IIMA_Hi

    国語辞典編纂者・飯間浩明さんが語る「ことばが通じない人」の判断基準
  • 日本の言語表記についての基礎情報 - yanok.net

    常用漢字 「一般の社会生活において現代の国語を書き表すための漢字使用の目安」として定められている漢字表。2,136文字について、字体と音訓や語例が示されている。平成22年(2010年)に改正され、昭和56年内閣訓令第1号に取って代わった。 常用漢字表 (平成22年内閣告示第2号) (文化庁) 現代仮名遣い 「一般の社会生活において現代の国語を書き表すための仮名遣いのよりどころ」として定められているもの。 現代仮名遣い (昭和61年内閣告示第1号) (文部科学省) 人名用漢字 「常用漢字表と人名用漢字表に掲げられた漢字は,いずれも子の名に使用することができます」として、人名用漢字表が提示されています。 子の名に使える漢字 (法務省) ローマ字 ローマ字のつづり方 (昭和29年内閣告示第一号) (文部科学省) 文字コード JIS X 0213:2000「7ビット及び8ビットの2バイト情報交換用

  • Budou - 機械学習を用いた日本語改行問題へのソリューション - ウェブ雑記

    こんにちは! 日語のウェブサイトを作っていると、日語特有の問題にぶちあたることがありますよね。 その中でも今回着目したいのは、日語改行問題。最近、この問題を解決するためのライブラリを公開したので、紹介します。 github.com そもそも日語改行問題とは何か ウェブブラウザで日語で書かれたウェブサイトを見ていると、ときどき文章が変なところで改行されているのを目にすることがありますよね。 たとえば、こんなかんじ。 「ソリューション」が「ソリューショ」と「ン」に分かれてしまっています。読みにくいですね。 英語では単語がスペースによって区切られますが、日語や中国語などのアジア圏の言語では単語がスペースで区切られないことが多いです。 そのため、英語では単語の途中で改行されることは通常ありませんが、日語では単語の途中で改行されることがよくあります。 文ならともかく、見出しやキャッチ

    Budou - 機械学習を用いた日本語改行問題へのソリューション - ウェブ雑記
  • 日本語 Temporal Awareness コーパス ver 0.1 (2016/06/06)

    コーパスは、日語ツイート内に現れる地名語に対して、ツイートの著者(以下、著者)が「その場に現在いるのか」「いたのか」「行く予定なのか」「言及しているだけなのか」(Liらが文献[3]で Temporal Awarenessと呼んでいる概念と対応)を、ツイートを読んだ第三者がクラウドソーシングを用いて付与したコーパスです。 コーパスを用いて訓練したモデルは、以下のような応用が考えられます: 観光地等のスポットの混雑予測 スポットの現在実況のみの収集/要約 スポットを実際に訪れた人の感想や意見のみをフィルタリング アノテーションガイドライン 以下の10種類のターゲット(地名語)を含むツイート各1200ツイートを元データとし、 Yahoo! クラウドソーシング を用いて以下のようなガイドラインのもとでアノテーションを収集しました。 固有名詞 秋葉原 仙台 渋谷駅 清水寺 スカイツリー 一般名

  • 「了解しました」より「承知しました」が適切とされる理由と、その普及過程について | 株式会社LIG(リグ)|DX支援・システム開発・Web制作

    あなたは「了解しました」と「承知しました」、どちらをよく使いますか? 【アンケート】 「了解しました」と「承知しました」、どっちを多く使いますか? — 菊池良 / Kikuchi Ryo (@kossetsu) 2016年2月25日 ツイッターでアンケートしたところ、こんな感じでした。わずかに「承知しました」の方が多いですね。 この2つの言い回しですが、「了解しました」よりも「承知しました」を使う方が正しい、とよく言われています。 僕がこれを初めて知ったとき、強い違和感を覚えました。理由は 「了解しました」をよく使っていた 日常でもビジネスでも「承知しました」を使っている人を見たことがなかった ある日、急に言われ始めた からです。「承知」が日常的な言い回しではなかったので、気になったんですね。 そこで調べてみたところ、いつから言われ始めて、どういう経路で定着したのかがある程度わかりました。

    「了解しました」より「承知しました」が適切とされる理由と、その普及過程について | 株式会社LIG(リグ)|DX支援・システム開発・Web制作
  • 動詞「まなざす」は“日本語として”おかしいか - 誰がログ

    【注意】このエントリは、動詞「まなざす」の意味・用法や登場した経緯や背景などについて解説したものではありません。 はじめに 下記のまとめのブコメにも何か書こうかなと書いてそのままいつもの書く書く詐欺になりそうなところだったのですが、 togetter.com その後もちょこちょこ「「まなざす」という動詞は日語としておかしい」というような言い方を見たので何か書いておくことにしました。 最後に背中を押したのは菊池誠氏の次の一連のツイートです。ただこれに似た言い方はいくつか見ましたし、共感を覚える方もけっこういるのではないでしょうか。 @kanenooto7248 はあ、「まなざす」という言葉を使うやつは嫌いだ、という話はしたけど、その出どころですか。「まなざす」は日語じゃないからな— kikumaco(9/7ベアーズ) (@kikumaco) 2016年1月25日 「まなざす」という言葉を

    動詞「まなざす」は“日本語として”おかしいか - 誰がログ
  • 日本語は特殊な言語か?

    そして特別難しい言語なのか? そもそも「他と似てない≒難しい」は言えるのか? 更にそもそも「言語が似てる」とは何か?

    日本語は特殊な言語か?
  • 言語学の入門書その2:定延利之『日本語教育能力検定試験に合格するための言語学22』 - 誰がログ

    前回:言語学の入門書その1:黒田龍之助『はじめての言語学』 - 思索の海 はじめての言語学 (講談社現代新書) 作者: 黒田龍之助出版社/メーカー: 講談社発売日: 2013/02/08メディア: Kindle版購入: 1人 クリック: 1回この商品を含むブログを見る 前回の内容は完全に忘れてましたよ。まさか第二弾があるとは自分でも驚きです。 きっかけ:日語教員養成講座での授業 今年度、インターカルト日語学校・日語教員養成講座というところで、「言語学概論」の授業を担当する機会がありました。 これまでも非常勤で教養の「言語学」や「言語学概論」といった授業を担当したことはありましたし、日語学系の授業でも必ず最初は言語学・言語研究での位置付けの話から始めます。また、日語教員を目指している受講生が多いクラスで日語学系の授業を担当したこともありましたので、全く新しい経験というわけではなか

    言語学の入門書その2:定延利之『日本語教育能力検定試験に合格するための言語学22』 - 誰がログ
  • 枕詞について: 極東ブログ

    昨日、ぬるい風呂に入ってぼんやり吏読について考えながら、ブログに書いた話は、おそらくあまり理解はされないだろうな。もう少しわかりやすく書くべきだったかな。でも、それで読まれるというわけでもないから、あれでもいいか、とかかんとか思いながら風呂から上がったとき、あっ、εὕρηκα!、と思った。ほんの瞬時。何十年来の枕詞についての謎が解けたのである。 次の瞬間、しかしなあ、それを証明することはできないなあと思い、ちょっと、ぼうっとした。それから寝入りばな、つらつら考えて、まあ、概ね正しいだろうが、その研究やってもなんの成果もでないだろう、というあたりで眠りに落ちた。夢で特に発見があったわけでもなかった。つまらない話であるが、ブログとかに書いておく。 枕詞とは何か。比喩的な用例も多くなったから、基的な意味確認をかねて、大辞泉から引いておく。 1 昔の歌文、特に和歌に用いられる修辞法の一。一定の語

  • 「〜かなと思います」という言い方 - ohnosakiko’s blog

    少し前に、「〜させていただきます」という言い方の不自然さについて記事が上がっていた。 丁寧"のつもりが、"慇懃無礼な印象"に?!『させていただく症候群』 - NAVERまとめ 視点・論点「させていただきます症候群」|視点・論点|NHK 解説委員室|解説アーカイブス この言い方が多用されておかしな感じになっていることに違和感を覚える人は結構いるようで、検索してみると7、8年前からその手の記事があるようだ。 私がここ最近気になっているのは、「〜かなと思います」という言い方。テレビの街頭インタビューでも識者のコメントでも耳にするし、ネットの書き込みでもよく見る。若い人に限らず、老若男女まんべんなく使っているようだ。 「〜したらもっと良くなるかなと思います」 「〜していくべきかなと思います」 「〜ってのはつまらないかなと思います」 「な」は「な?」と上げる。この「かな?」はたとえば、幼稚園の先生な

    「〜かなと思います」という言い方 - ohnosakiko’s blog
  • 日本語の複合語の省略において省略前の形態素のうち1モーラ分しか残らない事例|Colorless Green Ideas

    クレジットカード」の「カード」が省略されると、「クレカ」のように1モーラ分しか残らない事例を紹介する。 はじめに 日語で複合語を省略する場合、省略前の形態素のうち2モーラ分が残ることが多い。例えば、「デジタルカメラ」が「デジカメ」になったり、「パーソナルコンピュータ」が「パソコン」になるたぐいである。これに対して、省略前の形態素のうち1モーラ分しか残らない事例はあまりない。この記事では、「クレジットカード」が「クレカ」になるような日語の複合語の省略において省略前の形態素のうち1モーラ分しか残らない事例を挙げていきたいと思う。 漢字音が1モーラで表される例 漢語を省略したときに、残された漢字の音が1モーラで表されるために、1モーラ分しか残らないという例がある。 時間短縮 → 時短 学生生徒 → 学徒 生命保険 → 生保 安全保障 → 安保 (中華民国)国民政府 → 国府 田園都市線 →

  • 【便乗】日本語の活用と「過去形」(解説なし、宣伝のみ) - 誰がログ

    どうも、ラッスンゴレライを思い出そうとしてもどうしてもあるある探検隊が出てきてしまうぐらいにはおっさんの日語の研究者です。 さて、下記のエントリのタイトルと内容が最近自分がやっていることと近くて一瞬どきっとしてしまいました。この辺りの話、見方によっては古典的も古典的な問題で、書き出すときりがないのですが(関係する話や概念・用語を整理するだけでたいへん)、一部現代的にも色々面白い問題を含んでいると思ってやっています。というか活用研究などしている以上、いつまでも逃げてばかりはいられず… 日語の活用に"過去形"は無い - 殴る壁 ちょうど良いので?便乗して宣伝を二つばかり。 テンス・アスペクトの論文集を作っています 昨年度の日語文法学会でやったパネルセッションもその絡みだったのですが、 2014年後半戦の出没予定(学会とか) - 思索の海 テンス・アスペクトをテーマにした論文集(全4巻)を

    【便乗】日本語の活用と「過去形」(解説なし、宣伝のみ) - 誰がログ
  • 日本語の活用に"過去形"は無い - 殴る壁

    語で動詞等の活用形は 未然 連用 終止 連体 仮定 命令 古文法では仮定形に替わって已然形が用いられたが、過去形は存在しない 「面白かったのか」の「た」は助動詞の連体形 助動詞「た」は必ずしも過去の意味を持たない 「面白かったのか」の「た」は確認の意味 以上。 b.hatena.ne.jp

    日本語の活用に"過去形"は無い - 殴る壁
  • 日本語Wikipediaオントロジー プロジェクト日本語トップページ - OSDN

    Wikipedia は語彙網羅性および即時更新性に優れており,半構造情報資源であることからフリーテキストと比べてオントロジーとのギャップが小さいです.そのため,Wikipedia からのオントロジー学習研究が近年,盛んに行われています.しかしながら,Wikipedia はユーザ参加型という性質上,厳密な体系化が行われていないため,Wikipediaからのオントロジー学習には,多くの課題が存在しています.以上より,プロジェクトでは,日Wikipedia における様々なリソース(カテゴリツリー,一覧記事,リダイレクトリンク,Infobox, Infoboxテンプレート)から,大規模かつ汎用的なオントロジーを学習する手法を提案します. ダウンロード 最新リリース 日Wikipediaオントロジー 2013-11-7 (日付: 2013-11-11) 日Wikipediaオントロジー

    日本語Wikipediaオントロジー プロジェクト日本語トップページ - OSDN
  • クイズ王に勝ったIBM「Watson」、いよいよ日本語を学ぶ

    アイ・ビー・エム(日IBM)とソフトバンクテレコムは2月10日、「Watson」に日語を学習させ、Watsonを活用したさまざまなアプリケーションを共同展開すると発表した。 Watsonは人間のクイズ王に勝利したことで知られる、自然言語ベースのコグニティブ(認知的)技術。クラウドで提供され、人間が自然言語で投げかける複雑な質問を解釈し、膨大なデータの中から根拠に基づいた回答を提案する。膨大なレシピデータから料理を提案するアプリケーションもあるが、これまでWatsonは日語には対応していなかった。 Watsonがアルファベット以外の文字による言語に対応するのは初めてという。データ分析によって意志決定の改善が期待できる教育や銀行、保険、小売り、医療などの分野で普及を目指す。

    クイズ王に勝ったIBM「Watson」、いよいよ日本語を学ぶ
  • 第7回 コーパス日本語学ワークショップ | プログラム

    全文検索システム『ひまわり』を用いた既存資料の活用 既存のテキストデータを『ひまわり』にインポートし、検索(全文検索、形態素解析結果を利用した検索)する方法を説明・実習します。

  • 「許す」と「赦す」の件(みんな間違っている) - アスペ日記

    「シャルリー・エブド」誌の翻訳の問題がホットなようです。 銃撃の政治紙「すべては許される」と預言者風刺 「許す」と「赦す」 ―― 「シャルリー・エブド」誌が示す文化翻訳の問題 「許す」と「赦す」は同じ意味ですよ 私から見ると、みんな三者三様に間違っています。 (最初に書いておきますが、ここでは主に日語表記について述べ、シャルリー・エブド誌の表紙という題にはあまり触れません) 関口涼子氏の間違い まず、関口涼子氏の間違いから。 Tout est pardonnéを、「すべては許される」とすることで、この読みの多様性が全て消えてしまう。 もうすでにあちこちで指摘されていますが、「許す」は「赦す」を含んでいます。 現代日語で「許す」と「赦す」が排他的に使い分けられているなんていうことはありません。 で、こういうときには必ず、常用漢字(当用漢字)云々という人が出てきますが、それも誤解です。

    「許す」と「赦す」の件(みんな間違っている) - アスペ日記
  • アートイベント 万国學生藝術展覧祭 | 使える日本語フォント大集結!商用利用OKのフォント36のまとめ! | 學展 学展

    みなさんこんばんは。さめちゃんです。 2014年もはと20日を切ったわけですが、日は、持っていて絶対損はないフリーの日フォントをご紹介していきたいと思います。 その数36!!!! これだけあれば、相当な事がないかぎり有料フォントはいらないかもしれません。 怒濤の日フォントまとめ http://jikasei.me/font/genshin/ 源真ゴシック 個人・商用サイトで無料利用可。同人誌や各種印刷物なども可。 普段使いにおける使い勝手を重視したカスタマイズを施したフォント。 http://fontgraphic.jp/blog/item/130-fgpote.html FGポテ明 個人・商用サイトで無料利用可。同人誌や各種印刷物なども可。 写植を紙焼きでボかしたような処理で、緩やかなグリフ曲線を描いた美しい仕上がりになっています。 http://fontgraphic

    アートイベント 万国學生藝術展覧祭 | 使える日本語フォント大集結!商用利用OKのフォント36のまとめ! | 學展 学展