タグ

japaneseに関するlost_and_foundのブックマーク (75)

  • Budou - 機械学習を用いた日本語改行問題へのソリューション - ウェブ雑記

    こんにちは! 日語のウェブサイトを作っていると、日語特有の問題にぶちあたることがありますよね。 その中でも今回着目したいのは、日語改行問題。最近、この問題を解決するためのライブラリを公開したので、紹介します。 github.com そもそも日語改行問題とは何か ウェブブラウザで日語で書かれたウェブサイトを見ていると、ときどき文章が変なところで改行されているのを目にすることがありますよね。 たとえば、こんなかんじ。 「ソリューション」が「ソリューショ」と「ン」に分かれてしまっています。読みにくいですね。 英語では単語がスペースによって区切られますが、日語や中国語などのアジア圏の言語では単語がスペースで区切られないことが多いです。 そのため、英語では単語の途中で改行されることは通常ありませんが、日語では単語の途中で改行されることがよくあります。 文ならともかく、見出しやキャッチ

    Budou - 機械学習を用いた日本語改行問題へのソリューション - ウェブ雑記
  • 「ん」とはいったい何者なのか。どこからやってきたのか。かつてはなかった日本語「ん」の奥深い歴史 | ダ・ヴィンチWeb

    『ん 日語最後の謎に挑む』(山口謠司/新潮社) あいうえおの五十音図の枠外にぽつんと置かれた「ん」の文字。改めて、みなさんはどんな印象をお持ちだろうか? 「独特の存在感」「孤高」「最後にある“どや顔感”」。さらに、流行りの擬人化をしてみると、「どこから来たのかわからない転校生」との意見が筆者の周りでは聞かれた。なるほど、やはりほかの文字とは一線を画した雰囲気を感じる人は多いようだ。 それもそのはず。実は「ん」という文字はかつて日語にはなかったらしい。少なくとも『古事記』や『日書紀』『万葉集』など上代の書物に「ん」を書き表す文字が見当たらないという。では、「ん」とはいったい何者なのか。どこからやってきたのか。そのミステリーを解き明かすのが、『ん 日語最後の謎に挑む』(山口謠司/新潮社)である。書を読むと、普段いかに「ん」をナメていたのかがよくわかる。 「ん」は言葉によって発音が違う

    「ん」とはいったい何者なのか。どこからやってきたのか。かつてはなかった日本語「ん」の奥深い歴史 | ダ・ヴィンチWeb
  • 形態素解析を利用した文章校正手法の提案 | CiNii Research

  • 異字同訓使い分け手引き 42年ぶり見直し NHKニュース

    文化庁の文化審議会は訓読みが同じ漢字、「異字同訓」の使い分けの事例を示す手引きを42年ぶりに見直し、それぞれの漢字が持つ意味など詳しい説明を新たに加えました。 「異字同訓」の新たな手引きは21日開かれた文化庁の文化審議会国語分科会でまとまりました。 人に「会う」、意見が「合う」など、同じ訓読みをする複数の漢字の使い分けについては、昭和47年に手引きがまとめられましたが、去年、文化庁が行った調査で「漢字の選び方で迷うことがある」という人が75%に上ったことなどから、42年ぶりに見直されました。 新たな手引きでは、それぞれの漢字が持つ意味や使い分けの考え方などが詳しく説明されているのが特徴です。 例えば「とぶ」については、スキージャンプのような空中を移動している状態を言う場合は「飛ぶ」を、フィギュアスケートのジャンプのように地面を蹴って高く上がる場合は「跳ぶ」を使うとしています。 「すすめる」

  • Irohagana and the Surroundings

    What is stylistic regularisation of hiragana in the Meiji period?

    Irohagana and the Surroundings
  • 小中高の国語をガラッと変えたらどうだろう。

    思い切って、リベラルアーツでいうところの、文法学・修辞学・論理学をやったらどうだろうか。 文法学まず、文法学。 現在の国語の授業における文法論は特殊だ。 一応、中学で現代文の文法を、高校で古典の文法をならったけど、あれ意味がないように思う。 辞書と文法書さえ手にすれば、ドイツ語だってフランス語だって、素人でもなんとか作文はできるけど、その逆にアメリカ人に中学日語の文法書と日語の辞書を与えて作文が出来るとは思えない。 江戸時代の学者が、平安時代の文章を解釈するために成立させた学問がベースになっているためだろうけど。 思いっきり刷新したほうがいいと思う。 言語学的な内容も盛り込みつつ、日語学校で教えるような実際に即した日教育というのが着地点かと。 修辞学ディベートとプレゼンを国語の枠で教えたほうがいい。 というか、なんで義務教育で今までなかったのか。 論理学国語教育に「論理的に考える

    小中高の国語をガラッと変えたらどうだろう。
  • 第13回セミナー報告集「もう一度、組版」

    1999年の「日語の文字と組版を考える会」がスタートした。雨の日曜日にも関わらず、東京シニアワークスには熱気溢れる250人。この会の活動も三年目を迎え、いま、新たな気持ちでわれわれの足元を見つめなおしてみたい。今回のテーマは、「もう一度組版……『基語文字組版』のメッセージ」。新年度の幕開けにこれほど相応しいお題もないだろう。われらが世話人の一人でもある逆井氏が上梓した『基語文字組版』の提案するところ、新時代の組版ルールとは如何様なものであるか。変わりゆくもの、伝えるもの、それぞれに異なる思いを、ともに考え熱く語ってみたい。 (セミナー当日は時間も限られていたことから、会報では特に補足訂正があればお願いす ることとした。) ●初めに旧工程ありき 組版に関わるようになりましたそもそものきっかけは、30年前に板橋の志村にある凸版印刷の板橋工場に入社したことです。1969年という

  • EPUB日本語拡張仕様策定により、ブラウザーでの縦書きが進行中 -プレスリリース-イースト株式会社

    ITメディア http://ebook.itmedia.co.jp/ebook/articles/1101/19/news036.html Publickey http://www.publickey1.jp/blog/11/web_4.html Internet Watch http://internet.watch.impress.co.jp/docs/news/20110119_421301.html TechOn http://techon.nikkeibp.co.jp/article/NEWS/20110120/188874/ MdN http://www.nikkeibp.co.jp/article/news/20110120/257713/ 日経BP http://www.mdn.co.jp/di/newstopics/16808/ ASCII http://ascii.jp

    lost_and_found
    lost_and_found 2011/01/19
    あらためて -EPUB日本語拡張仕様策定により、ブラウザーでの縦書きが進行中
  • 趣味のWebデザイン - p要素は最小の節

    初稿:2003年8月24日~9月11日 平成15年8月24日 読点をまたいでの blockquote というのは、アリなのですかね。頭の中では、<p>hoge、<blockquote>hogehoge</blockquote>hoge。</p>こういう感じなのだけれど、これだと文法違反以前の問題として、頭の中で描いたとおりの意味としては解釈されない。で、あるならば、q タグでもって同一段落内に内包させるのが適切な感じもするけれど。強引に<p>hoge、hoge。</p><blockquote>hogehoge</blockquote><p>hoge。</p>こうすると、丸く収まる。けれど、意味付けのために語群を変えるのは末転倒というか。 「paragraph=段落」ではないのが問題の出発点。p要素はDTDにある通り、HTMLでは最小の節を担当している。だから、ブロックレベル要素を内包でき

  • 第35回 「日本語の特徴(その1)」 - 金谷武洋の『日本語に主語はいらない』

    夏の3か月を名古屋で過ごしたこともあって、しばらく書き込みを怠ってしまった。これをいい機会にここいらで一度初心に帰り、「日語の特徴」という大きなテーマで数回話してみたい。 9月からまた新学期が始まった。一度やったら好評だったのに気をよくして、日語一年生の最初のクラスの冒頭に「日語の特徴」を話すことにしている。日語に関心は持っているものの、一体どんな言葉なのか全く知らない学生がほとんどなので、学生の母語である仏語や英語と比較してどういう点で日語は違っているのかを10点ほど挙げ説明する。大掛かりな旅行に出る前に地図を見せながら見所を話す様なものだから、学生は目を輝かせて聞いてくれる。相手は子供ではないのだし、この導入部分は直接法(Direct method)でいきなり日語を使うよりも学生の母語で説明した方が遥かに効果的だ。日語話者の皆さんにも、日語の性質が改めて理解出来たり、英

  • CSS Writing Modes Level 3

    CSS Writing Modes Level 3 Editor’s Draft, 28 August 2023 More details about this document This version: https://drafts.csswg.org/css-writing-modes-3/ Latest published version: https://www.w3.org/TR/css-writing-modes-3/ Previous Versions: https://www.w3.org/TR/2019/REC-css-writing-modes-3-20191210/ Test Suite: http://test.csswg.org/suites/css-writing-modes-3_dev/nightly-unstable/ Feedback: CSSWG Is

    lost_and_found
    lost_and_found 2010/09/30
    CSSの縦書きモジュールのドラフト。Text Layout からWriting Modesに名称が変更。
  • 「モリサワ」発行小冊子の文字組版例 - なんでやねんDTP・新館

    以下は、何かのイベントでモリサワ社へ訪問した際にいただいた、「新社ビル コンセプトブック」と題された小冊子の1頁目の見出しと文部分。 どなたのディレクションかは判らない。 自社の組版ソフトもあるワケだから、使用アプリケーションも判らない。 約物は基半角ですか……*1 中黒を使った三点リーダーですか……*2 字送りはどうなっているんでしょう…… 少なくとも、 一般にいう(見た目のアキを揃える)プロポーショナル組みではなさそうだし…… 全体に、InDesignでいうところの(アキを比率でツメル)文字ツメをゆる〜く掛けてるような感じ……*3 結局、ジャスティファイによる調整で漢字の間にも調整量が割り振られ……*4 で、ぶら下げ組みですか……*5 でも、約物はあくまでも半角固定かなと思うと…… そうでもなかったり……ならその件に関しては文句はないのだが…… もしかして文章の内容を考慮して改

    「モリサワ」発行小冊子の文字組版例 - なんでやねんDTP・新館
  • ルビの書体: 芋づる式に

    ここのコメントのやり取りを経て、ルビの書体について手元の資料をざっと調べてみた。 『組みNOW』には文とルビは同一書体で組む.ただし,文がゴシックなどの場合は,ルビは明朝体で組む.とある。 『基語文字組版』にはなお、ルビ文字の書体としてはふつう、明朝系のものを用います。親文字がゴシック系の場合でもルビには明朝系のものを使います。これは、小さいサイズでの可読性において明朝系の書体のほうがまさるからです。実際、ルビ文字のサイズでは、画線の太い書体はつぶれてしまって非常に読みにくくなります。とある。 『組版原論』にはルビの書体は書体見帖には掲載されておらず、文字盤見帖を参照する外ない。写研の場合、ルビの書体は石井細明朝、石井中明朝、蘭明朝L、石井中教科書体、中見出しアンチック、石井中ゴシック体などのみであり、モリサワの場合もルビの書体は数少ない。ゴシックによる組版であっても、ルビ

  • JSIK_forum_081129_Yabe

    語文書の視覚的構造化と論理的マークアップ Visual Structuring of Japanese Documents and Logical Markup 家辺勝文1 YABE Masafumi 1 日仏会館フランス事務所 Maison Franco-Japonaise 〒150-0013 東京都渋谷区恵比寿3-9-25 E-mail: yabe@mfj.gr.jp 視覚的なメディアとしての文書は言語表記体系に依存した空間的構造をもち,形態依存の 意味作用の場を形作る.電子文書交換の観点から組版関係のJISなどを参照しつつ日語文 書の視覚的構造化の諸特性を再検討する. A document as visual media has its physical structure based on the writing system it uses, and pre- sents

  • 文字情報基盤構築のフォント公募 | yasuokaの日記 | スラド

    経済産業省の『平成22年度電子経済産業省推進費(文字情報基盤構築に関する研究開発事業)に係る委託先の公募』に関して、この3週間というもの、あちこちから私(安岡孝一)のもとに質問があった。いいかげん、同じことばかり答えるのも飽きてきたので、今までに答えた内容を、ざっと、ここにまとめておくことにする。 事業は、(1)文字情報基盤の将来像や課題を整理するための調査研究と、(2)この調査研究を進める上での調査の素材となるフォントの整備の2つの内容により構成される。

    lost_and_found
    lost_and_found 2010/08/27
    むむむ…
  • ノートや鉛筆が学校を変えた|佐藤秀夫

    著者の略歴- 1934年東京に生まれる。1958年東京大学教育学部卒業。1965年東京大学大学院教育学研究科博士課程修了。同年7月国立教育研究所研究員となり、第一研究部教育史料調査室長を経て、現在同研究所第一研究部長。主要著書「井上毅の教育政策」共著、東京大学出版会、「日近代教育百年史」全10巻、共編著、国立教育研究所、「明治前期文部省刊行誌集成」全11巻、一光社、「資料臨時教育会議」全五集、編集、文部省、「文部省掛図総覧」全10巻、共縞、東京書籍株式会社、「学校ことはじめ事典」小学館、「史料開智学校」 全21巻、監修、刊行中、松市、「現代日教育制度史料」既刊30巻、続刊中、共縞、東京法令出版株式会社ほか。 学校の生い立ちを考えるときには、その機構また歴史や社会的な背景を探る、といった記述になりやすい。 それももちろん意味のあることだが、学校で使われる道具も、文化の継承に大きな役割を

    lost_and_found
    lost_and_found 2010/08/23
    "1920年代(明治10)前後から、安価な国産鉛筆がこの国の子どもたちの学習に欠かせない筆記具として定着するようになった。"
  • ケータイ小説の書式が読みやすさと印象形成に及ぼす影響 <論文>

    携帯電話のディスプレイ上で読まれている, いわゆるケータイ小説の書式は, 改行が多く, センテンスが短めであるといった特徴があり, 一般的な小説の書式と大きく異なっている。このような書式の特徴は, 携帯電話のディスプレイで文章を読みやすくするために経験的に編み出されたと言われている。しかし, 実際にその書式が読み手に対してどのような効果を持っているのかは調べられていない。研究では, 携帯電話のディスプレイと紙面において, ケータイ小説を模した書式(ケータイ書式)と一般的な書式(一般書式)で小説を呈示し, 読み時間測定, 読みやすさ評定, 文章の印象評定を行った。その結果, 携帯電話で読んだ場合はケータイ書式の方が読み時間が短く, 読みやすいと評定されたが, 紙面で読んだ場合は差が見られなかった。また印象評定の結果から, 携帯電話で読んだ場合はケータイ書式の方がやわらかく積極的で活発, も

  • 日本語が縦書きから横書きになるまで(前篇)

    ビジネス文書や雑誌で、当然のように使われる日語の横書き表記だが、 どのような経緯で現在の形に定着したのかは手付かずの研究分野だった。 日語学者の屋名池誠教授は、日語の縦書き・横書きと、 日文化・社会とが影響しあう関係について研究している。 高井ジロル(以下、●印) 先生は、日語が縦書きから横書きに変化してきた経緯を、近代以降に発行された新聞や雑誌などの表記をくまなく調べることで明らかにしてきたんですよね。 屋名池 誠(以下、「——」) 日語のように縦書きも横書きもできる言語というのは、実は非常に珍しいんですよ。 私は、文字についての方向を「文字列展開方向」と「文字列配置方向」に分けて考えています。字の正面向きに対して垂直方向に進んでいけば、縦書き。正面に対して水平方向に進んでいけば、横書き。これが文字列展開方向。一方、画面に対してどう文字列が置かれているのかをいうのが、文字列

    日本語が縦書きから横書きになるまで(前篇)
  • イ・ヨンスク(1996)『「国語」という思想』岩波書店

    このブログの主目的は、(1)英語教育について根的に考え直すこと、(2)英語教育現場の豊かな知恵をできるだけ言語化すること、(3)英語教育に関する良質のコミュニケーションを促進すること、です。このブログでの見解などは柳瀬個人のものであり、柳瀬が所属する組織や団体などのものではありません。 十年以上ぶりにに読んだら、はたせるかな面白かったです。やはりこのは、言語教育関係者必読の名著といえましょう。 以下、私の印象に残った点を私なりにまとめます。恣意的な選択ですし、私の書き換えも多く入っていますので、ご興味の方は必ずご自身でこのを読んでください。 ■近代国民国家的な「国語」の誕生 フランス革命の際のフランス語は「国語」(langue nationale)として「国民」(nation)の精神的統合の象徴となった。(iiiページ) ■「国語」から「日語」へ 近代日において「日語」という地

  • Google Sites: Sign-in

    Not your computer? Use a private browsing window to sign in. Learn more about using Guest mode