タグ

日本語に関するakiramazのブックマーク (7)

  • Budou - 機械学習を用いた日本語改行問題へのソリューション - ウェブ雑記

    こんにちは! 日語のウェブサイトを作っていると、日語特有の問題にぶちあたることがありますよね。 その中でも今回着目したいのは、日語改行問題。最近、この問題を解決するためのライブラリを公開したので、紹介します。 github.com そもそも日語改行問題とは何か ウェブブラウザで日語で書かれたウェブサイトを見ていると、ときどき文章が変なところで改行されているのを目にすることがありますよね。 たとえば、こんなかんじ。 「ソリューション」が「ソリューショ」と「ン」に分かれてしまっています。読みにくいですね。 英語では単語がスペースによって区切られますが、日語や中国語などのアジア圏の言語では単語がスペースで区切られないことが多いです。 そのため、英語では単語の途中で改行されることは通常ありませんが、日語では単語の途中で改行されることがよくあります。 文ならともかく、見出しやキャッチ

    Budou - 機械学習を用いた日本語改行問題へのソリューション - ウェブ雑記
  • 外国人「日本のアニメの途中によく出るアレって何?」英語版の空耳案件がジワジワくる「よくぞ解読した」

    ジオ・レスペデーザ @gio_lespedeza 海外の人向けにアニメでよく聞く日語を解説する動画シリーズのコメント欄に「アニメの途中とかによく聞く、Grand sponsor Tokyo day OH Christmas って何?」みたいなコメントがあって、ちょっと考えたんだけど、「ご覧のスポンサーの提供でお送りします」だ… 2016-08-09 22:37:11

    外国人「日本のアニメの途中によく出るアレって何?」英語版の空耳案件がジワジワくる「よくぞ解読した」
  • 漢数字が数字順にソートされない理由を調べてみた - give IT a try

    はじめに:「なぜ漢数字は数字順に並ばない!?」 先日、こんなツイートをしたところ、結構たくさんの人にリツイートされました。(執筆時点で50件以上) 「漢数字はソートしても数字順に並ばない」という事実を生まれて初めて知った。まさかのサプライズ。 pic.twitter.com/Eqx3ltIfHs— Junichi Ito (伊藤淳一) (@jnchito) 2014年11月27日 「なぜ漢数字は数字順に並ばないのか」という問いに対して、表面的な回答をするなら「数字順に並ばないのは、数字の大きさではなく文字コード順でソートされているから」ということになります。 いや、もちろんそれはわかってるんです。 問題は「そもそもなんで数字順に文字コードを振らなかったの!?」ということです。 感覚的には「一郎、二郎、三郎」って並んでほしいじゃないですか。でも、プログラム上でソートすると「一郎、三郎、二郎」

    漢数字が数字順にソートされない理由を調べてみた - give IT a try
  • 17歳で獲るメダルよりも未来のメダルのほうがイイものだと信じて、高梨沙羅さんの続編に期待するの巻。 : スポーツ見るもの語る者〜フモフモコラム

    17歳で獲るメダルよりも未来のメダルのほうがイイものだと信じて、高梨沙羅さんの続編に期待するの巻。 Tweet Share on Tumblr カテゴリ:ソチ五輪ウィンタースポーツ 2014年02月12日07:02 高梨沙羅さん、ありがとうございました! ソチ五輪大会5日目、日には大きな喜びと大きな哀しみとが同時に訪れました。日時間の深夜2時30分からスタートした2つの決勝。ひとつは平野歩夢クン、平岡卓クンの10代コンビが進出したスノーボード・男子ハーフパイプ決勝。そしてもうひとつが、日国民の大きな期待を背負って、こちらも10代の高梨沙羅さんが挑んだ女子ジャンプ・ノーマルヒル決勝。 ハーフパイプでは平野クン・平岡クンがダブルでメダルを獲得する大快挙。1目はミスで得点を伸ばせなかった平岡クンが会心の2目でメダル圏内に飛び込めば、平野クンは1目首位の好演技から2目でさらに得点を伸

    17歳で獲るメダルよりも未来のメダルのほうがイイものだと信じて、高梨沙羅さんの続編に期待するの巻。 : スポーツ見るもの語る者〜フモフモコラム
  • 彼女の裸がガリガリだった

    好きな人は妖精みたいに細くて俺は大好きだった。 ようやく付き合えることになって、彼女を大事にしなければとドキドキした。 髪型はいつもふわふわで、細い身体によく映えていた。 小さくて、雰囲気は蒼井優ちゃんみたいな、あんな感じ。 頭がきゅっと小さくて、ふわっとしたシャツが似合った。 たまにワンピースを着ると中で身体が泳いで、かわいらしさを引き立てた。 折れそうな腕や腰、脚を見ていると守ってあげたいと思った。 それが、脱いだら老人の裸のようだった。 ブラトップを脱ぐと、枯れ木みたいな身体が現れて 「あっ、」と驚きの声を隠すので精一杯だった。 肋骨と胸骨は木琴みたいに演奏できそうだった。 背骨や肩の骨はニワトリの骨格標を彷彿とさせた。 膝と肘がやたら大きく見えた。 寝ている姿が、べ終わった後のフライドチキンみたいだった。 「胸がえぐれる」という表現を具体化させたような胸だった。 できることなら

    彼女の裸がガリガリだった
  • 「了解」は失礼か? - アスペ日記

    最近、「了解」は失礼だという説が出てきているようです。 どこの誰が言い出したのか知りませんが、ごく最近であることは確かです。 少し前のマナーには、そんなことは書いてありません。 たとえば、2003年のこれだけは知っておきたい! 改訂版 ビジネス・マナーハンドブックには、次のようにあります。 しかしそうしたルールができていない社外の人からのメールを受信したときには、「メール、受けとりました」「その件、了解しました」など、簡単でよいからすぐに返信し、… また、2005年の「こんなことも知らないの? 大人のマナー常識513」というマナーには、次のような記述があります。 内容に疑問のあるときにはその点を記して送信しますが、そうでなければ「メール拝見しました。○○の件は了解しました」などと簡単な返信でかまいません。 しかし、2008年の「信頼される社会人へのパスポート敬語検定」*1には、次のよう

    「了解」は失礼か? - アスペ日記
  • オナニーにおける「1コキ」について。

    オナニーにおいて、 陰茎を握り上下運動を行うことを、 「コク」と言う。 転じて、 手で「コク」事を「手コキ」。 足で「コク」事を「足コキ」。 尻で「コク」事を「尻コキ」。 等と表現される。 色々な方法での「コキ」方があるわけだ。 自身で「コク」場合にそれが使われるのは勿論、 他者に「コイ」て頂く際にもそれは使われる。 さて、 この「コク」とは、 一つの単位としても使われる。 1コキ、2コキ、3コキ、と。 そして、 1コキとは何をもって1コキなのかを明らかにしたく、 ここに明文化させていただいた。 原点として、 陰茎を握り上下運動を行うことを「コク」としている。 陰茎上部を握り、 1:下部へとスライドした段階で「1コキ」としてカウントするのか。 2:上部から下部、下部から上部へ戻した際に「1コキ」としてカウントするのか。 そこを明確にしたかった。 「半コキ」という言葉が好きだし、 それは非常

    オナニーにおける「1コキ」について。
  • 1