タグ

日本語に関するsato_susumuのブックマーク (6)

  • Out-of-the-box - 日本語Wikipediaで学習したdoc2vecモデル

    Wikipediaを対象にdoc2vec学習させたモデルを作成したので、学習済みモデルとして公開します。 概要 doc2vecは2014年にQuoc LeとTomas Mikolovによって発表された文章の埋め込みの手法です。今更doc2vecかという感じではありますが、日語のdoc2vecの学習済みモデルは探した限り容易に利用できるものがなかったこともあり、せっかくなので作成したモデルを配布します。 word2vecのような単語の分散表現においては学習済みモデルとして配布されたものを利用することが多いですが、文章の埋め込みに関しては対象とするドキュメント集合やそのドメインに特化した学習モデルを作成することが多い印象です。なので、学習済みモデルファイルの配布自体にそれほど意味があるわけではなさそうですが、既存手法との比較に利用したり、とりあえず何かしらの手法で単語列から文章ベクトル

    Out-of-the-box - 日本語Wikipediaで学習したdoc2vecモデル
  • 「死神」という表記は、出版社の校閲から「死に神」に改めるよう注文がくるという話

    あいざわ(相澤信一) @wingletter 「死神」という表記。講談社の校閲からは「『死に神』に改めなさい」という注文がきます。ぼくは「『に』という送り仮名はマヌケで白けてしまうので、イヤです」と突っぱねて、ちょっとしたイザコザになりました。 2021-06-03 21:35:25 あいざわ(相澤信一) @wingletter 双極性障害Ⅱ型(躁うつ病)に長年苦しんできましたが、なんとか折り合いをつけ、現在はwebマンガ編集の仕事に携わっています。ツイートは個人的な見解に基づくもので、所属先とはいっさい関係ございません。おもにマンガと業界の情勢/文学作品全般/深夜アニメ/躁うつ/酒場放浪記/そのほか日常の諸々についてつぶやいています。

    「死神」という表記は、出版社の校閲から「死に神」に改めるよう注文がくるという話
  • 「松明(たいまつ)」という字の「なんてそっちが『まつ』やねんというツッコミからはじまるなんでそっちやねん選手権

    ねこぜもん @nekozemon イラストとアニメーション✍️|MV/ジャケット/グッズ制作などのモノ作りをしております|映像参加作品まとめhttps://t.co/xIbbMIFhlx |ご依頼は今いっぱいいっぱいです…!🙇‍♂️ https://t.co/QhWxdOwHgt ゆる言語学ラジオ@著書『言語沼』発売中! @yuru_gengo 松明(たいまつ)は、「焚き松」のイ音便から。 漢字表記では同義の「松明(しょうめい)」から。 やまとことばに無理くり漢語を当てはめてしまって松の位置が真逆になっちゃった。(水野) #語源辞典ぜんぶ読む 2021-04-15 23:28:03

    「松明(たいまつ)」という字の「なんてそっちが『まつ』やねんというツッコミからはじまるなんでそっちやねん選手権
  • 黒tobirisuの黒々日記 熟字訓・当て字一覧

    下記の仲間。 日語アレコレの索引(日々増殖中) http://1311racco.blog75.fc2.com/blog-entry-2828.html語アレコレの索引(日々増殖中)【13】 http://mixi.jp/view_diary.pl?id=1929935424&owner_id=5019671 mixi日記2014年11月日から 熟字訓・当て字 世の中には、「熟字訓」とか「当て字」と呼ばれるものがある。なかには「それは読めない」というものもあり、なんでもかんでも認めると収拾がつかなくなる。 植物や魚介類の名前は、2字以上になるとほとんどが当て字だろう。 和布/稚海藻/若布/裙蔕菜……全部「わかめ」らしいorz。 常用漢字表が「熟字訓」としているものは、一般的と考えてよいだろう。 【改定常用漢字表】 http://www.bunka.go.jp/bunkashingi

  • 熟字訓 - Wikipedia

    この記事の内容の信頼性について検証が求められています。 確認のための文献や情報源をご存じの方はご提示ください。出典を明記し、記事の信頼性を高めるためにご協力をお願いします。議論はノートを参照してください。(2010年8月) 熟字訓(じゅくじくん)とは、日語において漢字からなる単語に、単字単位ではなく熟字単位で訓読み(訓)を当てたものである。それ故に、単字に分解してもそれぞれに熟字訓の要素は現れず、その読み方でも分節不可能なものが多い。 常用漢字表[1]の付表には、熟字訓の全てではないが、そのうちの116種(123表記)が示されている。 特徴[編集] 例えば、「明日」に「あす」という訓が当てられているが、単字の「明」や「日」に「あす」の要素は無く、読みの「あす」は「あ」と「す」に分けられない。漢語においては、「明」と「日」は修飾や被修飾の関係で組み合わせて新たな意味を作り出しているのであっ

  • Technical Writing  |  Google for Developers

    Send feedback Stay organized with collections Save and categorize content based on your preferences. Every engineer is also a writer. This collection of courses and learning resources aims to improve your technical documentation. Learn how to plan and author technical documents. You can also learn about the role of technical writers at Google.

    Technical Writing  |  Google for Developers
  • 1