jigendaddyのブックマーク / 2024年5月29日

日本語wikipediaにおける助詞・助動詞の使用頻度 – ロボット研究

本サイトは舞台に立てるロボットを目指して、私が取り組んでいるプロセスを、主として記憶のために書き連ねているものです。先のいくつかの記事で示しているように、ロボットが知識的文章を短く語る時に、削除した語を繋ぐ助詞をAI的に選択させようとしている。（体言１：名詞・動詞）＋（助詞１：助詞・助動詞）＋（体言２：名詞・動詞）＋（助詞２：助詞・助動詞）の語の並びの中で、体言１、体言２、助詞２が与えられた時に適切な、助詞１を選択させたい。これができれば、うまく、文章を短くできるだろうということである。そこで、この並びを、日本語wikipediaの前文から拾い出して、それを元に、ディープラーニング用の学習データを作ろうということである。４語対は、6千万個取れて、語は、word2vecのウェイトベクトルであらわすのだが、そのベクトルを取れる語は、さらに半分以下になってしまう。また、助詞、助動詞部分のパ

はてなブックマーク

タグ

2024年5月29日のブックマーク (1件)

日本語wikipediaにおける助詞・助動詞の使用頻度 – ロボット研究

お知らせ

月間はてなブックマーク数ランキング（2024年10月）

今週のはてなブックマーク数ランキング（2024年10月第4週）

今週のはてなブックマーク数ランキング（2024年10月第3週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス