並び順

ブックマーク数

期間指定

  • から
  • まで

41 - 51 件 / 51件

新着順 人気順

係助詞の検索結果41 - 51 件 / 51件

  • 文章作成に役立つ  読み手に違和感をあたえることなく自然に話題を切りかえる書き方 - 京都案内  こうへいブログ

    有題文「は」と無題文「が」 日本語のセンテンスというのは、大きく二通りに区分けすることができます。 それは、名詞句に「は」がついて述べられる「有題文」と、名詞句に「が」がつく「無題文」というように大きく分かれるのです。 たとえば、 a ) 太郎は講演会に来た。 b) 見知らぬ男(✖は / が)講演会に来た。 という文で比較してみると、b)の「見知らぬ男」は、指示対象が特定されていない「不定」の名詞句なので「は」を使うことは出来ません。 「は」を使うには、a)のような有題文にみられる「太郎」のように、指示対象が決められた「定」の名詞句でなければならないんです。 そう、未知の対象に「は」を使うことは出来なくて、特定名詞として扱われているか、もしくは、そこまでの文脈によって読み手に認知されていないと「は」という係助詞は使用できないんですね。 無題文に見られる未知の指示対象には「が」が使用されます

      文章作成に役立つ  読み手に違和感をあたえることなく自然に話題を切りかえる書き方 - 京都案内  こうへいブログ  
    • Elasticsearchで日本語の形態素解析を行おう。

      GET /damedame_analyzer/_analyzer { "analyzer": "standard", "explain" : true, "text": "私は、今年25歳になりました。昼は仕事をして夜はお酒を飲んでいます。趣味はバイクです。" } { "detail" : { "custom_analyzer" : false, "analyzer" : { "name" : "standard", "tokens" : [ { "token" : "私", "start_offset" : 0, "end_offset" : 1, "type" : "<IDEOGRAPHIC>", "position" : 0, "bytes" : "[e7 a7 81]", "positionLength" : 1, "termFrequency" : 1 }, { "token"

        Elasticsearchで日本語の形態素解析を行おう。
      • RでMeCab(RcppMeCab)を利用して形態素解析する方法

        RcppMeCabとは RcppMeCabは、Junhewk Kim氏が開発している、MeCabとRcppを利用して形態素解析するためのRパッケージです。 junhewk/RcppMeCab CRAN - Package RcppMeCab RcppMeCabによる形態素解析の例 形態素解析するための関数として、RcppMeCab::posとRcppMeCab::posParallelの2つがあります。両者はまったく同じ機能を提供するものですが、posParallelのほうは形態素解析の処理を内部的にマルチスレッドで回すことができます。posParallelが対応しているOS・プラットフォームならば、基本的にposParallelを使っておくほうが速いです。 渡す引数によって、以下のような出力を得ることができます。 require(RcppMeCab) sentence <- c("陽が照

          RでMeCab(RcppMeCab)を利用して形態素解析する方法
        • PHPを使って形態素解析と文章の類似度を出してみる - エキサイト TechBlog.

          ご無沙汰しております。 taanatsuです。 今回は珍しくPHPの記事を書いていこうと思います。 ExciteといえばPHPですからね!しらんけど。 形態素解析 皆さんは「形態素解析」という言葉を耳にしたことがありますでしょうか? 機械学習だ!AIだ!と騒がれる昨今、文章の解析で使われる手法の一つがこの形態素解析です。 私は漢字が4つ以上並ぶと読めなくなるので、形態素解析という言葉が苦手ではあります。 形態素解析とは、文章を「形態素」、いわゆる名詞・動詞・形容詞・副詞のような、日本語の最小単位の単語に分割する処理のことを言います。 形態素解析器「MeCab」 形態素解析を行ってくれるツールです。 今回はよく使われる「MeCab」を利用していきたいと思います。 で、Windowsの方はすいません。。。 会社のPCがMacなので、この記事はMac用になります。 私個人はWindows機を利用

            PHPを使って形態素解析と文章の類似度を出してみる - エキサイト TechBlog.
          • AWS のビデオ分析と Elasticsearch の全文検索を使って映像検索システムを作りました。 - Qiita

            AWS のビデオ分析と Elasticsearch の全文検索を使って、映像検索システムを作りました。記録を残させていただきます。 報告する内容 検索サービス概略 Amazon Rekognition というビデオ分析サービスから得られる情報 得られる情報が英語なので、翻訳サイト Excite で翻訳して使うことにしました。 Elasticsearch のデータスキーマ 検索サービスのアルゴリズム 映像頭出し再生の HTML と Javascript ほかに考えられる映像検索サービス システムを構築したのが2年前くらいなので、Elasticsearch のバージョンが6くらいです。Java でプログラミングしてあり、今も動きますが、Java のバージョンも11です。なので、プログラムは掲載しません。エッセンスのみご報告させていただきます。 検索サービス概略 検索サービスを受け付けるページは

              AWS のビデオ分析と Elasticsearch の全文検索を使って映像検索システムを作りました。 - Qiita
            • ぬばたまの夜さり来れば・・・巻第7-1101 - 大和の国のこころ、万葉のこころ

              訓読 >>> ぬばたまの夜さり来れば巻向(まきむく)の川音(かはと)高しも嵐(あらし)かも疾(と)き 要旨 >>> 暗闇の夜がやってくると、巻向川の川音が高くなった。嵐が来ているのだろうか。 鑑賞 >>> 『柿本人麻呂歌集』から1首。「ぬばたまの」は「夜」の枕詞。「巻向川」は、巻向山から三輪山の北を西流し、初瀬川にそそぐ川。「嵐かも」の「かも」は、疑問の係助詞。「嵐」の原文は「荒足」で、「荒」は、本来は、始原的で霊力が強く発動している状態をあらわす言葉とされ、そういった意味がここにも感じ取られています。 この歌について斎藤茂吉は「無理なくありのままに歌われているが、無理がないといっても、『ぬばたまの夜さるくれば』が一段、『巻向の川音高しも』が一段、共に伸々とした調べであるが、結句の『嵐かも疾き』は、強く緊(し)まって、厳密とでもいうべき語句である」と言い、「人麿を彷彿せしむるものである」と

                ぬばたまの夜さり来れば・・・巻第7-1101 - 大和の国のこころ、万葉のこころ
              • 形態素解析器(Janome)を使いこなしたい! - Qiita

                はじめに 「形態素解析器を使いこなしたい!」、そう思ったのはいったいいつからか... 今回は形態素解析器であるJanomeの公式Documentを自分なりにまとめました! 形態素解析器の使い方がよくわかっていない方の参考になれば幸いです! 参考文献 Janome API reference v0.4 Janome v0.4 documentation (ja)WELCOME TO JANOME'S DOCUMENTATION! (JAPANESE) Python, Janomeで日本語の形態素解析、分かち書き(単語分割) 目次 Tokenizer Analyzer char_filters token_filters janome.tokenizer module 入力した文字列を"Token"に変換して出力します。 from janome.tokenizer import Tokeniz

                  形態素解析器(Janome)を使いこなしたい! - Qiita
                • 小西甚一の古文学習三部作の価値−佐伯文法の影響を中心に− - 鶏肋断想

                  2018年3月24日(土) 国語教育史学会・第60回例会 於早稲田大学・発表資料 小西甚一の古文学習参考書三部作の価値 −佐伯文法の影響を中心に− 國學院大學兼任講師 大東文化大學非常勤講師 岡田 誠 序 小西甚一は、日本文学研究社として数多くの分野で業績を残したが、古文の学習参考書の名著を書き残したことでも知られている。小西甚一の書いた代表的な古文の学習参考書をあげると以下の三冊になる。 『古文研究法』(洛陽社)昭和30年 『国文法ちかみち』(洛陽社)昭和34年 『古文の読解』(旺文社)昭和37年 これらの三冊は、その水準は高く、後の学習参考書の模範とされたといわれている。これらの学習参考書は、初版が旧制から新制に学校制度が切り替わってから10年以内に書かれたもので、共通一次試験、センター試験導入以前の時期であり、入試問題も現在のような客観式のマーク問題ではなく、じっくりと読解させるもの

                    小西甚一の古文学習三部作の価値−佐伯文法の影響を中心に− - 鶏肋断想
                  • How to Tokenize Japanese in Python

                    Over the past several years there's been a welcome trend in NLP projects to be broadly multi-lingual. However, even when many languages are supported, there's a few that tend to be left out. One of these is Japanese. Japanese is written without spaces, and deciding where one word ends and another begins is not trivial. While highly accurate tokenizers are available, they can be hard to use, and En

                      How to Tokenize Japanese in Python
                    • jphrase

                      View statistics for this project via Libraries.io, or by using our public dataset on Google BigQuery Meta License: MIT License Author: shimajiroxyz Requires: Python >=3.11 jphraseは、日本語のテキストを文節に分割するためのライブラリです。 形態素解析から得られた単語の品詞情報に基づき、ルールベースで文節を決定します。 Basic Usage from jphrase import PhraseSplitter splitter = PhraseSplitter() print(splitter.split_text("今日はよく寝ました")) ['今日は', 'よく', '寝ました'] splitter = Phr

                        jphrase
                      • 形態素解析・Ngramとbag-of-words - Qiita

                        引き続き、機械学習やその他色々について得た知識を 復習and記事作成の練習and個人の備忘録としてまとめていきますよん! 今回も前回と同様、自然言語処理の分野です! タイトルの内容について、ざっくりといろいろ書いていきます! ⚠︎※※注意※※⚠︎ ・出来るだけ専門知識のあまりない人に対して、分かりやすく書くことを目標にしています。 そのため、厳密に言うと間違っている部分があると思いますがご容赦ください。 ・また、ネットで調べたレベルの知識がほとんどなので、 "厳密に言うと"レベルではなく間違っている箇所があるかもしれません。。 その場合は非常に申し訳ないです。指摘していただけると幸いです! 参考 自然言語処理の仕組みと手順 日本語形態素解析の裏側を覗く!MeCabはどのように形態素解析しているか 前回までの記事 ・機械学習について ・教師あり学習 〜回帰〜 ・教師あり学習 〜分類〜 ・Ra

                          形態素解析・Ngramとbag-of-words - Qiita