タグ

botに関するechigoya3のブックマーク (6)

  • 概要 UniDic

    UniDicは日語テキストに形態論情報を付与するための電子化辞書です。 UniDicは国立国語研究所のコーパスの構築に利用されています。 形態素解析辞書としてのUniDic(unidic-mecab)は形態素解析器MeCabの辞書として利用できます。 UniDicの特徴 FEATURE 国立国語研究所で規定した「短単位」という揺れの少ない斉一な単位で設計されています。 語彙素・語形・書字形・発音形の階層構造を持ち,表記の揺れや語形の変異にかかわらず同一の見出しを与えることができます。 語種をはじめとする言語研究に有用な情報を付与することができます。 アクセントや音変化の情報を付与することができ、音声処理の研究に利用することができます(現代語用のみ)。 言語資源としてのXML版UniDic 形態素解析辞書とは別に,言語資源として使いやすいXML形式にまとめたUniDicの公開を予定して

    echigoya3
    echigoya3 2014/02/05
    日本語テキストに形態論情報を付与するための電子化辞書 - 国立国語研究所コーパス開発センター
  • キーフレーズ抽出API の紹介

    ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは、日語処理技術部の阿久津剛之です。 Yahoo!デベロッパーネットワークにて、キーフレーズ抽出APIを公開しましたので紹介します。 キーフレーズ抽出APIとは、与えられた文章から、その文章を特徴づける重要な部分(キーフレーズ)を抽出し、独自の算出方法により点数付けを行って返すAPIです。 例えば、「東京ミッドタウンから青山一丁目駅まで歩いて15分かかります」という文章をキーフレーズ抽出APIに与えると、 「東京ミッドタウン」「青山一丁目駅」「15分」 という結果が返ってきます。 ここで、「青山一丁目駅」に注目してみましょう。 「青山一丁目駅」は、日形態素解析APIを用いて解析すると、 青山 / 一 / 丁目 / 駅

    キーフレーズ抽出API の紹介
    echigoya3
    echigoya3 2014/02/04
    文章から最大20個までのキーフレーズをスコア付きで返してくれるAPI
  • 伏見稲荷のおみくじ特集:イザ!

    大吉が一番多いようですね。純粋な凶はありませんが、凶っぽいものはいくつかあるようです。「吉凶不分末吉」「吉凶未分末大吉」など吉凶のよく分からないものがたくさんあります。おみくじの文面をよく見て自分で考えなければならないのでしょう。 この通常おみくじは殿と千鳥居を抜けた先にある奥社奉拝所で引くことが出来ます。そこを超えて山に登ると紙片では頂けません。ただし、伏見稲荷の山に登ると峰と呼ばれる祠の集積地がいくつかあります。 その各峰ごとにおみくじの筒と、吉凶の内容を記した看板が賽銭箱の右横辺りに置かれています。そこで無料で引くことが出来ますが、利用する際はお賽銭ぐらいはあげてください。 伏見稲荷の正式なおみくじはこれだけですが、周辺にもたくさんの神社仏閣があります。そこが独自のおみくじを置いているのです。また売店でもおみくじが置かれていたりします。 おみくじを置いているところは私の知る限り5

  • [PDF] 文書ジャンルとテキスト構造に着目した自動要約 - 国立情報学研究所

  • 川柳の自動生成アルゴリズムの紹介(どうしたら 機械で川柳 詠めるかな)

    メディア関係者向けお問い合わせ先 メールでのお問い合わせ: pr-jp@google.com メディア関係者以外からのお問い合わせにはお答えいたしかねます。 その他すべてのお問い合わせにつきましては、ヘルプセンターをご覧ください。

    川柳の自動生成アルゴリズムの紹介(どうしたら 機械で川柳 詠めるかな)
    echigoya3
    echigoya3 2013/08/16
    #bot
  • 品詞分類表

    品詞分類表って? 〈10種類覚えて!〉     基の「キ」  「自立語」「付属語」  すべての単語(これ以上小さくできない語の単位)は  1 「それだけで意味のわかる言葉」=自立語        2 「それだけでは意味のわからない言葉」=付属語に分けることができます。 さらに、「活用」=下に続く語によって変化する部分がある語かどうか、「主語」=「〜は」などの「〜」に使えるかどうか、 「述語」=「〜する」「〜の状態だ」「〜になる」などの言い回しに使えるかどうか、などによって、10種類の「品詞(ひんし)」 とよばれる種類に分ける方法を表したのが「品詞分類表(ひんしぶんるいひょう)」です。 (さらに代名詞を加え11品詞とする場合もあります。)

    echigoya3
    echigoya3 2013/08/02
    わかりやすい古典文法
  • 1