[B! parsing] nabinnoのブックマーク

nabinno id:nabinno

parsingに関するnabinnoのブックマーク (46)

GitHub - ruby/lrama: Pure Ruby LALR parser generator
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
nabinno 2024/05/19
github

ruby

lrama

parsing
リンク
Ruby: 2024年までのPrismパーサーの長い歴史を振り返る（翻訳）｜TechRacho by BPS株式会社
概要 CC BY-NC-SA 4.0 Deedに基づいて翻訳・公開いたします。英語記事: Prism in 2024 | Rails at Scale 原文公開日: 2024/04/16 原著者: Kevin Newton CC BY-NC-SA 4.0 Deed | 表示 - 非営利 - 継承 4.0 国際 | Creative Commons 日本語タイトルは内容に即したものにしました。 syntax treeは「構文ツリー」と訳しています。lexerは英ママとしています。 Ruby 3.3.0では、Prismと呼ばれる新しい標準ライブラリがCRubyに追加されました。PrismはRuby言語を解析するパーサーであり、Cライブラリ版（CRubyでもオプションで利用可能）とRubyライブラリ版（Ruby gemとして利用可能）の両方が公開されています。Prismプロジェクトは多くの開発
nabinno 2024/05/19
ハードなお仕事

bps

shopify

kevin-newton

prism

ruby

parsing
リンク
The future vision of Ruby Parser
RubyKaigi 2023 https://rubykaigi.org/2023/presentations/spikeolaf.html ruby/lrama https://github.com/ruby/lrama
nabinno 2023/05/13
speaker-deck

yuichiro-kaneko

ruby

parsing
リンク
GitHub - qcam/fiet: Fiết is a RSS feed parser in Elixir, which focuses on extensibility, speed, and standard compliance
nabinno 2018/12/29
github

fiet

rss

parsing

elixir
リンク
【お遊び】シンカリオンのトンデモメールを構文解析 - Qiita
新幹線変形ロボシンカリオンというアニメで印象的だった以下のようなメールの一文がありました。言ってあったか言ってなかったかどっちだったかちゃんと覚えていないけど、確かこの間手巻きパーティをやった時にちょこっと言った気がしなくもなきにしもあらずで多分言ったんじゃないかな、とココまで考えてみたけど、まあ言ってようが言っていまいがそこまで問題ないよね、と思うに至った次第です。このメールは、アニメで1秒程度しか出ておらず、制作スタッフの遊び心が満載の文です今回はその文をCabochaを使って構文解析してpydotで表示しました。やっていることは記事「滝沢カレンの理解不能な文章を言語解析してみた。」の二番煎じです。構文解析結果長文だけあって大きい・・・思ったよりもよく解析できています。見れば見るほどひどい文ですね。ソース Pythonで書いています。言語処理100本ノックの合間にちょ
nabinno 2018/10/23
qiita

cabocha

parsing

natural-language-processing

machine-learning

analytics
リンク
Cabocha環境をWindowsでDockerを使ってお手軽構築 - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
nabinno 2018/10/17
qiita

cabocha

parsing

natural-language-processing

machine-learning

analytics
リンク
素人の言語処理100本ノック:48 - Qiita
言語処理100本ノック 2015の挑戦記録です。環境はUbuntu 16.04 LTS ＋ Python 3.5.2 :: Anaconda 4.1.1 (64-bit)です。過去のノックの一覧はこちらからどうぞ。第5章: 係り受け解析夏目漱石の小説『吾輩は猫である』の文章（neko.txt）をCaboChaを使って係り受け解析し，その結果をneko.txt.cabochaというファイルに保存せよ．このファイルを用いて，以下の問に対応するプログラムを実装せよ． 48. 名詞から根へのパスの抽出文中のすべての名詞を含む文節に対し，その文節から構文木の根に至るパスを抽出せよ．ただし，構文木上のパスは以下の仕様を満たすものとする．各文節は（表層形の）形態素列で表現するパスの開始文節から終了文節に至るまで，各文節の表現を"->"で連結する「吾輩はここで始めて人間というものを見た」とい
nabinno 2018/08/27
qiita

cabocha

parsing

natural-language-processing

machine-learning

analytics
リンク
素人の言語処理100本ノック:49 - Qiita
言語処理100本ノック 2015の挑戦記録です。環境はUbuntu 16.04 LTS ＋ Python 3.5.2 :: Anaconda 4.1.1 (64-bit)です。過去のノックの一覧はこちらからどうぞ。第5章: 係り受け解析夏目漱石の小説『吾輩は猫である』の文章（neko.txt）をCaboChaを使って係り受け解析し，その結果をneko.txt.cabochaというファイルに保存せよ．このファイルを用いて，以下の問に対応するプログラムを実装せよ． 49. 名詞間の係り受けパスの抽出文中のすべての名詞句のペアを結ぶ最短係り受けパスを抽出せよ．ただし，名詞句ペアの文節番号が i と j （ i < j ）のとき，係り受けパスは以下の仕様を満たすものとする．問題48と同様に，パスは開始文節から終了文節に至るまでの各文節の表現（表層形の形態素列）を"->"で連結して表現する
nabinno 2018/08/27
qiita

cabocha

parsing

natural-language-processing

machine-learning

analytics
リンク
[環境構築] Python 2.7 で CaboCha を使用して係り受け解析 - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
nabinno 2018/08/27
qiita

cabocha

parsing

natural-language-processing

machine-learning

analytics
リンク
Python+WindowsでのMecab/Cabocha/KNP - Qiita
やりたいこと Windows+pythonでMecab/Cabocha/KNPを使う時、楽しようとして「import mecab」や、「import Cabocha」を使うとリコンパイルやら、UTF-8指定やら、面倒くさくなる。そこで、Sjift-Jis＋外部呼び出しで、デフォルトインストールで使えるようにする。環境 Windows Mecab/Cabocha/Juman/KNPのインストール(SHIFT-JISで) Mecab/Cabocha/Juman/KNPは環境変数に通しておくソース homefldrを任意の場所に設定すること (2016/12/17 追記:KNPにも対応) import os import subprocess from tempfile import NamedTemporaryFile class JapaneseDependencyRelation:
nabinno 2018/08/27
qiita

cabocha

parsing

natural-language-processing

machine-learning

analytics
リンク
Cabochaで活用して自動で「IOB2タグcorpus」学習データを発生 - Qiita
#coding: utf-8 from __future__ import print_function # Only needed for Python 2 import MeCab import CaboCha import sys import os cabocha = CaboCha.Parser("-f1 -n1") m = MeCab.Tagger ("-Ochasen") # For reading from file class getWords(): def readText(self, filename): ###ファイルを展開 with open(filename, 'r', encoding='utf-8') as f: tText = f.read() f.close() return tText #Usage: python training_generator
nabinno 2018/08/27
qiita

cabocha

parsing

natural-language-processing

machine-learning

analytics
リンク
Elixirで弱々しいAI#3「MeCab辞書差し替え |> CaboChaモジュールの作成」 - Qiita
（この記事は Elixir (その2)とPhoenix Advent Calendar 2016 8日目の記事です）前回は、PhoenixでWebアプリ化して、最後に出現した固有名詞をオウム返しする、多少は言われたことを掴む（文字通り「掴む」だけですが…）貧弱AIを作りましたが、「進撃の巨人」を知らないオールドタイプであることが判明しました今回は、MeCabの辞書を差し替え、貧弱AIを現代っ子に進化させた後、文章の構成を解析するための「CaboCha」をElixirで使えるようにします CaboChaのElixirモジュールは、世に無いようなので、今回作ってみますなお、本コラム中の「Elixirの書き方」については、あまり細かく説明をしていないので、「ここの書き方が分からない」とか「この処理が何をしているのかよく分からない」等あれば、コメントいただければ、回答します新語辞書に差し替
nabinno 2018/08/27
qiita

cabocha

parsing

natural-language-processing

machine-learning

analytics
リンク
Elixirで弱々しいAI#4「文脈から意味を読み取る」 - Qiita
5/8追記→【業務連絡w】altさん、コードの色付け、ありがとうございますm(__)m （この記事は Elixir (その2)とPhoenix Advent Calendar 2016 9日目の記事です）前回は、CaboChaで文章構成を解析するための準備を行いました今回は、いよいよAIらしいロジックである、意味解析．．．つまり、文脈から意味を読み取ってアクションする（といってもカンタンなものですが）を作り込んでいきますなお、本コラム中の「Elixirの書き方」については、あまり細かく説明をしていないので、「ここの書き方が分からない」とか「この処理が何をしているのかよく分からない」等あれば、コメントいただければ、回答します特に今回は、データ変換の書き方が、けっこう難しい領域に入っていきます（＆安易にcaseで書いてしまった(-_-u．．．）ので、遠慮無くご質問いただければと思います
nabinno 2018/08/27
qiita

cabocha

parsing

natural-language-processing

machine-learning

analytics
リンク
Elixirで弱々しいAI#5「感情のコーディング」 - Qiita
（この記事は Elixir (その2)とPhoenix Advent Calendar 2016 10日目の記事です）前回までは、文章解析を中心に作ってきましたが、少し方向性を変え、AIに感情のような「状態」を持たせ、その状態次第で返事を変えるようなロジックを作ってみましょうなお、本コラム中の「Elixirの書き方」については、あまり細かく説明をしていないので、「ここの書き方が分からない」とか「この処理が何をしているのかよく分からない」等あればコメントください人間の感情について Wikipediaには感情に関するこんな一覧がありますが、人間の感情は、複雑な切り口や分類を持っています中でも、会話に特化した分類というものがあり、感じたことから、どのようなアクションが行われるか、といった整理もありますこういった情報をヒントに、AIの感情というものを設計してみるとしましょうちなみにこの
nabinno 2018/08/27
qiita

cabocha

parsing

natural-language-processing

machine-learning

analytics
リンク
Elixirで弱々しいAI#6「くだけた会話も理解する」 - Qiita
（この記事は Elixir (その2)とPhoenix Advent Calendar 2016 11日目の記事です）前回は、AIに感情のような「状態」を持たせ、その状態次第で返事を変えるようなロジックを作ってみました最終回である今回は、くだけた会話もそこそこ理解できるようにするための工夫として、幾つかのトリッキーな構文での応答を作り込みますまた、Wikipediaから引用するようなロジックも作ってみたいと思いますなお、本コラム中の「Elixirの書き方」については、あまり細かく説明をしていないので、「ここの書き方が分からない」とか「この処理が何をしているのかよく分からない」等あればコメントくださいくだけた会話のパターンひとまず、以下のような、くだけた会話に対応できるよう、品詞等の構成とリアクションを整理しますパターン品詞等の構成リアクション
nabinno 2018/08/27
qiita

cabocha

parsing

natural-language-processing

machine-learning

analytics
リンク
CaboCha をサーバ化して起動時間を節約する - Qiita
概要構文解析器 CaboCha は、実際の1文あたりの処理時間はそれなりに速い（計算機の処理速度が大幅に向上している現代では）のですが、起動時に大きなモデルファイルを読み込む必要があるため、起動にはそれなりに時間がかかります。対話エンジンなどのレイテンシが重要なプログラムでは、この起動時間が大きなネックとなる場合があります。1回の応答生成の度に、CaboCha を起動し直していたのでは、応答時間が遅くなってテンポの良い対話ができなくなってしまうわけです。本稿では、CaboCha をサーバとして常駐させておくことにより、起動時間を節約してレイテンシを改善する方法を示します。本稿の方法は、サーバとクライアントからなります。サーバ側は、指定されたポートで待ち受ける HTTP サーバとして動作します。/cabocha?文字列という GET リクエストのみに反応して、指定された文字列を Ca
nabinno 2018/08/27
qiita

cabocha

parsing

natural-language-processing

machine-learning

analytics
リンク
root権限なしでCaboChaをインストールする． - Qiita
root権限がない状況でCaboCha1をインストールする方法です．Cabochaをインストールするためには CRF++ (0.55以降)2 MeCab (0.993以降)3 が必要なので事前に併せてインストールしています．検証環境 Ubuntu 16.04.3 LTS インストール場所の作成 CRF++,MeCab,CaboChaをインストールするための場所を~/usrに作ります． echo "export PATH=$HOME/usr/bin:$PATH" >> ~/.bashrc echo "export LD_LIBRARY_PATH=${HOME}/usr/lib" >> ~/.bashrc source ~/.bashrc mkdir $HOME/usr wget 'https://docs.google.com/uc?export=download&id=0B4y35FiV
nabinno 2018/08/27
qiita

cabocha

parsing

natural-language-processing

machine-learning

analytics
リンク
ubuntu16.04LTSにMecabとCaboChaをインストールしてpython3系から使えるようにする - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
nabinno 2018/08/27
qiita

cabocha

parsing

natural-language-processing

machine-learning

analytics
リンク
cabocha-python のインストールには python-dev / python3-dev / python3.6-dev などが必要 - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
nabinno 2018/08/27
qiita

cabocha

parsing

natural-language-processing

machine-learning

analytics
リンク
pythonで言語処理するためのライブラリインストール方法（Mecab/Cabocha） - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
nabinno 2018/08/27
qiita

cabocha

parsing

natural-language-processing

machine-learning

analytics
リンク
1 2 3 次のページ

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx