[B! python][日本語] koma_gのブックマーク

koma_g id:koma_g

pythonと日本語に関するkoma_gのブックマーク (8)

rich/README.ja.md at master · Textualize/rich
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
koma_g 2022/09/17
あとで読む

python

ライブラリ

rich

日本語
リンク
GitHub - p-geon/ja-tokenizer-docker-py: Mecab + NEologd + Docker + Python3
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
koma_g 2022/05/09
自然言語処理

python

docker

日本語
リンク
リクルート、Python向け日本語自然言語処理オープンソースライブラリ「GiNZA」公開
リクルートはこのほど、同社のAI研究機関・Megagon Labsが開発したPython向け日本語自然言語処理オープンソースライブラリ「GiNZA」（ギンザ）と、国立国語研究所と共同で研究してきた学習済みモデルを組み込んだ「GiNZA日本語Universal Dependencies（UD）モデル」をGitHubで公開した。 GiNZAは、複雑な導入作業不要で、ワンステップでモジュールとモデルファイルの導入が可能なライブラリ。エンジニアやデータサイエンティストが自然言語処理を簡単に応用できることを目指して開発したという。自然言語処理ライブラリ「spaCy」をフレームワークとして利用し、オープンソース形態素解析器「SudachiPy」を組み込んでおり、「産業用途に耐える性能を備えている」としている。spaCyの国際化機能により、複数の欧米言語と日本語の言語リソースを切り替えて使用することも
koma_g 2019/10/13
あとで読む

python

日本語

ライブラリ

自然言語処理
リンク
pysummarization
Unverified details These details have not been verified by PyPI Project links Homepage Meta License: GNU General Public License v2 (GPLv2) (GPL2) Author: accel-brain Tags Automatic, summarization, document, abstraction, abstract, text, filtering Automatic Summarization Library: pysummarization pysummarization is Python3 library for the automatic summarization, document abstraction, and text filter
koma_g 2019/10/04
あとで読む

python

NLP

自然言語

要約

日本語
リンク
GiNZA - Japanese NLP Library
Skip to the content. GiNZAの公開ページ What’s new! GiNZA v5.2.0をリリースしました (2024.03.31) 日本語の節認定のためのAPIを追加 (experimental) ja_ginza_bert_largeのβ版を公開中 cl-tohoku/bert-large-japanese-v2をベースモデルに採用精度が大幅に向上（LAS=0.938, UAS=0.949, UPOS=0.983, ENE=0.708） CUDAに対応し8GB以上のRAMを搭載したGPU環境、または、M1・M2などApple Silicon環境の利用を推奨 ginzaコマンドで日本語以外を含む全てのspaCyモデルが利用可能に ginza -m en_core_web_md の形でモデル名を指定することでCoNLL-U出力ツールとして利用可能 ginzaコマ
koma_g 2019/04/03
あとで読む

NLP

ライブラリ

日本語

論文

python
リンク
Pythonで学ぶはじめてのプログラミング入門教室/みんなのPythonサポートページ
Pythonで音声合成。 gTTSは日本語にも対応しているので，tts = gTTS(text='こんにちは', lang='ja')とすると女性の声で「こんにちは」ってしゃべります。 https://python programminglanguage.com/text-to-speech/...
koma_g 2018/02/04
python

音声

日本語

api
リンク
Python による日本語自然言語処理
はじめにこの文書は、 Steven Bird, Ewan Klein, Edward Loper 著萩原正人、中山敬広、水野貴明　訳『入門自然言語処理』 O'Reilly Japan, 2010. の第12章「Python による日本語自然言語処理」を、原書 Natural Language Processing with Python と同じ Creative Commons Attribution Noncommercial No Derivative Works 3.0 US License の下で公開するものです。原書では主に英語を対象とした自然言語処理を取り扱っています。内容や考え方の多くは言語に依存しないものではありますが、単語の分かち書きをしない点や統語構造等の違いから、日本語を対象とする場合、いくつか気をつけなければいけない点があります。日本語を扱う場合にも
koma_g 2014/11/03
python

日本語

文字コード

NLP

自然言語処理
リンク
PythonのUnicodeEncodeErrorを知る - HDEラボ
Pythonにはじめて触って、いつのまにか1年が過ぎたのですが、一番はまったのは、やっぱりunicodeの扱いだったと思います。特に、 UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-12: ordinal not in range(128) のようなエラーにはさんざん悩まされました。ここがたとえばrubyなど他の言語と比べてわかりにくいために、Pythonが取っつきにくい言語になっているのではないか、と個人的には思います。そこで、このエラーに関係するはまりどころとTipsをいくつか列挙してみました。これからPythonに触れられる方の参考になればと思います。なお、環境はUNIX上のPython 2.4, 2.5を想定しています。 u1はunicode型で、s1はstr型です。s1にどのよ
koma_g 2014/10/15
ハマリポイントと解法

python

文字コード

unicode

日本語

encoding
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx