[B! Python][日本語] ni66lingのブックマーク

ni66ling id:ni66ling

Pythonと日本語に関するni66lingのブックマーク (5)

face_recognition/README_Japanese.md at master · m-i-k-i/face_recognition
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
ni66ling 2021/01/06
face_recognition

github

python

face

recognition

日本語
リンク
https://www.freia.jp/taka/blog/python-textwrap-with-japanese/index.html
ni66ling 2020/11/15
text

wrap

python

日本語
リンク
Budou - 機械学習を用いた日本語改行問題へのソリューション - ウェブ雑記
こんにちは！日本語のウェブサイトを作っていると、日本語特有の問題にぶちあたることがありますよね。その中でも今回着目したいのは、日本語改行問題。最近、この問題を解決するためのライブラリを公開したので、紹介します。 github.com そもそも日本語改行問題とは何かウェブブラウザで日本語で書かれたウェブサイトを見ていると、ときどき文章が変なところで改行されているのを目にすることがありますよね。たとえば、こんなかんじ。「ソリューション」が「ソリューショ」と「ン」に分かれてしまっています。読みにくいですね。英語では単語がスペースによって区切られますが、日本語や中国語などのアジア圏の言語では単語がスペースで区切られないことが多いです。そのため、英語では単語の途中で改行されることは通常ありませんが、日本語では単語の途中で改行されることがよくあります。本文ならともかく、見出しやキャッチ
ni66ling 2016/09/13
日本語

改行

機械学習

python

budou
リンク
Pythonで unicodedata.normalize を使って全角半角を正規化する方法
（この記事は 2008年03月14日に別のブログに投稿した記事を移動・編集したものです。）インターネット上の日本語を扱っていると、全角半角が統一されていない事による表記揺れをなんとかしたい場面に出くわします。半角で書かれた iPod も、全角で書かれたｉＰｏｄも同じものとして扱いたいときや、あるいは単に見た目がきれいになるように、英数字は半角に、カタカナは全角にそろえたい、という場合です。 Python では setomitsさんによる zenhan.py を使うと、文字種ごとに全角半角を選択して変換することができ、除外文字も設定できるので便利です。ただ、そこまで柔軟でなくても良く、単に表記揺れがなくなれば良い、という場合も多いかと思います。その場合はPythonの標準ライブラリに含まれる unicodedata モジュールの normalize 関数を使うと便利です。 >>> impo
ni66ling 2013/10/25
Python

日本語

正規化

NFKC
リンク
Pythonで正規表現に日本語を使用する。 | 日記
一定期間更新がないため広告を表示しています
ni66ling 2013/10/25
python

regex

日本語
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx