エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント1件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
Python2系で文字参照のエスケープとか - 大絶賛名前募集中
車輪の再開発。 ほぼ同様の関数はHTMLParser.HTMLParser.unescapeやlxml.html.fromstringあたりにもある... 車輪の再開発。 ほぼ同様の関数はHTMLParser.HTMLParser.unescapeやlxml.html.fromstringあたりにもあるけれど、 前者は U+10000-U+10FFFFが無理 HTMLParser.HTMLParser()を一度生成しないと使えない←結構気に食わない だし、後者はunescapeのためにわざわざlxmlをimportするのも気が引けるので。 2系に限っているのは3系には既にあるため。 基本戦略はHTMLParser.unescapeと同じく(←書いてから知った)re.subを使う方法で。 re.subは第3引数(置換後文字列)に関数オブジェクトを置けるというのがポイントで、そこに文字参照→対応するユニコード文字(列)なる関数を置いてやればよい。 def unescape_charref(escaped): return re.sub('CHAR
2019/01/18 リンク