多くの文字データの中から特定の情報を取り出したいときがあります。 Pythonの正規表現と文字列置換(replaceメソッド)を使ってHTML内の特定のタグを消去してみます。 ちなみに正規表現というのは、文字列を特定のパターンとして認識して処理するための機能です。 正規表現は、多くのプログラミング言語で使うことができます。(C++, C#, Java, PHP, JavaScript… Cでも使えると言えば使える。たいていのCコンパイラはC++と同じく提供されているので) 次のHTMLコードからaタグのデータだけを消去したいとします。 <p>プログラミング学習<a href="http://diannao.work/">こちら</a></p> <p>暇つぶし<a href="https://youtube.com/">こっち</a></p> 最終的にこんな感じで取り出したいとします。 <p