例 7.1. Perl正则去除html的tag
想要将html
<h1>h1 content</h1> <div> div test </div> <invalidTag> invalid tag test </invalid>
中的标签tag去掉,变成:
h1 content div test <invalidTag> invalid tag test </invalid>
用的perl的正则的代码是:
$filteredHtml =~ s/<(\w+?)>(.+?)<\/\1>/$2/sg;
详细代码可参考【已解决】Perl中的正则表达式的替换和后向引用