阅读量:0
strip_tags和正则表达式可以配合使用来过滤HTML标签以及其他特定的文本格式。下面是一个示例代码,演示如何结合使用strip_tags和正则表达式来过滤HTML标签:
import re def remove_html_tags(text): cleaned_text = strip_tags(text) # 去除HTML标签 cleaned_text = re.sub(r'<.*?>', '', cleaned_text) # 去除其他特定格式的文本,如<>中的内容 return cleaned_text html_text = "<p>Hello, <strong>world!</strong></p>" cleaned_text = remove_html_tags(html_text) print(cleaned_text) # Output: Hello, world!
在这个示例中,首先使用strip_tags函数去除HTML标签,然后使用正则表达式<.*?>
来匹配并去除<>中的内容,最终得到清理后的文本。通过结合使用strip_tags和正则表达式,可以更好地过滤文本中的特定格式内容。