要去掉HTML标签,可以使用正则表达式或者Java的Jsoup库,这里给出一个使用Jsoup库的方法:

1、需要添加Jsoup库到项目中,如果你使用的是Maven项目,可以在pom.xml文件中添加以下依赖:
org.jsoup jsoup 1.14.3
2、使用Jsoup的clean方法去除HTML标签:
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
public class RemoveHtmlTags {
public static void main(String[] args) {
String html = "标题 这是一个段落。
这是另一个段落。
";
String text = removeHtmlTags(html);
System.out.println(text);
}
public static String removeHtmlTags(String html) {
Document document = Jsoup.parse(html);
return document.text();
}
}
这段代码会输出:
标题 这是一个段落。 这是另一个段落。
这样就去除了HTML标签,只保留了文本内容。