Java

【Java】HTMLの指定タグを削除する

JavaでHTMLを扱う際、任意のタグを削除したい場合がある。

以下コードで簡単にタグを削除できる。

/**
 * 指定のタグを削除する
 * @param str 対象文字列
 * @param tagName 削除対象のタグの名前
 * @return
 */
private static String htmlTagRemover(String str, String tagName) {
	str = str.replaceAll("<" + tagName + ".+?>", ""); // 開始タグ削除
	str = str.replaceAll("</" + tagName + ".+?", ""); // 終了タグ削除
	return str;
}

 

呼び出す側は以下。

// <a>タグを削除
data = htmlTagRemover(data, "a");