行业资讯 2025年08月6日
0 收藏 0 点赞 676 浏览 1873 个字
摘要 :

文章目录 1.使用StringEscapeUtils.unescapeHtml4() 2. 使用纯Java 学会取消转义字符串中的HTML字符。下面的示例将一个HTML字符串取消转义为包含与转义对应的实际Unico……




  • 1.使用StringEscapeUtils.unescapeHtml4()
  • 2. 使用纯Java

学会取消转义字符串中的HTML字符。下面的示例将一个HTML字符串取消转义为包含与转义对应的实际Unicode字符的字符串。

1.使用StringEscapeUtils.unescapeHtml4()

StringEscapeUtils类是Apache 公共文本库的一部分,用于从 Maven 存储库导入其最新版本。

<dependency>
    <groupId>org.apache.commons</groupId>
    <artifactId>commons-text</artifactId>
    <version>1.10.0</version>
</dependency>

unescapeHtml4 ()方法:

  • 将转义字符串作为参数。如果参数字符串为null则返回null。
  • 支持所有已知的 HTML 4.0 实体。
  • 如果一个实体未被识别,它就会被保留。

我们可以使用StringEscapeUtils.unescapeHtml4()如下方法:

String escapedString = \"&lt;java&gt;public static void main(String[] args) { ... }&lt;/java&gt;\";
String unEscapedHTML = StringEscapeUtils.unescapeHtml4(escapedString);
System.out.println(unEscapedHTML);

程序输出:

<java>public static void main(String[] args) { ... }</java>

2. 使用纯Java

我们可以创建自定义方法来支持其他 HTML 实体或库不支持的自定义 HTML 实体。

以下方法接受输入字符串,搜索所有 HTML 实体并在找到时对它们进行取消转义。我们可以根据需要添加或删除更多实体。

private static HashMap<String, String> htmlEntities;
  static {
    htmlEntities = new HashMap<String, String>();
    htmlEntities.put(\"&lt;\", \"<\");
    htmlEntities.put(\"&gt;\", \">\");
    htmlEntities.put(\"&amp;\", \"&\");
    htmlEntities.put(\"&quot;\", \"\\\"\");
    htmlEntities.put(\"&nbsp;\", \" \");
    htmlEntities.put(\"&copy;\", \"\\u00a9\");
    htmlEntities.put(\"&reg;\", \"\\u00ae\");
    htmlEntities.put(\"&euro;\", \"\\u20a0\");
  }
  public static final String unescapeHTML(String source) {
    int i, j;
    boolean continueLoop;
    int skip = 0;
    do {
      continueLoop = false;
      i = source.indexOf(\"&\", skip);
      if (i > -1) {
        j = source.indexOf(\";\", i);
        if (j > i) {
          String entityToLookFor = source.substring(i, j + 1);
          String value = (String) htmlEntities.get(entityToLookFor);
          if (value != null) {
            source = source.substring(0, i)
                + value + source.substring(j + 1);
            continueLoop = true;
          } else if (value == null) {
            skip = i + 1;
            continueLoop = true;
          }
        }
      }
    } while (continueLoop);
    return source;
  }

我们可以使用上述方法来取消转义HTML:

String input = \"&lt;java&gt;public static void main(String[] args) { ... }&lt;/java&gt;\";
String output = unescapeHtml(input);
System.out.println(output);

程序输出:

<java>public static void main(String[] args) { ... }</java>

 

微信扫一扫

支付宝扫一扫

版权: 转载请注明出处:https://www.zuozi.net/9182.html

管理员

相关推荐
2025-08-06

文章目录 一、Reader 接口概述 1.1 什么是 Reader 接口? 1.2 Reader 与 InputStream 的区别 1.3 …

988
2025-08-06

文章目录 一、事件溯源 (一)核心概念 (二)Kafka与Golang的优势 (三)完整代码实现 二、命令…

465
2025-08-06

文章目录 一、证明GC期间执行native函数的线程仍在运行 二、native线程操作Java对象的影响及处理方…

348
2025-08-06

文章目录 一、事务基础概念 二、MyBatis事务管理机制 (一)JDBC原生事务管理(JdbcTransaction)…

456
2025-08-06

文章目录 一、SnowFlake算法核心原理 二、SnowFlake算法工作流程详解 三、SnowFlake算法的Java代码…

517
2025-08-06

文章目录 一、本地Jar包的加载操作 二、本地Class的加载方法 三、远程Jar包的加载方式 你知道Groo…

832
发表评论
暂无评论

还没有评论呢,快来抢沙发~

助力内容变现

将您的收入提升到一个新的水平

点击联系客服

在线时间:08:00-23:00

客服QQ

122325244

客服电话

400-888-8888

客服邮箱

122325244@qq.com

扫描二维码

关注微信客服号