从文本JavaScript中删除HTML

有没有一种简单的方法可以在JavaScript中获取一个html字符串并去掉html？

当前回答

一个非常好的库是净化html，它是一个纯JavaScript函数，可以在任何环境中使用。

我的案例是React Native，我需要从给定文本中删除所有HTML标记。所以我创建了这个包装函数：

import sanitizer from 'sanitize-html';

const textSanitizer = (textWithHTML: string): string =>
  sanitizer(textWithHTML, {
    allowedTags: [],
  });

export default textSanitizer;

现在，通过使用textSanitizer，我可以获得纯文本内容。

2022-11-19 19:43:18

其他回答

const strip=(text) =>{
    return (new DOMParser()?.parseFromString(text,"text/html"))
    ?.body?.textContent
}

const value=document.getElementById("idOfEl").value

const cleanText=strip(value)

2022-01-19 08:53:18

我只需要去掉＜a＞标签，并用链接的文本替换它们。

这似乎很有效。

htmlContent= htmlContent.replace(/<a.*href="(.*?)">/g, '');
htmlContent= htmlContent.replace(/<\/a>/g, '');

2013-08-19 16:12:49

https://developer.mozilla.org/en-US/docs/Web/API/Element/insertAdjacentHTML

var div = document.getElementsByTagName('div');
for (var i=0; i<div.length; i++) {
    div[i].insertAdjacentHTML('afterend', div[i].innerHTML);
    document.body.removeChild(div[i]);
}

2019-02-09 12:48:26

方法1：

function cleanHTML(str){
  str.replace(/<(?<=<)(.*?)(?=>)>/g, '&lt;$1&gt;');
}

function uncleanHTML(str){
  str.replace(/&lt;(?<=&lt;)(.*?)(?=&gt;)&gt;/g, '<$1>');
}

方法2：

function cleanHTML(str){
  str.replace(/</g, '&lt;').replace(/>/g, '&gt;');
}

function uncleanHTML(str){
  str.replace(/&lt;/g, '<').replace(/&gt;/g, '>');
}

此外，不要忘记，如果用户碰巧发布了一条数学评论（例如：1<2），您不想删除整个评论。浏览器（仅测试了chrome）不将unicode作为html标记运行。如果将所有<替换为&lt；字符串中的每一个文件，unicode都将显示<为文本，而不运行任何html。我推荐方法2。jquery也能很好地工作$（'#element'）.text（）；

2019-12-14 21:28:33

您可以使用以下正则表达式去掉所有html标记：/<（.|\n）*？>/克

例子：

let str = "<font class=\"ClsName\">int[0]</font><font class=\"StrLit\">()</font>";
console.log(str.replace(/<(.|\n)*?>/g, ''));

输出：

int[0]()

2022-09-30 09:17:43

从文本JavaScript中删除HTML

推荐文章

最新文章

标签