废话不多说,都在代码中,直接上
JS代码:
代码如下:
<html>
<head>
<script language="javascript">
var a='<P><A href=\'~abc/ccg/ab.jpg\' width="3">文字</A><A width="4" style="color:#ddd; font-weight:bold;" mm_href="http:www.baidu.com" href="" mce_href="> href="" cbas <span>cchref</span> 1<a dd href="ccc" <A width="5" href="" mce_href=";
var b=/<a([\s]+|[\s]+[^<>]+[\s]+)href=(\"([^<>"\']*)\"|\'([^<>"\']*)\')[^<>]*>/gi;
var s=a.toLowerCase().match(b);
alert(s.length);
for(var i= 0;i<s.length;i++)
{
var ss = s[i].toLowerCase().match(b);
alert(RegExp.$3+RegExp.$4);
}
</script>
</head>
<body>
</body>
</html>
C#代码:
代码如下:
string html = "<P><A href='~abc/ccg/ab.jpg' height=\"4\" width='3' >文字</A><A width=\"4\" style=\"color:#ddd; font-weight:bold;\" mm_href=\"http:www.baidu.com\" href=\"" mce_href=\"> href=\"" cbas <span>cchref</span> 1<a df href=\"cc\" <A width=\"5\" href=\"" mce_href=\">";
Regex reg = new Regex("<a([\\s]+|[\\s]+[^<>]+[\\s]+)href=(\"(?<href>[^<>\"']*)\"|'(?<href>[^<>\"']*)')[^<>]*>", RegexOptions.IgnoreCase);
MatchCollection matchCollection = reg.Matches(html);
MessageBox.Show(matchCollection.Count.ToString());
foreach (Match match in matchCollection)
{
MessageBox.Show(match.Groups["href"].ToString());
}
小伙伴们是否了解了js及C#中使用正则表达式的异同点呢?有疑问的请留言,大家共同讨论。
更多信息请查看IT技术专栏