Discuz!NT官方社区

首页 » Discuz!NT开发与测试 » 论坛测试 » 火车头采集器中使用正则表达式截取指定字数-测试
testq - 2008-5-13 11:59:00
作者:采集之家-rq204

业务QQ:285576545
原文地址:
http://www.caijibbs.com/?action=show&id=36

因为有的论坛标题长度有限制,如DZ好像是60个,超过的话就不能发布,因此会出现发布不成功的问题。我们要做的就是用火车来截去多余的字符。本来火车有摘要的功能,不过要个人版以上才支持。可是作者开发的正则表表达功能为大家提供了太多的方便。我们就用正则来说一下怎样处理。 
正则表达式中有数量的表示方法。{2,5},就是2到5个字符的意思。这个大家用过的可能就知道。比如有个标题<title>
火车头采集技术服务内容及报价
</title>这个标题,我们要取的字字数为5,我们就可以写成这样的正则  
 

XML/HTML代码

    <title>(?<content>[^<]{5}?) 


 
这样就可以了。

 
Tags:
标题
,
正则表达式
,
字数
1
查看完整版本: 火车头采集器中使用正则表达式截取指定字数-测试