Discuz!NT 2.5 正式版 下载
beta、RC版升级补丁
Comsenz 招聘信息
首届Discuz!NT 模板大赛圆满结束
著名音乐网站SoGua网、分贝网
采用Discuz!NT搭建社区
FIFA Online2官网论坛使用Discuz!NT
游戏城寨论坛使用Discuz!NT搭建
第二届优秀版主评选揭晓
Discuz!NT 2.5正式开源 Discuz!NT文档中心
用户整合说明文档
Discuz!NT亮相微软Tech-Ed 2007
Discuz!NT情景搞笑短片抢先看
1/1页1 跳转到查看:349
发新话题 回复该主题

火车头采集器中使用正则表达式截取指定字数-测试

火车头采集器中使用正则表达式截取指定字数-测试

作者:采集之家-rq204

业务QQ:285576545
原文地址:
http://www.caijibbs.com/?action=show&id=36

因为有的论坛标题长度有限制,如DZ好像是60个,超过的话就不能发布,因此会出现发布不成功的问题。我们要做的就是用火车来截去多余的字符。本来火车有摘要的功能,不过要个人版以上才支持。可是作者开发的正则表表达功能为大家提供了太多的方便。我们就用正则来说一下怎样处理。 
正则表达式中有数量的表示方法。{2,5},就是2到5个字符的意思。这个大家用过的可能就知道。比如有个标题<title>
火车头采集技术服务内容及报价
</title>这个标题,我们要取的字字数为5,我们就可以写成这样的正则  
 

XML/HTML代码

    <title>(?<content>[^<]{5}?) 


 
这样就可以了。

 
Tags:
标题
,
正则表达式
,
字数

TOP

 
1/1页1 跳转到
发表新主题 回复该主题