关于对www.77169.com文章的采集

By | 2006 年 4 月 27 日

基于创力采集系统

列表索引页面:http://www.77169.com/Article/List/List_38.html

列表开始标记:<td height=13 class=main_tdbg_575>

列表结束标记:篇资讯

列表索引分页:批量生成:http://www.77169.com/Article/List/List_38_{$ID}.html

生成范围:自己定

链接开始标记:]<a class=’listA’ href=’

链接结束标记:title=’

标题开始标记:<td height="50" colspan="2" class="main_ArticleTitle" style="word-break:break-all;Width:fixed">

标题结束标记:</td>

正文开始标记:<td height=10 vAlign=top class=main_tdbg_575><span style="font-size:14.8px;line-height:18px">

正文结束标记:<TABLE cellSpacing=0 cellPadding=0 width="100%" border=0>

OK,这样的采集设置无法采集文章标题前有[组图][推荐]等字样的文章,如果需要采集,可以将

链接开始标记:]<a class=’listA’ href=’

换成   链接开始标记:</span><a class=’listA’ href=’

即可

发表评论

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据