什么是网站采集技术?

| |
[不指定 2008/05/28 10:14 | by helen ]
网站采集技术
就是用软件将别的网站的内容,转载到另一个网站上.
这个过程采集软件自动完成.

关于采集方法
一般大型网站建站的时候,固定的内容 如新闻、下载等 都是使用固定模板、自动生成静态页面的方式。这样就使得在源码中表格等设置都是一致的。

网站采集就是利用这样的一个原理,搜索页面中与采集设置相同的部分,然后搜集网站内容进入数据库。
例如:
某站的新闻在源码中是这样的
新闻内容

很容易可以看出,上面就是一个表格,然后包含新闻内容,设置采集方式的时候,就可以 从遇到页面的这个标记开始,到下一个
标记结束。运行采集后,就会将该站所有的新闻全部采集下来了。

当然这只是个简单的采集例子,实际应用中会比这复杂的多~~
computer | 评论(0) | 引用(0) | 阅读(275)
发表评论
表情
emotemotemotemotemot
emotemotemotemotemot
emotemotemotemotemot
emotemotemotemotemot
emotemotemotemotemot
打开HTML
打开UBB
打开表情
隐藏
昵称   密码   游客无需密码
网址   电邮   [注册]