[关闭]
@kangwg 2016-12-16T15:25:59.000000Z 字数 199 阅读 687

正文导入mongodb


数据来源

1.网页上的html
2.需要抓取的html
3.post所抓取的数据(json)

注:2和3的数据都需要导入mongodb

正文处理

1.保留标签<h></h><p></h><table><th><tr><td></table></th></tr></td><br><img src=""></img><center></center>
2.删除所有样式,如图片的高度,文字的颜色
添加新批注
在作者公开此批注前,只有你和作者可见。
回复批注