@kangwg
2016-12-16T15:25:59.000000Z
字数 199
阅读 687
1.网页上的html
2.需要抓取的html
3.post所抓取的数据(json)
注:2和3的数据都需要导入mongodb
1.保留标签<h></h><p></h><table><th><tr><td></table></th></tr></td><br><img src=""></img><center></center>
2.删除所有样式,如图片的高度,文字的颜色