知行编程网知行编程网  2023-01-07 12:00 知行编程网 隐藏边栏  7 
文章评分 0 次,平均分 0.0
导语: 本文主要介绍了关于python怎么写爬虫的相关知识,包括Python爬虫源代码,以及用python编写爬虫程序这些编程知识,希望对大家有参考作用。

python写爬虫的方法


一、python写爬虫的方法

1、将urllib2库引用进来。

2、调用库中的方法,将请求回应封装到response对象中。

3、调用response对象的read()方法,将回应字符串赋给hhtml变量。

4、打印。

import urllib2  #将urllib2库引用进来
response=urllib2.urlopen("http://www.xiaofamao.com") #调用库中的方法,将请求回应封装到response对象中
html=response.read() #调用response对象的read()方法,将回应字符串赋给hhtml变量
print html  #打印出来

拓展内容:


1、爬虫的介绍

网络爬虫,其实叫作网络数据采集更容易理解。

就是通过编程向web服务器请求数据(HTML形式),然后解析HTML提取出你想要的数据。


2、使用流程

根据url获取HTML数据;

解析HTML,获取目标信息;

存储数据;

重复第一步。

python爬虫相关知识点推荐:


本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。

本文为原创文章,版权归所有,欢迎分享本文,转载请保留出处!

知行编程网
知行编程网 关注:1    粉丝:1
这个人很懒,什么都没写
扫一扫二维码分享