经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 程序设计 » Python3 » 查看文章
python3.7简单的爬虫实例详解
来源:jb51  时间:2019/7/8 12:38:34  对本文有异议

python3.7简单的爬虫,具体代码如下所示:

  1. #https://www.runoob.com/w3cnote/python-spider-intro.html
  2.  
  3. #Python 爬虫介绍
  4.  
  5. import urllib.parse
  6. import urllib.request
  7. from http import cookiejar
  8. url = "http://www.baidu.com"
  9. response1 = urllib.request.urlopen(url)
  10. print("第一种方法")
  11. #获取状态码,200表示成功
  12. print(response1.getcode())
  13. #获取网页内容的长度
  14. print(str(response1.read()))
  15. print(len(response1.read()))
  16. print("第二种方法")
  17. request = urllib.request.Request(url)
  18. #模拟Mozilla浏览器进行爬虫
  19. request.add_header("user-agent","Mozilla/5.0")
  20. response2 = urllib.request.urlopen(request)
  21. print(response2.getcode())
  22. print(len(response2.read()))
  23. print("第三种方法")
  24. cookie = cookiejar.CookieJar()
  25. #加入urllib2处理cookie的能力#
  26. opener = urllib.request.build_opener(urllib.request.HTTPCookieProcessor(cookie))
  27. urllib.request.install_opener(opener)
  28. response3 = urllib.request.urlopen(url)
  29. print(response3.getcode())
  30. print(len(response3.read()))
  31. print(cookie)
  1. code https://github.com/pascal19821003/python
  2. path python/study/tutorial/pachong/1.py

总结

以上所述是小编给大家介绍的python3.7简单的爬虫实例详解,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对w3xue网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号