当前位置: 首页 > news >正文

展示网站开发做网站自己

展示网站开发,做网站自己,魔法自助建站,wordpress怎么做产品列表页我们来讲最常见的反反爬虫方法 import requests r requests.get(网页网址) print(r.requests.headers) 一.使用简单的方法把请求头改为真的浏览器模式 import requests link网页地址 heraders{User-Agent:} rrequests.get(link,headersheaders) print(r.requsts.headers)我们…我们来讲最常见的反反爬虫方法 import requests r requests.get(网页网址) print(r.requests.headers) 一.使用简单的方法把请求头改为真的浏览器模式 import requests link网页地址 heraders{User-Agent:} rrequests.get(link,headersheaders) print(r.requsts.headers)我们可以使用python的fake-uesragent可以容易的切换User-Agent pip install fake-uesragent from fake_useragent import UserAgent  import requestslink uaUserAgent() hearders{User-Agent:} responserequests.grt(urlurl,headersheaders)print(response.status_code) print(r.request.headers) 这里可以使用ua.random实现随机变换headers。每次生成的伪装表名不一样。我们还需要在headers里面写上Host和Referer 二.我们爬取的时候应该设置一段的时间限制 import time t1time.time() time.sleep(2 t2time.time() total_timet2-t1 print(total_time)我们的时间应该不能确定为一个固定的值我们现在可以加入random模块来实现时间的随机性。 import random import timesleep_timerandom.randint(0,2)random.random print(sleep_time) time.sleep(sleep_time)现在我们可以把爬虫和时间间隔结合在一起了 import requests from bs4 import BeautifulSoup import time import randomlinkdef scrap(link):headers{User-Agent:}rrequests.get(link,headersheaders)hemlr.textsoupBeautifulSoup(html,ixml)return soup soupscrap(link) title_listsoup.find_all(h1,class_post-title) for eachone in title_list:urleachone.a[href]print(开始爬取,url)soup_artscrap(url)titlesoup_art.find(h1,class_view-title).text.strip()print(标题,title)sleep_timerandom.randint(0,2)random.random()print(开始休息,sleep_time,秒)time.sleep(sleep_time) 我们可以把爬取的放入文件里面
http://www.lakalapos1.cn/news/69163/

相关文章:

  • 糗百网站源码如何套用别人网站做页面
  • 精品课程网站建设验收单电子商务网站功能设计与分析
  • 重庆可作为推广的网站电影网站标题怎么做流量多
  • 天津网站建设多少钱怎么避免网站开发后门
  • 国外酷炫flash网站深圳福田区是富人区吗
  • 内蒙古做网站灰色关键词排名
  • 网站维护工作是做啥北京网站编程培训
  • 网站建设客户分析调查问卷邯郸做网站哪家好
  • 自己创网站网络广告推广方法渠道
  • 网站平台建设实训内容商标设计网课
  • 广州网站订制开发o2o网站建设哪家好
  • 织梦的网站关键词有好看图片的软件网站模板下载
  • 郑州 服装网站建设大连做网站软件
  • 360云盘做 网站图片服务器凡客诚品线下店
  • 安徽住房和城乡建设厅注册网站微网站和微信
  • 济南专业网站托管公司wordpress类似的工具
  • 网站建设公司如何挖掘客户网站安全建设管理制度
  • 河南企业网站优化黄村网站建设公司
  • cms网站访问人数做网站怎样让内容在小窗口打开
  • 庆阳网站设计厂家企业网站建设变相收取等级保护费6
  • 首饰设计网站推荐学专科电子商务后悔死了
  • 网站开发网站页面做传奇网站云服务器地域改选哪里
  • 深圳网站上线方案wordpress获取文章内容过滤空格
  • 义乌市住房和城乡建设局网站成都旅行社网站建设
  • 湖南手机版建站系统哪家好新网站如何做网站优化
  • 电镀加工技术支持 东莞网站建设官网网址
  • 新网站备案做网站前端设计需要哪些证书
  • 某购物网站建设方案做彩票网站需要学习什么
  • 网站建立于网页设计西安小程序开发的公司
  • 网站注册页面代码外发加工网会员