当前位置: 首页 > news >正文

上海找做网站公司哪家好销售网站有哪些

上海找做网站公司哪家好,销售网站有哪些,电子 东莞网站建设,鞍山黄殿满爬取的基本步骤 很简单,主要是两大步 向url发起请求 这里注意找准对应资源的url,如果对应资源不让程序代码访问,这里可以伪装成浏览器发起请求。 解析上一步返回的源代码,从中提取想要的资源 这里解析看具体情况,一…

爬取的基本步骤

很简单,主要是两大步

向url发起请求

这里注意找准对应资源的url,如果对应资源不让程序代码访问,这里可以伪装成浏览器发起请求。


解析上一步返回的源代码,从中提取想要的资源

这里解析看具体情况,一般是筛选标签之中的信息或者资源,有很多筛选的第三方包和方法

贴吧图片下载

导入 requestslxml两个第三方包,没有需要下载

找到我们需要图片资源的==url ==, 比如我这里是 贴吧图片测试 http://c.tieba.baidu.com/p/5857827920

然后就是发起请求,拿到源代码,解析资源获得下载的url,下载资源到本地

import requests
from lxml import etree# 发起请求拿到网页源代码
index_url = 'http://c.tieba.baidu.com/p/5857827920'
response = requests.get(index_url).text# 解析源代码,筛选数据
selector = etree.HTML(response)
image_urls = selector.xpath('//img[@class="BDE_Image"]/@src')offset = 0
# 拿到url下载对应文件
for image_url in image_urls:image_content = requests.get(image_url).contentoffset += 1# 将数据写入本地with open("D:/桌面/image_test/{}.jpg".format(offset), 'wb') as f:f.write(image_content)

酷狗音乐歌曲下载

步骤是差不多的,但是这里找 url 变化了一点,找到你想要下载的歌曲,并打开对应的播放页,如下:
按下F12或者是右键点击检查,我这里用的是 谷歌浏览器,打开网页的源代码



网页源代码展示



选择上面的网络或者network,点击打开



network描述

然后刷新一下网页,发起的网络请求就可以在这个界面看到,然后筛选媒体或者media,看到后缀为MP3的文件打开,多图示例:

找mp3文件



找资源url



播放界面

看到请求网址,复制它,到一个新页面打开试一下能不能播放,如果可以,那么我们要下载的资源的url就找到了。这个也就是代码中发起请求的那个资源url

直接上代码

import requests# url
m_url = 'https://webfs.hw.kugou.com/202308142239/c9d5212c77dac7daf7e3a144b167e5ef/KGTX/CLTX001/d632d77fc37a7f5fee87baf23a0944cb.mp3'# 获取源代码headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/115.0.0.0 Safari/537.36m_resp = requests.get(m_url)'}# 这个headers就是请求标头,可以区别请求来源,会指明来源的操作系统浏览器这些信息,程序代码请求的话我们可以伪装成浏览器,加上这个标头。m_resp = requests.get(m_url, headers=headers)# 保存数据
with open("D:/桌面/test/geini.mp3", 'wb') as f:f.write(m_resp.content)

请求标头这里可以找到

请求标头
最下面的一个。

http://www.pjxw.cn/news/26842.html

相关文章:

  • 全国做网站找哪家好seo深度优化公司
  • 购物网站的推广seo搜索引擎优化内容
  • 阿里巴巴运营宁波seo智能优化
  • 做网站为何要续费百度手机助手app下载官网
  • 罗湖实惠的网站建设费用网站建设费用都选网络
  • 建设网站公司哪家技术好aso优化师工作很赚钱吗
  • 国外可以做网站盈利模式有哪些百度关键词在线优化
  • 卖房网站母亲节做什麽活动上海最近3天疫情情况
  • 全景网站开发待遇网络推广外包注意哪些
  • 做经营性的网站需要注册什么条件重庆seo教程博客
  • 想学网站建设优化去哪天津百度推广中心
  • 重庆网站布局信息公司谷歌搜索广告优化
  • 如何做网站劫持品牌策略
  • 即墨网站建设哪家好重庆营销型网站建设公司
  • dx网站是哪家公司做的搜索引擎技术包括哪些
  • 品牌形象设计毕业设计长沙搜索排名优化公司
  • 如何新建自己的网站谷歌seo网站优化
  • 个人网站源代码html学生个人网页优秀模板
  • 中国空间站离地球多远搜索引擎优化大致包含哪些内容或环节
  • 导航网站怎么做点击找回原来的百度
  • 有哪些网站适合大学生做兼职网站百度关键词优化
  • 移动互联网开发的前景seo优化多少钱
  • 做公司网站需要会什么科目网络营销推广专员
  • 虚拟资源下载主题wordpress北京优化核酸检测
  • c2c网站的功能tool站长工具
  • 什么是大型门户网站seo优化视频教程
  • 南昌商城网站设计百度推广登录官网
  • 怎么在濮阳网站做宣传衡阳seo优化推荐
  • 如何给自己做的网站加上域名品牌广告语经典100条
  • 在哪查网站备案新区快速seo排名