欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 房产 > 家装 > 打卡学习Python爬虫第二天|Web请求过程刨析

打卡学习Python爬虫第二天|Web请求过程刨析

2025/2/23 14:24:05 来源:https://blog.csdn.net/weixin_52687711/article/details/141278017  浏览:    关键词:打卡学习Python爬虫第二天|Web请求过程刨析

一、服务器渲染

服务器端渲染(Server-Side Rendering,简称SSR)是一种网页渲染技术。在这种技术中,服务器在接收到客户端的请求后,会生成页面的初始HTML内容,并将其发送给客户端。客户端浏览器接收到这些HTML内容后,直接进行解析和渲染,呈现给用户。这种模式下,页面的大部分内容在服务器端已经渲染完成,因此页面加载速度相对较快,并且对搜索引擎友好。但是,交互式的内容和功能需要等待客户端的JavaScript代码执行完成后才能实现。

流程如图: 

百度搜索科比,得到相关内容: 

查看该页面的源代码:

 

直接在网页的HTML代码中可以找到相同的内容! 在服务器上直接把数据和HTML整合在一起,统一返回浏览器就是服务器渲染。页面源代码中有数据。

二、客户端渲染 

客户端渲染(Client-Side Rendering,简称CSR)是网页渲染的另一种常见模式。在这种模式下,服务器主要负责返回一个基本的HTML页面结构以及必要的JavaScript和CSS文件。客户端的浏览器通过执行这些JavaScript代码来请求数据,并根据数据动态生成页面内容。 

客户端渲染在第一次请求时只得到一个HTML骨架和必要的Js和CSS ,第二次请求才能拿到数据,进行数据展示,在页面源代码中看不到数据。

 问题来了,HTML页面中没有数据,那么第二次请求要怎么去得到数据呢?

使用浏览器抓包工具

1、在相应的页面按F12或者右键-->检查

2、点击网络后,按Ctrl+R刷新页面

 找到第一次请求的url,预览看效果:

我们会发现只有简单的骨架,并没有我们需要的数据: 

3、继续往下,直到找到数据

 这时候点击标头就能得到我们需要的url:

将这个url复制到浏览器搜索,我们就能看到一个标准的json类型的数据:

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词