某某茶叶有限公司欢迎您!
金沙棋牌在线 > Web前端 > 浏览器HTTP缓存原理分析(转)

浏览器HTTP缓存原理分析(转)

时间:2019-12-29 06:39

浏览器 HTTP 缓存原理分析

2015/10/27 · HTML5 · 1 评论 · HTTP

原文出处: 桃子夭夭   

以前项目中遇到了很多浏览器缓存相关的问题,也在网上查过资料,搞过服务器的配置,来确保客户端加载服务器资源的速度和资源有效性。最近仔细看了下http协议中和缓存相关的一些属性,总结一下。

章节目录

写给后端程序员的HTTP缓存原理介绍 - 全栈开发者 http://www.admin10000.com/document/7091.html

时间:2016-12-12 17:51:30
作者: zhongxia

浏览器缓存原理

  • 浏览器缓存原理
  • 文字版描述
  • 一图以蔽之
  • 缓存相关首部字段
  • request缓存相关首部字段
  • response缓存相关首部字段
  • 实体首部缓存相关字段
  • 缓存配置的一些注意事项

零、前言

这里主要写的是理论,具体实践的比较少,后期写一个实践教程,内容基本都是从参考文章里面抄过来的【看完文章,顺便写做下笔记,加深理解。】

浏览器缓存,也就是客户端缓存,既是网页性能优化里面静态资源相关优化的一大利器,也是无数web开发人员在工作过程不可避免的一大问题,所以在产品开发的时候我们总是想办法避免缓存产生,而在产品发布之时又在想策略管理缓存提升网页的访问速度。

了解浏览器的缓存命中原理,是开发web应用的基础,本文着眼于此,学习浏览器缓存的相关知识,总结缓存避免和缓存管理的方法,结合具体的场景说明缓存的相关问题。希望能对有需要的人有所帮助。

文字版描述

①浏览器第一次访问服务器资源 /index.html

在浏览器中没有缓存文件,直接向服务器发送请求。

服务器返回  200 OK,实体中返回 index.html文件内容,并设置一个缓存过期时间,一个文件修改时间,一个根据index.html内容计算出来的实体标记Entity Tag,简称Etag。

浏览器将/index.html路径的请求缓存到本地。

②浏览器第二次访问服务器资源 /index.html

由于本地已经有了此路径下的缓存文件,所以这一次就不直接向服务器发送请求了。

首先进行缓存过期判断。浏览器根据①中设置缓存过期时间判断缓存文件是否过期。

情景一:若没有过期,则不向服务器发送请求,直接使用缓存中的结果,此时我们在浏览器控制台中可以看到  200 OK(from cache) ,此时的情况就是完全使用缓存,浏览器和服务器没有任何交互的。

情景二:若已过期,则向服务器发送请求,此时请求中会带上①中设置的文件修改时间,和Etag

然后进行资源更新判断。服务器根据浏览器传过来的文件修改时间,判断自浏览器上一次请求之后,文件是不是没有被修改过;根据Etag,判断文件内容自上一次请求之后,有没有发生变化

情形一:若两种判断的结论都是文件没有被修改过,则服务器就不给浏览器发index.html的内容了,直接告诉它,文件没有被修改过,你用你那边的缓存吧—— 304 Not Modified,此时浏览器就会从本地缓存中获取index.html的内容。此时的情况叫协议缓存,浏览器和服务器之间有一次请求交互。

情形二:若修改时间和文件内容判断有任意一个没有通过,则服务器会受理此次请求,之后的操作同

①我的文字表达能力可能有限,为了尽量把这个流程描述清楚一点,下面

以前项目中遇到了很多浏览器缓存相关的问题,也在网上查过资料,搞过服务器的配置,来确保客户端加载服务器资源的速度和资源有效性。最近仔细看了下http协议中和缓存相关的一些属性,总结一下。

一、浏览器缓存基本认识

一图以蔽之

图片 1

图片 2

浏览器缓存原理

1. 强缓存 和 协商缓存

浏览器在加载资源的时,先根据 http header 判断它是否命中强缓存.

  • 命中强缓存:浏览器直接从自己缓存中读取资源,不发送请求到服务器

  • 不命中强缓存:浏览器发送一个请求到服务器,服务器根据资源的另外一些 http header 验证 该资源 是否命中 协商缓存

    • 命中协商缓存:将请求返回,但不是返回该资源的数据,而是告诉浏览器可以直接从缓存中加载这个资源。

    • 不命中协商缓存:服务器返回该资源数据

缓存相关首部字段

文字版描述

①浏览器第一次访问服务器资源 /index.html

在浏览器中没有缓存文件,直接向服务器发送请求。

服务器返回  200 OK,实体中返回 index.html文件内容,并设置一个缓存过期时间,一个文件修改时间,一个根据index.html内容计算出来的实体标记Entity Tag,简称Etag。

浏览器将/index.html路径的请求缓存到本地。

 

②浏览器第二次访问服务器资源 /index.html

由于本地已经有了此路径下的缓存文件,所以这一次就不直接向服务器发送请求了。

首先进行缓存过期判断。浏览器根据①中设置缓存过期时间判断缓存文件是否过期。

情景一:若没有过期,则不向服务器发送请求,直接使用缓存中的结果,此时我们在浏览器控制台中可以看到  200 OK(from cache) ,此时的情况就是完全使用缓存,浏览器和服务器没有任何交互的。

情景二:若已过期,则向服务器发送请求,此时请求中会带上①中设置的文件修改时间,和Etag

然后进行资源更新判断。服务器根据浏览器传过来的文件修改时间,判断自浏览器上一次请求之后,文件是不是没有被修改过;根据Etag,判断文件内容自上一次请求之后,有没有发生变化

情形一:若两种判断的结论都是文件没有被修改过,则服务器就不给浏览器发index.html的内容了,直接告诉它,文件没有被修改过,你用你那边的缓存吧—— 304 Not Modified,此时浏览器就会从本地缓存中获取index.html的内容。此时的情况叫协议缓存,浏览器和服务器之间有一次请求交互。

情形二:若修改时间和文件内容判断有任意一个没有通过,则服务器会受理此次请求,之后的操作同①

 

我的文字表达能力可能有限,为了尽量把这个流程描述清楚一点,下面

2. 异同点 和 关系

共同点:命中,都是从浏览器缓存中加载资源
不同点:强缓存不发送请求到服务器,协商缓存会发送请求。

必须开启强缓存,协商缓存才会起作用

request缓存相关首部字段

图片 3

① cache-control  用来做缓存过期判断

常用指令:

no-cache  不直接使用缓存,始终向服务器发起请求

max-age  缓存过期时间,是一个时间数值,比如3600秒,设置为0的时候效果等同于no-cache

s-maxage  给缓存代理用的指令,对直接返回资源的server无效,当s-maxage生效时,会忽略max-age的值

only-if-cached 若有缓存,则只使用缓存,若缓存文件出问题了,请求也会出问题

② Pragma  用来做缓存过期判断

   它可以取值no-cache

   这是一个http1.0遗留的字段,当它和cache-control同时存在的时候,会被cache-control覆盖

③ if-match / if-none-match  用来做资源更新判断

   这个指令会把缓存中的Etag传给服务器,服务器用它来和服务器端的资源Etag进行对比,若不一致则证明资源被修改了,需要响应请求为 200 OK

④ if-modified-since  用来做资源更新判断

    这个指令会把文件的上一次缓存中的文件的更新时间传给服务器,服务器判断文件在这个时间点后是否被修改,如果被修改过则需要响应请求为200 OK

一图以蔽之

图片 4

图片 5

二、强缓存原理

什么是协商缓存?
如图,返回http状态为200,size为 form cache 的就是强缓存
图片 6

response缓存相关首部字段

图片 7

① cache-control  用来设置缓存过期时间

常用指令:

no-cache  让客户端不直接使用缓存,始终向服务器发起请求,不设置默认是这个,上边截图中的请求就是省略了,所以客户端不会直接使用缓存。

max-age  缓存过期时间,是一个时间数值,比如3600秒,设置为0的时候效果等同于no-cache

s-maxage  给缓存代理用的指令,对直接返回资源的server无效,当s-maxage生效时,会忽略max-age的值

private/public  默认是private,只在一个浏览器中缓存,设置为public时缓存可被多个用户共享

② Etag 用来设置根据资源内容生成的实体标签

    这个值有强tag和弱tag,区别是计算方式不同,只有强tag才会在资源被更新的时候立即发生变化,请求首部中的if-match/if-none-match字段就会传回这个值给服务端

③ age

   这个字段用来告诉客户端,这个response是在多久前被创建的,单位为秒,缓存服务器返回资源的时候必须创建此字段

缓存相关首部字段

1. HTTP Response Header 看强缓存