当前位置:首页 > 技术分析 > 正文内容

十分全面!作为前端应当了解的那些Web缓存知识

ruisui883个月前 (02-03)技术分析14

缓存优点

通常所说的Web缓存指的是可以自动保存常见http请求副本的http设备。对于前端开发者来说,浏览器充当了重要角色。除此外常见的还有各种各样的代理服务器也可以做缓存。当Web请求到达缓存时,缓存从本地副本`本地副本`中提取这个副本内容而不需要经过服务器。这带来了以下优点:

  • 缓存减少了冗余的数据传输,节省流量

  • 缓存缓解了带宽瓶颈问题。不需要更多的带宽就能更快加载页面

  • 缓存缓解了瞬间拥塞,降低了对原始服务器的要求。

  • 缓存降低了距离延时, 因为从较远的地方加载页面会更慢一些。

缓存种类

缓存可以是单个用户专用的,也可以是多个用户共享的。专用缓存被称为私有缓存,共享的缓存被称为公有缓存。

私有缓存

私有缓存只针对专有用户,所以不需要很大空间,廉价。Web浏览器中有内建的私有缓存——大多数浏览器都会将常用资源缓存在你的个人电脑的磁盘和内存中。如Chrome浏览器的缓存存放位置就在:C:\Users\Your_Account\AppData\Local\Google\Chrome\User Data\Default中的Cache文件夹和Media Cache文件夹。

公有缓存

公有缓存是特殊的共享代理服务器,被称为缓存代理服务器或代理缓存(反向代理的一种用途)。公有缓存会接受来自多个用户的访问,所以通过它能够更好的减少冗余流量。

下图中每个客户端都会重复的向服务器访问一个资源(此时还不在私有缓存中),这样它会多次访问服务器,增加服务器压力。而使用共享的公有缓存时,缓存只需要从服务器取一次,以后不用再经过服务器,能够显著减轻服务器压力。

事实上在实际应用中通常采用层次化的公有缓存,基本思想是在靠近客户端的地方使用小型廉价缓存,而更高层次中,则逐步采用更大、功能更强的缓存在装载多用户共享的资源。

缓存处理流程

而对于前端开发者来说,我们主要跟浏览器中的缓存打交道,所以上图流程简化为:

下面这张图展示了某一网站,对不同资源的请求结果,其中可以看到有的资源直接从缓存中读取,有的资源跟服务器进行了再验证,有的资源重新从服务器端获取。

注意,我们讨论的所有关于缓存资源的问题,都仅仅针对GET请求。而对于POST, DELETE, PUT这类行为性操作通常不做任何缓存

新鲜度限值

HTTP通过缓存将服务器资源的副本保留一段时间,这段时间称为新鲜度限值。这在一段时间内请求相同资源不会再通过服务器。HTTP协议中Cache-Control 和 Expires可以用来设置新鲜度的限值,前者是HTTP1.1中新增的响应头,后者是HTTP1.0中的响应头。二者所做的事时都是相同的,但由于Cache-Control使用的是相对时间,而Expires可能存在客户端与服务器端时间不一样的问题,所以我们更倾向于选择Cache-Control。

Cache-Control

下面我们来看看Cache-Control都可以设置哪些属性值:

max-age(单位为s)指定设置缓存最大的有效时间,定义的是时间长短。当浏览器向服务器发送请求后,在max-age这段时间里浏览器就不会再向服务器发送请求了。

Web Cache

var http = require('http');

var fs = require('fs');

http.createServer(function(req, res) {

if (req.url === '/' || req.url === '' || req.url === '/index.html') {

fs.readFile('./index.html', function(err, file) {

console.log(req.url)

//对主文档设置缓存,无效果

res.setHeader('Cache-Control', "no-cache, max-age=" + 5);

res.setHeader('Content-Type', 'text/html');

res.writeHead('200', "OK");

res.end(file);

});

}

if (req.url === '/cache.png') {

fs.readFile('./cache.png', function(err, file) {

res.setHeader('Cache-Control', "max-age=" + 5);//缓存五秒

res.setHeader('Content-Type', 'images/png');

res.writeHead('200', "Not Modified");

res.end(file);

});

}

}).listen(8888)

当在5秒内第二次访问页面时,浏览器会直接从缓存中取得资源

  • public 指定响应可以在代理缓存中被缓存,于是可以被多用户共享。如果没有明确指定private,则默认为public。

  • private 响应只能在私有缓存中被缓存,不能放在代理缓存上。对一些用户信息敏感的资源,通常需要设置为private。

  • no-cache 表示必须先与服务器确认资源是否被更改过(依靠If-None-Match和Etag),然后再决定是否使用本地缓存。

如果上文中关于cache.png的处理改成下面这样,则每次访问页面,浏览器都需要先去服务器端验证资源有没有被更改。

fs.readFile('./cache.png', function(err, file) {

console.log(req.headers);

console.log(req.url)

if (!req.headers['if-none-match']) {

res.setHeader('Cache-Control', "no-cache, max-age=" + 5);

res.setHeader('Content-Type', 'images/png');

res.setHeader('Etag', "ffff");

res.writeHead('200', "Not Modified");

res.end(file);

} else {

if (req.headers['if-none-match'] === 'ffff') {

res.writeHead('304', "Not Modified");

res.end();

} else {

res.setHeader('Cache-Control', "max-age=" + 5);

res.setHeader('Content-Type', 'images/png');

res.setHeader('Etag', "ffff");

res.writeHead('200', "Not Modified");

res.end(file);

}

}

});

no-store 绝对禁止缓存任何资源,也就是说每次用户请求资源时,都会向服务器发送一个请求,每次都会下载完整的资源。通常用于机密性资源。

关于Cache-Control的使用,见下面这张图(来自大额)

客户端的新鲜度限值

Cache-Control不仅仅可以在响应头中设置,还可以在请求头中设置。浏览器通过请求头中设置Cache-Control可以决定是否从缓存中读取资源。*这也是为什么有时候点击浏览器刷新按钮和在地址栏回车,在NetWork模块中看到完全不同的结果*

Expires

不推荐使用Expires,它指定的是具体的过期日期而不是秒数。因为很多服务器跟客户端存在时钟不一致的情况,所以最好还是使用Cache-Control.

服务器再验证

浏览器或代理缓存中缓存的资源过期了,并不意味着它和原始服务器上的资源有实际的差异,仅仅意味着到了要进行核对的时间了。这种情况被称为服务器再验证。

  • 如果资源发生变化,则需要取得新的资源,并在缓存中替换旧资源。

  • 如果资源没有发生变化,缓存只需要获取新的响应头,和一个新的过期时间,对缓存中的资源过期时间进行更新即可。 HTTP1.1推荐使用的验证方式是If-None-Match/Etag,在HTTP1.0中则使用
    If-Modified-Since/Last-Modified。

Etag与If-None-Match

根据实体内容生成一段hash字符串,标识资源的状态,由服务端产生。浏览器会将这串字符串传回服务器,验证资源是否已经修改,如果没有修改,过程如下(图片来自浅谈Web缓存):

上文的demo中我们见到过服务器端如何验证Etag:

由于Etag有服务器构造,所以在集群环境中一定要保证Etag的唯一性

If-Modified-Since与Last-Modified

这两个是HTTP1.0中用来验证资源是否过期的请求/响应头,这两个头部都是日期,验证过程与Etag类似,这里不详细介绍。使用这两个头部来验证资源是否更新时,存在以下问题:

  • 有些文档资源周期性的被重写,但实际内容没有改变。此时文件元数据中会显示文件最近的修改日期与If-Modified-Since不相同,导致不必要的响应。

  • 有些文档资源被修改了,但修改内容并不重要,不需要所有的缓存都更新(比如代码注释)

关于缓存的更新问题,请大家看看这里张云龙的回答,本文就不详细展开了。

本文demo代码如下:

Web Cache

var http = require('http');

var fs = require('fs');

http.createServer(function(req, res) {

if (req.url === '/' || req.url === '' || req.url === '/index.html') {

fs.readFile('./index.html', function(err, file) {

console.log(req.url)

//对主文档设置缓存,无效果

res.setHeader('Cache-Control', "no-cache, max-age=" + 5);

res.setHeader('Content-Type', 'text/html');

res.writeHead('200', "OK");

res.end(file);

});

}

if (req.url === '/shortcut.png') {

fs.readFile('./shortcut.png', function(err, file) {

console.log(req.url)

res.setHeader('Content-Type', 'images/png');

res.writeHead('200', "OK");

res.end(file);

})

}

if (req.url === '/cache.png') {

fs.readFile('./cache.png', function(err, file) {

console.log(req.headers);

console.log(req.url)

if (!req.headers['if-none-match']) {

res.setHeader('Cache-Control', "max-age=" + 5);

res.setHeader('Content-Type', 'images/png');

res.setHeader('Etag', "ffff");

res.writeHead('200', "Not Modified");

res.end(file);

} else {

if (req.headers['if-none-match'] === 'ffff') {

res.writeHead('304', "Not Modified");

res.end();

} else {

res.setHeader('Cache-Control', "max-age=" + 5);

res.setHeader('Content-Type', 'images/png');

res.setHeader('Etag', "ffff");

res.writeHead('200', "Not Modified");

res.end(file);

}

}

});

}

}).listen(8888)

更多深度技术内容,请关注云栖社区微信公众号:yunqiinsight。

扫描二维码推送至手机访问。

版权声明:本文由ruisui88发布,如需转载请注明出处。

本文链接:http://www.ruisui88.com/post/1088.html

标签: nocache
分享给朋友:

“十分全面!作为前端应当了解的那些Web缓存知识” 的相关文章

vue组件间的九种通信方式

前言Vue组件实例间的作用域是相互独立的,而通常一个页面是由很多个组件构成,这些组件可能又嵌套了组件,形成了一个关系网图,它们的关系可能是像下图中一样,大致分为两种使用场景,父子组件间通信和非父子组件间通信,父子组件间通信又分为直接父子关系和间接父子关系。vue提供了多种通信方法,针对不同的通信需求...

继Yuzu后,任天堂要求移除多个Switch模拟器项目

IT之家 7 月 11 日消息,任天堂美国分公司 (Nintendo of America) 已要求移除多个用于模拟 Nintendo Switch 游戏的开源模拟器项目,其中包括 Suyu、Nzu、Uzuy、Torzu、Sudachi 和 Yuzu-vanced 等。这些模拟器均被指控包含绕过任天...

Java教程:gitlab-使用入门

1 导读本教程主要讲解了GitLab在项目的环境搭建和基本的使用,可以帮助大家在企业中能够自主搭建GitLab服务,并且可以GitLab中的组、权限、项目自主操作GitLab简介GitLab环境搭建GitLab基本使用(组、权限、用户、项目)2 GitLab简介GitLab是整个DevOps生命周期...

Python 幕后:Python导入import的工作原理

更多互联网精彩资讯、工作效率提升关注【飞鱼在浪屿】(日更新)Python 最容易被误解的方面其中之一是import。Python 导入系统不仅看起来很复杂。因此,即使文档非常好,它也不能让您全面了解正在发生的事情。唯一方法是研究 Python 执行 import 语句时幕后发生的事情。注意:在这篇文...

编码 10000 个小时后,开发者悟了:“不要急于发布!”

【CSDN 编者按】在软件开发的道路上,时间是最好的老师。根据“一万小时定律”,要成为某个领域的专家,通常需要大约一万小时的刻意练习。本文作者身为一名程序员,也经历了一万小时的编程,最终悟出了一个道理:慢即是快,重视架构设计和代码质量,确保每一行代码都经得起时间的考验。作者 | Sotiris Ko...

壹啦罐罐 Android 手机里的 Xposed 都装了啥

这是少数派推出的系列专题,叫做「我的手机里都装了啥」。这个系列将邀请到不同的玩家,从他们各自的角度介绍手机中最爱的或是日常使用最频繁的 App。文章将以「每周一篇」的频率更新,内容范围会包括 iOS、Android 在内的各种平台和 App。本期继续歪楼,由少数派撰稿作者@壹啦罐罐介绍他正在使用的...