静态资源
静态资源即非服务器动态生成的文件。
常见静态资源类型:
- 浏览器端渲染:HTML、CSS、JS
- 图片:JPEG、GIF、PNG
- 视频:FLV、MPEG
- 文件:TXT 等任意下载文件
基本配置
Web 服务器一个重要的功能是服务静态文件(图像或静态 HTML 页面)。例如,Nginx 可以很方便的让服务器从 /data/www
获取 html
文件,从 /data/images
获取图片来返回给客户端,这只需要在 http
块指令中的 server
块指令中设置两个 location
块指令。
首先,创建 /data/www
目录,并放入 index.html
,创建 /data/images
目录并在其中放置一些图片。
接下来,打开配置文件。 创建一个 server 块:
http { server { } }
通常,配置文件可以包括多个 server
块,它们以 端口 和 服务器名称 来区分。当 Nginx 决定某一个 server
处理请求后,它将请求头中的 URI
和 server
块中的 location
块进行对比。
加入 location
块指令到 server
中:
将以下 location
块添加到 server
块:
location / { root /data/www; }
上面的 location
块指定 /
前缀与请求中的 URI
对比。对于匹配的请求,URI
将被添加到 root
指令中指定的路径,即 /data/www
,以此形成本地文件系统的路径,如访问 http://localhost/bog/welcome.html
,对应服务器文件路径为 /data/www/bog/welcome.html
。 如果 URI
匹配多个 location
块,Nginx 采用 最长前缀匹配原则(类似计算机网络里面的 IP 匹配), 上面的 location
块前缀长度为 1,因此只有当所有其他 location
块匹配时,才使用该块。
接下来,添加第二个位置块:
location /images/ { root /data; }
它将匹配以 /images/
(/
也匹配这样的请求,但具有较短的前缀)开始的请求。
server
块的最终配置如下:
server { location / { root /data/www; } location /images/ { root /data; } }
到目前为止,这已经是一个可以正常运行的服务器,它监听端口 80,并且可以在本地计算机上访问 http://localhost/
。 对于 /images/
开头的请求,服务器将从 /data/images
目录发送文件。 如,对于 /zb_users/upload/2024/csdn/example.png
请求,nginx 将响应 /data/images/example.png
文件。 如果不存在,Nginx 将返回 404。URI
不以 /images/
开头的请求将映射到 /data/www
目录。 例如,对于 http://localhost/some/example.html
请求,Nginx 将响应 /data/www/some/example.html
文件。
简易配置
# 虚拟主机server块 server { # 端口 listen 8080; # 匹配请求中的host值 server_name localhost; # 监听请求路径 location / { # 查找目录 root /source; # 默认查找 index index.html index.htm; } }
说明相关配置字段:
server
:配置虚拟主机的相关参数,可以有多个server_name
:通过请求中的 host 值,找到对应的虚拟主机的配置location
:配置请求路由,处理相关页面情况root
:查找资源的路径
配置完成后执行 nginx -t
看是否有错误,如果看到的是下面这种就是成功:
nginx: the configuration file /etc/nginx/nginx.conf syntax is ok nginx: configuration file /etc/nginx/nginx.conf test is successful
然后执行 nginx -s reload
更新 Nginx 配置文件
文件读取配置
http { # 调用 sendfile 系统传输文件,开启高效传输模式 # sendfile 开启的情况下,提高网络包的传输效率(等待,一次传输) sendfile on; # 减少网络报文段的数量 tcp_nopush on; # 与 tcp_nopush 相反 # tcp_nodelay off; }
在 Keep-Alive 连接下,提高网络包的传输实时性。
文件压缩配置
开发过程中难免用到一些成熟的框架,或者插件,这些外部的依赖,有时候体积比较大,导致页面响应缓慢,我们可以用打包工具(Webpack、rollup),将代码进行压缩,以缩小代码体积。 开启 Nginx Gzip 压缩功能。需要注意的是 Gzip 压缩功能需要浏览器跟服务器都支持,即服务器压缩,浏览器解析。
Nginx 配置 gzip
server { # 开启 gzip 压缩(默认 off) gzip on; # 设置压缩文件的类型(text/html) gzip_types text/csv text/xml text/css text/plain text/javascript application/javascript application/json application/xml; # 设置 gzip 所需的 HTTP 协议最低版本(HTTP/1.1, HTTP/1.0) gzip_http_version 1.1; # 设置压缩级别,压缩级别越高压缩时间越长 (1-9) gzip_comp_level 4; # 设置压缩的最小字节数, 页面 Content-Length 获取 gzip_min_length 1000; }
gzip_types
:要采用gzip
压缩的 MIME 文件类型,其中text/html
被系统强制启用;gzip_static
:默认 off,该模块启用后,Nginx 首先检查是否存在请求静态文件的 gz 结尾的文件,如果有则直接返回该.gz
文件内容;gzip_proxied
:默认 off,Nginx 做为反向代理时启用,用于设置启用或禁用从代理服务器上收到相应内容gzip
压缩;gzip_vary
:用于在响应消息头中添加Vary:Accept-Encoding
,使代理服务器根据请求头中的Accept-Encoding
识别是否启用gzip
压缩;gzip_comp_level
:gzip
压缩比,压缩级别是 1-9,1 压缩级别最低,9 最高,级别越高压缩率越大,压缩时间越长,建议 4-6;gzip_buffers
:获取多少内存用于缓存压缩结果,16 8k 表示以8k*16
为单位获得;gzip_min_length
:允许压缩的页面最小字节数,页面字节数从header
头中的Content-Length
中进行获取。默认值是 0,不管页面多大都压缩。建议设置成大于 1k 的字节数,小于 1k 可能会越压越大;gzip_http_version
:默认 1.1,启用gzip
所需的 HTTP 最低版本;
查看配置是否生效,查看响应头中的 Content-Encoding
字段,值为 gzip
。
注意:一般 gzip
的配置建议加上 gzip_min_length 1k
,否则会因为文件太小,压缩后体积还比压缩之前体积还大,所以最好设置 1kb
的文件就不要 gzip
压缩了。
Webpack 的 gzip 配置
当前端项目使用 Webpack 进行打包的时候,也可以开启 gzip 压缩:
// vue-cli3 的 vue.config.js 文件 const CompressionWebpackPlugin = require('compression-webpack-plugin') module.exports = { // gzip 配置 configureWebpack: config => { if (process.env.NODE_ENV === 'production') { // 生产环境 return { plugins: [new CompressionWebpackPlugin({ test: /\.js$|\.html$|\.css/, // 匹配文件名 threshold: 10240, // 文件压缩阈值,对超过10k的进行压缩 deleteOriginalAssets: false // 是否删除源文件 })] } } }, ... }
既然已经有 Nginx 的 gzip 压缩了,为什么还需要 Webpack 进行 gzip 压缩?
因为如果全都是使用 Nginx 来压缩文件,会耗费服务器的计算资源,如果服务器的 gzip_comp_level
配置的比较高,就更增加服务器的开销,相应增加客户端的请求时间,得不偿失。如果压缩的动作在前端打包的时候就做了,把打包之后的高压缩等级文件作为静态资源放在服务器上,Nginx 会优先查找这些压缩之后的文件返回给客户端,相当于把压缩文件的动作从 Nginx 提前给 Webpack 打包的时候完成,节约了服务器资源,所以一般推介在生产环境应用 Webpack 配置 gzip
压缩。
浏览器缓存
浏览器缓存是为了加速浏览,浏览器在用户磁盘上,对最近请求过的文档进行存储。当访问者再次请求这个页面时,浏览器就可以从本地磁盘显示文档,这样,就可以加速页面的阅览,缓存的方式节约了网络的资源,提高了网络的效率。
浏览器缓存可以通过添加 expires
和 cache-control
头来实现。
HTTP 协议的 Cache -Control 指定请求和响应遵循的缓存机制。在请求消息或响应消息中设置 Cache-Control 并不会影响另一个消息处理过程中的缓存处理过程。
- 请求时的缓存指令:
no-cache
、no-store
、max-age
、max-stale
、min-fresh
、only-if-cache
等 - 响应消息中的指令:
public
、private
、no-cache
、no-store
、no-transform
、must-revalidate
、proxy-revalidate
、max-age
。
设置绝对过期时间
设置以分钟为单位的绝对过期时间, 优先级比 Cache-Control 低, 同时设置 Expires 和 Cache-Control 则后者生效。也就是说要注意一点: Cache-Control 的优先级高于 Expires。
expires
起到控制页面缓存的作用,合理配置 expires
可以减少很多服务器的请求,expires
的配置可以在 HTTP 段中或者 server 段中或者 location 段中。比如控制图片等过期时间为 30 天, 可以配置如下:
# 对 html 文件缓存 24 小时 location ~ .*\.(htm|html)$ { expires 24h; root /var/www/html; } # 对常见格式的图片在浏览器本地缓存 30 天 location ~ .*\.(gif|jpg|jpeg|png|bmp|ico)$ { expires 30d; root /var/www/img/ } # 设置无限的缓存时间 location ~ \.(wma|wmv|asf|mp3|mmf|zip|rar|swf|flv)$ { expires max; root /var/www/upload/; }
设置相对过期时间
Cache-Control 通用消息头字段被用于在 HTTP 请求和响应中通过指定指令来实现缓存机制。缓存指令是单向的, 这意味着在请求设置的指令,在响应中不一定包含相同的指令。
指令不区分大小写,并且具有可选参数,可以用令牌或者带引号的字符串语法。多个指令以逗号分隔。
- 可缓存性
public
: 表明响应可以被任何对象(包括:发送请求的客户端,代理服务器,等等)缓存。表示相应会被缓存,并且在多用户间共享。默认是public
private
:表明响应只能被单个用户缓存,不能作为共享缓存(即代理服务器不能缓存它),可以缓存响应内容。响应只作为私有的缓存,不能在用户间共享。如果要求 HTTP 认证,响应会自动设置为private
no-cache
: 在释放缓存副本之前,强制高速缓存将请求提交给原始服务器进行验证。指定不缓存响应,表明资源不进行缓存。但是设置了no-cache
之后并不代表浏览器不缓存,而是在缓存前要向服务器确认资源是否被更改。因此有的时候只设置no-cache
防止缓存还是不够保险,还可以加上private
指令,将过期时间设为过去的时间only-if-cached
:表明客户端只接受已缓存的响应,并且不要向原始服务器检查是否有更新的拷贝
- 到期
max-age=<seconds>
:设置缓存存储的最大周期,超过这个时间缓存被认为过期(单位秒)。与Expires
相反,时间是相对于请求的时间。max-age
会覆盖掉Expires
s-maxage=<seconds>
:覆盖max-age
或者Expires
头,但是仅适用于共享缓存(比如各个代理),并且私有缓存中它被忽略。也就是说s-maxage
只用于共享缓存,比如 CDN 缓存(s -> share
)。与max-age
的区别是:max-age
用于普通缓存,而s-maxage
用于代理缓存。如果存在s-maxage
,则会覆盖max-age
和Expires
max-stale[=<seconds>]
:表明客户端愿意接收一个已经过期的资源。 可选的设置一个时间(单位秒),表示响应不能超过的过时时间min-fresh=<seconds>
: 表示客户端希望在指定的时间内获取最新的响应stale-while-revalidate=<seconds>
:表明客户端愿意接受陈旧的响应,同时在后台异步检查新的响应。秒值指示客户愿意接受陈旧响应的时间长度stale-if-error=<seconds>
:表示如果新的检查失败,则客户愿意接受陈旧的响应。秒数值表示客户在初始到期后愿意接受陈旧响应的时间
- 重新验证和重新加载
must-revalidate
:缓存必须在使用之前验证旧资源的状态,并且不可使用过期资源。表示如果页面过期,则去服务器进行获取proxy-revalidate
:与must-revalidate
作用相同,但它仅适用于共享缓存(例如代理),并被私有缓存忽略immutable
:表示响应正文不会随时间而改变。资源(如果未过期)在服务器上不发生改变,因此客户端不应发送重新验证请求头(例如If-None-Match
或If-Modified-Since
)来检查更新,即使用户显式地刷新页面
- 其他
no-store
:缓存不应存储有关客户端请求或服务器响应的任何内容。表示绝对禁止缓存!no-transform
: 不得对资源进行转换或转变。Content-Encoding
、Content-Range
和Content-Type
等 HTTP 头不能由代理修改。例如,非透明代理可以对图像格式进行转换,以便节省缓存空间或者减少缓慢链路上的流量。no-transform
指令不允许这样做。
设置相对过期时间, max-age
指明以秒为单位的缓存时间. 若对静态资源只缓存一次, 可以设置 max-age
的值为 315360000000(一万年)。比如对于提交的订单,为了防止浏览器回退重新提交,可以使用 Cache-Control 之 no-store
绝对禁止缓存,即便浏览器回退依然请求的是服务器,进而判断订单的状态给出相应的提示信息!
# 匹配 URI 时返回的静态资源缓存 3600 毫秒 if ($request_uri ~* "^/$|^/search/.+/|^/company/.+/") { add_header Cache-Control max-age=3600; } # 应用中不会改变的文件,通常可以再发送响应头前添加积极缓存 location ~* \.(js|css|png|jpg|gif)$ { add_header Cache-Control public,max-age=31536000; } # 缓存前要向服务器确认资源是否被更改 location ~* \.(js|css|png|jpg|gif)$ { add_header Cache-Control no-cache; } # 禁止缓存 location ~* \.(js|css|png|jpg|gif)$ { add_header Cache-Control no-store,no-cache,must-revalidate; }
特别区分:
no-cache
:浏览器和缓存服务器都不应该缓存页面信息no-store
: 请求和响应的信息都不应该被存储在对方的磁盘系统中
资源最后修改时间
该资源的最后修改时间,在浏览器下一次请求资源时,浏览器将先发送一个请求到服务器上, 并附上 If-Unmodified-Since
头来说明浏览器所缓存资源的最后修改时间, 如果服务器发现没有修改, 则直接返回 304(Not Modified)回应信息给浏览器(内容很少),如果服务器对比时间发现修改了,则照常返回所请求的资源。
需要注意:
Last-Modified
属性通常和Expires
或Cache-Control
属性配合使用, 因为即使浏览器设置缓存, 当用户点击 刷新 按钮时, 浏览器会忽略缓存继续向服务器发送请求, 这时Last-Modified
将能够很好的减小回应开销- ETag 将返回给浏览器一个资源 ID, 如果有了新版本则正常发送并附上新 ID,否则返回 304,但是在服务器集群情况下,每个服务器将返回不同的 ID,因此不建议使用
ETag
资源缓存策略
浏览器缓存 Header:expires
、cache-control
、last-modified
、etag
。
- 200 状态:当浏览器本地没有缓存或者下一层失效时,或者用户强制刷新时,浏览器直接去服务器获取最新资源
- 304 状态:由 Last-Modified / Etag 控制。当下一层失效时活用户刷新时,浏览器就会发送请求给服务器,如果服务端没有变更,则返回 304 给浏览器
- 200 状态(from cache):由 Expires / Cache-Control 控制,Expires 是绝对时间,Cache-Control 是相对时间,两者都存在时,Cache-Control 覆盖 Expires 只要没有失效,浏览器只访问自己的缓存
通用策略:
- 对于 HTML 文件,
cache-control
设置为no-cache
- 对于 JS、图片、CSS、字体等,设置
max-age=2592000
,也就是 30 天
location ~ .* \.(js)$ { add_header Cache-Control public; expires 24h; } location ~ .* \.(css)$ { add_header Cache-Control public; expires 86400; etag on; } location ~ .*\(gif|jpg|jpeg|png)$ { add_header Cache-Control must-revalidate; etag on; }
集群分布式部署建议关闭 Etag,因为每台机器生成的 Hash 是不同的。
配置 CORS 跨域访问
假设有两个域名 mrsingsing.com
和 api.mrsingsing.com
,如果 mrsingsing.com
域名想请求 api.mrsingsing.com
域名下的资源会因为 host
不一致存在跨域的问题。
反向代理解决跨域
为了绕开浏览器的跨域安全限制,需要将请求的域名由 api.mrsingsing.com
改为 mrsingsing.com
。同时约定 URL 规则来表明代理请求的身份,然后 Nginx 通过匹配该规则,将请求代理回原来的域。
server { listen 9001; server_name mrsingsing.com; location / { proxy_pass api.mrsingsing.com; } }
这里对静态文件的请求和后端服务的请求都以 mrsingsing.com
开始,不易区分,所以通常为了实现对后端服务请求的统一转发,通常我们会约定对后端服务的请求加上 /api/
的前缀或者其他的 path
来和静态资源的请求加以区分:
# 请求跨域,约定代理后端服务请求 path 以 /api/ 开头 location ^~/api/ { # 这里重写了请求,讲正则匹配中的一个分组的 path 拼接到真正的请求后面,并用 break 停止后续匹配 rewrite ^/api/(.*)$ /$1 break; poxy_pass api.mrsingsing.com; # 两个域名之间 Cookie 的传递与回写 proxy_cookie_domain api.mrsingsing.com mrsingsing.com; }
这样其实是通过 Nginx,用类似于 Hack 的方式规避了浏览器的跨域限制,实现了跨域访问。
这样,静态资源我们使用 mrsingsing.com/index.html
,动态资源我们使用 mrsingsing.com/api/getOrderList
,浏览器页面看起来仍然访问的前端服务器,绕过了浏览器的通源策略,毕竟我们看起来并没有跨域。
配置 header 解决跨域
在 Nginx 配置中配置对应二级域名 api.mrsingsing.com
:
# /etc/nginx/conf.d/api.mrsingsing.com.conf server { listen 80; server_name api.mrsingsing.com; add_header 'Access-Control-Allow-Origin' $http_origin; # 全局变量获得当前请求 origin,带 Cookie 的请求不支持 *(通配符) add_header 'Access-Control-Allow-Credentials' 'true'; # 为 true 可带上 cookie add_header 'Access-Control-Allow-Methods' 'GET, POST, OPTIONS'; # 允许请求方法 add_header 'Access-Control-Allow-Headers' $http_access_control_request_headers; # 允许请求的 header,可以为 *(通配符) add_header 'Access-Control-Expose-Headers' 'Content-Length,Content-Range'; if ($request_method = 'OPTIONS') { add_header 'Access-Control-Max-Age' 1728000; # OPTIONS 请求的有效期,在有效期内不用发出另一条预检请求 add_header 'Content-Type' 'text/plain; charset=utf-8'; add_header 'Content-Length' 0; return 204; # 200 也可以 } location / { root /usr/share/nginx/html/be; index index.html; } }
防盗链
防盗链机制的目的是防止服务器上的资源(例如图片、文件等)被其它用户采用其它的技术手段来访问或下载。
实现方式:区别哪些请求是非正常的用户请求
基于 http_refer
防盗链配置模块:
location ~* \.(gif|jpg|png|jpeg)$ { # 只允许 192.168.0.1 请求资源 # none 表示没带 refer # blocked 表示不是标准 HTTP 请求 valid_referers none blocked 192.168.0.1; if ($invalid_referer) { rewrite ^/ http://$host/logo.png; } }
- 设置防盗链文件类型,自行修改,每个后缀用
|
符号分隔 - 允许文件链出的域名白名单,自行修改成己方域名,域名与域名之间使用空格隔开
图片处理
在前端开发中,经常需要不同尺寸的图片。现在的云储存基本对图片都提供有处理服务(一般是通过在图片链接上加参数)。其实用 Nginx,可以通过几十行配置,搭建出一个属于自己的本地图片处理服务,完全能够满足日常对图片的裁剪/缩放/旋转/图片品质等处理需求。要用到 ngx_http_image_filter_module
模块。这个模块是非基本模块,需要安装。
下面是图片缩放功能部分的 Nginx 配置:
# 图片缩放处理 # 这里约定的图片处理 url 格式:以 example.com/img/ 路径访问 location ~* /img/(.+)$ { # 图片服务端储存地址 alias /Users/cc/Desktop/server/static/image/$1; # 图片宽度默认值 set $width -; # 图片高度默认值 set $height -; if ($arg_width != "") { set $width $arg_width; } if ($arg_height != "") { set $height $arg_height; } #设置图片宽高 image_filter resize $width $height; #设置Nginx读取图片的最大buffer image_filter_buffer 10M; # 是否开启图片图像隔行扫描 image_filter_interlace on; # 图片处理错误提示图,例如缩放参数不是数字 error_page 415 = 415.png; }