Nginx处理请求时的匹配规则详析
nginx 在收到一条请求时将先通过 server_name 匹配一个 server, 然后使用 server 中的 location 继续匹配.
匹配 server_name
在 nginx 中, server_name 决定了当收到一个请求后哪一个 server 会被使用. nginx 会使用请求头中的 Host 字段与 server_name 进行匹配. 定义 server_name 时可以使用 完全名称、通配符名称、正则表达式名称, 它们的匹配顺序如下:
- 完全匹配
- 前通配符匹配, 即 *.example.org
- 后通配符匹配, 即 mail.*
- 正则表达式匹配
如果没有匹配到结果, 将会使用 default_server 进行处理, 如果没有定义, 则第一个定义的为 default_server. 使用三个简单的 server 作为例子, 让他们监听 80 端口, server_name 分别设置为 *.org、*.net、*.com:
server { listen 80; server_name example.org www.example.org; return 401; } server { listen 80; server_name example.net www.example.net; return 402; } server { listen 80; server_name example.com www.example.com; return 403; }
在上面的配置中, 默认的服务器为 第一个, 随便访问一个不存在的 server 将会返回 401. 不过可以使用 default_server 手动设置一个默认主机, default_server 设置在 listen 字段, 如下:
server { listen 80 default_server; server_name example.net www.example.net; }
之后再匹配时, 未匹配到将会使用这个 server.
禁止访问
如果想要禁止一个没有携带 Host 字段的请求, 可以定义如下 server:
server { listen 80; server_name ""; return 444; }
server_name 定义为空字符串, 如果 Host 字段为空或不存在, 将会匹配到这个 server, 然后返回 404 状态码.
Nginx 的444 状态比较特殊,如果返回 444 那么客户端将不会收到服务端返回的信息,就像是网站无法连接一样, 浏览器直接显示 502. 但是如果使用反向代理, 还是显示正常状态码
如果想要禁止访问不存在的主机, 可以这样定义:
server { listen 80 default_server; server_name _; return 444; }
_ 在这里没有任何特别含义, 因为一个域名中不会出现 _, 所以不会与任何真实的域名相同, 使用其他非法字符是相同的道理.
同时匹配 IP 和 server_name
现在来看一下对于监听不同 IP 和不同 server_name 混合使用时是如何处理的:
server { listen 192.168.1.1:80; server_name example.org www.example.org; } server { listen 192.168.1.1:80; server_name example.net www.example.net; } server { listen 192.168.1.2:80; server_name example.com www.example.com; }
在这个配置中, nginx 首先匹配 IP, 匹配到后再匹配它们的 server_name, 如果没有匹配到 server_name, 则使用到它们默认的 server. 举个例子, 如果一个域名为 www.example.com 的请求来自 192.168.1.1:80. 但是监听 192.168.1.1:80 的 server 只有两个, 这两个都不能匹配 www.example.com, 那么就使用这两个 server 中的默认主机, 由于没有使用 defualt_server 定义监听, 所以默认为第一个即 www.example.org 这个 server. 当然你可以定义 defualt_server:
server { listen 192.168.1.1:80; server_name example.org www.example.org; } server { listen 192.168.1.1:80 default_server; server_name example.net www.example.net; } server { listen 192.168.1.2:80 default_server; server_name example.com www.example.com; }
匹配 location
在 nginx 匹配到一个 server 后, 就会通过 location 继续处理请求, 下面是一个示例:
server { listen 172.17.0.3:80; server_name _; location / { return 401; } location ~*\.(gif|jpg|png)$ { return 402; } location ~*\.(gif|jpg|png)$ { return 404; } location /api { return 403; } }
nginx 首先会在所有的 location 中搜索 前缀进行匹配, 匹配到前缀后, 将按顺序匹配使用 正则表达式 定义的 location, 匹配到就结束, 如果没有匹配到, 则使用之前匹配到前缀的那个 location 进行处理, 下面是具体匹配的例子:
- 一个 /x.gif 请求, 首先匹配到的前缀为 /, 然后使用剩下的 x.gif 跟 location 的正则去匹配, 先匹配到了 location ~*\.(gif|jpg|png)$, 返回 402.
- 一个 /x.pdf 请求, 由于 x.pdf 无法被匹配到, 所以使用 location / 进行处理.
- 一个 /api/x.gif, 首先匹配到前缀为 /api, 然后使用剩下的 x.gif 跟 location 的正则去匹配, 先匹配到了 location ~*\.(gif|jpg|png)$, 返回 402.
- 一个 /api/x.pdf 请求, 由于 x.pdf 无法被匹配到, 所以使用 location /api 进行处理.
参考
总结