主题
HTTP/HTTPS
HTTP
HTTP 全称为 HyperText Transfer Protocol,即超文本传输协议,是一个用于传输超媒体文档(例如 HTML
)的应用层协议
HTTP 协议的主要特点
- 是一个应用层协议
- 遵循经典的“客户端-服务端”模型(客户端发送请求,服务器返回响应)
- 灵活可扩展
- 语义上的自由,只规定了报文的基本格式,报文里的各个组成部分可以由开发者任意定制
- 传输格式的多样性
- 无连接: 每完成一个请求就断开连接(HTTP/1.1 后默认开启长连接)
- 无状态: HTTP 协议对于事务处理没有记忆能力(每个请求之间、浏览器和服务器之间都是相互独立毫无关联的)
- 可靠传输: HTTP 协议是一个可靠的传输协议(基于 TCP/IP 协议)
- 明文传输: 协议里的报文直接使用文本形式传输(HTTP/2.0 后改为二进制传输)
HTTP 协议的演变
HTTP/0.9
1990 年问世
功能简陋,只有一个 GET
方法,且只支持纯文本内容
HTTP/1.0
1996 年 5 月正式发布
- 任何格式的内容都可以发送
- 请求和响应增加了头信息
- 新增方法:
POST HEAD
- 添加了状态码、多字符集支持、权限、缓存、内容编码等功能
HTTP/1.1
1997 年 1 月发布,是目前主流的 HTTP 协议版本
- 长连接:TCP 连接默认不关闭可以被多个请求复用
- 管道机制:在同一个 TCP 链接里面,客户端可以同时发送多个请求
- 分块传输编码
- 缓存处理:
Cache-Control
和Etag/If-None-Match
- 断点续传
- 增加了
TLS
支持:支持HTTPS
传输 - 新增方法:
PUT PATCH OPTIONS DELETE
HTTP/1.1 缺点
- 单路连接请求低效:每个 TCP 连接只能对应一个 HTTP 请求
- 队头阻塞:当顺序发送的请求序列中的一个请求因为某种原因被阻塞时,在后面排队的所有请求也一并被阻塞,会导致客户端迟迟收不到数据。
- 头信息冗余
- 只允许由客户端主动发起请求
- 明文传输
HTTP/2.0
2015 年发布,主要基于 SPDY 协议(2009 年谷歌公开了自行研发的 SPDY 协议,主要解决 HTTP/1.1 效率不高的问题)
- 二进制传输:头信息和数据体都是二进制
- 多路复用/二进制分帧:在一个 TCP 连接中可以同时发送多个请求
- 头部压缩(使用 HPACK 算法进行压缩)
- 服务器推送:允许服务器未经请求主动向客户端发送资源
- 请求优先级
HTTP/2.0 缺点
- 建立连接时间长(本质上是 TCP 的问题)
- 没有彻底解决队头阻塞问题
- 弱网环境表现不佳
HTTP/3.0
HTTP/3.0 又称为 HTTP Over QUIC,其弃用 TCP 协议,改为使用基于 UDP 协议的 QUIC 协议来实现
- 实现了类似 TCP 的流量控制、传输可靠性的功能
- 实现了快速握手功能
- 集成了 TLS 加密功能
- 多路复用,彻底解决 TCP 中队头阻塞的问题
HTTP标准
报文格式
请求报文格式
http
<method><request-URL><version>
<headers>
<entity-body>
响应报文格式
http
<version><status><reason-phrase>
<headers>
<entity-body>
字段解释
- method
- HTTP动词
- 常见方法:HEAD / GET / POST / PUT / DELETE / PATCH / OPTIONS / TRACE
- 扩展方法:LOCK / MKCOL / COPY / MOVE
- version
- 报文使用的HTTP版本
- 格式为HTTP/<major>.<minor>
- url
<scheme>://<user>:<password>@<host>:<port>/<path>;<params>?<query>#<frag>
请求头列表
- Accept
- 指定客户端能够接收的内容类型
- Accept: text/plain, text/html
- Accept-Charset
- 浏览器可以接受的字符编码集
- Accept-Charset: iso-8859-5
- Accept-Encoding
- 指定浏览器可以支持的web服务器返回内容压缩编码类型
- Accept-Encoding: compress, gzip
- Accept-Language
- 浏览器可接受的语言
- Accept-Language: en,zh
- Accept-Ranges
- 可以请求网页实体的一个或者多个子范围字段
- Accept-Ranges: bytes
- Authorization
- HTTP授权的授权证书
- Authorization: Basic QWxhZGRpbjpvcGVuIHNlc2FtZQ==
- Cache-Control
- 指定请求和响应遵循的缓存机制 Cache-Control: no-cache
- Connection
- 表示是否需要持久连接 // HTTP 1.1默认进行持久连接
- Connection: close
- Cookie
- HTTP请求发送时,会把保存在该请求域名下的所有cookie值一起发送给web服务器
- Cookie: role=admin;ssid=1
- Content-Length
- 请求的内容长度
- Content-Length: 348
- Content-Type
- 请求的与实体对应的MIME信息
- Content-Type: application/x-www-form-urlencoded
- Date
- 请求发送的日期和时间
- Date: Tue, 15 Nov 2010 08:12:31 GMT
- Expect
- 请求的特定的服务器行为
- Expect: 100-continue
- From
- 发出请求的用户的Email
- From: user@email.com
- Host
- 指定请求的服务器的域名和端口号
- Host: www.github.com
- If-Match
- 只有请求内容与实体相匹配才有效
- If-Match: "737060cd8c284d8af7ad3082f209582d"
- If-Modified-Since
- 如果请求的部分在指定时间之后被修改则请求成功,未被修改则返回304代码
- If-Modified-Since: Sat, 29 Oct 2018 19:43:31 GMT
- If-None-Match
- 如果内容未改变返回304代码,参数为服务器先前发送的Etag,与服务器回应的Etag比较判断是否改变
- If-None-Match: "737060cd8c284d8af7ad3082f209582d"
- If-Range
- 如果实体未改变,服务器发送客户端丢失的部分,否则发送整个实体。参数也为Etag
- If-Range: "737060cd8c284d8af7ad3082f209582d"
- If-Unmodified-Since
- 只在实体在指定时间之后未被修改才请求成功
- If-Unmodified-Since: Sat, 29 Oct 2010 19:43:31 GMT
- Max-Forwards
- 限制信息通过代理和网关传送的时间
- Max-Forwards: 10
- Pragma
- 用来包含实现特定的指令
- Pragma: no-cache
- Proxy-Authorization
- 连接到代理的授权证书
- Proxy-Authorization: Basic QWxhZGRpbjpvcGVuIHNlc2FtZQ==
- Range
- 只请求实体的一部分,指定范围
- Range: bytes=500-999
- Referer
- 先前网页的地址,当前请求网页紧随其后,即来路
- Referer: http://www.zcmhi.com/archives/71.html
- TE
- 客户端愿意接受的传输编码,并通知服务器接受接受尾加头信息
- TE: trailers,deflate;q=0.5
- Upgrade
- 向服务器指定某种传输协议以便服务器进行转换(如果支持)
- Upgrade: HTTP/2.0, SHTTP/1.3, IRC/6.9, RTA/x11
- User-Agent
- User-Agent的内容包含发出请求的用户信息
- User-Agent: Mozilla/5.0 (Linux; X11)
- Via
- 通知中间网关或代理服务器地址,通信协议
- Via: 1.0 fred, 1.1 nowhere.com (Apache/1.1)
- Warning
- 关于消息实体的警告信息
- Warn: 199 Miscellaneous warning
响应头列表
- Accept-Ranges
- 表明服务器是否支持指定范围请求及哪种类型的分段请求
- Accept-Ranges: bytes
- Access-Control-Allow-Origin
- 配置有权限访问资源的域
- Access-Control-Allow-Origin: <origin>|*
- Age
- 从原始服务器到代理缓存形成的估算时间(以秒计,非负)
- Age: 12
- Allow
- 对某网络资源的有效的请求行为,不允许则返回405
- Allow: GET, HEAD
- Cache-Control
- 告诉所有的缓存机制是否可以缓存及哪种类型
- Cache-Control: no-cache
- Content-Encoding
- web服务器支持的返回内容压缩编码类型。
- Content-Encoding: gzip
- Content-Language
- 响应体的语言
- Content-Language: en,zh
- Content-Length
- 响应体的长度
- Content-Length: 348
- Content-Location
- 请求资源可替代的备用的另一地址
- Content-Location: /index.htm
- Content-MD5
- 返回资源的MD5校验值
- Content-MD5: Q2hlY2sgSW50ZWdyaXR5IQ==
- Content-Range
- 在整个返回体中本部分的字节位置
- Content-Range: bytes 21010-47021/47022
- Content-Type
- 返回内容的MIME类型
- Content-Type: text/html; charset=utf-8
- Date
- 原始服务器消息发出的时间
- Date: Tue, 15 Nov 2010 08:12:31 GMT
- ETag
- 请求变量的实体标签的当前值
- ETag: "737060cd8c284d8af7ad3082f209582d"
- Expires
- 响应过期的日期和时间
- Expires: Thu, 01 Dec 2010 16:00:00 GMT
- Last-Modified
- 请求资源的最后修改时间
- Last-Modified: Tue, 15 Nov 2010 12:45:26 GMT
- Location
- 用来重定向接收方到非请求URL的位置来完成请求或标识新的资源
- Location: http://www.zcmhi.com/archives/94.html
- Pragma
- 包括实现特定的指令,它可应用到响应链上的任何接收方
- Pragma: no-cache
- Proxy-Authenticate
- 它指出认证方案和可应用到代理的该URL上的参数
- Proxy-Authenticate: Basic
- Refresh
- 应用于重定向或一个新的资源被创造,在5秒之后重定向(由网景提出,被大部分浏览器支持)
- Refresh: 5; url=http://www.zcmhi.com/archives/94.html
- Retry-After
- 如果实体暂时不可取,通知客户端在指定时间之后再次尝试
- Retry-After: 120
- Server
- web服务器软件名称
- Server: Apache/1.3.27 (Unix) (Red-Hat/Linux)
- Set-Cookie
- 设置Http Cookie Set-Cookie: UserID=JohnDoe; Max-Age=3600; Version=1
- Strict-Transport-Security
- 设置浏览器强制使用HTTPS访问
- max-age: x秒的时间内 访问对应域名都使用HTTPS请求
- includeSubDomains: 网站的子域名也启用规则
- Strict-Transport-Security: max-age=1000; includeSubDomains
- Trailer
- 指出头域在分块传输编码的尾部存在 Trailer: Max-Forwards
- Transfer-Encoding
- 文件传输编码
- Transfer-Encoding:chunked
- Vary
- 告诉下游代理是使用缓存响应还是从原始服务器请求
- Vary: *
- Via
- 告知代理客户端响应是通过哪里发送的
- Via: 1.0 fred, 1.1 nowhere.com (Apache/1.1)
- Warning
- 警告实体可能存在的问题
- Warning: 199 Miscellaneous warning
- WWW-Authenticate
- 表明客户端请求实体应该使用的授权方案
- WWW-Authenticate: Basic
- X-Content-Type-Options
- 配置禁止MIME类型嗅探
- X-Content-Type-Options: nosniff
- X-Frame-Options
- 配置页面是否能出现在 <frame>, <iframe>, <embed>, <object> 等标签中,防止点击劫持
- X-Frame-Options: deny
- X-XSS-Protection
- 配置XSS防护机制
- X-XSS-Protection: 1; mode=block
HTTP状态码
1xx(临时响应)
表示临时响应并需要请求者继续执行操作的状态代码。
Code | 代码 | 说明 |
---|---|---|
100 | 继续 | 服务器返回此代码表示已收到请求的第一部分,正在等待其余部分。 |
101 | 切换协议 | 请求者已要求服务器切换协议,服务器已确认并准备切换。 |
2xx (成功)
表示成功处理了请求的状态代码。
Code | 代码 | 说明 |
---|---|---|
200 | 成功 | 服务器已成功处理了请求。通常,这表示服务器提供了请求的网页。 |
201 | 已创建 | 请求成功并且服务器创建了新的资源。 |
202 | 已接受 | 服务器已接受请求,但尚未处理。 |
203 | 非授权信息 | 服务器已成功处理了请求,但返回的信息可能来自另一来源。 |
204 | 无内容 | 服务器成功处理了请求,但没有返回任何内容。 |
205 | 重置内容 | 服务器成功处理了请求,但没有返回任何内容。 |
206 | 部分内容 | 服务器成功处理了部分GET请求。 |
3xx (重定向)
表示要完成请求,需要进一步操作。 通常,这些状态代码用来重定向。
Code | 代码 | 说明 |
---|---|---|
300 | 多种选择 | 针对请求,服务器可执行多种操作。服务器可根据请求者 (user agent) 选择一项操作,或提供操作列表供请求者选择。 |
301 | 永久移动 | 请求的网页已永久移动到新位置。服务器返回此响应(对 GET 或 HEAD 请求的响应)时,会自动将请求者转到新位置。 |
302 | 临时移动 | 服务器目前从不同位置的网页响应请求,但请求者应继续使用原有位置来进行以后的请求。 |
303 | 查看其他位置 | 请求者应当对不同的位置使用单独的 GET 请求来检索响应时,服务器返回此代码。 |
304 | 未修改 | 自从上次请求后,请求的网页未修改过。服务器返回此响应时,不会返回网页内容。 |
305 | 使用代理 | 请求者只能使用代理访问请求的网页。如果服务器返回此响应,还表示请求者应使用代理。 |
307 | 临时重定向 | 服务器目前从不同位置的网页响应请求,但请求者应继续使用原有位置来进行以后的请求。 |
4xx(请求错误)
这些状态代码表示请求可能出错,妨碍了服务器的处理。
Code | 代码 | 说明 |
---|---|---|
400 | 错误请求 | 服务器不理解请求的语法。 |
401 | 未授权 | 请求要求身份验证。对于需要登录的网页,服务器可能返回此响应。 |
403 | 禁止 | 服务器拒绝请求。 |
404 | 未找到 | 服务器找不到请求的网页。 |
405 | 方法禁用 | 禁用请求中指定的方法。 |
406 | 不接受 | 无法使用请求的内容特性响应请求的网页。 |
407 | 需要代理授权 | 此状态代码与 401(未授权)类似,但指定请求者应当授权使用代理。 |
408 | 请求超时 | 服务器等候请求时发生超时。 |
409 | 冲突 | 服务器在完成请求时发生冲突。服务器必须在响应中包含有关冲突的信息。 |
410 | 已删除 | 如果请求的资源已永久删除,服务器就会返回此响应。 |
411 | 需要有效长度 | 服务器不接受不含有效内容长度标头字段的请求。 |
412 | 未满足前提条件 | 服务器未满足请求者在请求中设置的其中一个前提条件。 |
413 | 请求实体过大 | 服务器无法处理请求,因为请求实体过大,超出服务器的处理能力。 |
414 | 请求的 URI 过长 | 请求的 URI(通常为网址)过长,服务器无法处理。 |
415 | 不支持的媒体类型 | 请求的格式不受请求页面的支持。 |
416 | 请求范围不符合要求 | 如果页面无法提供请求的范围,则服务器会返回此状态代码。 |
417 | 未满足期望值 | 服务器未满足"期望"请求标头字段的要求。 |
5xx(服务器错误)
这些状态代码表示服务器在尝试处理请求时发生内部错误。 这些错误可能是服务器本身的错误,而不是请求出错。
Code | 代码 | 说明 |
---|---|---|
500 | 服务器内部错误 | 服务器遇到错误,无法完成请求。 |
501 | 尚未实施 | 服务器不具备完成请求的功能。例如,服务器无法识别请求方法时可能会返回此代码。 |
502 | 错误网关 | 服务器作为网关或代理,从上游服务器收到无效响应。 |
503 | 服务不可用 | 服务器目前无法使用(由于超载或停机维护)。通常,这只是暂时状态。 |
504 | 网关超时 | 服务器作为网关或代理,但是没有及时从上游服务器收到请求。 |
505 | HTTP 版本不受支持 | 服务器不支持请求中所用的 HTTP 协议版本。 |
HTTPS
HTTPS (HyperText Transfer Protocol over Secure Socket Layer)可以理解为HTTP+SSL/TLS, 即 HTTP 下加入 SSL 层,HTTPS 的安全基础是 SSL。
交互
证书验证阶段
- 浏览器发起 HTTPS 请求
- 服务端返回 HTTPS 证书
- 其中证书包含:
- 颁发机构信息
- 公钥
- 公司信息
- 域名
- 有效期
- 指纹
- 其中证书包含:
- 客户端验证证书是否合法,如果不合法则提示告警
数据传输阶段
- 当证书验证合法后,在本地生成随机数
- 通过公钥加密随机数,并把加密后的随机数传输到服务端
- 服务端通过私钥对随机数进行解密
- 服务端通过客户端传入的随机数构造对称加密算法,对返回结果内容进行加密后传输
CA
CA (Certificate Authority) 是颁发数字证书的机构。是负责发放和管理数字证书的权威机构,并作为电子商务交易中受信任的第三方,承担公钥体系中公钥的合法性检验的责任。
GET 和 POST 的区别
安全是指请求方法不会破坏服务器上的资源
幂等是指多次执行相同的操作,其结果都是相同的
- 语义上(最本质的区别)
GET
是从服务器获取指定的资源,GET
方法是安全、幂等、可被缓存的POST
是根据请求负荷(报文 body)对指定的资源做出处理,具体的处理方式视资源类型而不同。POST
不安全、不幂等、(大部分实现)不可缓存。
在实际过程中开发者不一定会按照 RFC 规范定义的语义来实现 GET
和 POST
方法
- 可以用
GET
方法实现新增或删除数据的请求,这样实现的GET
方法自然就不是安全和幂等; - 可以用
POST
方法实现查询数据的请求,这样实现的POST
方法自然就是安全和幂等
GET 请求可以带 body 吗?
RFC 规范并没有规定 GET
请求不能带 body。只是因为 RFC 规范定义的 GET
请求是获取资源,所以根据这个语义不需要用到 body。
理论上任何 HTTP 请求都可以带 body,任何 HTTP 请求的 URL 也可以携带查询参数