Skip to content

HTTP/HTTPS

HTTP

HTTP 全称为 HyperText Transfer Protocol,即超文本传输协议,是一个用于传输超媒体文档(例如 HTML)的应用层协议

HTTP 协议的主要特点

  • 是一个应用层协议
  • 遵循经典的“客户端-服务端”模型(客户端发送请求,服务器返回响应)
  • 灵活可扩展
    • 语义上的自由,只规定了报文的基本格式,报文里的各个组成部分可以由开发者任意定制
    • 传输格式的多样性
  • 无连接: 每完成一个请求就断开连接(HTTP/1.1 后默认开启长连接)
  • 无状态: HTTP 协议对于事务处理没有记忆能力(每个请求之间、浏览器和服务器之间都是相互独立毫无关联的)
  • 可靠传输: HTTP 协议是一个可靠的传输协议(基于 TCP/IP 协议)
  • 明文传输: 协议里的报文直接使用文本形式传输(HTTP/2.0 后改为二进制传输)

HTTP 协议的演变

HTTP/0.9

1990 年问世

功能简陋,只有一个 GET 方法,且只支持纯文本内容

HTTP/1.0

1996 年 5 月正式发布

  • 任何格式的内容都可以发送
  • 请求和响应增加了头信息
  • 新增方法:POST HEAD
  • 添加了状态码、多字符集支持、权限、缓存、内容编码等功能

HTTP/1.1

1997 年 1 月发布,是目前主流的 HTTP 协议版本

  • 长连接:TCP 连接默认不关闭可以被多个请求复用
  • 管道机制:在同一个 TCP 链接里面,客户端可以同时发送多个请求
  • 分块传输编码
  • 缓存处理:Cache-ControlEtag/If-None-Match
  • 断点续传
  • 增加了 TLS 支持:支持 HTTPS 传输
  • 新增方法:PUT PATCH OPTIONS DELETE

HTTP/1.1 缺点

  • 单路连接请求低效:每个 TCP 连接只能对应一个 HTTP 请求
  • 队头阻塞:当顺序发送的请求序列中的一个请求因为某种原因被阻塞时,在后面排队的所有请求也一并被阻塞,会导致客户端迟迟收不到数据。
  • 头信息冗余
  • 只允许由客户端主动发起请求
  • 明文传输

HTTP/2.0

2015 年发布,主要基于 SPDY 协议(2009 年谷歌公开了自行研发的 SPDY 协议,主要解决 HTTP/1.1 效率不高的问题)

  • 二进制传输:头信息和数据体都是二进制
  • 多路复用/二进制分帧:在一个 TCP 连接中可以同时发送多个请求
  • 头部压缩(使用 HPACK 算法进行压缩)
  • 服务器推送:允许服务器未经请求主动向客户端发送资源
  • 请求优先级

HTTP/2.0 缺点

  • 建立连接时间长(本质上是 TCP 的问题)
  • 没有彻底解决队头阻塞问题
  • 弱网环境表现不佳

HTTP/3.0

HTTP/3.0 又称为 HTTP Over QUIC,其弃用 TCP 协议,改为使用基于 UDP 协议的 QUIC 协议来实现

  • 实现了类似 TCP 的流量控制、传输可靠性的功能
  • 实现了快速握手功能
  • 集成了 TLS 加密功能
  • 多路复用,彻底解决 TCP 中队头阻塞的问题

HTTP标准

报文格式

请求报文格式

http
<method><request-URL><version>
<headers>

<entity-body>

响应报文格式

http
<version><status><reason-phrase>
<headers>

<entity-body>

字段解释

  • method
    • HTTP动词
    • 常见方法:HEAD / GET / POST / PUT / DELETE / PATCH / OPTIONS / TRACE
    • 扩展方法:LOCK / MKCOL / COPY / MOVE
  • version
    • 报文使用的HTTP版本
    • 格式为HTTP/<major>.<minor>
  • url
    • <scheme>://<user>:<password>@<host>:<port>/<path>;<params>?<query>#<frag>

请求头列表

  • Accept
    • 指定客户端能够接收的内容类型
    • Accept: text/plain, text/html
  • Accept-Charset
    • 浏览器可以接受的字符编码集
    • Accept-Charset: iso-8859-5
  • Accept-Encoding
    • 指定浏览器可以支持的web服务器返回内容压缩编码类型
    • Accept-Encoding: compress, gzip
  • Accept-Language
    • 浏览器可接受的语言
    • Accept-Language: en,zh
  • Accept-Ranges
    • 可以请求网页实体的一个或者多个子范围字段
    • Accept-Ranges: bytes
  • Authorization
    • HTTP授权的授权证书
    • Authorization: Basic QWxhZGRpbjpvcGVuIHNlc2FtZQ==
  • Cache-Control
    • 指定请求和响应遵循的缓存机制 Cache-Control: no-cache
  • Connection
    • 表示是否需要持久连接 // HTTP 1.1默认进行持久连接
    • Connection: close
  • Cookie
    • HTTP请求发送时,会把保存在该请求域名下的所有cookie值一起发送给web服务器
    • Cookie: role=admin;ssid=1
  • Content-Length
    • 请求的内容长度
    • Content-Length: 348
  • Content-Type
    • 请求的与实体对应的MIME信息
    • Content-Type: application/x-www-form-urlencoded
  • Date
    • 请求发送的日期和时间
    • Date: Tue, 15 Nov 2010 08:12:31 GMT
  • Expect
    • 请求的特定的服务器行为
    • Expect: 100-continue
  • From
  • Host
    • 指定请求的服务器的域名和端口号
    • Host: www.github.com
  • If-Match
    • 只有请求内容与实体相匹配才有效
    • If-Match: "737060cd8c284d8af7ad3082f209582d"
  • If-Modified-Since
    • 如果请求的部分在指定时间之后被修改则请求成功,未被修改则返回304代码
    • If-Modified-Since: Sat, 29 Oct 2018 19:43:31 GMT
  • If-None-Match
    • 如果内容未改变返回304代码,参数为服务器先前发送的Etag,与服务器回应的Etag比较判断是否改变
    • If-None-Match: "737060cd8c284d8af7ad3082f209582d"
  • If-Range
    • 如果实体未改变,服务器发送客户端丢失的部分,否则发送整个实体。参数也为Etag
    • If-Range: "737060cd8c284d8af7ad3082f209582d"
  • If-Unmodified-Since
    • 只在实体在指定时间之后未被修改才请求成功
    • If-Unmodified-Since: Sat, 29 Oct 2010 19:43:31 GMT
  • Max-Forwards
    • 限制信息通过代理和网关传送的时间
    • Max-Forwards: 10
  • Pragma
    • 用来包含实现特定的指令
    • Pragma: no-cache
  • Proxy-Authorization
    • 连接到代理的授权证书
    • Proxy-Authorization: Basic QWxhZGRpbjpvcGVuIHNlc2FtZQ==
  • Range
    • 只请求实体的一部分,指定范围
    • Range: bytes=500-999
  • Referer
  • TE
    • 客户端愿意接受的传输编码,并通知服务器接受接受尾加头信息
    • TE: trailers,deflate;q=0.5
  • Upgrade
    • 向服务器指定某种传输协议以便服务器进行转换(如果支持)
    • Upgrade: HTTP/2.0, SHTTP/1.3, IRC/6.9, RTA/x11
  • User-Agent
    • User-Agent的内容包含发出请求的用户信息
    • User-Agent: Mozilla/5.0 (Linux; X11)
  • Via
    • 通知中间网关或代理服务器地址,通信协议
    • Via: 1.0 fred, 1.1 nowhere.com (Apache/1.1)
  • Warning
    • 关于消息实体的警告信息
    • Warn: 199 Miscellaneous warning

响应头列表

  • Accept-Ranges
    • 表明服务器是否支持指定范围请求及哪种类型的分段请求
    • Accept-Ranges: bytes
  • Access-Control-Allow-Origin
    • 配置有权限访问资源的域
    • Access-Control-Allow-Origin: <origin>|*
  • Age
    • 从原始服务器到代理缓存形成的估算时间(以秒计,非负)
    • Age: 12
  • Allow
    • 对某网络资源的有效的请求行为,不允许则返回405
    • Allow: GET, HEAD
  • Cache-Control
    • 告诉所有的缓存机制是否可以缓存及哪种类型
    • Cache-Control: no-cache
  • Content-Encoding
    • web服务器支持的返回内容压缩编码类型。
    • Content-Encoding: gzip
  • Content-Language
    • 响应体的语言
    • Content-Language: en,zh
  • Content-Length
    • 响应体的长度
    • Content-Length: 348
  • Content-Location
    • 请求资源可替代的备用的另一地址
    • Content-Location: /index.htm
  • Content-MD5
    • 返回资源的MD5校验值
    • Content-MD5: Q2hlY2sgSW50ZWdyaXR5IQ==
  • Content-Range
    • 在整个返回体中本部分的字节位置
    • Content-Range: bytes 21010-47021/47022
  • Content-Type
    • 返回内容的MIME类型
    • Content-Type: text/html; charset=utf-8
  • Date
    • 原始服务器消息发出的时间
    • Date: Tue, 15 Nov 2010 08:12:31 GMT
  • ETag
    • 请求变量的实体标签的当前值
    • ETag: "737060cd8c284d8af7ad3082f209582d"
  • Expires
    • 响应过期的日期和时间
    • Expires: Thu, 01 Dec 2010 16:00:00 GMT
  • Last-Modified
    • 请求资源的最后修改时间
    • Last-Modified: Tue, 15 Nov 2010 12:45:26 GMT
  • Location
  • Pragma
    • 包括实现特定的指令,它可应用到响应链上的任何接收方
    • Pragma: no-cache
  • Proxy-Authenticate
    • 它指出认证方案和可应用到代理的该URL上的参数
    • Proxy-Authenticate: Basic
  • Refresh
  • Retry-After
    • 如果实体暂时不可取,通知客户端在指定时间之后再次尝试
    • Retry-After: 120
  • Server
    • web服务器软件名称
    • Server: Apache/1.3.27 (Unix) (Red-Hat/Linux)
  • Set-Cookie
    • 设置Http Cookie Set-Cookie: UserID=JohnDoe; Max-Age=3600; Version=1
  • Strict-Transport-Security
    • 设置浏览器强制使用HTTPS访问
    • max-age: x秒的时间内 访问对应域名都使用HTTPS请求
    • includeSubDomains: 网站的子域名也启用规则
    • Strict-Transport-Security: max-age=1000; includeSubDomains
  • Trailer
    • 指出头域在分块传输编码的尾部存在 Trailer: Max-Forwards
  • Transfer-Encoding
    • 文件传输编码
    • Transfer-Encoding:chunked
  • Vary
    • 告诉下游代理是使用缓存响应还是从原始服务器请求
    • Vary: *
  • Via
    • 告知代理客户端响应是通过哪里发送的
    • Via: 1.0 fred, 1.1 nowhere.com (Apache/1.1)
  • Warning
    • 警告实体可能存在的问题
    • Warning: 199 Miscellaneous warning
  • WWW-Authenticate
    • 表明客户端请求实体应该使用的授权方案
    • WWW-Authenticate: Basic
  • X-Content-Type-Options
    • 配置禁止MIME类型嗅探
    • X-Content-Type-Options: nosniff
  • X-Frame-Options
    • 配置页面是否能出现在 <frame>, <iframe>, <embed>, <object> 等标签中,防止点击劫持
    • X-Frame-Options: deny
  • X-XSS-Protection
    • 配置XSS防护机制
    • X-XSS-Protection: 1; mode=block

HTTP状态码

1xx(临时响应)

表示临时响应并需要请求者继续执行操作的状态代码。

Code代码说明
100继续服务器返回此代码表示已收到请求的第一部分,正在等待其余部分。
101切换协议请求者已要求服务器切换协议,服务器已确认并准备切换。

2xx (成功)

表示成功处理了请求的状态代码。

Code代码说明
200成功服务器已成功处理了请求。通常,这表示服务器提供了请求的网页。
201已创建请求成功并且服务器创建了新的资源。
202已接受服务器已接受请求,但尚未处理。
203非授权信息服务器已成功处理了请求,但返回的信息可能来自另一来源。
204无内容服务器成功处理了请求,但没有返回任何内容。
205重置内容服务器成功处理了请求,但没有返回任何内容。
206部分内容服务器成功处理了部分GET请求。

3xx (重定向)

表示要完成请求,需要进一步操作。 通常,这些状态代码用来重定向。

Code代码说明
300多种选择针对请求,服务器可执行多种操作。服务器可根据请求者 (user agent) 选择一项操作,或提供操作列表供请求者选择。
301永久移动请求的网页已永久移动到新位置。服务器返回此响应(对 GET 或 HEAD 请求的响应)时,会自动将请求者转到新位置。
302临时移动服务器目前从不同位置的网页响应请求,但请求者应继续使用原有位置来进行以后的请求。
303查看其他位置请求者应当对不同的位置使用单独的 GET 请求来检索响应时,服务器返回此代码。
304未修改自从上次请求后,请求的网页未修改过。服务器返回此响应时,不会返回网页内容。
305使用代理请求者只能使用代理访问请求的网页。如果服务器返回此响应,还表示请求者应使用代理。
307临时重定向服务器目前从不同位置的网页响应请求,但请求者应继续使用原有位置来进行以后的请求。

4xx(请求错误)

这些状态代码表示请求可能出错,妨碍了服务器的处理。

Code代码说明
400错误请求服务器不理解请求的语法。
401未授权请求要求身份验证。对于需要登录的网页,服务器可能返回此响应。
403禁止服务器拒绝请求。
404未找到服务器找不到请求的网页。
405方法禁用禁用请求中指定的方法。
406不接受无法使用请求的内容特性响应请求的网页。
407需要代理授权此状态代码与 401(未授权)类似,但指定请求者应当授权使用代理。
408请求超时服务器等候请求时发生超时。
409冲突服务器在完成请求时发生冲突。服务器必须在响应中包含有关冲突的信息。
410已删除如果请求的资源已永久删除,服务器就会返回此响应。
411需要有效长度服务器不接受不含有效内容长度标头字段的请求。
412未满足前提条件服务器未满足请求者在请求中设置的其中一个前提条件。
413请求实体过大服务器无法处理请求,因为请求实体过大,超出服务器的处理能力。
414请求的 URI 过长请求的 URI(通常为网址)过长,服务器无法处理。
415不支持的媒体类型请求的格式不受请求页面的支持。
416请求范围不符合要求如果页面无法提供请求的范围,则服务器会返回此状态代码。
417未满足期望值服务器未满足"期望"请求标头字段的要求。

5xx(服务器错误)

这些状态代码表示服务器在尝试处理请求时发生内部错误。 这些错误可能是服务器本身的错误,而不是请求出错。

Code代码说明
500服务器内部错误服务器遇到错误,无法完成请求。
501尚未实施服务器不具备完成请求的功能。例如,服务器无法识别请求方法时可能会返回此代码。
502错误网关服务器作为网关或代理,从上游服务器收到无效响应。
503服务不可用服务器目前无法使用(由于超载或停机维护)。通常,这只是暂时状态。
504网关超时服务器作为网关或代理,但是没有及时从上游服务器收到请求。
505HTTP 版本不受支持服务器不支持请求中所用的 HTTP 协议版本。

HTTPS

HTTPS (HyperText Transfer Protocol over Secure Socket Layer)可以理解为HTTP+SSL/TLS, 即 HTTP 下加入 SSL 层,HTTPS 的安全基础是 SSL。

交互

证书验证阶段

  • 浏览器发起 HTTPS 请求
  • 服务端返回 HTTPS 证书
    • 其中证书包含:
      • 颁发机构信息
      • 公钥
      • 公司信息
      • 域名
      • 有效期
      • 指纹
  • 客户端验证证书是否合法,如果不合法则提示告警

数据传输阶段

  • 当证书验证合法后,在本地生成随机数
  • 通过公钥加密随机数,并把加密后的随机数传输到服务端
  • 服务端通过私钥对随机数进行解密
  • 服务端通过客户端传入的随机数构造对称加密算法,对返回结果内容进行加密后传输

CA

CA (Certificate Authority) 是颁发数字证书的机构。是负责发放和管理数字证书的权威机构,并作为电子商务交易中受信任的第三方,承担公钥体系中公钥的合法性检验的责任。

GET 和 POST 的区别

安全是指请求方法不会破坏服务器上的资源

幂等是指多次执行相同的操作,其结果都是相同的

  • 语义上(最本质的区别)
    • GET 是从服务器获取指定的资源,GET 方法是安全、幂等、可被缓存的
    • POST 是根据请求负荷(报文 body)对指定的资源做出处理,具体的处理方式视资源类型而不同。POST 不安全、不幂等、(大部分实现)不可缓存。

在实际过程中开发者不一定会按照 RFC 规范定义的语义来实现 GETPOST 方法

  • 可以用 GET 方法实现新增或删除数据的请求,这样实现的 GET 方法自然就不是安全和幂等;
  • 可以用 POST 方法实现查询数据的请求,这样实现的 POST 方法自然就是安全和幂等

GET 请求可以带 body 吗?

RFC 规范并没有规定 GET 请求不能带 body。只是因为 RFC 规范定义的 GET 请求是获取资源,所以根据这个语义不需要用到 body。
理论上任何 HTTP 请求都可以带 body,任何 HTTP 请求的 URL 也可以携带查询参数

粤ICP备20009776号