|
|
|
|
公众号矩阵

Http协议发展简史以及常见面试题解析

超文本传输协议(HTTP)是Internet上最普遍和广泛采用的应用程序协议之一:它是客户端和服务器之间的通用语言,可实现现代Web。

作者:laker 来源: Java大厂面试官|2021-01-14 05:12

本文转载自微信公众号「Java大厂面试官」,作者laker 。转载本文请联系Java大厂面试官公众号。 

目录

  • 什么是HTTP协议
  • HTTP协议发展简史
    • HTTP 0.9 单行协议
    • HTTP 1.0 构建扩展性
    • HTTP 1.1 标准化协议
    • HTTP 2.0 更高性能的协议
  • 问题
  • 1.http1.1长连接keep-alive和http2.0的多路复用有什么区别?
  • 2.什么是流水线(管道机制)?
  • 3.现代浏览器在与服务器建立了一个 TCP 连接后是否会在一个 HTTP 请求完成后断开?
  • 4.一个 TCP 连接可以对应几个 HTTP 请求?
  • 5.一个 TCP 连接中 HTTP 请求发送可以一起发送么(比如一起发三个请求,再三个响应一起接收)?

什么是HTTP协议

超文本传输协议(HTTP)是Internet上最普遍和广泛采用的应用程序协议之一:它是客户端和服务器之间的通用语言,可实现现代Web。从简单的一个关键字和文档路径开始,它不仅成为浏览器的选择协议,而且几乎成为所有与Internet连接的软件和硬件应用程序的选择协议。

HTTP具有四个版本:

  • HTTP / 0.9
  • HTTP / 1.0
  • HTTP / 1.1
  • HTTP / 2.0

时至今日,常用的版本是HTTP / 1.1,未来的发展版本是HTTP / 2.0。

HTTP协议发展简史

HTTP 0.9 单行协议

HTTP协议的第一个简单实现,仅支持获取网页。一开始都没有版本号,为了区分其他版本,后来被称为0.9。HTTP / 0.9非常简单:请求由一行组成,并以唯一的方法GET开头,后跟资源的路径。

  1. GET /mypage.html 
  2.  
  3. <HTML> 
  4. A very simple HTML page 
  5. </HTML> 

从1991年开始,HTTP就有了自己的生命,并在接下来的几年中迅速发展。

缘分呐❤️,我也是1991年破壳。

核心功能:

  • 简单的客户端-服务器,请求-响应协议。
  • 支持的方法:只有GET。
  • ASCII协议,通过TCP / IP链接运行。
  • 设计用于传输超文本文档(HTML)。
  • 每次请求后,服务器和客户端之间的连接都会关闭。
  • 没有HTTP标头(无法传输其他内容类型文件),没有状态/错误代码,没有URL,没有版本控制

这个我表示我生活在现代,目前我所经历的都没碰到过。。。直接跳过,不研究👄

HTTP 1.0 构建扩展性

HTTP / 0.9协议非常有限,浏览器和服务器都迅速增加扩展性,使其变的更加通用。

1996年5月,HTTP工作组(HTTP-WG)发布了RFC 1945,此版本添加了许多补充数据字段,称为规范的标头。这允许其他信息在客户端和服务器之间以及请求和后续页面之间传递。

  1. GET /mypage.html HTTP/1.0 
  2. User-Agent: NCSA_Mosaic/2.0 (Windows 3.1) 
  3.  
  4. 200 OK 
  5. Date: Tue, 15 Nov 1994 08:12:31 GMT 
  6. Server: CERN/3.0 libwww/2.17 
  7. Content-Type: text/html 
  8. <HTML> 
  9. A page with an image 
  10.   <IMG SRC="/myimage.gif"
  11. </HTML> 

核心功能:

  • 提供的标头字段包括有关请求和响应的丰富元数据(HTTP版本号,状态代码,内容类型)
  • 响应:不限于超文本(Content-Type标头提供了传输普通HTML文件以外的文件的功能,例如脚本,样式表,媒体)
  • 支持的方法:GET,HEAD,POST
  • 请求可能包含多个换行符分隔的标头字段。
  • 响应对象以响应状态行为前缀。
  • 响应对象具有自己的一组由换行符分隔的标头字段。
  • 每次请求后,服务器和客户端之间的连接都会关闭。

nginx默认还是http1.0协议,刚好前几天碰到个问题【1.0不支持分块传输】,具体可参见:

nginx 下载文件 upstream sent invalid chunked response while reading upstream 错误

HTTP 1.1 标准化协议

HTTP / 1.1标准解决了早期版本中的许多协议歧义,并引入了许多关键的性能优化:

  • 保持活动连接
  • 分块编码传输
  • 字节范围请求
  • 附加缓存机制
  • 传输编码
  • 请求流水线(管道机制)

如今,大多数浏览器都支持1.0和1.1的实现,新浏览器默认使用1.1,但是如果有需要的话,还可以回退到早期版本。RFC定义明确指出的一件事是,HTTP协议的所有实现都应向后兼容。也就是说,实现HTTP /1.1规范的浏览器应该能够从服务器接收1.0响应。相反,服务器端的1.1实现也应该能够响应来自1.0浏览器的请求。

将HTTP转变为正式的IETF Internet标准的工作与围绕HTTP / 1.0的文档编制工作并行进行,大约持续了四年时间:1995年至1999年。

实际上,第一个正式的HTTP / 1.1标准是在RFC 2068,于1997年1月正式发布,距HTTP / 1.0发布大约六个月。然后,两年半之后的1999年6月,许多改进和更新被纳入该标准,并以RFC 2616的形式发布。

  1. GET /static/img/header-background.png HTTP/1.1 
  2. Host: developer.cdn.mozilla.net 
  3. User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10.9; rv:50.0) Gecko/20100101 Firefox/50.0 
  4. Accept: */* 
  5. Accept-Language: en-US,en;q=0.5 
  6. Accept-Encoding: gzip, deflate, br 
  7. Referer: https://developer.mozilla.org/en-US/docs/Glossary/Simple_header 
  8.  
  9. 200 OK 
  10. Age: 9578461 
  11. Cache-Control: publicmax-age=315360000 
  12. Connection: keep-alive 
  13. Content-Length: 3077 
  14. Content-Type: image/png 
  15. Date: Thu, 31 Mar 2016 13:34:46 GMT 
  16. Last-Modified: Wed, 21 Oct 2015 18:27:50 GMT 
  17. Server: Apache 
  18.  
  19. (image content of 3077 bytes) 

核心功能:

  • 可以重用连接,从而节省了多次重新打开连接的时间。
  • 添加了流水线,允许在完全传输第一个请求的答案之前发送第二个请求,从而降低了通信延迟。
  • 现在也支持分块编码传输。
  • 已经引入了其他缓存控制机制。
  • 引入了内容协商,包括语言,编码或类型,并使客户端和服务器可以就最适当的内容达成共识。
  • 现在可以在同一IP地址托管不同域的功能允许服务器托管。

HTTP / 1.1更改了HTTP协议的语义,默认情况下使用长连接。这意味着,除非另有说明(通过Connection: close标头),否则 服务器应默认保持连接打开。

但是,此功能也已反向移植到HTTP / 1.0,并通过Connection: Keep-Alive标头启用。因此,如果您使用的是HTTP / 1.1,从技术上讲,您不需要 Connection: Keep-Alive标头,但是许多客户端仍然选择提供它。

自2005年以来,可用于网页的API集大大增加,其中一些API创建了针对特定目的的HTTP协议扩展,主要是新的特定HTTP标头:

  • 服务器发送的事件,服务器可以将偶尔的消息推送到浏览器。
  • WebSocket,可以通过升级现有的HTTP连接来设置的新协议。

这里可以参考我之前写的 系统设计基础 长轮询、WebSocket、服务器发送事件(SSEs)协议

HTTP / 1.0和HTTP / 1.1之间的短链接、长连接区别

在这里插入图片描述

上图右边HTTP1.1通过建立长连接,中间的几次 TCP握手都省掉了

HTTP管道传输和多个并行连接

由于Keep-Alive标头的行为,HTTP流水线,多个连接和更多改进已得到实现。

在这里插入图片描述

HTTP 2.0 更高性能的协议

多年以来,网页变得更加复杂,甚至成为独立的应用程序。显示的视觉媒体数量,增加交互性的脚本的数量和大小也有所增加:通过明显更多的HTTP请求传输更多的数据。HTTP / 1.1连接需要以正确的顺序发送请求。从理论上讲,可以使用几个并行连接(通常在5到8之间),从而带来相当大的开销和复杂性。例如,HTTP管道已成为Web开发中的一种资源负担。

在2010年代上半年,Google通过实施实验性协议SPDY展示了一种在客户端和服务器之间交换数据的替代方法。这引起了同时使用浏览器和服务器的开发人员的兴趣。SPDY定义了响应能力的提高,并解决了传输数据重复的问题,是HTTP / 2协议的基础。

HTTP / 2协议与HTTP / 1.1版本有几个主要区别:

  • 它是二进制协议,而不是文本。不再可以手动读取和创建它。尽管有这个障碍,现在仍可以实施改进的优化技术。
  • 它是一个多路复用协议。可以在同一连接上处理并行请求,从而消除了HTTP / 1.x协议的顺序和阻塞约束。
  • 压缩头文件。由于这些请求在一组请求中通常很相似,因此消除了重复和传输数据的开销。
  • 它允许服务器通过称为服务器推送的机制,在需要之前在客户端缓存中填充数据。

请求和响应如何并行发生

上面的照片显示了请求和响应如何并行发生。还显示了如何将多个请求/响应拆分为单独的帧,并以异步方式一一发送。

正式标准化后,在2015年5月,HTTP / 2取得了很大的成功。到2016年7月,所有网站有8.7%已在使用它,占所有请求68%以上。高流量的网站采用速度最快,大大节省了数据传输开销和后续预算。

由于HTTP / 2不需要适应网站和应用程序,因此这种快速的采用率很可能是:使用HTTP / 1.1或HTTP / 2对它们是透明的。使用最新的服务器与最新的浏览器进行通信就足以启用它:仅需要有限的一组组即可触发采用,并且随着旧版浏览器和服务器版本的更新,使用量自然增加了,而无需使用其他Web开发人员的努力。

Http2.0必须建立在TLS的基础上,也就是必须是Https的请求。

问题

1.http1.1长连接keep-alive和http2.0的多路复用有什么区别?

  • http1.1 keep-alive 是不关闭 TCP 连接,也就是长连接;
    • 在不使用管道机制的情况下,交互是单工的,即客户端必须要等前一个请求的响应返回之后,新的请求才能发过去。
    • 在使用管道机制的情况下,请求发送可以非阻塞,但是响应返回必须依然严格按照请求的顺序。

http2.0多路复用则是基于流的,那么在传输的时候,无论请求还是响应,只要逻辑上允许就可以传输,如果两个请求没有依赖关系可以不必等待前一个返回而直接发送,虽说用的是同一条连接。

2.什么是流水线(管道机制)?

默认情况下,HTTP 请求是按顺序发出的。下一个请求只有在当前请求收到应答过后才会被发出。由于会受到网络延迟和带宽的限制,在下一个请求被发送到服务器之前,可能需要等待很长时间。

流水线是在同一条长连接上发出连续的请求,而不用等待应答返回。这样可以避免连接延迟。理论上讲,性能还会因为两个 HTTP 请求有可能被打包到一个 TCP 消息包中而得到提升。就算 HTTP 请求不断的继续,尺寸会增加,但设置 TCP 的 MSS(Maximum Segment Size) 选项,仍然足够包含一系列简单的请求。

并不是所有类型的 HTTP 请求都能用到流水线:只有 idempotent 方式,比如 GET、HEAD、PUT 和 DELETE 能够被安全的重试:如果有故障发生时,流水线的内容要能被轻易的重试。

今天,所有遵循 HTTP/1.1 的代理和服务器都应该支持流水线,虽然实际情况中还是有很多限制:一个很重要的原因是,目前没有浏览器默认启用这个特性。

问题RFC 2616 中规定了:

一个支持持久连接的客户端可以在一个连接中发送多个请求(不需要等待任意请求的响应)。收到请求的服务器必须按照请求收到的顺序发送响应。

至于标准为什么这么设定,我们可以大概推测一个原因:由于 HTTP/1.1 是个文本协议,同时返回的内容也并不能区分对应于哪个发送的请求,所以顺序必须维持一致。比如你向服务器发送了两个请求 GET/query?q=A 和 GET/query?q=B,服务器返回了两个结果,浏览器是没有办法根据响应结果来判断响应对应于哪一个请求的。

Pipelining 这种设想看起来比较美好,但是在实践中会出现许多问题:

  • 一些代理服务器不能正确的处理 HTTP Pipelining。
  • 正确的流水线实现是复杂的。
  • Head-of-line Blocking 连接头阻塞:在建立起一个 TCP 连接之后,假设客户端在这个连接连续向服务器发送了几个请求。按照标准,服务器应该按照收到请求的顺序返回结果,假设服务器在处理首个请求时花费了大量时间,那么后面所有的请求都需要等着首个请求结束才能响应。

所以现代浏览器默认是不开启 HTTP Pipelining 的。

由于这些原因,流水线已经被更好的算法给代替,如multiplexing多路复用,已经用在 HTTP/2。

HTTP1.X链接管理

  • 左边短链接
  • 中间长连接
  • 右边管道机制

在这里插入图片描述

3.现代浏览器在与服务器建立了一个 TCP 连接后是否会在一个 HTTP 请求完成后断开?

其实看了上面的内容的话就知道答案了,现代浏览器默认是HTTP1.1协议,保持长连接是不会断开的,那么我们来验证下:Chrom浏览器F12,2次访问一个网站的结果:第一次:

第二次:

结果分析:

初始化连接和 SSL 开销消失了,说明使用的是同一个 TCP 连接

4.一个 TCP 连接可以对应几个 HTTP 请求?

一个 TCP 连接是可以发送多个 HTTP 请求的。

从问题3的截图就可以证明了。

5.一个 TCP 连接中 HTTP 请求发送可以一起发送么(比如一起发三个请求,再三个响应一起接收)?

HTTP/1.1 存在一个问题,单个 TCP 连接在同一时刻只能处理一个请求,意思是说:两个请求的生命周期不能重叠,任意两个 HTTP 请求从开始到结束的时间在同一个 TCP 连接里不能重叠。

虽然 HTTP/1.1 规范中规定了 Pipelining 来试图解决这个问题,但是这个功能在浏览器中默认是关闭的。原因的话问题2已经阐述过了,

HTTP2 提供了 Multiplexing 多路传输特性,可以在一个 TCP 连接中同时完成多个 HTTP 请求。

参考:

https://developer.mozilla.org/en-US/docs/Web/HTTP/Basics_of_HTTP/Evolution_of_HTTP

http://qnimate.com/what-is-multiplexing-in-http2/

https://developer.mozilla.org/zh-CN/docs/Web/HTTP/Connection_management_in_HTTP_1.x

https://medium.com/platform-engineer/evolution-of-http-69cfe6531ba0

https://blog.csdn.net/ywlmsm1224811/article/details/96436768

【编辑推荐】

  1. 漫谈 HTTP 连接的相关知识
  2. 【干货!不讲PPT系列】Multicast组播技术很简单!PIM、IGMP组播协议!实践出真知
  3. 系统设计基础之长轮询、WebSocket、服务器发送事件(SSEs)协议
  4. 我们一起谈谈DHCP协议
  5. HTTPS原理与实战视频课程(自签证书+Openssl使用+keyTool使用+Nginx配置)
【责任编辑:武晓燕 TEL:(010)68476606】

点赞 0
分享:
大家都在看
猜你喜欢

订阅专栏+更多

数据湖与数据仓库的分析实践攻略

数据湖与数据仓库的分析实践攻略

助力现代化数据管理:数据湖与数据仓库的分析实践攻略
共3章 | 创世达人

3人订阅学习

云原生架构实践

云原生架构实践

新技术引领移动互联网进入急速赛道
共3章 | KaliArch

30人订阅学习

数据中心和VPDN网络建设案例

数据中心和VPDN网络建设案例

漫画+案例
共20章 | 捷哥CCIE

210人订阅学习

订阅51CTO邮刊

点击这里查看样刊

订阅51CTO邮刊

51CTO服务号

51CTO官微