HTTP协议

一面中,如果有笔试,考HTTP协议的可能性较大。

前言

一面要讲的内容:

  • HTTP协议的主要特点

  • HTTP报文的组成部分

  • HTTP方法

  • get 和 post的区别

  • HTTP状态码

  • 什么是持久连接

  • 什么是管线化

二面要讲的内容;

  • 缓存

  • CSRF攻击

HTTP协议的主要特点

  • 简单快速

  • 灵活

  • 无连接

  • 无状态

通常我们要答出以上四个内容。如果实在记不住,一定要记得后面的两个:无连接、无状态

我们分别来解释一下。

简单快速

简单:每个资源(比如图片、页面)都通过 url 来定位。这都是固定的,在http协议中,处理起来也比较简单,想访问什么资源,直接输入url即可。

灵活

http协议的头部有一个数据类型,通过http协议,就可以完成不同数据类型的传输。

无连接

连接一次,就会断开,不会继续保持连接。

无状态

客户端和服务器端是两种身份。第一次请求结束后,就断开了,第二次请求时,服务器端并没有记住之前的状态,也就是说,服务器端无法区分客户端是否为同一个人、同一个身份。

有的时候,我们访问网站时,网站能记住我们的账号,这个是通过其他的手段(比如 session)做到的,并不是http协议能做到的。

HTTP报文的组成部分

在回答此问题时,我们要按照顺序回答:

  • 先回答的是,http报文包括:请求报文响应报文

  • 再回答的是,每个报文包含什么部分。

  • 最后回答,每个部分的内容是什么

请求报文包括:

  • 请求行:包括请求方法、请求的url、http协议及版本。

  • 请求头:一大堆的键值对。

  • 空行指的是:当服务器在解析请求头的时候,如果遇到了空行,则表明,后面的内容是请求体。

  • 请求体:数据部分。

响应报文包括:

  • 状态行:http协议及版本、状态码及状态描述。

  • 响应头

  • 空行

  • 响应体

HTTP方法

包括:

  • GET:获取资源

  • POST:传输资源

  • put:更新资源

  • DELETE:删除资源

  • HEAD:获得报文首部

HTTP方法有很多,但是上面这五个方法,要求在面试时全部说出来,不要漏掉。

get 和 post 比较常见。

put 和 delete 在实际应用中用的很少。况且,业务中,一般不删除服务器端的资源。

head 可能偶尔用的到。

get 和 post的区别

区别有很多,如果记不住,面试时,至少要任意答出其中的三四条。

有一点要强调,get是相对不隐私的,而post是相对隐私的

我们大概要记住以下几点:

1、浏览器在回退时,get不会重新请求,但是post会重新请求。【重要】

2、get请求会被浏览器主动缓存,而post不会。【重要】

3、get请求的参数,会报保留在浏览器的历史记录里,而post不会。做业务时要注意。为了防止CSRF攻击,很多公司把get统一改成了post。

4、get请求在url中传递的参数有大小限制,基本是2kb,不同的浏览器略有不同。而post没有注意。

5、get的参数是直接暴露在url上的,相对不安全。而post是放在请求体中的。

http状态码

http状态码分类:

常见的http状态码:

部分解释:

  • 206的应用:range指的是请求的范围,客户端只请求某个大文件里的一部分内容。比如说,如果播放视频地址或音频地址的前面一部分,可以用到206。

  • 301:重定向(永久)。

  • 302:重定向(临时)。

  • 304:我这个服务器告诉客户端,你已经有缓存了,不需要从我这里取了。

400和401用的不多。403指的是请求被拒绝。404指的是资源不存在。

持久链接/http长连接

如果你能答出持久链接,这是面试官很想知道的一个点。

  • 轮询:http1.0中,客户端每隔很短的时间,都会对服务器发出请求,查看是否有新的消息,只要轮询速度足够快,例如1秒,就能给人造成交互是实时进行的印象。这种做法是无奈之举,实际上对服务器、客户端双方都造成了大量的性能浪费。

  • 长连接:HTTP1.1中,通过使用Connection:keep-alive进行长连接,。客户端只请求一次,但是服务器会将继续保持连接,当再次请求时,避免了重新建立连接。

注意,HTTP 1.1默认进行持久连接。在一次 TCP 连接中可以完成多个 HTTP 请求,但是对每个请求仍然要单独发 header,Keep-Alive不会永久保持连接,它有一个保持时间,可以在不同的服务器软件(如Apache)中设定这个时间。

长连接中的管线化

如果能答出管线化,则属于加分项。

管线化的原理

长连接时,默认的请求这样的:

	请求1 --> 响应1 -->请求2 --> 响应2 --> 请求3 --> 响应3

长连接中的管线化,请求是这样的:

	请求1 --> 请求2 --> 请求3 --> 响应1 --> 响应2 --> 响应3

管线化就是,我把现在的请求打包,一次性发过去,你也给我一次响应回来。

管线化的注意事项

面试时,不会深究管线化。如果真要问你,就回答:“我没怎么研究过,准备回去看看~”