Headers
HTTP协议的Header总共分为三种,分别是General Headers
、Entity Headers
、Request/Response Headers
。目前最新的是基于HTTP/1.1的RFC2616,总共规定了47种头部字段。
General Headers
我把被Request和Response共享的Headers成为General Headers,具体有:
general-header = Cache-Control
| Connection
| Date
| Pragma
| Trailer
| Transfer-Encoding
| Upgrade
| Via
| Warning
-
Cache -Control 指定请求和响应遵循的缓存机制,单向work
Cache-Control:Public 可以被任何缓存所缓存 Cache-Control:Private 内容只缓存到私有缓存中 Cache-Control:no-cache 所有内容都不会被缓存
Connection 允许客户端和服务器指定与请求/响应连接有关的选项,keep-alive或者close
Date 提供日期和时间标志,说明报文是什么时间创建的
Pragma 头域用来包含实现特定的指令,最常用的是Pragma:no-cache,和
Cache-Control:no-cache
作用相同。用于Http/1.1之前的版本还没有实现Cache-Control
字段Trailer 如果报文采用了分块传输编码(chunked transfer encoding) 方式,就可以用这个首部列出位于报文拖挂(trailer)部分的首部集合
Transfer-Encoding 告知接收端为了保证报文的可靠传输,对报文采用了什么编码方式
Upgrade 给出了发送端可能想要”升级”使用的新版本和协议
Via 显示了报文经过的中间节点(代理,网嘎un)
Entity Headers
EntityHeaders主要用来描述消息体(message body)的一些元信息,具体有:
entity-header = Allow
| Content-Encoding
| Content-Language
| Content-Length
| Content-Location
| Content-MD5
| Content-Range
| Content-Type
| Expires
| Last-Modified
其中,以Content为前缀的Headers主要描述了消息体的结构、大小、编码等信息,Expires描述了Entity的过期时间,Last-Modified描述了消息的最后修改时间。
- Content-Length:消息的内容长度
- Content-Type:请求实体对应的MIME信息,application/x-www-form-urlencoded或者响应返回的MIME类型 Content-Type: text/html; charset=utf-8
- Expires:浏览器会在指定时间前都使用本地缓存
- Last-Modified:用于指示资源的最后修改时间
- Content-Encoding:服务端支持的返回内容压缩编码类型
- Content-Location:请求资源可替代的另一地址
- Content-Range:在整个返回体中本部分的字节位置
- Allow:允许的Method,只出现在状态码为405的响应消息中
Request Headers
在Request-Line
后面紧跟着的就是Headers
。我们在上面已经介绍了General Headers
和Entity Headers
,下面便是Request Headers
定义:
request-header = Accept
| Accept-Charset
| Accept-Encoding
| Accept-Language
| Authorization
| Expect
| From
| Host
| If-Match
| If-Modified-Since
| If-None-Match
| If-Range
| If-Unmodified-Since
| Max-Forwards
| Proxy-Authorization
| Range
| Referer
| TE
| User-Agent
| Cookie
Request Headers
扮演的角色其实就是一个Request消息的调节器。需要注意的是若一个headers名称不在上面列表中,则默认当做Entity Headers
的字段。在HTTP/1.1中,除了HOST字段,其他都是可选的。
前缀为 Accept 的headers
定义了客户端可以接受的媒介类型、语言和字符集等
- Acceppt:text/html 代表浏览器可以接受的类型为 text/html,如果服务器无法返回html文档,会返回406。一般浏览器可以处理任何类型 Accept:*/*
- Accept-Encoding: 浏览器申明自己接收的编码方法,通常指定压缩方法,是否支持压缩,支持什么压缩方法(compress,gzip)
- Accpet-Language:申明自己接收的语言
- Accept-Charset:申明接收的字符集,如utf-8
From, Host, Referer 和User-Agent
详细定义了客户端 如何初始化Request
- User-Agent:告诉服务端,消息来源的OS和浏览器信息
- Referer:请求的上下文信息,即上一个网页的地址
- Host:必须的报文头字段,指定服务端的域名和端口号,通常从url解析
- From:发出请求用户的email
- Range:请求实体的一部分,指定范围 bytes=500-999
前缀为 If 的headers
规定了服务器只能返回符合这些描述的资源,若不符合, 则会返回304 Not Modified
。
-
If-Modified-Since
:带上浏览器缓存页面的最后修改时间,Server端会对比实际文件的最后修改时间(Response消息的Last-Modified字段),一样则返回304,有修改返回200 OK和文件内容。客户端丢弃旧内容,缓存新内容。 -
If-None-Match
:和Etag一起work,Client端再次请求同个资源时,带上上次Server端Response消息的Etag字段到If-None_Match中
若Request-Line
中的Method
为GET
,请求中不包含消息体,若为POST
,则会包含消息体。
一个具体的Request消息实例:
GET /articles/http-basics HTTP/1.1
Host: www.articles.com
Connection: keep-alive
Cache-Control: no-cache
Pragma: no-cache
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Response Headers
下面是response-header
的定义:
response-header = Accept-Ranges
| Age
| ETag
| Location
| Proxy-Authenticate
| Retry-After
| Server
| Vary
| WWW-Authenticate
| Set-Cookie
- Age: 表示消息自server生成到现在的时长,单位是秒
- ETag: 是对Entity进行MD5 hash运算的值,用来检测更改
- Location: 被重定向的URL
- Server: 服务器标识
- Vary:告诉下有代理是使用缓存还是从原始服务器请求
- Set-Cookie:设置http Cookie