HTTP笔记6HTTP首部

HTTP首部

HTTP报文首部结构

复习一下前边的知识:
HTTP报文大致可分为报文首部和报文主体两块,通常并不一定要有报文主体

请求报文及响应报文的结构


请求报文结构如下:

  • 报文首部
    • 请求行
    • 请求首部字段
    • 通用首部字段
    • 实体首部字段
    • 其他(如Cookie)
  • 空行换行(CR+LF)
  • 报文主体

响应报文结构如下:

  • 报文首部
    • 状态行
    • 响应首部字段
    • 通用首部字段
    • 实体首部字段
    • 其他(如Cookie)
  • 空行换行(CR+LF)
  • 报文主体

HTTP首部字段

HTTP首部字段是构成HTTP报文的要素之一,它给浏览器和服务器提供报文主体大小、所使用的语言、认证信息等内容

HTTP首部字段结构

HTTP首部字段由首部字段名和字段值构成,中间用冒号“:”分隔
首部字段名:字段值, 例如:Content-Type:text/html

同一个字段名可以有多个字段值,如:
Keep-Alive:timeout=15, max=100

HTTP首部字段类型

HTTP首部字段根据实际用途被分为以下4种类型

  • 通用首部字段
  • 请求首部字段
  • 相应首部字段
  • 实体首部字段

HTTP/1.1 首部字段一览

HTTP/1.1规范定义了如下47种首部字段






除了这47种,还有Cookie、Set-Cookie和Content-Disposition等其他RFC种定义的首部字段用的比较多

End-to-End首部和Hop-by-hop首部

HTTP首部字段将定义成缓存代理和非缓存代理的行为分成2种:
端到端首部 和 逐跳首部


HTTP/1.1 通用首部字段

Cache-Control

Cache-Control能够控制缓存的行为,Cache-Control指令一览

缓存请求指令:

  • max-age(秒):响应的最大age值
  • min-fresh: 期望在指定时间内的响应仍有效
  • max-stale:接收已过期的响应
  • no-cache:不接收缓存的数据
  • no-store:不缓存任何内容
  • no-transform:代理不可更改媒体类型
  • only-if-cached:只从代理的缓存获取资源
  • cache-extension:新指令标记

缓存响应指令:

  • public:可向任意方提供响应
  • private:仅向特定用户返回响应
  • no-cache:缓存前必须确认其有效性
  • no-store:不缓存任何内容
  • no-transform:代理不可更改媒体类型
  • must-revalidate:可缓存但必须向源服务器进行确认
  • proxy-revalidate:
  • max-age:响应的最大Age值
  • s-maxage:公共缓存服务器响应的最大Age值
  • cache-extension:新指令标记

Connection

Connection首部字段具备如下两个作用:

  • 管理持久连接
  • 控制不再转发给代理的首部字段

HTTP/1.1之前版本的默认连接都是非持久连接,如果要在旧版本的HTTP协议上维持持续连接,则需要指定Connection:Keep-Alive
Connection:close表示断开连接

Date

首部字段Date表明创建报文的日期和时间

Transfer-Encoding

首部字段Transfer-Encoding规定了传输报文主体时采用的编码方式
HTTP/1.1的传输编码方式仅对分块传输编码有效

Via

Via记录了客户端和服务器之间的请求和响应报文的传输路径

Upgrade

Upgrade用于检测HTTP协议及其他协议是否可使用更高的版本进行通信,其参数值可以用来指定一个完全不同的通信协议

Trailer

Trailer说明了在报文主体后记录了哪些首部字段

Warning

该首部通常会告知用户一些与缓存相关的问题警告


请求首部字段

Host

Host表示资源所处的互联网主机名和端口号,该字段是HTTP/1.1规范内唯一一个必须被包含在请求内的首部字段

Accept

Accetp首部字段可通知服务器,客户端能够处理的媒体类型及媒体类型的优先级,可使用type/subtype这种形式,一次可以指定多种媒体类型

Accept:text/html,application/xhtml+xml,application/xml;q=0.9,/;q=0.8

举几个常见媒体类型的例子:

  • 文本文件
    text/html, text/plain, text/css
    application/xhtml+xml, application/xml
  • 图片文件
    image/jpeg, image/png, image/gif
  • 视频文件
    video/mpeg, video/quicktime
  • 应用程序使用的二进制文件
    application/octet-stream, application/zip

q=0.9表示权重,默认值为1.0,且1为最大值。当服务器提供多种内容时,将会首先返回权重高的媒体类型

Accept-Charset

Accept-Charset首部字段可用来通知服务器客户端支持的字符集及优先顺序,用q值来表示相对优先级

Accept-Charset:iso-8859-5, utf-8;q=0.8

Accept-Encoding

Accept-Encoding用来告知服务器客户端支持的内容编码及优先级顺序,可一次性指定多种内容编码,常见的集中编码格式:

  • gzip
  • compress
  • deflate
  • identity

采用q值来表示优先级,可使用星号*指定任意格式的编码格式

Accept-Language

Accept-Language告知服务器客户端能够处理的自然语言集,可用q值表示优先级

Accept-Language:zh-cn,zh;q=0.7,en-us,en;q=0.3

User-Agent

User-Agent会将客户端的浏览器和其他信息发送给服务器

Authorization

Authorization用来告知服务器客户端的认证信息(证书值)


Proxy-Authorization

此认证发生在客户端和代理之间

From

客户端的邮件地址

If-Match

形如If-xxx这种形式的请求首部字段,都可成为条件请求。服务器接收到附带条件的请求后,只有判断指定条件为真时,才会执行请求

If-Match的字段值会和服务器端实体标记ETag匹配,一致时服务器才会接受请求,反之则返回状态码412 Precondition Failed

If-Modified-Since

if-none-match

与if-match的作用相反,只有在if-none-match字段值与ETag值不一致时才处理该请求
在Get或Head方法中使用if-none-match可获取最新的资源

If-Range

If-Unmodified-Since

与If-Modified-Since的作用相反

Max-Forwards

Max-Forwards:5
每次转发数值减1,当数值变成0时返回响应。可以避免由于位置原因而导致的请求陷入循环

Range

Range:bytes=5001-10000
对于只需获取部分资源的范围请求,包含首部字段Range即可告知服务器资源的指定范围
接收到Range首部字段请求的服务器,会在请求之后返回状态码206 Partial Content的响应,无法处理该范围请求时,则会返回200 ok的响应及全部资源

Referer

Referer会告知服务器请求的原始资源的URI,其中可能含有ID和密码等保密信息,写进Referer有可能导致泄密

TE

TE:gzip, deflate;q=0,5

TE会告知服务器客户端能够处理响应的传输编码方式及优先级,而Accept-encoding怎表示内容的编码的方式

还可指定伴随Trailer字段的分块传输编码的方式


响应首部字段

Accept-Ranges

Accept-Ranges是用来告知客户端服务器是否能处理范围请求,以指定获取服务器端某个部分的资源
可指定的字段有两种,可处理范围请求时为bytes,反之为none

Accept-Ranges:bytes

Age

Age:60

Age告知客户端,源服务器在多久前创建了响应,单位是秒

ETag

ETag:"82ec22325w"

ETag是资源的唯一标识,以字符串方式表示,服务器会为每份资源分配对应的ETag值。当资源更新时,ETag值也需要更新

强ETag和弱ETag

  • 强ETag
    无论实体发生多么细微的变化都会改变其值
  • 弱ETag
    只有资源发生了根本改变,产生差异时才会改变ETag值,在字段开始处附加W/ ETag:W/"usagi-1234"

Location

Location可以将响应接收方引导至某个新的URI,基本上,该字段会配合3XX的响应,提供重定向的URI

3xx
Location:http//www.google.cn/hk

Server

Server表示了服务器上安装的HTTP服务器应用程序的信息

Server: Apache/2.2.6(Unix) PHP/5.2.5

Retry-after

Retry-after: 120(或是日期时间)

告知客户端应该在多久之后再次发送请求,配合503 或 3xx一起使用

WWW-Atuthenticate

WWW-Atuthenticate: Basic realm="usagidesign Auth"

WWW-Atuthenticate用于HTTP访问认证,它会告知客户端适用于访问请求URI的认证方案

Proxy-Atuthenticate

和WWW-Atuthenticate一样,不过是发生在客户端和代理之间

Vary

Vary: Accept-Language

Vary可以控制代理的缓存,只返回Accept-Language值相同的缓存


实体首部字段

Allow

405 Method Not Allowed
Allow: GET, POST

该字段用于通知客户端能够支持的Request的HTTP方法,当服务器接收到不支持的HTTP方法时,返回405 Method Not Allowed作为响应,同时将支持的方法写入Allow返回

Content-Location

与Location不同,Content-Location表示的是报文主体返回资源对应的URI

Content-Encoding

Content-Encoding: gzip

Content-Encoding表示实体主体的编码方式

Content-Language

Content-Language表示主体使用的自然语言

Content-Length

Content-Length表明了实体主体的大小,单位是字节。如果主体进行了编码传输,则不再使用此字段

Content-MD5

Content-MD5是一串由MD5算法生成的值,其目的在于检查报文主体在传输过程中是否保持完整,以确认传输到达
对报文主体执行MD5算法获得128位二进制数,再通过Base64编码后将结果写入Content-MD5字段,由于HTTP首部无法记录二进制值,所以要通过Base64编码。接收方收到后对报文主体再执行一次相同的MD5算法,通过比较值来判断主体的准确性

有被篡改的可能

Content-type

Content-type: text/html; charset=UTF-8

和Accept一样,Content-type表示了实体主体对象的媒体类型

Content-Range


针对范围请求,返回响应时使用Content-Range可以告知客户端返回的哪个范围,单位是字节

Expires

Expires: Wed, 04 Jul 2012 08:26:05 GMT

Expires表示了资源的有效期,如果在有效期内,缓存服务器会以缓存来应答请求,如果过了有效期则从源服务器请求资源。
如果不希望缓存服务器对资源缓存时,则将Expires值和Date值设置为相等

当首部字段Cache-Control有指定max-age时,会优先处理max-age

Last-Modified

Last-Modified: Thurs, 30 Jun 2016 18:00:00 GMT

Last-Modified表示资源最终修改的时间


为Cookie服务的首部字段

Set-Cookie

Set-Cookie: status=enable; expires=Thurs, 30 Jun 2016 18:00:00 GMT; path=/; domain=.hackr.jp;

下面是一个Set-Cookie的例子:

Set-Cookie: laravel_session=eyJpdiI6IjJnN1Rwd;
expires=Thu, 30-Jun-2016 12:37:37 GMT;
Max-Age=7200;
path=/;
HttpOnly

Cookie

Cookie: laravel_session=eyJpdiI6IjJnN1Rwd

客户端接收到的服务器端发送的Cookie


其他首部字段

  • X-Frame-Options
  • X-XSS-Protection
  • DNT
  • P3P

X-Frame-Options

该字段属于响应首部,用于控制网站内容在其他web网站的Frame标签内的显示问题,主要目的是为了防止点击劫持攻击
有两个字段值:

  • DENY
    拒绝
  • SAMEORIGIN
    仅同域名下的页面匹配时许可

X-XSS-Protextion

X-XSS-Protextion: 1

该字段属于响应首部,踏实针对跨站脚本攻击(XSS)的一种对策,用0和1来控制浏览器XSS防护机制的开关

P3P

该字段属于响应首部,通过利用P3P技术,可以让web网站上的个人隐私编程一种仅供程序可理解的形式,以达到保护用户隐私的目的

DNT

DNT: 1

该字段属于请求首部,DNT是Do not track的简称,意为拒绝个人信息被收集,用0和1来控制,可以拒绝被精准广告追踪


补充说明:

Accept和content-type的区别,accept表示发送方(客户端)希望接收的资源类型,而content-type表示发送方发送的资源类型

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,242评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,769评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,484评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,133评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,007评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,080评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,496评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,190评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,464评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,549评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,330评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,205评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,567评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,889评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,160评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,475评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,650评论 2 335

推荐阅读更多精彩内容