1.什么是http
超文本传输协议,是因特网上应用最为广泛的一种网络传输协议,所有www文件遵守这个标准。
web数据交换的基础,是一种client-server协议,是由像浏览器的这种接收方发起的。使用web浏览器,网络爬虫或者其他工具,客户端发起一个到服务端指定端口【默认为80】的HTTP请求。
HTTP是基于TCP/IP通信协议来传递数据的。HTTP用TCP而不是UDP是因为打开一个网页必须要传输很多数据,TCP协议提供传输控制,按顺序数据和错误纠正。
客户端和服务端请求和应答的标准TCP。
2.工作原理
浏览器作为HTTP客户端通过URL向HTTP服务端发送请求,服务器接收到后进行响应。
URL传输协议:
1.服务器。通常为域名。
2.端口号。HTTP默认为80.
3.路径。/分隔目录
4.查询。?为起点,&隔开,=分开参数名与数据。
URL请求过程
输入网址后 => 浏览器发送request向服务器获取html文件 =>服务器返回response => 浏览器分析response的html发现还需要css,js等 =>request向服务器 =>下载完成 =>显示网页
3.HTTP协议特点
1.无线连接
限制每次只能处理一个请求,服务器处理完客户的请求后得到了客户的反馈后就断开了连接。
可以节约时间。
2.媒体独立
处理的内容均为http发送,客户端和服务端指定使用合适的MIME-type内容类型。
3.无状态的
表示在两次传输之间没有记忆能力,信息之间是相互独立的。
为了实现网站之间的交互,可以使用HTTP Cookies,把cookies添加在头部,创建一个会话可以每次请求都可共享相同的上下文信息,相同的通信。
4.主要内容
包含内容
完整的HTTP请求和响应:
1.http消息结构
2.http请求方法
3.http相应头信息
4.http状态码
消息结构
http是基于客户端/服务端c/sde架构模型,通过可靠的链接交换信息,是一个无状态的请求/响应协议。
1.客户端请求消息
组成:请求行request,请求头部header,空行和请求数据。
一个简单的demo:客户端请求
GET /hello。txt HTTP/1.1
User-Agent: curl/7.16.3 libcurl/7.16.3 OpenSSL/0.9.7l zlib/1.2.3
Host: www.example.com
Accept-Language: en, mi
2.服务端响应消息
组成:状态行,消息报头,空行和响应正文 。
服务端响应
HTTP/1.1 200 OK
Date: Mon, 27 Jul 2009 12:28:53 GMT
Server: Apache
Last-Modified: Wed, 22 Jul 2009 19:15:56 GMT
ETag: "34aa387-d-1568eb00"
Accept-Ranges: bytes
Content-Length: 51
Vary: Accept-Encoding
Content-Type: text/plain
输出结果:
Hello World! My payload includes a trailing CRLF.
请求方法
最常用的是GRT和POST。区别
get
请求url时发送的
/test/demo_form.asp?name1=value1&name2=value2
1.请求可以被缓存。
2.可以保存在浏览器记录里。
3.可以被收藏为书签
4.不应该在由敏感数据时使用
5.有长度限制
6.请求只应当用于取回数据。
post方法
http主体中发送:
POST /test/demo_form.asp HTTP/1.1
Host: w3schools.com
name1=value1&name2=value2
1.请求不会被缓存
2.不会保存在浏览器中
3.不能收藏为书签
4.对于长度没有限制。
头响应信息
包括一个状态行,一些响应头信息,一个空行和文档。
HTTP/1.1 200 OK
Content-Type: text/html
Header2: ...
...
HeaderN: ...
(Blank Line)
<!doctype ...>
<html>
<head>...</head>
<body>
...
</body>
</html>
状态码
常用:
200请求成功
301资源链接被永久转移到其他URL
404请求的资源网页等不存在
500内部服务器错误
大体分类:
1·· 信息,服务器收到请求,需要请求者继续执行操作
2··成功,操作被成功接受并处理
3··重定向,需要进一步操作即可完成请求
4··客户端错误,请求包含语法错误或者无法完成请求
5··服务器错误,服务器在请求过程中发生了错误