什么是HTTP?
在Web应用中,服务器把网页传给浏览器,实际上就是把网页的HTML代码发送给浏览器,让浏览器显示出来。而浏览器和服务器之间的传输协议是HTTP,所以:
- HTML是超文本标记语言(英语:HyperText Markup Language,简称:HTML)是一种用于创建网页的标准标记语言,会HTML,就可以编写网页;
- HTTP是在网络上传输HTML的协议,所以叫做超文本传输协议,用于浏览器和服务器的通信。
请求与响应
- 浏览器负责发起请求
- 服务器在 80 端口接收请求
- 服务器负责返回内容(响应)
- 浏览器负责下载响应内容
HTTP 的作用就是指导浏览器和服务器如何进行沟通。
curl 命令
curl是一种命令行工具,作用是发出网络请求,然后得到和提取数据,显示在"标准输出"(stdout)上面。
- 语法
$ curl [option] [url]
- 常见参数
- 如果要把这个网页保存下来,可以使用
-o
参数,这就相当于使用wget命令了。
$ curl -o [文件名] [url]
- 有的网址是自动跳转的。使用
-L
参数,curl就会跳转到新的网址。
$ curl -L [url]
-
-i
参数可以显示http response的头信息,连同网页代码一起。
$ curl -i [url]
-
-v
参数可以显示一次http通信的整个过程,包括端口连接和http request头信息。
$ curl -v [url]
- curl默认的HTTP动词是GET,使用
-X
参数可以支持其他动词。
$ curl -X POST [url]
$ curl -X DELETE [url]
- 发送表单信息
-发送表单信息有GET和POST两种方法。GET方法相对简单,只要把数据附在网址后面就行。
$ curl example.com/form.cgi?data=xxx
-POST方法必须把数据和网址分开,curl就要用到--data参数。
$ curl -X POST --data "data=xxx" example.com/form.cgi
请求示例
curl -s -v -H "Agmaps: xxx" -- "https://www.baidu.com"
- 请求的内容为
GET / HTTP/1.1
Host: www.baidu.com
User-Agent: curl/7.59.0
Accept: */*
Agmaps: xxx
curl -X POST -s -v -H "Agmaps: xxx" -- "Agmaps://www.baidu.com"
- 请求的内容为
POST / HTTP/1.1
Host: www.baidu.com
User-Agent: curl/7.59.0
Accept: */*
Agmaps: xxx
curl -X POST -d "Agmaps" -s -v -H "Agmaps: xxx" -- "https://www.baidu.com"
- 请求的内容为
POST / HTTP/1.1
Host: www.baidu.com
User-Agent: curl/7.59.0
Accept: */*
Agmaps: xxx
Content-Length: 10
Content-Type: application/x-www-form-urlencoded
Agmaps
请求格式
1 动词 路径 协议/版本
2 Key1: value1
2 Key2: value2
2 Key3: value3
2 Content-Type: application/x-www-form-urlencoded
2 Host: www.baidu.com
2 User-Agent: curl/7.59.0
3
4 要上传的数据
- 请求最多包含四部分,最少包含三部分。(也就是说第四部分可以为空)
- 第三部分永远都是一个回车(\n)
- 动词有 GET POST PUT PATCH DELETE HEAD OPTIONS 等
- 这里的路径包括「查询参数」,但不包括「锚点」
- 如果你没有写路径,那么路径默认为 /
- 第 2 部分中的 Content-Type 标注了第 4 部分的格式
用 Chrome 发请求
- 打开 Network
- 地址栏输入网址
- 在 Network 点击,查看 request,点击「view source」
- 点击「view source」
- 点击「view source」
- 点击「view source」
- 点了?可以看到请求的前三部分了
- 如果有请求的第四部分,那么在 FormData 或 Payload 里面可以看到
响应示例
上面三个请求示例,前两个请求对应的响应分别为
HTTP/1.1 200 OK
Accept-Ranges: bytes
Cache-Control: private, no-cache, no-store, proxy-revalidate, no-transform
Connection: Keep-Alive
Content-Length: 2443
Content-Type: text/html
Date: Tue, 22 May 2018 12:31:38 GMT
Etag: "588603ec-98b"
Last-Modified: Mon, 23 Jan 2017 13:23:56 GMT
Pragma: no-cache
Server: bfe/1.0.8.18
Set-Cookie: BDORZ=27315; max-age=86400; domain=.baidu.com; path=/
<!DOCTYPE html>
<!--STATUS OK--><html> <head> 后面太长,省略了……
HTTP/1.1 302 Found
Connection: Keep-Alive
Content-Length: 17931
Content-Type: text/html
Date: Tue, 22 May 2018 12:31:38 GMT
Etag: "54d9749e-460b"
Server: bfe/1.0.8.18
<html>
<head>
<meta http-equiv="content-type" content="text/html;charset=utf-8"> 后面太长,省略了……
- GET 请求和 POST 请求对应的响应可以一样,也可以不一样
- 响应的第四部分可以很长很长很长
响应格式
1 协议/版本号 状态码 状态解释
2 Key1: value1
2 Key2: value2
2 Content-Length: 17931
2 Content-Type: text/html
3
4 要下载的内容
- 状态码详见HTTP状态码-维基百科,是服务器对浏览器说的话
- 第 2 部分中的 Content-Type 标注了第 4 部分的格式
- 第 2 部分中的 Content-Type 遵循 MIME 规范
用 Chrome 查看响应
- 打开 Network
- 输入网址
- 选中第一个响应
- 查看 Response Headers,点击「view source」,点击「view source」,点击「view source」
- 你会看到响应的前两部分
- 查看 Response 或者 Preview,你会看到响应的第 4 部分