Labs 導讀
在WebSocket出現之前,一個Web應用(即時聊天、多人協作)的客戶端和服務端之間常見的雙向數據交換方式有短輪詢、長輪詢、SSE(Server-Sent Events,服務器發送事件)。這些方式在效率和網絡帶寬利用率方面存在諸多問題。WebSocket協議應運而生,對外提供了簡單的雙向數據傳輸能力。
作者:朱磊
單位:中國移動智慧家庭運營中心成都業務支持中心
Part 01 ●介紹●
WebSocket是一種在TCP連接上進行全雙工通訊的網絡通信協議。在2009年誕生,于2011年被IETF(The Internet Engineering Task Force,國際互聯網工程任務組)定為標準并發布RFC 6455互聯網標準跟蹤文檔,2016發布了RFC7936文檔進行補充。WebSocket API同時也被W3C定為標準。
WebSocket協議設計之初是為了取代HTTP形式的通信,因為RFC6202中提到HTTP協議最初不是用來做雙向數據通信的。WebSocket協議并沒有完全舍棄HTTP,它基于HTTP基礎服務在現有環境中實現了雙向通信目標。正如RFC 6455中說的那樣,WebSocke的設計哲學是最小約束的框架,唯一的約束就是協議是基于幀而不是流,并且支持Unicode文本和二進制幀兩者。
Part 02 ●握手●
WebSocket協議分為建連握手、消息傳輸和斷連握手三個部分,整體流程如下圖所示。
2.1 建連握手-客戶端
為了兼容HTTP服務器側的應用程序和代理,客戶端的建連握手(包括通過代理或通過TLS加密隧道進行的連接)是一個遵循RFC2616中定義的有效HTTP升級請求,客戶端連接握手請求header部分字段如下圖所示。此外,客戶端一旦發送了的連接握手就必須等待來自服務器的響應。
- 請求URI
格式,ws-URI = "ws:" "http://" host [ ":" port ] path [ "?" query ]或者wss-URI = "wss:" "http://" host [ ":" port ] path [ "?" query ],任何無效值都會造成建連失敗
- 請求行
必須是GET方法,HTTP版本至少是1.1
- Upgrade
值必須是“websocket”,ASCII值,不區分大小寫
- Connection
值必須包含“Upgrade”,ASCII值,不區分大小寫
- Sec-WebSocket-Key
客戶端為本次建連隨機生成的16字節base64編碼的字符串
- Origin
源地址,瀏覽器客戶端必填,非瀏覽器客戶端選填
- Sec-WebSocket-Protocol
客戶端支持的一個或多個以逗號分隔的子協議,按優先級排序
- Sec-WebSocket-Version
客戶端擬使用協議版本號,值必須為13。歷史版本9、10、11和12不再作為有效值
- Sec-WebSocket-Extensions
客戶端擬使用協議擴展。目前HyBi Working Group進行了多路復用擴展和壓縮擴展,多路復用擴展實現共享底層TCP連接。壓縮擴展為WebSocket協議增加了壓縮功能,例如 x-webkit-deflate-frame
2.2 建連握手-服務端
當客戶端與服務端建立WebSocket連接時,服務端必須回復客戶端建連握手請求,握手回復header部分字段如下圖所示。
- 狀態行
HTTP/1.1 101 Switching Protocols,表示接受客戶端建連。若服務器想要停止處理客戶端的握手,可返回例如401這樣的錯誤代碼的HTTP響應
- Upgrade
值必須是“websocket”
- Connection
值必須包含“Upgrade”
- Sec-WebSocket-Accept
若服務端接受客戶端連接,生成該值。先將客戶端請求頭的 Sec-WebSocket-Key值與RFC4122文檔中定義的全局唯一標識“258EAFA5-E914-47DA-95CA-C5AB0DC85B11”拼接,然后進行SHA-1哈希再進行base64-encoded得到該值
- Sec-WebSocket-Protocol
服務端擬使用的協議,該值從客戶端發送的Sec-WebSocket-Protocol中選擇,若服務端都不支持,值為空
- Sec-WebSocket-Extensions
服務端擬使用協議擴展
2.3 斷接握手
客戶端和服務端都可以發送包含指定控制序列的控制幀(Close控制幀)以開始關閉握手。一方在接收到關閉控制幀時,只需發送一個關閉幀作為響應,然后關閉連接。存在攔截代理等情況下,TCP關閉握手并不總是可靠的端到端握手,上述關閉握手過程旨在補充TCP關閉握手(FIN/ACK)。
Part 03 ● 數據傳輸●
客戶端一旦和服務端連接握手成功,雙方就可以開始數據傳輸了。這是一個雙向通信信道,在遵循RFC 6455規范中“消息”概念的基礎上,雙方均可以獨立地隨意發送數據。一條消息包含一個或者多個數據幀(不一定對應于網絡層中的消息),Websocket幀格式如下圖所示。
3.1 幀結構
- FIN
1位,表示是否是一條消息的最后一個分片。
- RSV1, RSV2, RSV3
1位,擴展功能未使用的情況下默認值為0。
- Opcode
4位,定義“Playload data”數據類型。
0(十進制):連續幀
1:文本幀
2:二進制幀
3-7:預留非控制幀
8:連接關閉幀
9:心跳ping幀
10:心跳pong幀
11-15:預留控制幀
- MASK
1位,是否屏蔽“Playload data”,1是,0否。
- Payload length
7位,或者7+16位,或者7+64位,表示Payload data的長度。具體地,Payload length小于125,數據長度用Payload length表示;Payload length等于126,數據長度用Payload length后面16位表示;Payload length等于127,數據長度用Payload length后面64位表示。
- Masking-key
32位,存放客戶端發送的掩碼。為了防止代理緩存污染攻擊,RFC6455中要求掩碼必須來自強大的熵源,不可被預測。常規算法以字節為步長遍歷載荷數據, 對于載荷數據的第i個字節, 做i對4取模得到j,掩碼覆蓋后的載荷數據的第i個字節的值為原第i個字節與Masking-Key的第j個字節做按位異或操作。
- Payload data
載荷數據分為擴展數據和應用數據兩種,擴展數據在握手階段協商是否使用,應用數據在擴展數據之后。
3.2 控制幀
控制幀由Opcode值確定,協議當前定義的控制幀的操作碼包括 0x8 (Close)、0x9(Ping)、和0xA(Pong)??刂茙仨氂幸粋€小于等于125字節的有效載荷長度,對于Close控制幀有效載荷的前2個字節表示狀態碼,剩余字節表示關閉原因,如下圖所示。
3.3 消息分片
消息分片指將概念上的一條“消息”通過多個數據幀發送。消息分片允許發送未知大小的消息,而不必緩沖整條消息。同時,消息分片結合多路復用協議的擴展,可以分割消息為更小的分段以共享輸出通道。
協議中分片消息開始幀的FIN位為0,opcode位為非0表示該幀為某消息分片,中間幀FIN位為0,opcode位為0,最后通過FIN位為1,opcode為0標識分片結束。協議要求分片數據幀按順序發送到另一端。
Part 04 ●總結●
WebSocke是設計在TCP層之上,不需要考慮數據長度,數據粘包拆包。也能通過擴展功能與HTTP/2多路復用結合,充分利用帶寬。開發者只需在服務端和客戶端代碼中按序處理消息分片邏輯。
審核編輯:湯梓紅
-
服務器
+關注
關注
12文章
9295瀏覽量
85886 -
網絡通信
+關注
關注
4文章
814瀏覽量
29895 -
網絡帶寬
+關注
關注
0文章
42瀏覽量
8339 -
WebSocket
+關注
關注
0文章
29瀏覽量
3763
原文標題:技術 | 淺談WebSocket協議-RFC 6455
文章出處:【微信號:5G通信,微信公眾號:5G通信】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論