原文链接:
https://blog.bitsrc.io/deep-dive-into-websockets-e6c4c7622423
本文已同步归纳在 Github。
更新
[2021-3-1]
- Initial release
概述
在早期的互联网世界里面,web 应用都是基于 HTTP 请求构建的,同时 HTTP 请求由用户的交互触发。随着技术的发展,出现了以实时数据传输和双向通信为要求的低延时应用,比如:
- 多人在线游戏
- 聊天应用
- 实时更新的 RSS 订阅
- 体育直播等
WebSockets 就是为解决这些问题而生的。一些三方库简化了 WebSockets,让我们可以方便的使用 WebSockets 而不需要懂太多的底层原理,提高开发效率。
本文致力于讲解 WebSockets 的一些基本特性,为大家知识扫盲。
WebSockets 体系
WebSockets 定义了一个 API,用来在客户端与服务端之间建立一个 socket 连接。使得浏览器可以和服务器双向发送数据,另外,WebSockets 相较于 HTTP 做了很多优化,为实时通信带来了更好的体验。
实时通信
HTTP 请求耗费了几百个字节来发送 cookie 和其它的请求头,这无异于会增加实时通信的性能开销。
然而 WebSockets 仅仅只消耗 6 个字节(请求头占 2 个,传输的值占 4 个)。
所以 WebSockets 更适合实时的数据传输,并且由于性能开销比较小,用来实现低延时的应用也再好不过了。
WebSocket 连接
直接给 WebSocket 构造函数传一个 URL 就可以开启一个 WebSocket 连接了。如果你要指定子协议,可以传入第二个参数:
1 | // 创建一个新的 WebSocket 连接 |
创建连接之后,你可以添加一些额外的事件句柄,分别当连接开启时、传输数据时、连接出错时触发:
1 | // WebSocket 连接开启之后,会发送一些数据给服务器 |
建立连接之后,会触发 WebSocket 实例上的 onopen
事件,此时就意味着完成了握手,之后就可以在任意时刻互相发送数据了;当客户端的 WebSocket 接收到了数据,就会触发 onmessage
事件;而 onerror
事件则可以用来处理异常。
你可能会问:“创建一个连接,监听发送消息的事件”,这个操作不是很常见吗?有什么新意吗?
事实上,在 WebSockets 中针对连接做处理是很重要的。
我们处理 WebSocket 连接的方式以及当连接异常的时候进行重连的操作,决定了会话的整体容错程度。
断线重连的容错机制
目前使用 WebSockets 普遍遇到的问题是:当客户端或者服务器没有响应的时候如何断开连接,为了解决这个问题,你应当实现一套优雅的机制。特别是如果某个 WebSocket 连接的生命周期比较长的话,就需要定义一个方法,周期性的刷新连接(本质上就是重复的关闭/开启连接)以确保当前连接的有效性,通过这种方式来实现一个平滑的会话。
可伸缩的连接
因为服务器需要保持高可用性来让 WebSockets 进行持久化连接,所以需要实现可伸缩的服务器,用来应对大量的 WebSocket 连接。然而,在一个 ws
连接开启之后的大多数时间,该连接都是闲置的。
因此你可能会问:后端怎么实现可伸缩的 WebSockets?
实现可伸缩的 WebSocket 是一项复杂的任务,需要用一个类似背板的东西来记录出现故障的服务器节点的连接和已发送的信息。
此外,实现可伸缩的 WebSocket 的最佳实践可能就是:结合开启的连接数量,实现一个向外拓展的策略。
因为用户可能并不会频繁的进行重连操作,所以基于已开启的 WebSockets 连接来改善可伸缩性是很有意义的。
数据传输模式
Web Sockets 有多种不同的模式来传输数据。你可以直接通过 WebSockets 发送消息,也可以向客户端推送消息。
给 web app 发送通知
在 APP 内部发送通知是 WebSockets 的一个很常见的用途,WebSockets 仅仅只在新的消息可用时通知浏览器。
每当用户收到消息通知,并且进入通知详情页的时候,应用程序就会发起一个 HTTP 请求来获取该消息的内容。
根据上面的用途,WebSocket 并不会把消息的具体内容发给前端,而是传递一个“信号”,告诉前端:“这个消息可用了”。
实时数据传输
像多人游戏和聊天应用这样的程序,对于实时度要求比较高,所以必须低延迟的发送数据。
针对这种情况,我们可以直接通过 WebSocket 连接来快速的传输数据。
数据压缩
WebSockets 的数据压缩一直以来都不是被经常讨论的话题,但是假如在某个时刻需要同时发送大量数据,使用一种合理的压缩方式就显得格外重要。
然而要实现 WebSockets 的数据压缩,客户端和服务端的意见必须一致。
你知道 WebSockets 为了解决数据压缩的问题,专门提供了一个拓展么?
当客户端给 WebSockets 连接的请求头的 Sec-Websocket-Extensions
字段指定了 permessage-deflate
拓展,服务端必须在响应头中返回相应的拓展字段,以确认该拓展是否可用。
客户端发起请求:
1 | GET /socket HTTP/1.1 |
服务端响应:
1 | HTTP/1.1 101 Switching Protocols |
Web Sockets 安全性
WebSockets 没有限制传输数据的数量,攻击者可能会利用这个特性进行 DoS 攻击。
因此,最基本的做法是使用一套鉴权机制,强制进行安全认证。目前较为普遍的做法是使用 JWT,JWT 可以快速的验证请求的签名。
除此之外,可以使用 wss
代替 ws
,wss
和 HTTPS 类似,可以对 WebSocket 连接进行加密。
浏览器兼容性
大多数浏览器对于 WebSockets 的支持度都是蛮好的:
WebSockets 内置了跨域通信功能,意味着不同域名之间可以进行通信。你可以自行指定一个可用的域名,通过这种方式来提高安全性。
除此之外,诸如 socket.IO(NodeJS)和 SignalR(.NET)这样的三方 WebSockets 库,会针对老旧的浏览器,使用 HTTP 协议。
总结
无论何时何地,只要你需要在客户端和服务器之间建立一个低延迟的连接,那么 WebSockets 就是你最好的选择。
然而,由于使用 WebSockets 会更改项目的架构,所以直接把 WebSockets 集成到现有的项目中可能会有问题。另外,这篇文章:事件源,会影响你使用 WebSockets 进行通信,我也推荐你阅读一下。
如果你想了解其它的有关于 WebSockets 的知识,可以在评论区交流;另外,WebSocket 的示例 demo 可以 点这里。
感谢阅读。