负载均衡简介
负载均衡是系统设计中的一个关键组件,它有助于将传入的请求和流量均匀地分配到多个服务器上。负载均衡的主要目标是通过避免单个服务器过载并减少停机时间来确保高可用性、可靠性和性能。通常,负载均衡器位于客户端和服务器之间,接受传入的网络和应用程序流量,并使用各种算法将流量分发给多个后端服务器。通过在多台服务器上平衡应用程序请求,负载均衡器可以减轻单个服务器的负担并防止任何一台服务器成为单一故障点,从而提高整体应用可用性和响应性。
为了充分利用可扩展性和冗余性,我们可以在系统的每一层尝试进行负载均衡。我们可以在三个地方添加 LBs:
- 用户和 web 服务器之间
- 在 Web 服务器和内部平台层之间,比如应用服务器或缓存服务器
- 内部平台层和数据库之间。

关键术语和概念
负载均衡器:一种设备或软件,根据预定义的规则或算法将网络流量分配到多个服务器上。后端服务器:接收并处理负载均衡器转发请求的服务器。也称为服务器池或服务器农场。负载均衡算法:负载均衡器用于确定如何在后端服务器之间分配传入流量的方法。健康检查:负载均衡器定期执行的测试,以确定后端服务器的可用性和性能。不健康的服务器会被移出服务器池直到它们恢复。会话持久性:一种技术,确保来自同一客户端的后续请求被定向到相同的后端服务器,保持会话状态并提供一致的用户体验。SSL/TLS 终止:在负载均衡器级别解密 SSL/TLS 加密流量的过程,减轻后端服务器的解密负担,并允许集中管理 SSL/TLS。
负载均衡器如何工作?
负载均衡器通过将传入的网络流量分配到多个服务器或资源上来确保计算资源的有效利用并防止过载。以下是负载均衡器分发流量的一般步骤:
- 负载均衡器接收来自客户端或用户的请求。
- 负载均衡器评估传入的请求,并确定应由哪台服务器或资源处理该请求。这是基于预定义的负载均衡算法完成的,该算法考虑了诸如服务器容量、服务器响应时间、活动连接数和地理位置等因素。
- 负载均衡器将传入的流量转发到选定的服务器或资源。
- 服务器或资源处理请求并发送响应回负载均衡器。
- 负载均衡器接收来自服务器或资源的响应,并将其发送给发起请求的客户端或用户。