随着AI工作负载的爆炸式增长,服务提供商和企业需要加速计算,以安全高效地在大规模云上交付高性能的AI应用。前段时间,F5公司宣布推出一项全新的创新AI应用交付和应用安全解决方案,即BIG-IP Next for Kubernetes。那么该方案有何性能优势,是否通过实践验证?本文将为你全面解读。
F5 BIG-IP Next for Kubernetes是专门为Kubernetes环境设计的解决方案,并已在大型电信云和5G基础设施中得到验证。该技术现可提供针对领先AI用例的定制化服务,例如推理、检索增强生成(RAG)以及无缝的数据管理和存储,与NVIDIA BlueField-3 DPU的集成最小化了硬件占用空间,实现了细粒度的多租户,同时实现能源消耗优化,并提供高性能的网络、安全和流量管理。
专为高需求服务提供商和大型基础设施设计的F5 BIG-IP Next for Kubernetes可带来以下价值:与客户的前端网络无缝集成,显著降低延迟,同时提供高性能的负载均衡,以处理上亿参数AI模型及高达万亿次运维操作的海量数据需求。此外,该方案还具有丰富的可观测性和细粒度信息,支持HTTP之外的多项L7协议,确保在极高性能下实现增强的入站和出站控制。此外, 客户可完全自动化AI训练和推理端点发现和安全功能,加强数据完整性和主权,同时解决现代 AI环境中至关重要的加密能力。