摘要: LLM 大模型学习必知必会系列(十三):基于SWIFT的VLLM推理加速与部署实战 阅读全文
posted @ 2024-05-31 23:04 汀、人工智能 阅读(93) 评论(0) 推荐(0) 编辑
摘要: LLM 大模型学习必知必会系列(十二):VLLM性能飞跃部署实践:从推理加速到高效部署的全方位优化[更多内容:XInference/FastChat等框架] 阅读全文
posted @ 2024-05-31 22:59 汀、人工智能 阅读(1166) 评论(0) 推荐(0) 编辑