将大语言模型(LLM)的推理端点部署在Azure Functions这类Serverless平台上,初看起来是一个完美的组合:按需扩展、无服务器运维负担、与云生态系统无缝集成。但在真实的项目中,这种看似简单的架构背后隐藏着巨大的成本和稳定性
2023-11-20