datakfy
本站致力于IT相关技术的分享
在React前端与Python spaCy服务间构建基于OpenTelemetry的端到端追踪体系 在React前端与Python spaCy服务间构建基于OpenTelemetry的端到端追踪体系
当用户反馈“文本实体识别功能有时很慢”时,一个横跨前端、BFF(Backend for Frontend)和Python机器学习服务的三层架构,瞬间变成了一个调试黑洞。问题出在哪里?是用户网络到CDN的延迟,是React应用自身的计算,是N
2023-10-27
实现MyBatis动态SQL性能的可观测性 从Oracle到Prometheus再到Storybook诊断面板 实现MyBatis动态SQL性能的可观测性 从Oracle到Prometheus再到Storybook诊断面板
一个陈旧但核心的报表模块,响应时间从几百毫秒悄无声息地攀升到了十几秒。应用性能监控(APM)系统只给出了一个模糊的告警:com.ourcompany.mapper.ReportMapper.queryComplexReport方法耗时过长。
2023-10-27
在 Fastify 事件驱动架构中实现端到端处理时延的 Prometheus 监控 在 Fastify 事件驱动架构中实现端到端处理时延的 Prometheus 监控
我们团队的事件驱动系统上线后,基础的 CPU 和内存监控图表一片绿色,标准的 HTTP 网关入口请求时延 P99 也稳定在 50ms 以内。然而,一种不安感始终萦绕不去。当产品经理询问“一个订单创建事件,从触发到最终通知用户,整个流程需要多
2023-10-27
使用Prometheus与GCP构建高基数WebRTC会话质量的可观测性管道 使用Prometheus与GCP构建高基数WebRTC会话质量的可观测性管道
我们的WebRTC业务在过去两个季度增长了500%,但我们的故障排查能力却倒退回了石器时代。当用户投诉“视频卡顿”时,我们能做的只有检查GCP上的服务器CPU和内存,这些指标几乎永远是绿色的。问题显而易见:服务端的基础设施监控,对于诊断发生
2023-10-27