datakfy
本站致力于IT相关技术的分享
构建高可用Milvus分区动态管理服务中的分布式锁架构权衡 构建高可用Milvus分区动态管理服务中的分布式锁架构权衡
在一个典型的多租户AI服务中,我们使用Milvus作为核心的向量检索引擎。为了隔离租户数据并优化资源利用,我们采用了动态加载和卸载Partition的策略。应用服务是无状态、可水平扩展的,这意味着任何一个服务实例都可能接收到来自某个租户的请
构建驱动推荐系统优化的iOS情感反馈Kit及其可观测性设计 构建驱动推荐系统优化的iOS情感反馈Kit及其可观测性设计
我们团队的推荐流(Feed)遇到了一个棘手的数据难题。业务方期望通过用户的负反馈(“不喜欢”、“减少这类推荐”)来快速迭代推荐模型,但我们现有的埋点系统完全无法支撑这个需求。现有的方案仅仅是在用户点击“不喜欢”时,向服务端发送一个独立的、无
使用Prometheus与GCP构建高基数WebRTC会话质量的可观测性管道 使用Prometheus与GCP构建高基数WebRTC会话质量的可观测性管道
我们的WebRTC业务在过去两个季度增长了500%,但我们的故障排查能力却倒退回了石器时代。当用户投诉“视频卡顿”时,我们能做的只有检查GCP上的服务器CPU和内存,这些指标几乎永远是绿色的。问题显而易见:服务端的基础设施监控,对于诊断发生
2023-10-27
BDD规范驱动的Svelte动态UI引擎及其MongoDB持久化方案 BDD规范驱动的Svelte动态UI引擎及其MongoDB持久化方案
一个僵化的组件库是团队效率的隐形杀手。每当业务逻辑需要微调——比如一个按钮的禁用条件、一个输入框的校验规则——都必须由前端工程师修改代码、构建、然后重新部署。这个循环在快速迭代的产品中是不可接受的。我们的痛点非常明确:需要一种机制,将UI组
基于 Knative 事件驱动架构的异构 SSR 服务数据一致性实现 基于 Knative 事件驱动架构的异构 SSR 服务数据一致性实现
定义复杂技术问题在构建一个要求极致用户体验和高弹性伸缩能力的现代 Web 应用时,我们面临一个典型的架构困境。前端渲染层,为了追求首屏加载速度(TTFB)和 SEO 友好性,服务器端渲染(SSR)几乎是必然选择,而 Node.js 生态在这
2023-10-27
构建服务于实时推荐的向量特征存储与检索系统 构建服务于实时推荐的向量特征存储与检索系统
在构建现代推荐系统时,一个核心挑战在于如何弥合模型离线训练与在线服务之间的鸿沟,尤其是在处理高维向量(Embeddings)特征时。训练-服务偏斜(Training-Serving Skew)往往源于两套独立的数据处理管道:一套用Pytho
3 / 5