<?xml version="1.0" encoding="utf-8"?>
<feed xmlns="http://www.w3.org/2005/Atom">
  <title>datakfy</title>
  
  <subtitle>datakfy</subtitle>
  <link href="https://datakfy.com/atom.xml" rel="self"/>
  
  <link href="https://datakfy.com/"/>
  <updated>2026-01-14T14:42:43.281Z</updated>
  <id>https://datakfy.com/</id>
  
  <author>
    <name>datakfy</name>
    
  </author>
  
  <generator uri="https://hexo.io/">Hexo</generator>
  
  <entry>
    <title>利用APISIX插件体系为Azure Functions上的LLM服务构建韧性与成本控制层</title>
    <link href="https://datakfy.com/3396218438/"/>
    <id>https://datakfy.com/3396218438/</id>
    <published>2023-11-20T10:35:17.000Z</published>
    <updated>2026-01-14T14:42:43.281Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;将大语言模型（LLM）的推理端点部署在Azure Functions这类Serverless平台上，初看起来是一个完美的组合：按需扩展、无服务器运维负担、与云生态系统无缝集成。但在真实的项目中，这种看似简单的架构背后隐藏着巨大的成本和稳定性风险。一个未经保护和优化的LLM</summary>
        
      
    
    
    
    <category term="架构设计" scheme="https://datakfy.com/categories/%E6%9E%B6%E6%9E%84%E8%AE%BE%E8%AE%A1/"/>
    
    
    <category term="APISIX" scheme="https://datakfy.com/tags/APISIX/"/>
    
    <category term="Azure Functions" scheme="https://datakfy.com/tags/Azure-Functions/"/>
    
    <category term="LLM" scheme="https://datakfy.com/tags/LLM/"/>
    
    <category term="Serverless" scheme="https://datakfy.com/tags/Serverless/"/>
    
    <category term="API网关" scheme="https://datakfy.com/tags/API%E7%BD%91%E5%85%B3/"/>
    
  </entry>
  
  <entry>
    <title>在React前端与Python spaCy服务间构建基于OpenTelemetry的端到端追踪体系</title>
    <link href="https://datakfy.com/1559603946/"/>
    <id>https://datakfy.com/1559603946/</id>
    <published>2023-10-27T11:10:00.000Z</published>
    <updated>2026-01-14T14:42:43.280Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;当用户反馈“文本实体识别功能有时很慢”时，一个横跨前端、BFF（Backend for Frontend）和Python机器学习服务的三层架构，瞬间变成了一个调试黑洞。问题出在哪里？是用户网络到CDN的延迟，是React应用自身的计算，是Node.js</summary>
        
      
    
    
    
    <category term="可观测性" scheme="https://datakfy.com/categories/%E5%8F%AF%E8%A7%82%E6%B5%8B%E6%80%A7/"/>
    
    
    <category term="前端" scheme="https://datakfy.com/tags/%E5%89%8D%E7%AB%AF/"/>
    
    <category term="spaCy" scheme="https://datakfy.com/tags/spaCy/"/>
    
    <category term="OpenTelemetry" scheme="https://datakfy.com/tags/OpenTelemetry/"/>
    
    <category term="分布式追踪" scheme="https://datakfy.com/tags/%E5%88%86%E5%B8%83%E5%BC%8F%E8%BF%BD%E8%B8%AA/"/>
    
    <category term="Node.js" scheme="https://datakfy.com/tags/Node-js/"/>
    
  </entry>
  
  <entry>
    <title>使用C#在DigitalOcean构建连接GCP Pub/Sub与React的高可用WebSocket消息桥</title>
    <link href="https://datakfy.com/1430590521/"/>
    <id>https://datakfy.com/1430590521/</id>
    <published>2023-10-27T10:33:41.000Z</published>
    <updated>2026-01-14T14:42:43.280Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;我们的核心计算服务，出于成本和历史原因，部署在DigitalOcean的Droplets上。然而，对于事件驱动和异步任务处理，我们选择了Google Cloud</summary>
        
      
    
    
    
    <category term="后端架构" scheme="https://datakfy.com/categories/%E5%90%8E%E7%AB%AF%E6%9E%B6%E6%9E%84/"/>
    
    
    <category term="Google Cloud Pub/Sub" scheme="https://datakfy.com/tags/Google-Cloud-Pub-Sub/"/>
    
    <category term="React" scheme="https://datakfy.com/tags/React/"/>
    
    <category term="C#" scheme="https://datakfy.com/tags/C/"/>
    
    <category term="DigitalOcean" scheme="https://datakfy.com/tags/DigitalOcean/"/>
    
    <category term="WebSocket" scheme="https://datakfy.com/tags/WebSocket/"/>
    
    <category term="多云架构" scheme="https://datakfy.com/tags/%E5%A4%9A%E4%BA%91%E6%9E%B6%E6%9E%84/"/>
    
  </entry>
  
  <entry>
    <title>构建代码审查流程的可观测性管道：从 CircleCI Webhook 到 Grafana 面板</title>
    <link href="https://datakfy.com/0125723891/"/>
    <id>https://datakfy.com/0125723891/</id>
    <published>2023-10-27T10:30:00.000Z</published>
    <updated>2026-01-14T14:42:43.279Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;团队规模扩大后，代码审查（Code Review）流程的效率开始变得模糊不清。我们能感觉到合并请求（Pull Request）的周期在变长，但具体瓶颈在哪里，没人能用数据说清楚。是评审响应太慢？是修改的轮次太多？还是单纯因为某些项目的 CI</summary>
        
      
    
    
    
    <category term="DevOps" scheme="https://datakfy.com/categories/DevOps/"/>
    
    
    <category term="CircleCI" scheme="https://datakfy.com/tags/CircleCI/"/>
    
    <category term="Grafana" scheme="https://datakfy.com/tags/Grafana/"/>
    
    <category term="Code Review" scheme="https://datakfy.com/tags/Code-Review/"/>
    
    <category term="可观测性" scheme="https://datakfy.com/tags/%E5%8F%AF%E8%A7%82%E6%B5%8B%E6%80%A7/"/>
    
  </entry>
  
  <entry>
    <title>使用 Actix-web 与 ZeroMQ 构建一个进程隔离的分布式插件系统并通过 GitHub Actions 实现自动化部署</title>
    <link href="https://datakfy.com/0659358486/"/>
    <id>https://datakfy.com/0659358486/</id>
    <published>2023-10-27T10:30:00.000Z</published>
    <updated>2026-01-14T14:42:43.279Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;项目的需求演进往往会把一个干净的单体应用拖入泥潭。最初，我们只是需要一个核心的HTTP服务，但很快，各种定制化的数据处理逻辑开始涌入：一个需要调用Python脚本，一个需要执行计算密集的算法，另一个则需要连接一个特殊的硬件设备。把这些功能全部塞进主服务进程，不仅会让代码库变</summary>
        
      
    
    
    
    <category term="后端架构" scheme="https://datakfy.com/categories/%E5%90%8E%E7%AB%AF%E6%9E%B6%E6%9E%84/"/>
    
    
    <category term="Actix-web" scheme="https://datakfy.com/tags/Actix-web/"/>
    
    <category term="ZeroMQ" scheme="https://datakfy.com/tags/ZeroMQ/"/>
    
    <category term="GitHub Actions" scheme="https://datakfy.com/tags/GitHub-Actions/"/>
    
    <category term="Rust" scheme="https://datakfy.com/tags/Rust/"/>
    
    <category term="微内核架构" scheme="https://datakfy.com/tags/%E5%BE%AE%E5%86%85%E6%A0%B8%E6%9E%B6%E6%9E%84/"/>
    
  </entry>
  
  <entry>
    <title>基于 Raft 与 Algolia 构建高可用分布式配置系统的 CQRS 架构实践</title>
    <link href="https://datakfy.com/1277713026/"/>
    <id>https://datakfy.com/1277713026/</id>
    <published>2023-10-27T10:30:00.000Z</published>
    <updated>2026-01-14T14:42:43.280Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;一个看似简单的分布式配置管理系统，在生产环境中，往往要同时满足两个相互冲突的核心需求：写入操作必须保证强一致性与高可用性，任何配置的变更都不能丢失或产生冲突；而读取与搜索操作则需要极致的速度、模糊匹配和高并发能力，以供成百上千的服务实例或开发者频繁查询。&lt;/p&gt;
&lt;p&gt;传统</summary>
        
      
    
    
    
    <category term="分布式系统" scheme="https://datakfy.com/categories/%E5%88%86%E5%B8%83%E5%BC%8F%E7%B3%BB%E7%BB%9F/"/>
    
    
    <category term="Raft 协议" scheme="https://datakfy.com/tags/Raft-%E5%8D%8F%E8%AE%AE/"/>
    
    <category term="API 设计" scheme="https://datakfy.com/tags/API-%E8%AE%BE%E8%AE%A1/"/>
    
    <category term="Algolia" scheme="https://datakfy.com/tags/Algolia/"/>
    
    <category term="Nuxt.js" scheme="https://datakfy.com/tags/Nuxt-js/"/>
    
    <category term="Lit" scheme="https://datakfy.com/tags/Lit/"/>
    
  </entry>
  
  <entry>
    <title>构建高可用Milvus分区动态管理服务中的分布式锁架构权衡</title>
    <link href="https://datakfy.com/1367464888/"/>
    <id>https://datakfy.com/1367464888/</id>
    <published>2023-10-27T10:30:00.000Z</published>
    <updated>2026-01-14T14:42:43.280Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;在一个典型的多租户AI服务中，我们使用Milvus作为核心的向量检索引擎。为了隔离租户数据并优化资源利用，我们采用了动态加载和卸载Partition的策略。应用服务是无状态、可水平扩展的，这意味着任何一个服务实例都可能接收到来自某个租户的请求，并需要确保其对应的Partit</summary>
        
      
    
    
    
    <category term="分布式系统" scheme="https://datakfy.com/categories/%E5%88%86%E5%B8%83%E5%BC%8F%E7%B3%BB%E7%BB%9F/"/>
    
    
    <category term="Milvus" scheme="https://datakfy.com/tags/Milvus/"/>
    
    <category term="分布式锁" scheme="https://datakfy.com/tags/%E5%88%86%E5%B8%83%E5%BC%8F%E9%94%81/"/>
    
    <category term="架构设计" scheme="https://datakfy.com/tags/%E6%9E%B6%E6%9E%84%E8%AE%BE%E8%AE%A1/"/>
    
    <category term="Zookeeper" scheme="https://datakfy.com/tags/Zookeeper/"/>
    
    <category term="Redis" scheme="https://datakfy.com/tags/Redis/"/>
    
  </entry>
  
  <entry>
    <title>构建基于SAML与SNS的自动化代码审查安全门禁</title>
    <link href="https://datakfy.com/1870970552/"/>
    <id>https://datakfy.com/1870970552/</id>
    <published>2023-10-27T10:30:00.000Z</published>
    <updated>2026-01-14T14:42:43.280Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;团队的代码审查（Code Review）流程一度陷入瓶颈。安全规范的检查依赖人工，不仅效率低下，且标准难以统一，关键漏洞时常在合并后才被发现，修复成本极高。最初的解决方案是引入一个简单的CI/CD Webhook，在每次提交Pull</summary>
        
      
    
    
    
    <category term="DevSecOps" scheme="https://datakfy.com/categories/DevSecOps/"/>
    
    
    <category term="Code Review" scheme="https://datakfy.com/tags/Code-Review/"/>
    
    <category term="AWS SNS" scheme="https://datakfy.com/tags/AWS-SNS/"/>
    
    <category term="SAML" scheme="https://datakfy.com/tags/SAML/"/>
    
    <category term="AWS Lambda" scheme="https://datakfy.com/tags/AWS-Lambda/"/>
    
    <category term="AWS Step Functions" scheme="https://datakfy.com/tags/AWS-Step-Functions/"/>
    
  </entry>
  
  <entry>
    <title>构建从 Kafka 到 Pinecone 的实时向量摄取服务 Swift 实现与 Cilium 安全加固</title>
    <link href="https://datakfy.com/2149685500/"/>
    <id>https://datakfy.com/2149685500/</id>
    <published>2023-10-27T10:30:00.000Z</published>
    <updated>2026-01-14T14:42:43.281Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;问题的起点非常明确：一个持续产生高流量事件的Kafka</summary>
        
      
    
    
    
    <category term="后端架构" scheme="https://datakfy.com/categories/%E5%90%8E%E7%AB%AF%E6%9E%B6%E6%9E%84/"/>
    
    
    <category term="Pinecone" scheme="https://datakfy.com/tags/Pinecone/"/>
    
    <category term="Kafka" scheme="https://datakfy.com/tags/Kafka/"/>
    
    <category term="Swift" scheme="https://datakfy.com/tags/Swift/"/>
    
    <category term="Cilium" scheme="https://datakfy.com/tags/Cilium/"/>
    
    <category term="消息队列" scheme="https://datakfy.com/tags/%E6%B6%88%E6%81%AF%E9%98%9F%E5%88%97/"/>
    
  </entry>
  
  <entry>
    <title>构建基于 Consul KV 与 Knative 的微前端动态样式注入方案</title>
    <link href="https://datakfy.com/2402358205/"/>
    <id>https://datakfy.com/2402358205/</id>
    <published>2023-10-27T10:30:00.000Z</published>
    <updated>2026-01-14T14:42:43.281Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;在设计一个基于 Knative 的多租户微前端 SaaS</summary>
        
      
    
    
    
    <category term="云原生" scheme="https://datakfy.com/categories/%E4%BA%91%E5%8E%9F%E7%94%9F/"/>
    
    
    <category term="架构设计" scheme="https://datakfy.com/tags/%E6%9E%B6%E6%9E%84%E8%AE%BE%E8%AE%A1/"/>
    
    <category term="Consul" scheme="https://datakfy.com/tags/Consul/"/>
    
    <category term="Knative" scheme="https://datakfy.com/tags/Knative/"/>
    
    <category term="微前端" scheme="https://datakfy.com/tags/%E5%BE%AE%E5%89%8D%E7%AB%AF/"/>
    
  </entry>
  
  <entry>
    <title>在容器编排环境中基于外部状态存储实现Dask调度器的高可用架构</title>
    <link href="https://datakfy.com/4204133945/"/>
    <id>https://datakfy.com/4204133945/</id>
    <published>2023-10-27T10:30:00.000Z</published>
    <updated>2026-01-14T14:42:43.282Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;一个长期运行的分布式计算任务，其调度器Pod因为节点故障或OOM而崩溃，所有计算状态瞬间蒸发。这是在生产环境中使用原生Dask时，我们不得不面对的严峻现实。Dask的中心化调度器（Scheduler）本身是一个单点故障（SPOF），尽管容器编排平台（如Kubernetes）</summary>
        
      
    
    
    
    <category term="分布式系统" scheme="https://datakfy.com/categories/%E5%88%86%E5%B8%83%E5%BC%8F%E7%B3%BB%E7%BB%9F/"/>
    
    
    <category term="Kubernetes" scheme="https://datakfy.com/tags/Kubernetes/"/>
    
    <category term="Dask" scheme="https://datakfy.com/tags/Dask/"/>
    
    <category term="CAP Theorem" scheme="https://datakfy.com/tags/CAP-Theorem/"/>
    
    <category term="容器编排" scheme="https://datakfy.com/tags/%E5%AE%B9%E5%99%A8%E7%BC%96%E6%8E%92/"/>
    
    <category term="etcd" scheme="https://datakfy.com/tags/etcd/"/>
    
  </entry>
  
  <entry>
    <title>Ktor 与 Server-Sent Events 驱动的异步 Prettier 格式化服务实现</title>
    <link href="https://datakfy.com/4237349681/"/>
    <id>https://datakfy.com/4237349681/</id>
    <published>2023-10-27T10:30:00.000Z</published>
    <updated>2026-01-14T14:42:43.282Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;团队扩大后，前端代码格式化规范的统一成了一个不大不小的麻烦。虽然有 &lt;code&gt;.prettierrc&lt;/code&gt; 和 &lt;code&gt;husky&lt;/code&gt;，但总有人本地环境配置不当，导致 CI 阶段因为格式问题频繁失败。CI 流水线中执行 &lt;code&gt;npm</summary>
        
      
    
    
    
    <category term="后端架构" scheme="https://datakfy.com/categories/%E5%90%8E%E7%AB%AF%E6%9E%B6%E6%9E%84/"/>
    
    
    <category term="Prettier" scheme="https://datakfy.com/tags/Prettier/"/>
    
    <category term="Ktor" scheme="https://datakfy.com/tags/Ktor/"/>
    
    <category term="Server-Sent Events" scheme="https://datakfy.com/tags/Server-Sent-Events/"/>
    
    <category term="GraalVM" scheme="https://datakfy.com/tags/GraalVM/"/>
    
    <category term="Kotlin" scheme="https://datakfy.com/tags/Kotlin/"/>
    
  </entry>
  
  <entry>
    <title>使用Prometheus与GCP构建高基数WebRTC会话质量的可观测性管道</title>
    <link href="https://datakfy.com/5724949465/"/>
    <id>https://datakfy.com/5724949465/</id>
    <published>2023-10-27T10:30:00.000Z</published>
    <updated>2026-01-14T14:42:43.282Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;我们的WebRTC业务在过去两个季度增长了500%，但我们的故障排查能力却倒退回了石器时代。当用户投诉“视频卡顿”时，我们能做的只有检查GCP上的服务器CPU和内存，这些指标几乎永远是绿色的。问题显而易见：服务端的基础设施监控，对于诊断发生在客户端网络环境中的、高度动态的W</summary>
        
      
    
    
    
    <category term="可观测性" scheme="https://datakfy.com/categories/%E5%8F%AF%E8%A7%82%E6%B5%8B%E6%80%A7/"/>
    
    
    <category term="Kubernetes" scheme="https://datakfy.com/tags/Kubernetes/"/>
    
    <category term="Prometheus TSDB" scheme="https://datakfy.com/tags/Prometheus-TSDB/"/>
    
    <category term="WebRTC" scheme="https://datakfy.com/tags/WebRTC/"/>
    
    <category term="Google Cloud (GCP)" scheme="https://datakfy.com/tags/Google-Cloud-GCP/"/>
    
    <category term="Golang" scheme="https://datakfy.com/tags/Golang/"/>
    
  </entry>
  
  <entry>
    <title>构建驱动推荐系统优化的iOS情感反馈Kit及其可观测性设计</title>
    <link href="https://datakfy.com/5502615834/"/>
    <id>https://datakfy.com/5502615834/</id>
    <published>2023-10-27T10:30:00.000Z</published>
    <updated>2026-01-14T14:42:43.282Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;我们团队的推荐流（Feed）遇到了一个棘手的数据难题。业务方期望通过用户的负反馈（“不喜欢”、“减少这类推荐”）来快速迭代推荐模型，但我们现有的埋点系统完全无法支撑这个需求。现有的方案仅仅是在用户点击“不喜欢”时，向服务端发送一个独立的、无上下文的HTTP请求。这种方式导致</summary>
        
      
    
    
    
    <category term="移动端开发" scheme="https://datakfy.com/categories/%E7%A7%BB%E5%8A%A8%E7%AB%AF%E5%BC%80%E5%8F%91/"/>
    
    
    <category term="Emotion" scheme="https://datakfy.com/tags/Emotion/"/>
    
    <category term="iOS 开发" scheme="https://datakfy.com/tags/iOS-%E5%BC%80%E5%8F%91/"/>
    
    <category term="推荐系统" scheme="https://datakfy.com/tags/%E6%8E%A8%E8%8D%90%E7%B3%BB%E7%BB%9F/"/>
    
    <category term="Kit" scheme="https://datakfy.com/tags/Kit/"/>
    
  </entry>
  
  <entry>
    <title>构建一个基于 Express 和 Prettier 的容器化代码格式化即服务 (FaaS) 平台</title>
    <link href="https://datakfy.com/5985621928/"/>
    <id>https://datakfy.com/5985621928/</id>
    <published>2023-10-27T10:30:00.000Z</published>
    <updated>2026-01-14T14:42:43.283Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;团队扩张到一定规模后，代码风格一致性就成了 CI/CD 流水线中的一个顽疾。起初，我们依赖 &lt;code&gt;pre-commit&lt;/code&gt; 钩子和本地的 &lt;code&gt;.prettierrc&lt;/code&gt;</summary>
        
      
    
    
    
    <category term="DevOps" scheme="https://datakfy.com/categories/DevOps/"/>
    
    
    <category term="Node.js" scheme="https://datakfy.com/tags/Node-js/"/>
    
    <category term="Kubernetes" scheme="https://datakfy.com/tags/Kubernetes/"/>
    
    <category term="容器编排" scheme="https://datakfy.com/tags/%E5%AE%B9%E5%99%A8%E7%BC%96%E6%8E%92/"/>
    
    <category term="Prettier" scheme="https://datakfy.com/tags/Prettier/"/>
    
    <category term="Express.js" scheme="https://datakfy.com/tags/Express-js/"/>
    
    <category term="CI/CD" scheme="https://datakfy.com/tags/CI-CD/"/>
    
  </entry>
  
  <entry>
    <title>BDD规范驱动的Svelte动态UI引擎及其MongoDB持久化方案</title>
    <link href="https://datakfy.com/6537118214/"/>
    <id>https://datakfy.com/6537118214/</id>
    <published>2023-10-27T10:30:00.000Z</published>
    <updated>2026-01-14T14:42:43.283Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;一个僵化的组件库是团队效率的隐形杀手。每当业务逻辑需要微调——比如一个按钮的禁用条件、一个输入框的校验规则——都必须由前端工程师修改代码、构建、然后重新部署。这个循环在快速迭代的产品中是不可接受的。我们的痛点非常明确：需要一种机制，将UI组件的行为逻辑与代码实现解耦，允许非</summary>
        
      
    
    
    
    <category term="架构与设计" scheme="https://datakfy.com/categories/%E6%9E%B6%E6%9E%84%E4%B8%8E%E8%AE%BE%E8%AE%A1/"/>
    
    
    <category term="UI 组件库" scheme="https://datakfy.com/tags/UI-%E7%BB%84%E4%BB%B6%E5%BA%93/"/>
    
    <category term="Svelte" scheme="https://datakfy.com/tags/Svelte/"/>
    
    <category term="MongoDB" scheme="https://datakfy.com/tags/MongoDB/"/>
    
    <category term="BDD" scheme="https://datakfy.com/tags/BDD/"/>
    
  </entry>
  
  <entry>
    <title>基于 Knative 事件驱动架构的异构 SSR 服务数据一致性实现</title>
    <link href="https://datakfy.com/6629834866/"/>
    <id>https://datakfy.com/6629834866/</id>
    <published>2023-10-27T10:30:00.000Z</published>
    <updated>2026-01-14T14:42:43.283Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;h3 id=&quot;定义复杂技术问题&quot;&gt;&lt;a href=&quot;#定义复杂技术问题&quot; class=&quot;headerlink&quot; title=&quot;定义复杂技术问题&quot;&gt;&lt;/a&gt;定义复杂技术问题&lt;/h3&gt;&lt;p&gt;在构建一个要求极致用户体验和高弹性伸缩能力的现代 Web</summary>
        
      
    
    
    
    <category term="架构设计" scheme="https://datakfy.com/categories/%E6%9E%B6%E6%9E%84%E8%AE%BE%E8%AE%A1/"/>
    
    
    <category term="Node.js" scheme="https://datakfy.com/tags/Node-js/"/>
    
    <category term="Knative" scheme="https://datakfy.com/tags/Knative/"/>
    
    <category term="TiDB" scheme="https://datakfy.com/tags/TiDB/"/>
    
    <category term="Java" scheme="https://datakfy.com/tags/Java/"/>
    
    <category term="SSR" scheme="https://datakfy.com/tags/SSR/"/>
    
  </entry>
  
  <entry>
    <title>基于 ELK Stack 构建 MongoDB 慢查询日志的实时解析与诊断平台</title>
    <link href="https://datakfy.com/6937002366/"/>
    <id>https://datakfy.com/6937002366/</id>
    <published>2023-10-27T10:30:00.000Z</published>
    <updated>2026-01-14T14:42:43.283Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;我们的生产环境 MongoDB 集群开始出现无法预测的性能抖动。高峰期，部分核心服务的响应时间会从几十毫秒飙升到数秒。问题在于，这些抖动是间歇性的，当我们介入排查时，系统负载早已恢复正常。传统的排查方式——SSH到各个节点，手动 &lt;code&gt;grep&lt;/code&gt;</summary>
        
      
    
    
    
    <category term="数据工程与存储" scheme="https://datakfy.com/categories/%E6%95%B0%E6%8D%AE%E5%B7%A5%E7%A8%8B%E4%B8%8E%E5%AD%98%E5%82%A8/"/>
    
    
    <category term="可观测性" scheme="https://datakfy.com/tags/%E5%8F%AF%E8%A7%82%E6%B5%8B%E6%80%A7/"/>
    
    <category term="MongoDB" scheme="https://datakfy.com/tags/MongoDB/"/>
    
    <category term="NoSQL" scheme="https://datakfy.com/tags/NoSQL/"/>
    
    <category term="ELK Stack" scheme="https://datakfy.com/tags/ELK-Stack/"/>
    
    <category term="Logstash" scheme="https://datakfy.com/tags/Logstash/"/>
    
  </entry>
  
  <entry>
    <title>构建服务于实时推荐的向量特征存储与检索系统</title>
    <link href="https://datakfy.com/6723454984/"/>
    <id>https://datakfy.com/6723454984/</id>
    <published>2023-10-27T10:30:00.000Z</published>
    <updated>2026-01-14T14:42:43.283Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;在构建现代推荐系统时，一个核心挑战在于如何弥合模型离线训练与在线服务之间的鸿沟，尤其是在处理高维向量（Embeddings）特征时。训练-服务偏斜（Training-Serving Skew）往往源于两套独立的数据处理管道：一套用Python生态（如Pandas,</summary>
        
      
    
    
    
    <category term="数据工程与存储" scheme="https://datakfy.com/categories/%E6%95%B0%E6%8D%AE%E5%B7%A5%E7%A8%8B%E4%B8%8E%E5%AD%98%E5%82%A8/"/>
    
    
    <category term="Pinecone" scheme="https://datakfy.com/tags/Pinecone/"/>
    
    <category term="Kotlin" scheme="https://datakfy.com/tags/Kotlin/"/>
    
    <category term="Solid.js" scheme="https://datakfy.com/tags/Solid-js/"/>
    
    <category term="Fastify" scheme="https://datakfy.com/tags/Fastify/"/>
    
    <category term="Feature Store" scheme="https://datakfy.com/tags/Feature-Store/"/>
    
  </entry>
  
  <entry>
    <title>基于领域事件与AWS SQS构建Django到C#的最终一致性数据管道</title>
    <link href="https://datakfy.com/7882541458/"/>
    <id>https://datakfy.com/7882541458/</id>
    <published>2023-10-27T10:30:00.000Z</published>
    <updated>2026-01-14T14:42:43.284Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;我们面临一个典型的异构系统集成挑战：一个核心业务系统由 Django 构建，负责商品数据的全生命周期管理；而一个新的、高性能的搜索与推荐服务则决定采用 C# 和 .NET 平台，以利用其类型安全和计算性能优势。问题在于，如何以一种可靠、解耦且可扩展的方式，将 Django</summary>
        
      
    
    
    
    <category term="分布式架构" scheme="https://datakfy.com/categories/%E5%88%86%E5%B8%83%E5%BC%8F%E6%9E%B6%E6%9E%84/"/>
    
    
    <category term="C#" scheme="https://datakfy.com/tags/C/"/>
    
    <category term="AWS SQS" scheme="https://datakfy.com/tags/AWS-SQS/"/>
    
    <category term="Domain-Driven Design (DDD)" scheme="https://datakfy.com/tags/Domain-Driven-Design-DDD/"/>
    
    <category term="Django" scheme="https://datakfy.com/tags/Django/"/>
    
    <category term="Meilisearch" scheme="https://datakfy.com/tags/Meilisearch/"/>
    
  </entry>
  
  <entry>
    <title>构建基于SQL Server CDC与Java WebSocket的静态站点实时数据层</title>
    <link href="https://datakfy.com/7367103721/"/>
    <id>https://datakfy.com/7367103721/</id>
    <published>2023-10-27T10:30:00.000Z</published>
    <updated>2026-01-14T14:42:43.283Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;我们面临一个棘手的技术约束。前端团队选定Gatsby作为内容交付平台，目标是利用其预构建（Pre-building）能力将页面生成纯静态HTML/CSS/JS，部署至CDN以获得极致的加载性能和全球低延迟。然而，业务方要求一个核心的仪表盘页面必须能够实时反映后端一个老旧系统</summary>
        
      
    
    
    
    <category term="架构与设计" scheme="https://datakfy.com/categories/%E6%9E%B6%E6%9E%84%E4%B8%8E%E8%AE%BE%E8%AE%A1/"/>
    
    
    <category term="Kafka" scheme="https://datakfy.com/tags/Kafka/"/>
    
    <category term="Java" scheme="https://datakfy.com/tags/Java/"/>
    
    <category term="Gatsby" scheme="https://datakfy.com/tags/Gatsby/"/>
    
    <category term="SQL Server" scheme="https://datakfy.com/tags/SQL-Server/"/>
    
    <category term="WebSockets" scheme="https://datakfy.com/tags/WebSockets/"/>
    
    <category term="Debezium" scheme="https://datakfy.com/tags/Debezium/"/>
    
  </entry>
  
  <entry>
    <title>基于 TDD 与 Babel 运行时转译实现 OAuth 2.0 插件化认证核心</title>
    <link href="https://datakfy.com/7984638091/"/>
    <id>https://datakfy.com/7984638091/</id>
    <published>2023-10-27T10:30:00.000Z</published>
    <updated>2026-01-14T14:42:43.284Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;维护一个支持多种认证方式的 OAuth 2.0 服务，其复杂性往往会随着业务扩展而失控。最初可能只需要支持标准的密码模式，但很快，产品需求就会引入 GitHub、Google 登录，甚至对接遗留系统的单点登录。这通常导致核心代码库中出现臃肿的</summary>
        
      
    
    
    
    <category term="后端架构" scheme="https://datakfy.com/categories/%E5%90%8E%E7%AB%AF%E6%9E%B6%E6%9E%84/"/>
    
    
    <category term="架构设计" scheme="https://datakfy.com/tags/%E6%9E%B6%E6%9E%84%E8%AE%BE%E8%AE%A1/"/>
    
    <category term="Node.js" scheme="https://datakfy.com/tags/Node-js/"/>
    
    <category term="OAuth 2.0" scheme="https://datakfy.com/tags/OAuth-2-0/"/>
    
    <category term="TDD" scheme="https://datakfy.com/tags/TDD/"/>
    
    <category term="Babel" scheme="https://datakfy.com/tags/Babel/"/>
    
  </entry>
  
  <entry>
    <title>实现MyBatis动态SQL性能的可观测性 从Oracle到Prometheus再到Storybook诊断面板</title>
    <link href="https://datakfy.com/8223974546/"/>
    <id>https://datakfy.com/8223974546/</id>
    <published>2023-10-27T10:30:00.000Z</published>
    <updated>2026-01-14T14:42:43.284Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;一个陈旧但核心的报表模块，响应时间从几百毫秒悄无声息地攀升到了十几秒。应用性能监控（APM）系统只给出了一个模糊的告警：&lt;code&gt;com.ourcompany.mapper.ReportMapper.queryComplexReport&lt;/code&gt;方法耗时过长。DBA团</summary>
        
      
    
    
    
    <category term="可观测性" scheme="https://datakfy.com/categories/%E5%8F%AF%E8%A7%82%E6%B5%8B%E6%80%A7/"/>
    
    
    <category term="Oracle" scheme="https://datakfy.com/tags/Oracle/"/>
    
    <category term="MyBatis" scheme="https://datakfy.com/tags/MyBatis/"/>
    
    <category term="Prometheus" scheme="https://datakfy.com/tags/Prometheus/"/>
    
    <category term="Storybook" scheme="https://datakfy.com/tags/Storybook/"/>
    
  </entry>
  
  <entry>
    <title>在 Fastify 事件驱动架构中实现端到端处理时延的 Prometheus 监控</title>
    <link href="https://datakfy.com/8773472891/"/>
    <id>https://datakfy.com/8773472891/</id>
    <published>2023-10-27T10:30:00.000Z</published>
    <updated>2026-01-14T14:42:43.284Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;我们团队的事件驱动系统上线后，基础的 CPU 和内存监控图表一片绿色，标准的 HTTP 网关入口请求时延 P99 也稳定在 50ms</summary>
        
      
    
    
    
    <category term="可观测性" scheme="https://datakfy.com/categories/%E5%8F%AF%E8%A7%82%E6%B5%8B%E6%80%A7/"/>
    
    
    <category term="Node.js" scheme="https://datakfy.com/tags/Node-js/"/>
    
    <category term="Fastify" scheme="https://datakfy.com/tags/Fastify/"/>
    
    <category term="Prometheus" scheme="https://datakfy.com/tags/Prometheus/"/>
    
    <category term="事件驱动架构 (EDA)" scheme="https://datakfy.com/tags/%E4%BA%8B%E4%BB%B6%E9%A9%B1%E5%8A%A8%E6%9E%B6%E6%9E%84-EDA/"/>
    
    <category term="SLI" scheme="https://datakfy.com/tags/SLI/"/>
    
  </entry>
  
  <entry>
    <title>基于事件溯源构建支撑实时与分析双重负载的CQRS读模型</title>
    <link href="https://datakfy.com/9087182586/"/>
    <id>https://datakfy.com/9087182586/</id>
    <published>2023-10-27T10:30:00.000Z</published>
    <updated>2026-01-14T14:42:43.284Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;一个棘手的架构需求摆在面前：我们需要为一个高频资产追踪系统设计后端。该系统必须同时满足两个看似矛盾的目标。第一，为数千个并发用户提供一个实时仪表盘，延迟必须在亚秒级，实时展示资产的最新位置与状态。第二，数据分析团队需要对资产的全生命周期历史进行复杂的ad-hoc查询，例如“</summary>
        
      
    
    
    
    <category term="后端架构" scheme="https://datakfy.com/categories/%E5%90%8E%E7%AB%AF%E6%9E%B6%E6%9E%84/"/>
    
    
    <category term="WebSockets" scheme="https://datakfy.com/tags/WebSockets/"/>
    
    <category term="Memcached" scheme="https://datakfy.com/tags/Memcached/"/>
    
    <category term="JWT" scheme="https://datakfy.com/tags/JWT/"/>
    
    <category term="Event Sourcing" scheme="https://datakfy.com/tags/Event-Sourcing/"/>
    
    <category term="Delta Lake" scheme="https://datakfy.com/tags/Delta-Lake/"/>
    
  </entry>
  
  <entry>
    <title>构建异构微服务体系下的Solr近实时原子更新管道</title>
    <link href="https://datakfy.com/9160834453/"/>
    <id>https://datakfy.com/9160834453/</id>
    <published>2023-10-27T10:30:00.000Z</published>
    <updated>2026-01-14T14:42:43.284Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;项目进入深水区，一个棘手的技术痛点浮出水面。我们的数据科学团队（主力技术栈为Python/FastAPI）需要对用户画像数据进行复杂的、多维度的实时查询，以支撑在线推荐和反欺诈模型。而这些用户画像数据，其源头分散在多个由Java/Spring</summary>
        
      
    
    
    
    <category term="架构与设计" scheme="https://datakfy.com/categories/%E6%9E%B6%E6%9E%84%E4%B8%8E%E8%AE%BE%E8%AE%A1/"/>
    
    
    <category term="Spring Boot" scheme="https://datakfy.com/tags/Spring-Boot/"/>
    
    <category term="FastAPI" scheme="https://datakfy.com/tags/FastAPI/"/>
    
    <category term="Solr" scheme="https://datakfy.com/tags/Solr/"/>
    
    <category term="微服务" scheme="https://datakfy.com/tags/%E5%BE%AE%E6%9C%8D%E5%8A%A1/"/>
    
    <category term="数据一致性" scheme="https://datakfy.com/tags/%E6%95%B0%E6%8D%AE%E4%B8%80%E8%87%B4%E6%80%A7/"/>
    
  </entry>
  
  <entry>
    <title>基于 GitLab CI/CD 自动化部署支持 mTLS 与死信队列的事件中继服务</title>
    <link href="https://datakfy.com/4315702014/"/>
    <id>https://datakfy.com/4315702014/</id>
    <published>2023-10-27T10:30:00.000Z</published>
    <updated>2026-01-14T14:42:43.282Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;团队内部的服务间通信开始出现混乱。最初，各服务通过直接的 HTTP 调用或简单的 Webhook</summary>
        
      
    
    
    
    <category term="DevOps" scheme="https://datakfy.com/categories/DevOps/"/>
    
    
    <category term="Relay" scheme="https://datakfy.com/tags/Relay/"/>
    
    <category term="GitLab CI/CD" scheme="https://datakfy.com/tags/GitLab-CI-CD/"/>
    
    <category term="Dead Letter Queue" scheme="https://datakfy.com/tags/Dead-Letter-Queue/"/>
    
    <category term="mTLS" scheme="https://datakfy.com/tags/mTLS/"/>
    
  </entry>
  
  <entry>
    <title>基于Delta Lake构建多租户分片数据湖的元数据路由Kit实现</title>
    <link href="https://datakfy.com/9196905833/"/>
    <id>https://datakfy.com/9196905833/</id>
    <published>2023-10-27T10:30:00.000Z</published>
    <updated>2026-01-14T14:42:43.284Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;项目初期，为了快速迭代，我们将所有租户的分析型数据全部塞进了一个巨大的Delta Lake表中，通过一个 &lt;code&gt;tenant_id&lt;/code&gt;</summary>
        
      
    
    
    
    <category term="数据工程" scheme="https://datakfy.com/categories/%E6%95%B0%E6%8D%AE%E5%B7%A5%E7%A8%8B/"/>
    
    
    <category term="Kit" scheme="https://datakfy.com/tags/Kit/"/>
    
    <category term="多租户" scheme="https://datakfy.com/tags/%E5%A4%9A%E7%A7%9F%E6%88%B7/"/>
    
    <category term="Delta Lake" scheme="https://datakfy.com/tags/Delta-Lake/"/>
    
    <category term="数据库分片" scheme="https://datakfy.com/tags/%E6%95%B0%E6%8D%AE%E5%BA%93%E5%88%86%E7%89%87/"/>
    
    <category term="PySpark" scheme="https://datakfy.com/tags/PySpark/"/>
    
  </entry>
  
  <entry>
    <title>基于 Micronaut 和 OCI 标准构建管理应用生命周期的 Kubernetes Operator</title>
    <link href="https://datakfy.com/2865623821/"/>
    <id>https://datakfy.com/2865623821/</id>
    <published>2023-10-27T10:15:32.000Z</published>
    <updated>2026-01-14T14:42:43.281Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;团队内部推进 GitOps 已经有一段时间，但总有几个场景覆盖不到。最典型的一个，是基础环境镜像的自动化更新。例如，我们有一个通用的 Java 基础镜像，当它更新了安全补丁并推送到 OCI 仓库后，我们希望所有依赖它的应用 Pod</summary>
        
      
    
    
    
    <category term="云原生" scheme="https://datakfy.com/categories/%E4%BA%91%E5%8E%9F%E7%94%9F/"/>
    
    
    <category term="Micronaut" scheme="https://datakfy.com/tags/Micronaut/"/>
    
    <category term="OCI" scheme="https://datakfy.com/tags/OCI/"/>
    
    <category term="设计模式" scheme="https://datakfy.com/tags/%E8%AE%BE%E8%AE%A1%E6%A8%A1%E5%BC%8F/"/>
    
    <category term="Kubernetes" scheme="https://datakfy.com/tags/Kubernetes/"/>
    
    <category term="核心库" scheme="https://datakfy.com/tags/%E6%A0%B8%E5%BF%83%E5%BA%93/"/>
    
  </entry>
  
  <entry>
    <title>构建动态可配的多租户SaaS平台：从VPC网络隔离到Cassandra数据建模的架构权衡</title>
    <link href="https://datakfy.com/6185675108/"/>
    <id>https://datakfy.com/6185675108/</id>
    <published>2023-10-27T10:15:32.000Z</published>
    <updated>2026-01-14T14:42:43.283Z</updated>
    
    
      
      
        
        
    <summary type="html">&lt;p&gt;最初的多租户设计方案几乎都始于同一个简单的起点：在所有核心数据表中增加一个 &lt;code&gt;tenant_id&lt;/code&gt;</summary>
        
      
    
    
    
    <category term="分布式架构" scheme="https://datakfy.com/categories/%E5%88%86%E5%B8%83%E5%BC%8F%E6%9E%B6%E6%9E%84/"/>
    
    
    <category term="架构设计" scheme="https://datakfy.com/tags/%E6%9E%B6%E6%9E%84%E8%AE%BE%E8%AE%A1/"/>
    
    <category term="Cassandra" scheme="https://datakfy.com/tags/Cassandra/"/>
    
    <category term="VPC" scheme="https://datakfy.com/tags/VPC/"/>
    
    <category term="Nacos" scheme="https://datakfy.com/tags/Nacos/"/>
    
    <category term="多租户" scheme="https://datakfy.com/tags/%E5%A4%9A%E7%A7%9F%E6%88%B7/"/>
    
  </entry>
  
</feed>
