在 Kubernetes 集群中,kube-apiserver 是一个至关重要的组件,它不仅要对外响应客户端的 HTTPS 请求,还要对内与 controller-manager
2024 年 12 月 11 号,OpenAI 的 Kubernetes 集群发生故障,API、ChatGPT、Sora 等服务都受到了影响,且时间长达 4 小时 22 分钟。 关于这次故障,官方有
凌虚 published on included in 系统架构 我之前的文章里有分享过自己总结的做技术选型的思考框架,本文将会分享一下我总结的做系统组件调优/优化的思考框架。 组件优化的思考框架 常见的互联网
Kubernetes CPU 配置 -> Linux CFS 在使用 Kubernetes 时,可以通过 resources.requests 和 resources.limits 配置资源的请求和限额,例如: 1 2 3 4 5 6 7 8 9 10 11 12 13 apiVersion: v1 kind: Pod metadata: name: nginx spec: containers: - name: app image: nginx resources: requests: cpu: "250m" limits: cpu: "500m" 对容
有读者提问:Flannel 与 Calico 的区别。文本将解析一下这两个组件。 Flannel Flannel 的架构非常简单,只有两个组件:flanneld 和 flannel-cni-
凌虚 published on included in AI 在现代 AI 技术的推动下,声音处理领域取得了巨大进展。从语音识别(ASR)到文本转语音(TTS),再到个性化声音克隆,这些技术已经深入到我们的日
凌虚 published on included in AI 大语言模型(LLM)为基于文本的对话提供了强大的能力。那么,能否进一步扩展,将其转化为语音对话的形式呢?本文将展示如何使用 Whisper 语音识别和 llama.cpp 构建
凌虚 published on included in 系统架构 技术选型无处不在,你可能需要选择一种类库、选择一个框架、选择一种语言、选择一种组件、选择一个架构模式、选择一种系统方案……。 那么如何构建一个
凌虚 published on included in AI RAG(Retrieval Augmented Generation 检索增强生成)是目前业界中的一种主流方法,通过增加额外知识的方式来减少大语言模型(LLM)的幻觉问题(一本正经
Kubernetes 10 问 假设集群有 2 个 node 节点,其中一个有 pod,另一个则没有,那么新的 pod 会被调度到哪个节点上? 应用程序通过容器的形式运行,如果 OOM(Out-