Kubernetes APF（API 优先级和公平调度）简介

凌虚 published on 2024-12-23 included in Kubernetes

在 Kubernetes 集群中，kube-apiserver 是一个至关重要的组件，它不仅要对外响应客户端的 HTTPS 请求，还要对内与 controller-manager

我对 OpenAI Kubernetes 集群故障的追问与疑惑

凌虚 published on 2024-12-19 included in Kubernetes

2024 年 12 月 11 号，OpenAI 的 Kubernetes 集群发生故障，API、ChatGPT、Sora 等服务都受到了影响，且时间长达 4 小时 22 分钟。关于这次故障，官方有

系统组件优化的思考框架

凌虚 published on 2024-12-14 included in 系统架构

我之前的文章里有分享过自己总结的做技术选型的思考框架，本文将会分享一下我总结的做系统组件调优/优化的思考框架。组件优化的思考框架常见的互联网

Kubernetes：CPU 配置、Linux CFS、编程语言的性能问题

凌虚 published on 2024-12-11 included in Kubernetes

Kubernetes CPU 配置 -> Linux CFS 在使用 Kubernetes 时，可以通过 resources.requests 和 resources.limits 配置资源的请求和限额，例如： 1 2 3 4 5 6 7 8 9 10 11 12 13 apiVersion: v1 kind: Pod metadata: name: nginx spec: containers: - name: app image: nginx resources: requests: cpu: "250m" limits: cpu: "500m" 对容

Kubernetes 集群网络：Flannel 与 Calico 的区别

凌虚 published on 2024-11-30 included in Kubernetes

有读者提问：Flannel 与 Calico 的区别。文本将解析一下这两个组件。 Flannel Flannel 的架构非常简单，只有两个组件：flanneld 和 flannel-cni-

AI 声音：数字音频、语音识别、TTS 简介与使用示例

凌虚 published on 2024-11-28 included in AI

在现代 AI 技术的推动下，声音处理领域取得了巨大进展。从语音识别（ASR）到文本转语音（TTS），再到个性化声音克隆，这些技术已经深入到我们的日

Web 端语音对话 AI 示例：使用 Whisper 和 llama.cpp 构建语音聊天机器人

凌虚 published on 2024-11-24 included in AI

大语言模型（LLM）为基于文本的对话提供了强大的能力。那么，能否进一步扩展，将其转化为语音对话的形式呢？本文将展示如何使用 Whisper 语音识别和 llama.cpp 构建

构建自己的框架去做技术选型

凌虚 published on 2024-11-21 included in 系统架构

技术选型无处不在，你可能需要选择一种类库、选择一个框架、选择一种语言、选择一种组件、选择一个架构模式、选择一种系统方案……。那么如何构建一个

RAG 示例：使用 langchain、Redis、llama.cpp 构建一个 kubernetes 知识库问答

凌虚 published on 2024-11-19 included in AI

RAG（Retrieval Augmented Generation 检索增强生成）是目前业界中的一种主流方法，通过增加额外知识的方式来减少大语言模型（LLM）的幻觉问题（一本正经

Kubernetes 10 问，测测你对 k8s 的理解程度

凌虚 published on 2024-11-16 included in Kubernetes

Kubernetes 10 问假设集群有 2 个 node 节点，其中一个有 pod，另一个则没有，那么新的 pod 会被调度到哪个节点上？应用程序通过容器的形式运行，如果 OOM（Out-

1
2
3
10