PVE 直通 RTX 6000D 大显存算力卡硬核排障实录
本文记录在 H3C 服务器 PVE 环境下,将 NVIDIA RTX 6000 Ada(48G 大显存纯算力卡)直通给 Windows/Linux 虚拟机,并彻底解决“代码 43”及“Fallen off the bus”报错的完整排坑过程。适用于需要在开启 SR-IOV 的企业级服务器上部署大显存 GPU 的运维与 AI 基础设施工程师。阅读本文,你将获得从底层 BIOS MMIO 寻址排查到 PVE 虚拟机配置的最佳实践,避免在客机驱动与注册表层面做无效消耗。
搭建大模型 API 中转并用于国内数据蒸馏:基于 sub2api 的部署
前言:本文给出一个基于 sub2api 的最小可复现部署方案,用于统一接入上游大模型服务,并将其暴露为内部可控的 API 入口,适合需要做数据清洗、批处理、文本标准化或轻量服务编排的个人开发者与小团队。全文重点覆盖环境与版本、部署路径、配置要点、验证方法与运维边界,并补充许可证与合规提醒,帮助你快速判断“能不能用、怎么落地、上线前还缺什么”。
PVE制作Windows11镜像模板
这篇文章给出一套可复现流程:在 Proxmox VE(PVE)上把 Windows 11 做成可克隆、可在 PVE 面板注入用户名/密码/静态 IP/主机名、并且宿主机能读取 IP / 优雅关机的基础通用模板。适用对象是需要批量交付 Windows VM 的运维/平台/研发同学;你会得到一套从建 VM、安装驱动与 Guest Agent、接入 Cloud-Init(ConfigDrive + Cloudbase-Init)、泛化封模和常见故障定位的完整 SOP。
K8s 常用命令手记
前言:这是一份偏“随用随查”的 K8s 命令手记,覆盖排障、发布、日志、网络、Ingress/真实 IP、以及开发调试常见操作。适合日常运维/开发在集群里定位问题、验证配置、快速改动资源。你会得到:一套可复制粘贴的命令清单 + 真实 IP(X-Forwarded-For)落地要点 + 常见“暂停容器/挂起 Pod”技巧。
PVE制作Ubuntu24镜像模板
这篇文章讲清楚:如何在 Proxmox VE(PVE)上把 Ubuntu 24.04 做成可克隆、可注入配置、可被宿主管理的基础通用模板。适用对象是准备批量交付 VM 的运维/平台/研发同学;你会得到一套可复现流程:预装最小通用工具、安装并保证 qemu-guest-agent 开机可用、补齐 Cloud-Init 驱动器并让 PVE 面板可注入用户名/SSH Key/IP、最后做模板泛化清理避免克隆冲突。
ZFS Mirror vs mdadm RAID1:Linux 双盘镜像搭建、故障演练与性能实测
ZFS 在 Linux 上越来越常见:它把文件系统 + 软件 RAID + 校验 + 快照/发送接收打包成一个整体,尤其适合对数据可靠性有要求的场景(虚拟化、数据库、备份仓库等)。
这篇文章记录我在 Ubuntu 22.04 上用两块盘搭建 ZFS Mirror(等价 RAID1)、做 fio 性能压测,并进行一次“拔盘换盘”的灾难演练过程。过程中也踩到了一些典型坑:比如 设备命名漂移(sdb/sdc 交换)、以及 4K 随机读压测结果“离谱地慢/离谱地快”的原因,需要指出的是ZFS带来高级特性的同时,也会降低读写性能。
⚠️提示:本文包含清盘/创建 zpool 的危险命令,请勿在生产环境盲目复制。
一次 K8s 集群内网故障的排查记录
本文记录了一次 Kubernetes 集群内 Pod 间网络极度缓慢 的排障过程,并借机系统性梳理了几种常见的 K8s 网络模式(VXLAN Overlay、host-gw、Calico IPIP/BGP、eBPF 等)。
核心经历:
使用 Docker 快速搭建 Redis 数据库
Redis 是一个高性能的内存数据结构存储,既可作数据库、缓存,也可作消息中间件。它支持字符串、哈希、列表、集合、有序集合、位图、HyperLogLog、地理位置与流等丰富类型,提供持久化、主从复制、哨兵与集群高可用。典型用途包含会话管理、热点缓存、分布式锁、排行榜、计数器、实时订阅发布与流式分析,常见于高并发、低延迟的电商、社交、游戏与物联网场景。使用简单,性能可达百万级QPS,可靠,生态更好。
跨语言任务队列代码实战:Spring Boot + RabbitMQ + Celery 全链路打通
在工业软件相关场景里,后端经常需要把耗时、异步、可并行的任务(如模型推理、文件转码、批处理)从 HTTP 同步链路中剥离出去。最常见的做法是:Java(Spring Boot)作为生产者 → RabbitMQ 作为消息中间件 → Celery(Python)作为消费者/Worker。本文基于真实项目,梳理一套可直接落地集成方案,覆盖关键配置与坑点,帮助你在实际生产环境稳定运行。
使用 Docker 快速搭建 PostgreSQL 数据库
在过去十多年里,MySQL 一直是 Web 开发的首选数据库,尤其是在 LAMP(Linux + Apache + MySQL + PHP)架构盛行的年代。但近年来MySQL 被 Oracle 公司主导,许可证改为 GPL v2 协议,越来越多的企业和开发团队选择 PostgreSQL 作为核心数据库。
在这篇文章中,我们将介绍如何利用 Docker Compose 快速部署 PostgreSQL 数据库,并结合其他常见数据库系统进行对比,帮助你更好地理解 PostgreSQL 的优势和适用场景。










