Get busy living

Stay Hungry,Stay Foolish


  • 首页

  • 分类

  • 归档

  • gitbook

  • 关于

  • 搜索

让告警大脑透明化:WebhookWise 的全链路可观测性

发表于 2026-07-02 | 分类于 services
一个负责「决定要不要半夜叫醒你」的系统,最大的恐惧是变成黑盒。这篇讲 WebhookWise 怎么把可观测性做成第一等公民——从 OTLP 出口、Alloy 收集、指标/追踪/日志/事件/信号/剖析六类信号,到一个会让「没人看的指标」直接 CI 失败的离线契约。 架构和整体设计见前一篇《Webho ...
阅读全文 »

WebhookWise:把吵闹的告警做成一个小型 AIOps 控制面

发表于 2026-07-02 | 分类于 services
一个「告警太吵、飞书天天刷屏」的痛点,怎么长成了一套带 AI 分析、降噪去重、事务性转发和全链路可观测的告警中枢。这篇讲它是什么,也讲关键设计背后的取舍。 一、从痛点说起监控体系搭起来之后,最先崩的往往不是系统,是人。Prometheus、Grafana、Alertmanager、云监控、飞书机 ...
阅读全文 »

多机代理监控 + GitHub Runner 状态统一接入 Uptime Kuma

发表于 2026-06-24 | 分类于 services
目的:把两类监控——每台机器的代理/网络心跳、GitHub 组织的 self-hosted runner 在线状态——统一接入 Uptime Kuma,掉线告警、看得出是哪台,并各自保留原有的”防误判”逻辑。 这是 《从”代理又挂了”到一套多机监控告警系统》 的落地续篇:那篇手搓了一套云端接收 + ...
阅读全文 »

从"代理又挂了"到一套多机监控告警系统

发表于 2026-06-23 | 分类于 services
一个”代理超时怎么发个通知”的小需求,怎么一步步长成了覆盖 5 台机器、带反向心跳兜底、还顺带监控 GitHub Runner 的告警系统。以及中间那个让我查了半小时的经典 Shell 坑。 起点:一个很小的需求我用 Clash 代理,节点经常抽风。最初的想法特别朴素: 能不能代理超时的时候, ...
阅读全文 »

在 ARM64 + 新内核(6.17) 上踩 Pixie 的坑:从满怀期待到果断放弃

发表于 2026-06-16 | 分类于 services
最近想给自建的 Kubernetes 集群上一套 eBPF 可观测性,第一个想到的就是 Pixie——无需埋点就能看到服务调用拓扑、HTTP/gRPC/SQL 流量、火焰图,听起来很美。 但我的集群是 Oracle Cloud 的 2 节点 ARM64(aarch64),内核 6.17。这篇记录在这 ...
阅读全文 »

hermes 安装与初始化记录

发表于 2026-04-15 | 分类于 services
Hermes Agent 安装使用文档 简介Hermes Agent 是由 Nous Research 构建的开源自对齐 AI 代理。 核心特性 特性 说明 多模型支持 Anthropic、OpenAI、OpenRouter (200+)、NVIDIA NIM、Hugging Face、 ...
阅读全文 »

OpenClaw 安装与初始化记录

发表于 2026-03-30 | 分类于 services
OpenClaw 安装与初始化记录日期: 2026-03-30操作人: imwl主机环境: Linux (aarch64/arm64), OrbStack VMOpenClaw 版本: 2026.3.28 (f9b1079) 1. 环境准备1.1 检查系统环境 项目 值 操作系统 Li ...
阅读全文 »

kuberay简单使用

发表于 2025-05-11 | 分类于 Kubernetes
ray 简介Ray是一个开源的分布式机器学习框架,不仅拥有高效的分布式训练能力,也有丰富的机器学习应用,极大地降低了大规模机器学习的门槛,非常适合人工智能方向的科研人员和工程师们学习! Ray有诸多模块,包括 实现基本分布式能力的Ray Core 进行数据处理的Ray Data 进行训练的Ray ...
阅读全文 »

多个版本流量区分

发表于 2025-05-04 | 分类于 Kubernetes
服务默认 svc 和 pod, 将 latest 全局替换成 v1, v2 ,v3 就是三个不同的版本. 给 latest 多创建了一个 svc myapp123456789101112131415161718192021222324252627282930313233343536373839404 ...
阅读全文 »

cert工具使用

发表于 2025-01-20 | 分类于 services
certimate使用 docker-compose.yaml 配置 12345678910111213services: certimate: image: certimate/certimate:latest container_name: certimate restart ...
阅读全文 »
12…32
WeiLai

WeiLai

好学近乎知,力行近乎仁,知耻近乎勇

313 日志
23 分类
25 标签
GitHub E-Mail 简书 Facebook
© 2026 WeiLai