社区
博客
小组
Kubernetes Gateway API SIG
资料
Envoy 中文文档
Kubebuilder 中文文档
云原生资料库
Istio 中文文档
活动
更新
标签
关于
可观测性
如何降低可观测性带来的认知负荷
本文讨论了降低可观测性对认知负荷的影响。在处理大量数据时,我们需要过滤和转换数据点以生成适当的信号,并依赖警报系统来进行人类干预。游戏日是测试响应能力的好机会。在团队中培养协作文化对每个人的福祉至关重要。通过实施这些策略,软件工程团队可以确保他们具备使用和有效理解可观测性信号所需的知识和技能。
Alex Gervais
可观测性
发布于 2023-04-13
字数 3237
阅读时长 15 分钟
阅读英文原文
应用响应时延背后深藏的网络时延
应用异常时,基本可以分为服务访问不通和服务响应慢两个大类。其中服务响应慢的问题定位非常棘手,很多无头案。应用团队有日志和追踪,对于自认为的不可能不合理的事情都会甩给基础设施团队,又由于基础设施团队现有的监控数据缺乏应用的观测视角,通常成为一切「不是我的问题」超自然现象的终极背锅侠,其中以网络团队尤为严重。
李倩
可观测性
发布于 2023-03-08
字数 2286
阅读时长 10 分钟
可观测性实战:快速定位 K8s 应用故障
故障发生在 2023 春节前两天,DeepFlow 团队内部访问工单系统出现问题,影响了所有北京区的同事,这篇文章将详细记录如何利用 DeepFlow 定位到对这次问题根因(网关 MSS 误变更导致报文大于 MTU,大数据报文被丢弃)。
李倩
可观测性
发布于 2023-02-14
字数 1651
阅读时长 8 分钟
可观测性场景下 Grafana Plugin 开发实战
分享可观测性场景下 Grafana Plugin 的开发细节和原理。
周振宇
可观测性
发布于 2022-12-28
字数 3809
阅读时长 17 分钟
Kubernetes 服务异常排障过程全解密
Kubernetes 服务异常排障过程的实践经验分享。
李倩
可观测性
发布于 2022-12-26
字数 2493
阅读时长 11 分钟
SkyWalking 基于 ShardingSphere-Proxy 的 MySQL-Sharding 分库分表的存储特性介绍
在 MySQL 存储基础上 SkyWalking v9.3.0 提供了一种新的存储方式 MySQL-Sharding,它提供了基于 ShardingSphere-Proxy 的分库分表特性,而分库分表是关系型数据库面对大数据量处理的成熟解决方案。
万凯
可观测性
发布于 2022-12-02
字数 2331
阅读时长 11 分钟
KubeCon 北美 2022 可观测性开放日见闻
本文是作者参加 KubeCon 北美 2022 可观测性开放日的见闻分享。
Eric Schabell
宋净超
可观测性
发布于 2022-11-09
字数 1763
阅读时长 8 分钟
阅读英文版原文
论元数据在可观测性中的重要性
虚拟化和容器化让应用的部署环境和运行环境变得复杂起来,系统的复杂度呈指数级增长。在
垂直领域
下各个可观测性开源产品的
侧重点也是不同
,那打通这些产品之间的联系,来构建自己的可观测性平台是一件比较复杂的事情。
陈晨
可观测性
发布于 2022-11-07
字数 4530
阅读时长 21 分钟
DeepFlow 开启 Kube-OVN CNI Kubernetes 集群的可观测性
DeepFlow 在 Kube-OVN CNI 环境的全栈、全链路可观测性建设实践
宋建昌
可观测性
发布于 2022-10-21
字数 6419
阅读时长 29 分钟
DeepFlow AutoLogging 介绍:自动采集应用调用日志和流日志
DeepFlow AutoLogging 可以自动采集网络流日志,并提供丰富的性能指标和精细至每包的 TCP 时序日志,与应用调用日志结合提供完整的全栈回溯能力。
李倩
可观测性
发布于 2022-10-14
字数 5908
阅读时长 27 分钟
««
«
1
2
3
»
»»