2022 年度工作总结
年度感受是既无聊又有意思,挑战不大,技术提升不大
给领导
监控平台
- 告警渠道切换开发上线,全部通过飞书实现
- 数据类监控开发上线,主要对象是阿里云数据类监控,面向运维和研发
- 监控回调功能开发上线,主要面向运维,用于监控信息的告警回调
- 监控平台内权限管理开发上线,用户只能看到自己关心的内容
- 告警规则和告警路由的细节开发,用户可以只关心自己想看的告警
- 日志服务细节开发,不同主体账户的接入,以及权限管理
- 客户端功能开发上线,如进程类监控,可参数化配置启动基础监控,pushgateway 功能
账单平台
- 前期主要维护老的 OpsMind 账单平台,输出财务数据
- 后期主要新开发独立的账单平台
- 账单可视化功能,能够直观看到项目组使用的钱占比
- 账单查账功能,能够满足用户更加仔细查询资源的费用
- 账单拆分功能,针对公共项目拆分金额到具体相关项目组
- 机器使用率可视化,能够查询项目资源的资源使用率,对资源升降配提供数据支撑
给自己
监控平台
将监控平台所涉及的点基本输出成了小册
用户提到的一些需求还是很有价值的
- 告警路由的正则匹配
- 要监控但是不要告警
- 告警信息太多,噪音太大
- 监控大屏自定义,但是用户都不太会自主配置
- Prometheus 的 remote read 和 write 功能
- 客户端的参数自定义
- pushgateway
面临的终极问题还是接入和推广的不积极,导致我的动力不足
账单平台
就是一坨屎,毫无意义可言,没有后续动作的设计就是一坨屎
本身 finops 的原则是一个闭环的设计,有数据、有输出、有调整
我们现在面临的是有数据、有输出,无调整,没有调整就没有持续的活力
权限设计
还是很值得一提的,但是现在的设计方式不是很好
基于分组的设计,而且逻辑大部分在前端
结语
跟聪明的人交流是一件很舒服的事情,比如跟对应的研发沟通,他也知道你说的是啥,你也知道他说的是啥
比如跟运维沟通,你发现他说的方案不是很好,而你说出的好的方案他不理解或者抓不到你的重点
要么是你笨要么是他笨,总之一方满足不了另一方
你们的信息不对等
但是
虽然工作看起来不是很畅快,但是我们要寻找一些积极的意义
比如你很不乐意许多事情,首先是你的位置决定了的,那么你就需要做自己认可的事情
也许明年要换个环境了,或者说往上走一步了