2022 年度工作总结

年度感受是既无聊又有意思,挑战不大,技术提升不大

给领导

监控平台

  • 告警渠道切换开发上线,全部通过飞书实现
  • 数据类监控开发上线,主要对象是阿里云数据类监控,面向运维和研发
  • 监控回调功能开发上线,主要面向运维,用于监控信息的告警回调
  • 监控平台内权限管理开发上线,用户只能看到自己关心的内容
  • 告警规则和告警路由的细节开发,用户可以只关心自己想看的告警
  • 日志服务细节开发,不同主体账户的接入,以及权限管理
  • 客户端功能开发上线,如进程类监控,可参数化配置启动基础监控,pushgateway 功能

账单平台

  • 前期主要维护老的 OpsMind 账单平台,输出财务数据
  • 后期主要新开发独立的账单平台
  • 账单可视化功能,能够直观看到项目组使用的钱占比
  • 账单查账功能,能够满足用户更加仔细查询资源的费用
  • 账单拆分功能,针对公共项目拆分金额到具体相关项目组
  • 机器使用率可视化,能够查询项目资源的资源使用率,对资源升降配提供数据支撑

给自己

监控平台

将监控平台所涉及的点基本输出成了小册

用户提到的一些需求还是很有价值的

  • 告警路由的正则匹配
  • 要监控但是不要告警
  • 告警信息太多,噪音太大
  • 监控大屏自定义,但是用户都不太会自主配置
  • Prometheus 的 remote read 和 write 功能
  • 客户端的参数自定义
  • pushgateway

面临的终极问题还是接入和推广的不积极,导致我的动力不足

账单平台

就是一坨屎,毫无意义可言,没有后续动作的设计就是一坨屎

本身 finops 的原则是一个闭环的设计,有数据、有输出、有调整

我们现在面临的是有数据、有输出,无调整,没有调整就没有持续的活力

权限设计

还是很值得一提的,但是现在的设计方式不是很好

基于分组的设计,而且逻辑大部分在前端

结语

跟聪明的人交流是一件很舒服的事情,比如跟对应的研发沟通,他也知道你说的是啥,你也知道他说的是啥

比如跟运维沟通,你发现他说的方案不是很好,而你说出的好的方案他不理解或者抓不到你的重点

要么是你笨要么是他笨,总之一方满足不了另一方

你们的信息不对等

但是

虽然工作看起来不是很畅快,但是我们要寻找一些积极的意义

比如你很不乐意许多事情,首先是你的位置决定了的,那么你就需要做自己认可的事情

也许明年要换个环境了,或者说往上走一步了

上次更新:
贡献者: kongzZ