云服务器价格_云数据库_云主机【优惠】最新活动-搜集站云资讯

专属服务器_cdn加_怎么买

小七 141 0

持续智能:更多信号,更少噪音

这是第七个人类学家的博客。这个博客讨论的是监控,CAMS中的M(文化、自动化、监控和共享)。监控对于任何DevOps组织都是极其重要的。好的、有效的监控是难以实现的。有必要从IT监控转向持续情报。软件开发和交付生命周期的持续智能可以采取"袖珍NOC"的形式,即实时、平视地显示有关系统状态、软件产品开发和交付的信息。我在continuous delivery和DevOps行业工作了九年,在这期间我做了很多观察。我见过成功的策略,也有失败的。我的目标是帮助你成为成功者之一!我很乐意听到您对持续交付的意见和经验德沃普斯。大熊猫最近发布了《2016年监测状况》,这是一份关于监测的调查,分发给1700多名行业专业人士。他们说,"2016年,系统性能和可用性对声誉和品牌忠诚度的影响比以往任何时候都更为直接和关键。it团队的绩效越来越被用来衡量业务的结果,这也许并不奇怪,客户满意度和SLA合规性领先于"传统"绩效指标,如事件量和平均修复时间(MTTR)"[1],大熊猫发现前五大监控挑战是:83%的报告难以快速补救服务中断79%的报告难以降低组织的警报噪音监控工具78%报告难以确保适当监控工具的预算76%报告难以快速识别服务中断75%报告难以将服务迁移到云端他们进一步报告了2016年最预期的IT监控挑战是:结垢监测随着增长改进监控策略警报相关性或噪音降低保持SLA或其他性能kPicloud migrationGene Kim的三种方法是可以用来应对监控最困难的挑战的原则。三种方式是:第一个方法:系统思考-关注整个系统的性能,关注由它。那个第二种方法:扩大反馈循环-重点是增加反馈和对所有相关团队的理解。这样做的结果将是增加与所有客户的沟通和响应,缩短和扩大所有反馈回路,并将知识嵌入到客户的位置和对象需要。那个第三种方式:不断实验和学习的文化——将实验和实践融入工作文化中。鼓励从风险中学习,不断重复和练习,这是掌握知识的关键。并提供所需的改进技能,同时提高所需的风险。[2] 应用Gene Kim的第一种系统思维方式需要查看完整的DevOps工具链,并决定监控和提取哪些信息。根据维基百科,DevOps工具链如下所示:[3]代码-代码开发和审查,持续集成工具构建-版本控制工具,代码合并,构建状态测试-测试和结果确定性能包-工件存储库,应用程序预部署阶段发布-变更管理,发布批准,发布自动配置-基础设施配置和管理,基础设施作为代码工具监控-应用程序性能监控,最终用户体验-有了深思熟虑的系统知识,就可以解决第二种方法。此步骤是实际的监视、警报和日志记录步骤。第一种方法的分析结果为监控系统提供了反馈接触点。它是对谁、什么、何时、为什么、地点和方式等问题的答案。这是系统本身开始表达关于自身的智能的步骤。如果这种情报被提炼出来并变成可操作的信息,它就可以变得连续。持续智能可以提供一个由9个可操作的监控项目组成的"袖珍NOC",安装在智能手机屏幕上。经理袖珍NOC的九个重要指标示例是:部署频率:多久部署一次代码,多久一次被客户使用?这一指标每周都会上升或保持稳定。例:一周两次,每次50次一天。改变数量:对于每个部署,有多少用户情景和新的代码行被投入生产?示例:每天3个新特性,平均每周500行新代码。除了体积外,另一个要考虑的参数是改变。引导时间(从开发到部署):通过a/B测试周期,从开发到100%部署并在生产上升级,平均需要多长时间?随着团队更好地掌握生命周期百分比失败部署的数量:导致中断或负面用户反应的部署失败的百分比是多少?这个指标应该会随着时间的推移而减少。示例:本月有9%的部署失败,而上个月只有15%。该指标应结合变更量进行审查。如果更改量很低或保持不变,但失败部署的百分比增加,则可能存在故障在某个地方。卑鄙恢复时间:当我们失败时,我们花了多长时间才恢复过来?这是一个真实的指标,表明你在处理变化方面有多好,这应该随着时间的推移而减少。由于以前没有遇到过的复杂问题,您可以预期这个数字会出现一些峰值。上个星期团队平均花费15分钟来解决问题,而这个问题需要14分钟周。顾客票务量:客户生成的用于指示服务中的问题的警报数。顾客满意度是一个基本的指标。例如:本周生成的票数为54张,而用户量保持稳定的情况下为38张,这不是一件好事。%n用户量的变化:新用户注册、与服务交互并产生流量的数量。随着新用户的加入,我的基础设施是否能够满足需求?本周,由于一个外部事件导致大量的请求被删除,客户数量猛增了30%提高可用性:服务的总体正常运行时间是多少?我是否违反了任何SLA?示例:即使用户发生变化,过去3个月的正常运行时间仍保持在99.9%音量。性能(响应时间):我的服务是否在预定的阈值内执行?无论用户数量或任何新部署的百分比变化如何,此指标都应保持稳定。示例:来自所有地理位置和设备的响应时间低于5秒。[4]我们将从第二种方式停止,因为这是一篇关于监视的博客文章。吉恩·金的第三条路,创造一种不断试验和学习的文化,这将是一篇未来的博客文章本身。托马斯McGonagle全球服务CloudBees高级DevOps顾问[1]?utm_medium=社交&utm_source=twitter&utm_campaign=国家监控网络研讨会[2]https://en.wikipedia.org/wiki/DevOps[3]https://en.wikipedia.org/wiki/DevOps[4]: 德沃斯文化人类学家的田野笔记第2部分:复合词:持续的交付需要持续的遵从第3部分:5DevOps隐喻第4部分:DevOps Dojos:实践和指导的安全场所第5部分:Bramavihara:DevOps的四个不可估量第6部分:聊天:DevOps的促进剂第7部分:持续智能:更多的信号,更少的噪音第8部分:将操作放在DevOps中:第1部分