官方 公众号矩阵 移动端 51CTO 体育开源基础软件社区 BOB体育栈 BOB体育官方微 BOB体育官方 BOB体育 BOB体育训练营 体育开源基础软件社区订阅号 BOB体育官方APP BOB体育官方企业版APP 体育开源基础软件社区视频号
# 一分钟精华速览 #混沌工程作为一种提高体育架构弹性能力和容错能力的复杂体育手段,近年来讨论声音不断,相比在分布式官方上进行随机的故障注入实验,基于混沌工程的大规模自动化故障演练,不仅能将“作战演习”常态化,还能通过提高覆盖面而获得更高的产出价值,帮助更全面地完善故障应急预案和处理体系。此前 TakinTalks 分享了去哪儿在过去 3 年里 4 个阶段的混沌工程能力建设(破坏官方是为了更稳
# 一分钟精华速览 #混沌工程是在分布式官方上进行实验,在整个官方中随机位置通过工具引发故障,从而提高官方健壮性以及人员的响应效率,建立对官方抵御生产环境中失控条件的能力以及信心的手段。虽然混沌工程已经发展了十余年,但对大部分公司和研发团队,它仍是一个比较陌生的领域。本文总结了去哪儿 2019 年至今,从零开始建设混沌工程平台的 4 个阶段,以及各阶段的落地成果,整体建设思路和落地路线极具参考性。
货拉拉体育稳定性团队负责人——李全TakinTalks 社区特邀讲师。2021 年加入货拉拉,现任货拉拉体育稳定性团队负责人,主导了公司体育稳定
一分钟精华速览本文概述了挚文集团(陌陌和探探母公司)在微服务架构下解决故障定位问题中遇到的痛点、解决方案以及取得的效果。通过构建统一可观测平台,实现了故障快速定位,大幅提升了问题定位的效率。文中还讨论了存储优化、数据采集、链路追踪等相关细节。总体上,可观测平台在挚文集团内部已得到了广泛运用和较好的业务支撑成效。关键词:可观测性;微服务;监控;链路追踪 作者介绍 挚文集团基础平台体育总监——童子龙
一分钟精华速览全栈可观测是一种更全面、更综合和更深入的观测能力,能协助全面了解和监测官方的各个层面和组件,它不仅仅是一个体育上的概念,更多地是体育与业务的结合。在“以业务为导向”的大前提下,全栈可观测正在成为趋势。本文分享了阿里云可观测平台服务作为全球分布的超大业务官方,同时也作为服务全球企业用户的可观测平台提供方,在故障洞察提效中遇到的业务挑战,以及 6 个关键体育点和 2 个应用案例。作者介绍
一分钟精华速览 本文概述了挚文集团(陌陌和探探母公司)在微服务架构下解决故障问题中遇到的痛点、解决方案以及取得的效果。通过构建统一可观测平台,实现了故障快速,大幅提升了问题的效率。文中还讨论了存储优化、数据采集、链路追踪等相关细节。总体上,可观测平台在挚文集团内部已得到了广泛运用和较好的业务支撑成效。 关键词:可观测性;微服务;监控;链路追踪 作者介绍 挚文集团基础平台体育总监——
一分钟精华速览 全栈可观测是一种更全面、更综合和更深入的观测能力,能协助全面了解和监测官方的各个层面和组件,它不仅仅是一个体育上的概念,更多地是体育与业务的结合。在“以业务为导向”的大前提下,全栈可观测正在成为趋势。 本文分享了阿里云可观测平台服务作为全球分布的超大业务官方,同时也作为服务全球企业用户的可观测平台提供方,在故障洞察提效中遇到的业务挑战,以及 6 个关键体育点和 2 个应用案例。
一分钟精华速览 每一位被故障折磨的稳定性负责人,都或多或少面临自证的困境:如何证明今年的稳定性工作是出色的?在无法完全避免故障发生的前提下,如何证明稳定性保障工作的价值?在团队和工具尚不完备时,如何高效率推进稳定性建设工作? 本期邀请货拉拉稳定性负责人,从全局视角分享如何在 2 年内从 0-1 建立稳定性度量体系建设的经验,官方介绍稳定性指标度量的价值、落地方法及成效。 作者介绍 货拉拉体育稳
以业务为核心进行,统一建设可截图免费领取以上所有资料。
实际精力,年底整体的可用性确实提升了很多。
去哪儿网测试會員註冊专家——鲁国宁TakinTalks 社区专家团成员。2019 年加入去哪儿网,负责测试流程的治理和测试工具建设。主
一分钟精华速览 去哪儿发布的数据显示,在过去一年中,其发布故障率始终保持在 4‰ 以下并不断降低。作为一家出行旅游服务平台,去哪儿网如何在复杂的业务场景下,仍能保持如此低的故障率?其中功能测试左移功不可没。 本文介绍了去哪儿网通过自动化测试、智能推荐、本地化等平台的建设,在低成本、低故障率、高效率方面的显著成效,并详细介绍了各阶段的实践重难点。 作者介绍 去哪儿网测试會員註冊专家——鲁国宁 Tak
一分钟精华速览 流量录制与回放体育在故障排除、性能优化和升级迁移等方面具有重要的应用价值。流量录制是指记录网络通信过程中的数据包,包括请求和响应数据,以便后续分析和调试。流量回放则是将录制的数据包重新发送到网络中,以模拟真实的网络通信环境,验证网络应用BOB体育的性能和稳定性。 本文以去哪儿网为例,介绍流量录制与回放实践,探讨其在接口自动化测试和全链路压测中的应用成效。 作者介绍 去哪儿高级Java
一分钟精华速览容量保障的目标是保证服务在大量用户访问时,依然可以正常为用户提供服务。比如
一分钟精华速览全链路压测之所以被誉为电商大促备战的 “核武器” ,是因为它基于实际的生产业
中国人寿研发中心高级工程师——刘玢TakinTalks社区专家团成员。拥有多年會員註冊和运维经验
中国人寿将无侵入在线压测作为防御稳定性风险的重要手段,作为保险行业首家落地生产全链路压测的企业,其实践经验具有相当的借鉴意义。
一分钟精华速览 越来越多企业正在通过故障注入和演练的方式提升官方可靠性,这其中金融行业的应用较为特殊。一方面其可靠性要求比非涉账类官方更高;另一方面金融行业有更加严格的监管要求,如客户、账目等信息都有严格约束。加之金融官方较其他行业官方更加庞大、繁杂,所以金融行业落地混沌工程和故障演练等工作需尤为谨慎、严谨。 本文介绍了中国人寿故障演练的项目背景、目标思路、体育方案等,分享其在预知故障和降低不确定
以B站直播业务为例,直播作为一个大部门,假设整体容量使用率是 40%,想要提高使用率,通过直观的可视化报表可以看到直播大部门下
微盟基础架构团队体育专家——戴明智TakinTalks社区专家团成员,SpringFramework、Apache Skywalking社区Contributor,个人官方阅读量100w+。2019年入职微盟,基础架构团队体育专家,参与并负责微盟全链路灰度平台的建设。
一分钟精华速览 全链路灰度发布是指在微服务体系架构中,应用的新、旧版本间平滑过渡的一种发布方式。由于微服务之间依赖关系错综复杂,一次发布可能会涉及多个服务升级,所以在发布前进行小规模的生产环境验证,让新版本的应用实例来承接、处理限定规模或范围的业务流量,能最大限度控制发布上线风险,保证业务连续性。 本文详细解读微盟全链路灰度平台实践难点、解决思路及使用场景,还原其服务百万商家客户的全过程。 作者
一分钟精华速览在典型的分布式官方中,用户的一个请求到达组合的前端服务后,前端服务会分发请求到内部的各个服务,每次调用都涉及跨官方的一次请求和一次响应。在有大规模、高并发请求量的官方中,如何标识这些请求及存储这些调用信息,并形成调用链?如果官方的某两个服务间出了问题,又如何为业务方提供可视化的展现形式以快速排障?本文总结了微盟支持千亿级规模的调用链实践,详解平台的建设目标、设计思路和落地效果。作者介
一分钟精华速览应急预案,是指在官方出现故障时,为了保障核心业务能够持续可用,而提前准备的指导手册。这个手册可以用来告诉我们:在遇到什么样的问题后,做什么样的操作能最大化地降低对业务的影响,将被动响应变为主动防御。哈啰结合“930大促”活动,从多角度分享了其在日常梳理、预案保鲜、预案执行等方面的实践经验。作者介绍 哈啰体育风险负责人——孟闯 TakinTalks稳定性社区专家团成员。十年互联网行业研
一分钟精华速览 当成千上万的服务器都处于低利用率时,就意味着巨额的浪费,良好的容量管理可以帮助消除某些“最后时刻”的临时应急式的盲目或者超量采购。除了成本合理控制方面,容量管理还要预估对客户可能产生影响的业务发展和风险变化。 B站在降本增效大背景下,从业务视角对整体容量做了可视化管理,本文详细描述了其容量管理的背景、思路及成效。 作者介绍 哔哩哔哩资深SRE专家 张鹤 TakinTalks社
一分钟精华速览 可观测能力是指在复杂的软件官方中能及时、准确感知到服务状态,特别是异常或故障的发生,确定异常的影响范围、异常部位边界、判定异常点位、并由相关人员或软件做出准确决策的能力。 本文作者结合虎牙SRE实践及20余年架构、研发、运维经验,重点讲述如何设计和建设观测能力,做到分钟级感知故障、定位和快恢。 作者介绍 《SRE原理与实践》作者 张观石 TakinTalks稳定性社区专家团成
一分钟精华速览 聊稳定性治理的文章很多,但面对官方的“各类疾病”,到底该从哪里着手才能立竿见影,怎么才能“药到病除”?相信在看这个问题时,大家会抱着“能不能学两招回去用”的心态阅读。 「TakinTalks论道系列」第3期,我们采访了4位资深从业人员,分别从CTO、稳定性负责人、SRE架构师、研发工程师等不同视角,去了解大家经验里比较好用、能够落实的“独门秘籍”。 温馨提醒:本文约4000字,预
引言 保险业务的数字化转型正如火如荼地进行,产品线上化、投保线上化、承保线上化、核保线上化等业务转型,导致官方的应用范围不断扩大,用户的高频访问也正在成为常态。同时,官方复杂性也呈指数上升,这些因素都增加了官方的稳定性风险。 中国人寿将无侵入在线压测作为防御稳定性风险的重要手段,作为保险行业首家落地生产全链路压测的企业,其实践经验具有相当的借鉴意义。 作者介绍 中国人寿寿险研发中心高级工程师
引言保险业务的数字化转型正如火如荼地进行,产品线上化、投保线上化、承保线上化、核保线上化等业务转型,导致官方的应用范围不断扩大,用户的高频访问也正在成为常态。同时,官方复杂性也呈指数上升,这些因素都增加了官方的稳定性风险。中国人寿将无侵入在线压测作为防御稳定性风险的重要手段,作为保险行业首家落地生产全链路压测的企业,其实践经验具有相当的借鉴意义。作者介绍 中国人寿寿险研发中心高级工程师 熊军军
一分钟精华速览容量保障的目标是保证服务在大量用户访问时,依然可以正常为用户提供服务。比如,在“双11”购物节的超高访问量下,各电商官方依然能够稳定地运行,可以说容量保障是所有体育人都应当具备的技能。知名体育体育官方老张结合其在电商行业多年的容量保障经验,官方梳理了一套容量保障方法,分享了如何根据业务场景制定容量保障的目标,以及如何从点到面官方地落实容量保障工作。!file(http://s2.51c
一分钟精华速览全链路压测之所以被誉为电商大促备战的“核武器”,是因为它基于实际的生产业务场景、官方环境,模拟海量的用户请求和数据对整个业务链进行压力测试,能真实反映官方的状况,对官方风险和瓶颈真正做到心中有数。微盟作为电商SaaS的龙头企业,支撑着数十万中小电商企业的经营,那么在电商大促中微盟官方面临过哪些容量保障挑战?他们的全链路压测又是如何发挥作用的?!file(http://s2.51ct
Copyright © 2005-2023 版权所有