京东详情页怎么做,京东详情页技术解密?( 四 )


方法tree监控 , 一次请求在单品页SOA系统内部所经过的每一个类的方法作为结点形成这么一颗树 , 这棵树非常直观看到系统内部的依赖结构关系和任何一个节点的请求量的大小 , 如果性能、可用率、异常量、访问量出现异常可第一时间标红报警 , 出现任何故障可第一时间聚焦到具体某一个点上 , 极大提升了定位和处理故障的时间;

京东详情页怎么做,京东详情页技术解密?


异常监控 , 系统依赖的外部服务以及系统内部抛出的任何一条异常的堆栈信息都被异步埋点记录下来 , 进行实时的统计和报警 , 对系统健康度的把控起到至关重要的作用;
京东详情页怎么做,京东详情页技术解密?



京东详情页怎么做,京东详情页技术解密?


用户行为的跟踪 , 详细记录用户在什么时间做了什么事情以及当时的网络情况 , 方便用户出现问题时回放出问题时的现场 , 快速帮助用户解决问题 。
监控细节还有很多 , 以上几个监控手段对当前业务系统帮助非常大也是非常实用的一些能力 , 现在业务系统已经做到非常透明 , 任何人都可以清晰看到系统的健康度 , 并且部分服务具备通过故障自动容错的能力 , 对系统整体的稳定性提供了非常大的保障 。
6. 限流手段
京东APP上所有商品价格库存都是分区域的 , 因此很多刷子以及爬虫不断的来爬京东各区域的价格、库存和促销信息等 , 有一个很明显的特征就是大量刷子刷时用户登录态的占比会明显下降 , 因此单品页针对用户的行为实时行为数据进行分析和控制:
流量清洗能力 , 根据用户的pin、IP的实时分析和清洗 , 并可以根据已登录和未登录做不同策略;
系统过载保护能力 , 任何时候不能让系统挂掉 , 把明显的恶意流量清洗之后进行按一定策略进行排队 , 保障流量不超过系统极限负载 , 同时给用户比较友好的一些交互体验 。
7. 压测
单品页压测比较麻烦 , 一方面压测的流量大 , 对线上可能会造成很多不可预知的问题 , 另一方面涉及的基础服务比较多 , 牵涉的人就多 , 每次压测要协调上下游几十号人支持 , 协调成本比较高 , 第三方面压测的商品数量都在上百万的商品 , 每次压测的SKU会变更 , 脚本变更比较大 , 第四每次压测完成之后需要人工形成压测报告并分析其中的薄弱环节问题 , 因此APP端产出了一个自己的压测平台 , 通过流程方面来协助解决以上几个问题:
启动压测任务可自动收集压测数据并产出需要的压测脚本:
线上流量的隔离;
通知相关方 , 确认压测时间和压测方案;
按照压测脚本逐步进行压测任务执行;
形成压测报告 , 并分析压测过程中问题点 。
压测数据准备方面:
线上流量日志进行回放 , 并且按照压测目标放大到一定倍数来回放;
按照各品类的流量占比选出一部分商品作为热点数据来进行压测 , 检验各环节对热点数据的处理是否合理;
针对一些埋点以及统计要能清洗掉这部分数据 , 目前主要是根据请求的一些固定特征 , 比如设备号和特殊标识来进行区分 , 并且上下游都要能做到一致的数据清洗规则 。

推荐阅读