观察云是面向开发、运维、测试、业务团队的实时数据监控平台,可以统一满足云、云原生、应用、业务的监控需求,快速实现基础设施、中间件、应用层、业务层的可观测性。 基础设施监控、日志指标管理、应用性能监控、用户访问监控、可用性监控、异常检测、系统级安全检查、CI可视化、场景和看板是“观察云”的可观测解决方案,通过统一的数据采集、全面的数据监控、无缝关联分析、自定义等功能,为用户提供更快捷、更轻松、更全面、更自由的系统可观测平台场景搭建高度可编程,成员协作敏捷。“cat” 是服务端项目的基础组件,它提供了 j**a、c c++、nodeJS、Python、Go等多语言客户端与美团点评的基础设施中间件框架(MVC框架、RPC框架、数据库框架、缓存框架、消息队列、配置系统等)深度融合,为美团点评各业务线提供丰富的性能指标、健康状态、实时告警等。
添加不超过 140 字的评论(可选)。
添加一个 ** 注释,可选效果不超过 140 个字。
添加不超过 140 字的评论(可选)。
添加不超过 140 字的评论(可选)。
添加不超过 140 字的评论(可选)。
添加不超过 140 字的评论(可选)。
添加不超过 140 字的评论(可选)。
添加不超过 140 字的评论(可选)。
添加不超过 140 字的评论(可选)。
添加不超过 140 字的评论(可选)。
添加不超过 140 字的评论(可选)。
添加不超过 140 字的评论(可选)。
添加不超过 140 字的评论(可选)。
添加不超过 140 字的评论(可选)。
添加不超过 140 字的评论(可选)。
添加不超过 140 字的评论(可选)。
添加**评论,不超过140字(可选) 目前的方案存在以下问题 1:虽然可以实现纯后端的链路指标监控,但缺乏链路追踪,缺乏链路拓扑,无法做到与基础设施、前端的全链路和日志 2: 研发端:通过人工埋设收集关键指标,增加研发和维护成本, CAT监控系统与业务**相互依存,导致一方出现问题,可能影响业务3: 运维端:CAT系统需要维护、升级、维护等,无法获取有效信息(CPU、 MEM等)在运维端通过CAT系统。中间件串联,数据分析难度大 4:用户体验一般,社区一般,关于CAT本身,它是一个开源项目,目前开源项目在生态中的更新频率如下图所示,开源项目缺乏维护,不适合长期稳定发展。
添加**评论,不超过140字(可选) 5:因为是研发回顾所有 CAT 本身都严重依赖 m**en 6:程序严重依赖太多包,整个程序本身比较重 根据对接同学的反馈,当前租户信息是以通过**植入的cat***(如事务、事件、心跳等)为基础,然后显示在CAT系统的指标维度中, 链路拓扑图缺失,研发生反馈解决多租户问题,以上推荐解决方案如下: 1:在服务器上安装datakit,收集CPU、内存、网络等信息 2:访问rum到前端**、APP、小程序 目的:默认自带隐藏信息, 并且观测云默认不收集敏感用户信息(手机号、用户ID),如果需要收集可以使用前端观察云提供的 SDK API 对埋点进行个性化设置3:后端服务,当应用启动时,启动一个 j**aagentJAR,自动收集链接信息 目的:通过行为和日志与前端对接,打造全链路环境。 效果是 xx 用户可以点击【登录】按钮查看调用的后端 API 的详细链接信息,同时可以看到日志信息 4:数据库、介质和间接访问 目的:在观测云场景中搭建数据库和中间件场景,将视图绑定到整个链接, 并意识到在查看某个请求时,可以同时查看数据库和中间件操作**情况五:云厂商数据采集 目的:实时掌握云产品的使用情况,及时报警如:证书过期提醒等。 CAT 基于 j** a 开发的实时应用监控平台为后端服务提供全面的实时监控和告警服务,客户减少故障发现时间,降低故障定位成本,并辅助链路服务本身,但与观测云相比,观测云提供了一整套可观测的解决方案, 从庞大而复杂的服务器主机中,梳理出清晰的云原生关系,精准定位每个请求,记录完整的事件和日志,拥有丰富的可编辑场景图,充分了解和记录每个租户的用户行为轨迹,是一个完整的可观测平台。