APP下载

Cloud周报第126期:ThousandEyes网络洞察工具新增全球SaaS故障监控地图,供企业掌握自家采用SaaS运作情形

消息来源:baojiabao.com 作者: 发布时间:2024-09-28

报价宝综合消息Cloud周报第126期:ThousandEyes网络洞察工具新增全球SaaS故障监控地图,供企业掌握自家采用SaaS运作情形
图片来源: 

ThousandEyes

重点新闻(2021/11/11~2021/11/17)

  网络洞察工具     SaaS故障     监控地图  

ThousandEyes全球网络洞察地图添SaaS服务监控,追踪逾2万座机房内SaaS运作状况

思科旗下网络效能监控业者ThousandEyes,近日为自家推出的网络洞察监控工具,添加应用程序故障监控功能,以地图呈现当前全球各地发生的SaaS故障事件,供IT维运人员掌握应用程序的运作情形。企业除可从ThousandEyes网络故障地图上,掌握各地网络服务故障事件,现还可监控应用程序故障事件,并从地图一旁的列表中,了解过去5天发生的SaaS中断事件,然目前无法点选单一事件来获得故障状况的进一步资讯。

这个新功能类似监控网站Downdetector提供的监控工具,但不同的是,新功能的SaaS运作资料是来自,部署在超过2万座资料中心的ThousandEyes可观测性套件回传的资讯,而Downdetector则是仰赖民众主动通报应用程序故障状况,以及采用开源方式收集资讯。因此,思科宣称ThousandEyes地图提供的资讯,相比其他同质性服务更接近源头。(详全文)

  GCP      网络基础设施     中断事件   

Google云端网络基础设施又发生故障,导致Spotify、Snapchat等多个网站停摆

Google云端服务在太平洋标准时间11月16日10点左右,又发生大规模故障事件,导致大量仰赖其云端资源的网站停摆,包含Snapchat、Discord、Spotify、Etsy、Home Depot等网站都受影响,无法提供服务。Google在当日10点10分发布了服务中断事件公告,提到因网络基础设施服务Cloud Networking发生故障,导致由对外代理负载平衡器服务的网站,出现404错误。

此外,Cloud Networking故障也连带造成GCP平台其他服务,包含App Engine、Cloud Functions、Apigee和Cloud Run,暂时中断。整起云端服务故障事件,历经近2小时排除。Google说明,故障发生当下,对外代理负载平衡器的配置更改未生效,使得用户的网站停摆,经调整,配置已可正常推送,并表示,经内部完整调查后,会对外发布此次事件的分析报告。(详全文)

  日本-上云    AWS    GCP平台  

日本-选定AWS和GCP作为首批上云系统的执行环境,目标统一各机关系统基础设施减少维运成本

甫于9月正式成立的日本-数位厅,已在10月底宣布,选定AWS和GCP平台作为执行全国性行政系统的首批公有云环境。这项宣布是隶属在日本-共用平台上云建置工作专案,目的是要统一和标准化各部会和机关自行维运系统的基础设施,以降低维运人力需求,减少维护成本 。

根据日媒日经新闻的报导,数位厅选择外部云端环境时,在安全、资料管理和法遵面,约有350项要求,而经检核AWS和GCP环境,确认两者满足各项需求,会先搬迁数位厅的网站,还有8个市政厅网站上云,作为试点基础,进行测试。数位厅计划鼓励各地方-在2025年前,搬迁所有自行维运的系统上-云,预估可减少约3成的-年度IT预算。(详全文)

  Google云端    机器学习    工作管线建置  

Google推出机器学习工作管线建置服务,加速机器学习工作流程

Google近日推出机器学习工作管线服务Vertex Pipelines,企业可用来建立机器学习工作管线,加速在内部复制机器学习工作流程,甚至可进一步利用工作管线建立系统,来自动重新训练和部署模型,实现MLOps。Vertex Pipelines支援Kubeflow Pipelines(KFP)和TensorFlow Extended(TFX)开源函式库,企业可透过KFP和TFX将工作管线步骤转换成容器,来封装机器学习流程,并在Vertex Pipelines上执行。

另外,Vertex Pipelines是一项无服务器服务,企业上传和执行KFP或TFX工作管线后,不需处理基础设施的配置,可专注机器学习作业,由Vertex AI处理配置和扩充基础设施。Vertex Pipelines与Vertex AI以及其他Google工具紧密整合,企业可在Vertex Pipeline中配置一系列工作管线步骤,包含从BigQuery汇入资料,到使用Vertex AI训练模型,接着用Cloud Storage储存工作管线产出物,最后获得模型评估指标,并且部署模型到Vertex AI端点。(详全文)

  AWS     应用韧性评估      恢复时间目标  

AWS推出可评估应用程序韧性的Resilience Hub服务,可用来发现应用韧性弱点

针对应用程序的韧性需求,AWS推出应用韧性评估服务Resilience Hub,企业可自行定义、追踪和管理应用程序的韧性。Resilience Hub的韧性评估功能采用Well-Architected Framework最佳实践,可发现应用基础设施不完整或是错误的配置,找出潜在的韧性弱点,来评估企业应用程序的韧性。通过Resilience Hub,企业可依自身业务和应用程序的状况,用秒、分、小时和天为单位,来衡量应用恢复时间目标(RTO),也就是应用从故障中恢复的时间,还有设定应用恢复点目标(RPO),代表故障发生后,经最长多少时间应用可能会丢失资料。

接着,Resilience Hub会根据企业设定的目标,评估应用程序的配置是否满足要求,提供建议和韧性分数,来追踪、改善应用程序的韧性。AWS表示,AWS Resilience Hub评估涵盖的范围,不仅是应用程序软件和程式码,还包括托管应用程序的整个基础设施堆叠,像是网络、VM和数据库等。目前新韧性服务已在美国俄亥俄州、奥勒冈州、法兰克福、新加坡、东京等地区提供,会陆续在更多的地区上线。用户可以免费试用Resilience Hub服务6个月,之后按追踪的应用程序数量,每个应用每月15美元来付费。(详全文)

  Google云端     数据库服务     资料清除    

Google Cloud Spanner现在可以设定资料删除政策,降低清理对数据库效能造成的影响

Google在分散式数据库服务Cloud Spanner加入Time To Live(TTL)功能,企业云端管理员可用来设定政策,来定期清理Spanner资料表中不要的资料,除减少储存空间降低成本外,也能确保数据库资料符合资料留存法规。TTL会在Spanner后台持续运作,管理员可用宣告方式指定资料表列的删除政策,像是删除时间点,不需撰写程式码,或是使用外部脚本来清理资料。之后,TTL会依照管理员设定的政策,在指定时间清除资料。

TTL因是Spanner的内建功能,具扩充性,可扫描和删除企业执行实例所有节点的过期资料,即便数据库规模随时间推进,越来越大,TTL也会因应自动扩充扫描范围。此外,与执行一次性的资料清理脚本相比,因TTL清除程序会选在系统处低优先需求的时间段,来运作,能够最大程度减少对数据库工作负载产生的影响。TTL功能还整合进Cloud Monitoring中,管理员能端到端监控进度和警示,不需建立和维护额外的工作管线。TTL现已经上线,提供所有Spanner用户免费使用。(详全文)

  微软     Azure    DDoS 防护   

微软推出内嵌式DDoS防护方案,搭配第三方防护使用Azure DDoS服务,提升Azure环境防护力

因应DDoS攻击复杂性和频率迅速演变的态势,微软近日发布内嵌式DDoS防护方案预览版,可通过部署了Azure Gateway负载平衡器,以及整合Azure DDoS防护标准服务的合作伙伴网络虚拟设备,来缓解DDoS攻击。内嵌式DDoS防护结合了Azure DDoS防护标准服务,提供L3至L7的全面防护,来缓解体积型的DDoS攻击,包含短时间爆发的低量DDoS攻击,保护企业存放在Azure的资源,且不影响对延迟高度敏感应用的可用性或效能。企业可至Azure市集挑选虚拟设备,来部署网络虚拟设备执行实例,就可以展开内嵌式DDoS防护方案的部署工作。新方案未来将在所有Azure地区提供使用。(详全文)

  Google云端    GKE      基础设施管理   

GKE基础设施自动管理功能Autopilot现支援竞价式Pod,供企业执行不需高可靠度负载省成本

Google为K8s服务GKE的基础设施自动管理功能Autopilot,添加竞价式(Spot)Pod的支援,供企业可以为不需高可靠性的工作负载,选择更便宜的方式在GKE Autopilot上执行。Google考量企业有些工作负载不需生产等级的可靠性,像是容错批次处理负载,可使用竞价式Pod执行GKE丛集和节点池,来降低使用成本,因而为可自动管理K8s基础设施的Autopilot,增加竞价式Pod的支援。企业使用竞价式 Pod执行工作负载时,可以获得少于定价6成至91%的折扣,然而,当GCP平台运算资源需求量高时,企业竞价式资源可能会被收回。GKE从1.21.4版本开始提供竞价式Pod,而Autopilot会将竞价式Pod和一般Pod分开,不会落在同一节点上。(详全文)

图片来源/ThousandEyes、Google云端、AWS、微软

  更多Cloud动态  

1. 台南市-采混合云架构,打造城市动态影像AI感知平台,辨识重要路口交通情形、景点人流及公共场所防疫状况(详全文)

2. 微软找上刚正式从IBM脱离的基础架构管理服务商Kyndryl合作,要推进Microsoft Cloud在混合云市场的发展。(详全文)

3. AWS发布搭载Nvidia A10G GPU的EC2执行实例G5,机器学习效能达前一代3倍以上(详全文)

4. Google承诺5年内投资澳洲10亿美元,强化当地自家云端服务设施(详全文)

资料来源:iThome整理,2021年11月

2021-11-20 22:46:00

相关文章