【Azure Storage Account ADLS】可用性指标降低的警告和是否会发生故障转移 - LuBu0505/My-Code GitHub Wiki

问题描述

image.png 使用存储位于Azure的存储账号和ADLS Gen2,为存储账号的可用性配置了告警。

想了解:

  1. 可用性报警对业务依赖并使用存储账号的业务程序是否会产生影响,比如是否会导致依赖存储账号的程序不能正常工作,报错等

  2. 当可用性降低后,存储账号是否会产生故障转移?或者是在一定的可用率值的范围内,是不会对应用程序造成影响的

问题解答

1) 可用性报警对业务依赖并使用存储账号的业务程序是否会产生影响,比如是否会导致依赖存储账号的程序不能正常工作,报错等

Azure Monitor Alert 将在满足预设的条件时,主动发起 **邮件/短信 **等通知。

收到警报后,需要手动观察存储账号状态:

  • 各项指标
  • 日志(如有开启诊断日志)
  • 网络连接(检查客户端访问Storage Account的网络状态),
  • 存储帐户的容量,
  • 或其他因素。

如果出现了严重的情况,没有及时得到解决,应用是会受到影响的。会导致依赖存储账号的程序不能正常工作。

**可用性 :**存储服务或指定的 API 操作的可用性百分比。 可用性通过由 TotalBillableRequests 值除以适用的请求数(其中包括引发意外错误的请求)计算得出。 所有意外错误都会导致存储服务或指定的 API 操作的可用性下降。

2) 当可用性降低后,存储账号是否会产生故障转移?或者是在一定的可用率值的范围内,是不会对应用程序造成影响的

Azure Storage Account /ADLS Gen 2 有两种类型的故障转移:

  • 用户自己管理的故障转移 - 可以管理发生意外服务中断时的存储帐户故障转移。
  • Microsoft 管理的故障转移 - 仅当主要区域中发生严重灾难时才可能被 Microsoft 启动。

Microsoft 管理的故障转移 是在极端情况下,如果原始主要区域因发生重大灾难而被认为在合理的时间内无法恢复,Microsoft 可能会启动区域故障转移。所以,本例中的 Availability(可用性)下降到99.98%是不会触发Microsoft Azure管理的故障转移。而需要由用户自己来决定是否触发故障转移, 因99.98%是一个很小的波动,如果应用程序有重试机制,一般情况下,应用程序会可以通过重试缓解此类问题。

参考资料

Azure 存储灾难恢复计划和故障转移 : https://learn.microsoft.com/zh-cn/azure/storage/common/storage-disaster-recovery-guidance

Microsoft.Storage/storageAccounts 支持的指标 : https://learn.microsoft.com/zh-cn/azure/storage/blobs/monitor-blob-storage-reference#transaction-metrics

Monitor Azure Blob 存储 : https://learn.microsoft.com/zh-cn/azure/storage/blobs/monitor-blob-storage?toc=%2Fazure%2Fstorage%2Fblobs%2Ftoc.json&tabs=azure-portal

当在复杂的环境中面临问题,格物之道需:浊而静之徐清,安以动之徐生。 云中,恰是如此!