Чтобы полностью понять природу проблем и ошибок, недостаточно просто смотреть в логи. Нам нужно заглянуть под капот Microsoft Azure Backup Server (MABS) и подробно разобрать его базовые механизмы. MABS использует три совершенно разных типа операций для защиты наших данных. Когда инфраструктура работает корректно, эти операции почти незаметны. Но как только механизм отслеживания изменений выходит из строя, система переходит в режим «грубой силы», что напрямую влияет на производительность дисков. Поэтому рассмотрим три ключевых процесса шаг за шагом, чтобы четко понимать, кто, когда, как и почему нагружает наши сети и хранилища.
Справочная информация к схеме:
- MSDPM (Microsoft System Center Data Protection Manager Service) — мозг и центральный диспетчер MABS. Это центральная служба, которая хранит все расписания и политики защиты и управляет заданиями. Сама служба не копирует данные, но дает агентам команды на создание точек восстановления или запуск Consistency Check.
- CBEngine (Cloud Backup Engine / MARS Agent) — облачный курьер и шифровальщик. Это агент Microsoft Azure Recovery Services (MARS). Он активируется только тогда, когда локальный backup уже завершен. Его единственная задача — сжать данные, надежно зашифровать их (AES-256) и передать по защищенному каналу в облако. С продуктивными серверами он при этом вообще не контактирует.
- DPMRA (DPM Replication Agent) — рабочие руки системы. Это исполнительная служба, которая работает как на самом сервере MABS, так и на защищаемых серверах, например Hyper-V. Именно DPMRA читает диски, рассчитывает контрольные суммы или хэши, собирает измененные блоки данных, то есть delta, и передает их по локальной сети.
- DB (Datenbank / DPMDB) — память MABS. SQL Server Database, в которой backup-сервер хранит всю свою конфигурацию: где находятся backups, какие файлы защищаются, а также журналы успешных и неудачных заданий. Если DPMDB выходит из строя, сервер забывает, где находятся его резервные копии.
- Azure Cloud (Recovery Services Vault) — бронированный сейф за пределами площадки (Disaster Recovery). Облачное хранилище Microsoft, в котором размещаются наши зашифрованные долгосрочные backups. Это наша страховка на случай полного отказа локального дата-центра, например из-за пожара, ransomware или физического уничтожения серверов.
- Storage (Local) — локальный склад, то есть первый уровень backup. Локальные дисковые массивы, подключенные к серверу MABS, на которых хранятся свежие оперативные резервные копии. Именно оттуда мы можем восстановить виртуальную машину в течение нескольких минут, так как данные находятся рядом, в локальной сети.
- VSS Writer (Volume Shadow Copy Service Writer) — транзакционный регулятор. Специальный компонент внутри операционной системы и приложений, например Hyper-V или SQL. Когда MABS хочет создать backup, VSS Writer дает приложению команду: «Заморозьте на долю секунды все изменения в оперативной памяти и запишите их на диск!» Благодаря этому мы получаем полную, консистентную резервную копию, а не «кашу данных» из наполовину записанных файлов.
- VM (Virtual Machine) — защищаемый объект, то есть «пациент». Наша виртуальная машина с операционной системой, базами данных и службами, которая работает на Hyper-V host. Именно ее состояние мы сохраняем и пытаемся восстановить в исходном виде.
- Storage (VM Disks) (хранилище / Storage Pool) — физический фундамент. Диски, такие как HDD, SSD или SAN, на которых физически находятся файлы виртуальных машин на стороне Hyper-V или тома с резервными копиями на стороне MABS. Скорость Storage напрямую определяет, насколько быстро будет выполнен Consistency Check.