что такое синтетический мониторинг
Мониторинг производительности: реальные пользователи и их эмуляция
Синтетический мониторинг
Синтетический мониторинг включает в себя мониторинг производительности в «лабораторных» условиях, обычно с помощью автоматизированных инструментов в цельном окружении. Такой подход включает в себя создание скриптов, симулирующих путь, который может пройти пользователь, пользуясь приложением. Таким образом тестируются не настоящие пользователи, но заранее определённый набор инструкций, который выполняется в предопределённом окружении.
Контролируя переменные окружения, вы можете понять, где в производительности узкие места и каковы их источники. Однако, все эти данные не отражают реальный пользовательский опыт, особенно если поведение пользователя не ограничивается только лишь просмотром страницы.
Синтетический мониторинг может быть важным компонентом тестирования регрессий и средством мониторинга выпущенного и работающего приложения. Ухудшение базовых метрик производительности в ходе CI/CD-процесса должно вести к приостановке релиза, по крайней мере до тех пор, пока не выяснится, почему метрики ухудшились. Если проблема возникает только в Production-режиме, синтетические тесты предоставят информацию, которая поможет идентифицировать, изолировать и решить проблему, прежде чем она отразится на пользователях.
Мониторинг реальных пользователей (RUM)
В отличие от синтетического мониторинга, RUM собирает данные от настоящих пользователей, вне зависимости от их устройств, браузеров, сети или геолокации. Пока пользователь взаимодействует с приложением, тайминги такого взаимодействия записываются, вне зависимости от того, какое действие выполняется в конкретный момент. Такой мониторинг собирает данные о реальном использовании приложения, а не о том поведении, которое ожидают разработчики или, скажем, отдел маркетинга. Это особенно важно для больших веб-сайтов или сложных приложений, где функциональность или содержимое постоянно меняются, а количество пользователей может очень сильно расти, создавая новые нагрузки и требования.
Используя RUM, бизнес может лучше понять своих клиентов и определить зоны сайта, которые требуют большего внимания. Более того, RUM может помочь понять географию или канал распространения приложения. Знание своих пользователей и трендов поможет вам выстроить бизнес-планы и думать наперёд, позволяя вам определить приоритетные зоны, которые требует оптимизации и улучшения производительности.
Сравнение подходов
Синтетический мониторинг хорошо подходит для отлавливания регрессий в ходе разработки приложения. Особенно полезным может оказаться занижение скорости сети (network throttling (en-US) ). Такой подход довольно прост, недорог и великолепно подходит для тестирования определённых точек приложения по мере того, как вы вносите изменения в код. Но он даёт лишь узкий обзор производительности и не говорит о том, что испытывает пользователь.
Тестирование на реальных пользователях, в свою очередь, даёт информацию о настоящих пользователях, которые используют приложение или веб-сайт. И хотя получение и обработка таких данных обходится дороже и не так проста, такой подход даёт жизненно важные данные о пользовательском опыте.
API для измерения производительности
«Власть к чему-то готовится»: государство потратит 100 миллиардов на отслеживание протестных акций с помощью искусственного интеллекта
«Ростех» уже разрабатывает специальное программное обеспечение
«Ростех» разрабатывает специальное программное обеспечение, которое поможет федеральным и региональным властям предсказывать массовые беспорядки. Как ожидается, система будет анализировать сообщения в СМИ, данные социальных сетей, «умных» камер и других источников.
При этом, как сообщает «Коммерсант», если беспорядки уже начались, искусственный интеллект проанализирует поведение толпы и рекомендует силовикам порядок действий.
В проекте «Методики прогнозной и аналитической модели «Массовые беспорядки» описаны принципы работы будущей системы. В частности, в качестве примеров массовых беспорядков приводятся столкновение между мигрантами и националистами на Хованском кладбище в Москве в 2016 году, акция «Ставрополье — не Кавказ» в 2013 году и столкновения между футбольными фанатами на Манежной площади в Москве в 2010 году.
Система призвана предвосхищать такие события, обеспечивая «многофакторный мультивариантный анализ вероятностей возникновения массовых беспорядков и несанкционированных публичных мероприятий». Как это возможно? Как ожидается, система будет в перманентном режиме анализировать публикации в СМИ, посты в социальных сетях, данные из систем интеллектуального видеонаблюдения и мониторинга общественного транспорта. Если массовые беспорядки уже начались, с целью предотвращения эскалации система будет анализировать число участников митинга, поведение зачинщиков, направление движения толпы, число пострадавших, количество полицейских и росгвардейцев, задействованных в обеспечении порядка.
Директор экспертно-аналитического центра «Северо-Запад» Екатерина Колесникова заявила «Блокноту», что, во-первых, после ряда громких скандалов, когда некоторые ведомства и корпорации были пойманы за руку на расхищении государственных средств, очередная подобная на-гора идея выглядит подозрительно.
Искусственный интеллект призван помочь силовикам
Ранее сообщалось, что шесть исследовательских центров по искусственному интеллекту получат федеральные гранты порядка 1 млрд рублей каждый в рамках национальной программы «Цифровая экономика Российской Федерации». Отбор получателей из 36 заявок завершила рабочая группа под председательством заместителя председателя правительства Дмитрия Чернышенко.
Наиболее популярными направлениями развития искусственного интеллекта, по которым поступили заявки, являются межотраслевые технологии для различных отраслей экономики, для оптимизации управленческих решений, для медицины, для промышленности. Но, кроме этого, правительство заинтересовалось возможностями использования искусственного интеллекта для анализа психологического состояния россиян по их аккаунтам в социальных сетях.
В частности, реализацией подобного заказа займется ФГБУ «Институт системного программирования им. В. П. Иванникова». Подрядчик должен выполнить работы до 1 сентября 2024 года.
Кстати, и американские ученые тоже намерены расширить границы мониторинга со стороны ИИ за жизнью граждан. Предполагается, что искусственный интеллект будет следить за здоровьем людей через их унитазы.
Не исключено, что со временем искусственный интеллект может из «слуги» человека попытаться стать его «хозяином». Но нынешнее руководство России считает подобный сценарий в ближайшем будущем маловероятным.
Как улучшить производительность сайта с помощью мониторинга реальных пользователей
Время — деньги. Независимо от того, каковы ваши взгляды на этот счет, медленная загрузка — это плохо. Исследования показывают: коэффициент конверсии снижается прямо пропорционально с каждой проходящей секундой. Спустя три секунды половина пользователей покинет ваш сайт. Почти половина из них даже расскажет некоторым друзьям, как недовольны они остались вашим приложением.
Существует множество причин, по которым ваш сайт загружается медленно, и знание о том, где он виснет, — изначальный и первый шаг на пути исправления проблемы. Вы можете воспользоваться консолью разработчика, проверив на вкладке Network, сколько времени уходит на загрузку ваших ресурсов и сколько времени требуется после этого для отображения первой страницы. Это уже может пролить на вещи кое-какой свет, но по-прежнему дает информацию исключительно о том, как все работает у людей с тем же оборудованием, что и у вас, а также сидящих в том же офисе. Так что этого мало.
Существуют методы сбора дополнительной информации о том, как ваше приложение ведет себя в различных условиях. Они делятся на две основные категории: синтетический мониторинг и мониторинг реальных действий пользователей.
Синтетический и реальный мониторинг
Обычно вы не ждете, пока какой-то функционал появится онлайн, чтобы отловить проблемы и баги, которые могут проявить себя. Именно поэтому вы проверяете свое приложение заранее и пишете модульные, интеграционные и сквозные тесты. Но эти автоматические тесты, даже в сочетании с ручным тестированием, не всегда могут гарантировать хороший опыт для конечного пользователя. Они не имитируют поведение веб-сайта в зависимости от сети, устройства или географического местоположения.
Как и в случае с багами, вы хотите узнать о сложностях и, возможно, исправить их до того, как реальный пользователь столкнется с ними. Именно поэтому вам нужно смоделировать работу вашего приложения на максимально возможном числе конфигураций. Это называется синтетическим мониторингом. Для этого существуют инструменты, которые позволяют протестировать ваше приложение по различным параметрам: географическое расположение сервера, время работы DNS, пропускная способность и т. д.
Моделирование — это замечательно, особенно когда у вас нет никаких реальных данных, но невозможно смоделировать каждую конкретную ситуацию. После выхода вашего приложения в широкий мир полезной практикой будет отслеживание его поведения с настоящими пользователями. Это называется мониторингом реальных пользователей (Real User Monitoring) или RUM.
Интерфейс Performance
Для мониторинга нашего приложения в естественных условиях в JavaSсript есть интерфейс под названием Performance, предоставляющий информацию относительно производительности. Этот интерфейс расширяется четырьмя следующими API.
Navigation Timing API предоставляет данные о производительности, связанные с загрузкой документа. Resource Time API предоставляет эти данные относительно загрузки ресурсов приложения (изображений, скриптов и так далее). User Timing API позволяет разработчику создавать свои собственные метрики, помещая некоторые “отметки” и “измерения” в код приложения. И, наконец, Performance Timeline API комбинирует все эти метрики на временной шкале и предоставляет способы их извлечения.
(Некоторые фичи, которые мы собираемся обсудить здесь, все еще экспериментальны. Они реализованы в Firefox и Google Chrome, но, например, не в Safari).
Временная шкала и записи производительности
Вы можете получить доступ к временной шкале производительности и ее записям из объекта window. Заходим на любой сайт и в консоли запускаем:
Для google.com эта команда возвращает примерно 24 записи:
Запись Performance Navigation Timing
Запись Navigation Timing дает вам информацию о производительности при начальной загрузке вашего сайта. Если вы хотите видеть только эти метрики, вы можете запросить только навигационные записи:
Вот мои результаты для google.com:
Все эти параметры дают информацию о времени, которое требуется на выполнение каждой задачи, необходимой для загрузки вашей страницы. Отсчет начинается с того момента, когда пользователь инициировал загрузку, например, кликнул на ссылку или нажал Enter после ввода домена в строке URL. Атрибуты, которые вы видите, соответствуют следующим этапам:
В браузерах, где еще не поддерживается интерфейс второго уровня, таких как Safari, вы можете использовать следующую команду, чтобы получить доступ почти к той же информации:
Запись Performance Paint Timing
Записи отрисовки помогают вам понять, когда пользователь видит что-то в первый раз.
Из различных событий на временной шкале навигации не всегда очевидно, как каждое из них воспринимается пользователем. События отрисовки сообщают вам, когда на экране пользователя отобразится первый пиксель.
Записи Performance Resource Timing
Временная шкала навигации предоставляет вам метрики относительно начальной загрузки DOM. HTML-страницы обычно не поступают в одиночку и сопровождаются набором таблиц стилей и скриптов. Вы можете проверить время их загрузки с помощью записей синхронизации ресурсов.
Вы можете видеть изображения и скрипты, а также “xmlhttprequests”. Даже после первоначальной загрузки и рендеринга DOM ресурсы, вероятно, будут запрашиваться с помощью JavaSсript. Относящиеся к этому метрики также будут добавлены в буфер записей при их появлении.
Записи ресурсов содержат ту же информацию, что и общая временная шкала: поиск домена, начало и конец соединения, начало и конец запроса и т.д.
Метки и измерения производительности
Возможно, вы захотите создать свои собственные метрики для проверки производительности вашего кода. Для этого можно использовать API пользовательских ресурсов (User Resource API). Он позволяет создавать метки и измерения в вашем коде.
Метка — это нечто вроде точки останова. Вы устанавливаете ее в любом месте вашего кода, и она появляется в списке записей с указанием точного времени события (от момента начала отсчета, когда пользователь инициировал переход на вашу страницу).
Если, например, вы хотите знать, когда действительно времязатратная задача будет выполнена, вы можете добавить после нее метку:
Если после загрузки страницы и выполнения функции вы запросите записи меток интерфейса производительности, то увидите созданные вами метки с указанием времени:
Если вас интересует не сам тайминг, а скорее длительность выполнения, вы можете использовать измерения между метками:
Вызывая записи измерений через API производительности, вы увидите продолжительность вашей действительно длительной задачи:
Сбор и анализ данных
Все эти данные доступны в пользовательском браузере. Чтобы извлечь из них какую-либо полезную информацию, нам нужно собрать их у всех наших пользователей и сохранить там, где мы сможем их обработать. Мы должны отправить их через POST на наш бэкэнд, но есть два вопроса: когда и как.
Эти метрики касаются не только начальной загрузки приложения; они также могут предоставить информацию о производительности вашего веб-сайта с момента начала пользовательской навигации по нему до момента закрытия страницы с помощью временных шкал ресурсов, меток и измерений.
Вы можете использовать одного или нескольких наблюдателей, чтобы получать уведомления, когда в список добавляется новая запись.
Вы можете определить наблюдателя для всех записей, но также и для данного типа или даже имени. Эта практика может быть полезна, если вас интересуют только некоторые самоопределяемые измерения.
Оба метода имеют свои плюсы и минусы, и выбор зависит от вас и от того, что именно вы хотите сделать.
Чтобы проанализировать данные и улучшить ваше приложение на их основе, нужно собрать статистику по многим пользователям. Ищите не только среднее значение, но также проверяйте распределение данных. Кроме того, вы можете объединить собранные данные с некоторой информацией об устройстве и его местоположении.
Но какие метрики действительно важны и где именно вы можете повысить производительность вашего приложения? На этот вопрос нет однозначного ответа, но вот несколько советов, которыми вы можете воспользоваться:
Скорость — это тоже фича. Проследите за своим приложением в реальных условиях, чтобы увидеть, где и как его можно сделать быстрее. Многие метрики уже имеются в вашем распоряжении благодаря API JavaSсript, а другие API позволяют вам настроить свои собственные. Собирая и извлекая полезную информацию из этих данных, вы можете увидеть, где теряется время, и спроектировать решения.
Что такое синтетический мониторинг
Это второй пост в серии статей о подходах и направлениях в мониторинге современных бизнес-приложений. Другие публикации серии доступны по следующим ссылкам:
С помощью АРМ-решений, о которых мы пишем в своих статьях, наша команда профессионально реализовала большое количество проектов по мониторингу. Этот опыт дает нам возможность отнести себя к немногочисленной группе специалистов в области мониторинга, способных компетентно говорить не только о возможностях каждого АРМ- инструмента, но и об их реальной отдаче. Если Вы фанат какого-то из продуктов, и у Вас иная точка зрения, мы искренне будем рады отзывам и комментариям, а также конструктивным дискуссиям (оставлять свои комментарии Вы можете внизу статьи или в User Group DevOps Hub. IT Service management организовывать дискуссии, где мы активно участвуем). А если Вы, дорогой читатель, представитель компании-производителя, то мы будем рады, если наше мнение поможет сделать Ваш продукт более совершенным и полезным для нашего сообщества пользователей и внедренцев…
В заметке о мониторинге реальных пользователей мы упомянули о синтетическом мониторинге. Как правило, ИТ специалисты так или иначе представляют, о чем идет речь, но немногие осознают всю значимость данного направления. Зато это прекрасно понимают как эксперты, так и производители. Недаром в HP назвали соответствующий продукт Мониторингом Бизнес-Процессов (BPM).
Синтетический мониторинг в принципе является очень тонким, высокотехнологическим направлением. Не все производители даже в состоянии разработать собственную технологию. Например, в Dell Foglight присутствуют два разных инструмента, причем лицензируемых отдельно. Foglight Transaction Recorder (FTR) предоставляет самые базовые возможности по мониторингу веб-приложений. Для более сложных сценариев Dell предлагает продукт узкоспециализированной компании Tevron® – Citratest. Конечно, для созвучности с названием Foglight он продается под названием FTR-Advanced. При этом стоимость FTR-Advanced уже в четыре-пять раз дороже FTR, а лицензии на него заказываются непосредственно в Tevron, что, по опыту, значительно усложняет получение тестовых ключей для пилотных проектов.
Если сделать шаг назад, то и бизнес-мониторинг HP создавался компанией Mercury Interactive, которую НР выкупила около десяти лет назад. Эта широкоизвестная американо-израильская компания в свое время выстрелила с инновационным продуктом, который стал лидером на рынке, ранее безраздельно принадлежавшему такому монстру как Rational Software.
За десять лет эти идеи получили логическое развитие и трансформировались в несколько основополагающих принципов синтетического мониторинга – HP BPM.
Разнообразие технологий и точность воспроизведения сценариев
Как известно, HP Functional Tester и LoadRunner могут протестировать приложения, написанные на самых разных языках и технологиях программирования, то есть являются де-факто стандартными инструментами автоматизации тестирования и эмуляции действий большого количества пользователя в ИТ – индустрии. Ведь чем реалистичнее мы повторяем действия пользователя, тем надежнее синтетический мониторинг и точнее результаты.
Разнообразие технологий, точность воспроизведения и возможность по оработке результатов является предметом заслуженного уважения всей индустрии. За примерами далеко ходить не надо – даже IBM Tivoli позволяет пользоваться скриптами (записанными сценариями) от HP. Лучшего признания и не придумаешь!
Сквозная интеграция скриптов
Продолжая тему скриптов стоит отметить, что технологии HP обеспечивают сквозную интеграцию скриптов между различными продуктами. Если что-либо было протестировано с помощью средств автоматического или нагрузочного тестирования, то эти же скрипты в дальнейшем можно использовать и для мониторинга – ведь в основе лежат те же самые технологии. Аналогично любую сессию, записанную в рамках мониторинга реальных пользователей, можно парой кликов превратить в скрипт.
Это существенно облегчает работу инженеров и отлично вписывается в инструментарий в рамках концепции DevOps.
Облачные сервисы
Синтетический мониторинг показывает доступность и производительность сервисов не в вакууме, а для конкретных пользователей. А они не всегда находятся внутри корпоративной сети. Более того, сегодня миллионы людей регулярно ездят за границу. И, к примеру, ИТ-департаменту Сбербанка необходимо обеспечить достойный уровень обслуживания своих клиентов интернет-банкинга, находящихся в Германии, Таиланде или Северной Америке. Другими словами, растет важность синтетического мониторинга качества обслуживания своих пользователей из разных уголков мира.
HP на этот вызов ответил своим облачным решением синтетического мониторинга, основанным на тех же технологиях и полностью интегрированных с НР мониторингом, развернутым в своем Дата- центре. У прочих производителей с этим пока еще гораздо хуже. Так, для предоставления облачной услуги, тот же Dell Foglight перепродает услуги еще одной компании – SmartBear. То есть заказчик синтетического мониторинга от Dell банально может оказаться в ситуации использования продуктов от трех(!) разных компаний, и заложником их дальнейшего развития. Не говоря уже о необходимости обеспечения их взаимодействия и получения адекватной сервисной поддержки, ведь тот же SmartBear на сегодняшний день не представлен за пределами Северной Америки и Западной Европы.
Выявление ошибок с помощью функционального тестирования
По статистике, в течение первого месяца после выхода системы в продуктив (или глобального обновления), как минимум половина сбоев связана не с инфраструктурой, а с ошибками, пропущенными при тестировании. А теперь вспоминаем, что HP BPM является средством функционального тестирования, то есть не только следит за доступностью сервисов и обнаруживает ошибки и медленную работу, а и проверяет корректность логики.
Допустим, в продуктивную среду попала неполная версия справочника продуктов, которые может заказать пользователь. С помощью только мониторинга доступности и производительности об этом никто не узнает, здесь поможет только верификация корректности. HP эту сверку автоматически выполняет с помощью функциональной верификации. Используя другие инструменты, подобную ошибку смогут обнаружить только при помощи статистики за неделю или месяц, когда бизнес-владелец обратит внимание на то, что какие-то из продуктов вообще не запрашивались.
Даже этот краткий экскурс по технологиям и принципам, реализованным в HP BPM, наглядно демонстрирует, что же позволяет этому решению доминировать на рынке.
Это второй пост в серии статей о подходах и направлениях в мониторинге. Другие публикации серии доступны по следующим ссылкам:
ИТ База знаний
Полезно
— Онлайн генератор устойчивых паролей
— Онлайн калькулятор подсетей
— Руководство администратора FreePBX на русском языке
— Руководство администратора Cisco UCM/CME на русском языке
— Руководство администратора по Linux/Unix
Навигация
Серверные решения
Телефония
FreePBX и Asterisk
Настройка программных телефонов
Корпоративные сети
Протоколы и стандарты
Обзор систем мониторинга облачных инфраструктур и приложений
Системные администраторы и девопсы теперь могут использовать сетевые ресурсы, хранилища, виртуальные машины, ERP, системные программные обеспечения и приложения большинства публичных или частных облачных платформ или гибридных сред.
Переход организаций к облачной среде может быть мотивирован высокой доступностью, выгодной ценой и возможностью оптимизации в реальном времени, которая возможна только в облачной среде.
Но, наряду с многочисленными преимуществами, возникает необходимость мониторинга инфраструктуры и приложений, работающих в облаке.
Эта статья прольет свет на мониторинг облачных платформ и предоставит вам информацию об инструментах, которые облегчат вам, как Cloud разработчику, мониторинг инфраструктуры и приложений.
Мониторинг инфраструктуры и приложений
Таким образом, мониторинг облачных сред включает наблюдение за показателями производительности веб-серверов, приложений, серверов хранения, виртуальных облачных сетей, виртуальных машин и любых других служб, работающих в облачной среде.
Рассмотрим некоторые преимущества мониторинга в облаке.
Учет потребления облачных ресурсов
Мониторинг как услуга в облаке помогает организациям увидеть текущие ресурсы и связанные с ними затраты с помощью тэгов. Затем администраторы могут использовать данные о ресурсах для определения приоритетов и масштабирования ресурсов на основе затрат и спроса.
Оптимизация производительности
На основе результатов системных оповещений, событий и триггеров, настроенных для отслеживания ресурсов инфраструктуры, девопсы могут выполнять настройку ресурсов, например, балансировку нагрузки, для оптимальной работы инфраструктуры.
Гарантированная безопасность системы
Мониторинг пользователей в реальном времени, мониторинг входящего и исходящего трафика и частые тесты, выполняемые на конечных точках API, служат моделями безопасности для облачной инфраструктуры/приложений. Видимость означает, что любая аномалия в системе может быть легко выявлена до эскалации.
Популярные средства мониторинга для разработчиков облачных сред
Ниже приведены некоторые из наиболее используемых инструментов мониторинга облачных вычислений, доступных для сисадминов и девопсов.
1. CloudWatch
2. Dynatrace
Для мониторинга инфраструктуры OneAgent может собирать метрики из безсеверных инфраструктур, контейнеров, модулей, виртуальных компьютеров и даже облачных баз данных и многого другого.
Dynatrace использует PurePath для визуализации мобильных и веб приложений на уровне кода. В результате разработчики получают представление о доступности и производительности внешних и внутренних транзакций, выполняемых в любой облачной среде.
Кроме того, инструмент не только обеспечивает трассировку, метрики и данные журнала только для локальных сред. Она позволяет интегрировать несколько облачных технологий и расширить сторонние инструменты для обеспечения бесконтактного мониторинга приложений, работающих в облачных средах. Кроме того, разработчики могут использовать API Dynatrace для внедрения собранных метрик в средства отчетности и анализа сторонних производителей для более интуитивных системных отчетов.
Для начала работы с Dynatrace, можно подписаться на бесплатную пробную версию и развернуть инструмент в своей среде для мониторинга всего стека.
3. DataDog
Подключение Datadog к классической или облачной инфраструктуре обеспечивает детальную видимость производительности инфраструктуры и приложений.
Все это можно просмотреть исчерпывающим образом: от хостов в сети до экземпляров контейнеров и даже активных процессов, выполняемых на любой инфраструктуре. Этот инструмент мониторинга имеет встроенные функции, как агент Datadog, монитор производительности приложений Datadog, диспетчер журналов Datadog и профилировщик Continuous. Встроенные инструменты отвечают за сбор метрик системы и обнаружение любых изменений в системе.
Затем разработчики могут просмотреть и анализировать собранные показатели производительности с помощью гибких панелей мониторинга. Созданные панели мониторинга представляют тенденции в метриках.
Например, можно просмотреть частоту ошибок облачных приложений, задержки в сетевых конечных точках, а также обслуживаемые или неуспешные запросы HTTPS. Следовательно, администраторы и разработчики облачных служб могут создавать сводки показателей на панели мониторинга для любого периода.
Datadog обеспечивает интеграцию на основе агентов, аутентификации и библиотек для обеспечения унифицированного системного мониторинга в случаях распространения систем и приложений.
4. Prometheus
Например, HTTP запрос как имя метрики (ключ) и соответствующее общее количество этих запросов как значение.
Prometheus работает с автономным единственным сервером Prometheus, который удаляет метрики из нескольких источников данных и сохраняет их как данные временных рядов.
Кроме того, средство имеет такие платформы визуализации, как Grafana, Consoles и Expression.
Для системных оповещений Prometheus использует диспетчер оповещений для гибкой отправки уведомлений и управления ими с помощью сообщений электронной почты, систем по вызову и платформ чатов, таких как Slack, где разработчики могут своевременно реагировать на возникающие системные проблемы.
5. MetricFire
Graphite, например, обрабатывает сбор метрик с помощью агента Hosted Graphite, который включает службы сбора, такие как diamond. Diamond, демон python, собирает метрики ЦП, показатели использования дисков, сетевых операций ввода-вывода, метрики веб-приложений и многое другое.
Затем разработчики могут просматривать метрики в расширенных по функциям панелях мониторинга Grafana или Graphite. С помощью панелей мониторинга разработчики могут наблюдать метрики из нескольких источников, таких как Graphite, Prometheus и другого программное обеспечение для мониторинга облачных инфраструктур.
Панели мониторинга Grafana отличаются высокой настраиваемостью и могут быть преобразованы в соответствии с большинством требований к визуализации. Разработчики также могут создавать сложные графики и диаграммы с несколькими метриками и трассировками для предоставления окончательных отчетов о работе систем.
Благодаря размещенным инструментам разработчики могут сразу понять системные данные без необходимости установки нескольких сторонних инструментов.
Заключение
Итак, мы рассмотрели, что такое мониторинг облачной инфраструктуры и приложений, изучили некоторые преимущества мониторинга.
Приведенные в данной статье инструменты благодаря своей гибкости и функционалу, облегчат мониторинг всей инфраструктуры. Можно развернуть и попробовать бесплатные пробные версии и выбрать подходящий под конкретные нужды.
Онлайн курс по Linux
Мы собрали концентрат самых востребованных знаний, которые позволят тебе начать карьеру администратора Linux, расширить текущие знания и сделать уверенный шаг к DevOps