2020-06-17 12:59 pm
Entry tags:

Из переписки - Vmware, syslog и -1

Сислог в который слали логи по tcp (нужен был порт отличный от 514) работал крайне нестабильно. Плюсуем баг esxi про ‘sensor -1’ (
https://docs.vmware.com/en/VMware-vSphere/6.7/rn/esxi670-201911001.html
) и получаем забивающуюся память и отвал hostd
В итоге выключил сислог по tcp и накатил апдейт
Причем все тачки работали нормально при отвале хоста от вцентра. Но каждый раз приходилось согласовывать даунтайм, корректно гасить их и регистрировать на соседнем хосте (vim-cmd solo/registervm [path to vmx])
2020-06-17 11:23 am
Entry tags:

Мониторинг через LPAR2RRD - обновление

Анонсирована новая версия бесплатной системы мониторинга виртуальных сред LPAR2RRD - в новой версии реализована поддержка Oracle VM/DB, Nutanix и vSphere 7.0

https://www.lpar2rrd.com/note620.php
2020-05-24 01:36 pm
Entry tags:

Почему CIM, а не SNMP

Традиционно подход к мониторингу начинается с SNMP. Протоколы SNMP старые, придуманы и введены давно, и имеют ряд проблем по скорости, безопасности и так далее, с чем кто-то мирится, кто -то нет - забывая про альтернативы.
Альтернативы есть, это и API, и SMI-S / CIM
Подробнее можно начать читать:
Storage Discovery via SMI-S and CIM
https://docs.servicenow.com/bundle/orlando-it-operations-management/page/product/discovery/reference/r_DataCollDiscoStorageviaSMISCIM.html
2020-05-21 06:39 pm
Entry tags:

Zabbix with Prometheus

Выноска из чата:
буду писать только различия где они есть, там где оба могут не буду, у меня прост фулл табличка
- отсутствие мультиязычной документации у прометея
- отсутствие у прометея управления авторизацией, надо городить костыли с nginx или еще чем, из коробки LDAP как в заббиксе не сделать
- заббикс так и валяется на рынке легаси для мониторинга хостов и в сторону кубера с микросервисами не догоняет пром
- заббикс слишком жирный по хранению данных, пром 2-4 байта на точку, заббикс 8-12
- заббикс не умеет в IaC, только если портянки к API писать, что собсна для релизов не оч подходит
- promql позволяет на лету работать с метриками(арифметические операции и тп)
- заббикс сильно зависит от софта - пыха, база, вебсервер, слишком сложно обновлять это все дело и управлять. Нужно сразу мониторить его бд, его вебсервер. Прому достаточно заменить бинарь.
- проблемы вытекающие из пыхи и бд: жутко медленный UI, жутко медленные запросы, до сих пор помню как с массовой агрегацией метрик или сложном запросе у меня тупо 502 от API выкидывало, заббикс не мог мне отдать данные. База забикса в принципе не предназначена для прямого хранения метрик
- Пром жрет слишком много ресурсов, порой заббиксу хватает 4гб на небольшой проект с головой, пром же в зависимости от обьема экспортеров и метрик может рассосаться в 16гб
- ну и с федерацией собсна и там и там глухо

- вывод: если есть ресурсы и хочется "вжух вжух promql с Iac" то прометей, если ресурсов нет, не хочется разбираться в новой системе, и есть достаточно времени и терпения на ожидание простых ответов на клик в гуе, то заббикс

для CNCF заббикс не подходит
.. это бинарь ОДИН ..а не куча помойки из пхп Nginx и базы. заббикс умер с релизом куба
в IaC забибкс так и не умеет
2020-05-21 05:07 pm
Entry tags:

linkmeup_sysadmins 22. Мониторинг\\\суббота, 23.05 10:30 Мск

Начинаем готовиться к linkmeup_sysadmins #22. Мониторинг\\\ 23.05 10:30 Мск

В выпуске поговорим о мониторинге в целом и о его конкретных реализациях.
Кто:
- Игорь Ковач - инженер систем мониторинга и автоматизации
- Илья Аблеев - занимается мониторингом, выстраивает процессы с ним связанные; в свободное время продвигает Zabbix Community в России
- Константин Михайлов - человек практикующий мониторинг и управление, инженер, предприниматель, исследователь

Когда: суббота, 23.05 10:30 Мск

Про что:

- Что ещё скрывается за словом "мониторинг" в современное время (сервисы, метрики, процессы, LMA, etc.)?
- Какие бывают продукты и решения на рынке систем мониторинга?
- Что мониторить и что делать с результатами?
- Как делать мониторинг так, чтобы было "вжух - и классно"?

https://linkmeup.ru/blog/560.html
2020-04-22 07:37 pm

Еще раз о памяти - Memory usage alarm triggers for certain types of Virtual Machines in ESXi 6.x

Memory usage alarm triggers for certain types of Virtual Machines in ESXi 6.x (2149787)
ESXi's active memory metric, despite being called "Memory Utilization" or "Memory Usage" in different parts of the UI, is in no way related to the in-guest memory metrics. It doesn't show how much guest OS memory is available nor how much guest memory is in an "active" working set or "resident". It is only used for making memory reclamation decisions in addition to other resource controls like shares, limits and reservation
https://kb.vmware.com/s/article/2149787
2020-02-29 12:15 pm
Entry tags:

Monhouse - Big Monitoring Meetup 19 марта, 18:30, CI/CD процессы.

Помните камрадов из Monhouse? Они ещё делали Big Monitoring Meetup.
Так вот, один митап раз в год это хорошо, а сделать целый календарь событий это ещё лучше!
Оказывается в этом году они планируют провести аж 10 мероприятий, а до BMM5 так и вообще осталось меньше двух месяцев. Так что спешите видеть и участвовать ;)

https://monhouse.tech/events
19 марта, 18:30, Monitoring Meetup: CI/CD процессы.
Офис компании DataArt, Большой Сампсониевский пр., 60
2020-02-24 02:45 pm
Entry tags:

SCOM and Exchange Managed Availability and Log Analytics

Из переписки:
Возвращаясь к мониторингу. Если кому-то показалось, что я пропагандирую scom или говорю, что с помощью других систем нельзя его реализовать - то перечитайте сообщения еще раз. Я не закрываю глаза на проблемы и недостатки продуктов MS, только потому, что я на MS работаю в данный момент. Делай я так, меня бы сложно было назвать нормальным инженером.

SCOM из коробки имеет интеграцию со встроенной системой мониторинга (Managed Availability). Ничего не мешает ее реализовать на Zabbix. Но опять же - лично я этого НИ РАЗУ не видела. Но это и не значит, что у кого-то этого нет. Для одного заказчика делали похожее в Log Analytics (лог Managed Availavility\Monitoring - туда пишутся последние ошибки). MS давно уже ушел от мониторинга только счетчиков - это не показательно. У вас могут быть задержки по дискам, которые реально не влияют на систему от слова никак. Надо ли в этом случае бежать и что-то делать срочно? В масштабах облака мониторинг посредством синтетических транзакций при огромном количестве серверов очень ресурсоемкая задача. Поэтому мониторинг выполняется через Managed Availability локально на каждом сервере. Про MA написано много статей, которые можно почитать
https://techcommunity.microsoft.com/t5/exchange-team-blog/customizing-managed-availability/ba-p/592164
Ну и на русском в блогах тоже есть.

Read more... )
2020-02-24 02:40 pm
Entry tags:

Exchange monitoring - Exoprise CloudReady and Nexthink

Exchange monitoring:
Exoprise CloudReady
MTA Inbound
The total time it takes to reply to an email from our auto-responders to the inbox. This metric measures inbound queue performance.
MTA Transport
The time it takes for a reply to reach the inbound MTA servers. This metric measures inbound transport performance and is a subset of the MTA Inbound time as reported by processing servers.
MTA Outbound
The time it takes to send an email to our CloudReady auto-responders. This metric measures outbound queue and transfer performance. MTA stands for message-transfer-agent and is responsible for the transmission of email between servers.
Test and monitor Exchange MAPI over HTTP for availability and end-to-end performance. This sensor connects to a mailbox using MAPI over HTTP like newer Outlook versions.
https://help.exoprise.com/kb/mail-queue-and-mail-flow-tests/
https://www.exoprise.com/solutions/exchange-mail-queue-monitoring/

Nexthink
The Swiss company Nexthink has developed a digital experience platform that combines monitoring, user engagement, analytics and automation — all from the emplyee’s perspective. The company claims that its modular platform provides the ability to manage the full employee digital experience cycle, from issue detection to employee engagement to resolution, all from a single console.
https://www.networkworld.com/article/3285646/nexthinks-digital-experience-management-platform-quickly-solves-performance-problems.html
2020-02-01 12:18 pm
Entry tags:

Monitoring

PRTG
Zabbix
Nagios
BMC Patrol
BMC Remedy
HP OpenView
HPE OneView
IBM Tivoli Monitoring
https://www.comparitech.com/net-admin/best-hp-monitoring-tools/

9 Best Bandwidth Monitor and Network Usage Monitoring Tools
1. Network Bandwidth Analyzer Pack
2. NetFlow Traffic Analyzer
3. PRTG Network Monitor
4. NetFlow Analyzer
5. FREE Real-Time Bandwidth Monitor
6. FREE Network Analyzer & Bandwidth Monitoring Bundle
7. ntopng
8. Cacti
9. BandwidthD
https://www.dnsstuff.com/bandwidth-monitor