Перейти к содержимому
Участник сообщества #8
Участник сообщества #8
21 нояб. 2024 г., 12:04(изменён)
0
0

Падения контейнеров в кластере WebSoftHCM

Из чата сообщества

Добрый вечер, коллеги. Имеем кластер WebSoftHCM, состоящий из трех нод (worker, web1, web2) и балансировщика нагрузки на NGINX. Все ноды на линукс ubuntu, WebSoftHCM запущен в докер контейнерах. Очень часто случаются падения контейнеров на веб нодах. Ранее контейнеры останавливались, сейчас настроили докер на автоматический перезапуск контейнера в случае его остановки вследствии ошибок. Воркер нода работает стабильно. В логах никакой инфы, которая могла бы помочь локализовать проблему не нахожу. Сотрудники в момент перезапуска контейнера видят ошибку 502, пока нода не поднимется либо пока nginx не перекинет их на рабочую ноду. подскажите пожалуйста как решить вопрос или хотя бы направьте в нужное русло, что бы мы могли локализовать проблему и решить ее...

Участник сообщества
Участник сообщества21 нояб. 2024 г., 13:18(изменён)

Тут тогда надо идти от кода, полагаю. Раз падают только веб-роли. Значит, агенты уведомления и прочее не причем. А перед падем есть понимание нет ли проблем с контейнеризацией, может по памяти просто вылазит за границы. У нас тут история была на разработке, сборка без докера под линукс просто из за того что в очереди сообщений были сообщения и не было коннекта к smtp, приложение выжирало всю память 24 гб, просто очередь сообщений 🤪

Участник сообщества
Участник сообщества21 нояб. 2024 г., 13:20(изменён)

периодически посматриваю за памятью. пока не замечал переполнения полного. но не исключаю такой вероятности на 100%

Участник сообщества
Участник сообщества21 нояб. 2024 г., 13:20(изменён)

Или например при массовом вызове EnableLog была история если использовать не разво при запуске, а как принято сразу в коде страницы написать EnableLog потом LogEvent ловили падения при массовом обращении прользователей, да и в принципе в агенте я это проявил, если в несколько тредов запустить EnableLog 🧐 , это правда еще на win был просто краш по обращению к памяти и все

Чтобы ответить, необходимо войти в систему