Меня зовут Михаил. Живу в Питере, работаю обычным сисадмином. Кроме работы, увлекаюсь всем подряд, от походов, до написания мелких рассказиков. Журнал, хоть и называется "Заметки админа", здесь можно найти всё, и юмор, и мои рассказики, и техническую информацию по работе. Если что кому интересно, задавайте вопросы тут, если смогу, отвечу. И о правилах журнала. В журнале присутствует ненормативная лексика, я не сдерживаюсь, да и других не сдерживаю, так, что, если вам это не по душе, то ... ну сами понимаете. Общаться я предпочитаю на "ты", всякие "выканья" меня вводят в ступор. Если этими краткими словами я не отвратил тебя от прочтения этого журнала, милости просим. О политике френдов Да, во френдомарафонах не участвую, френжу только тех, чей журнал мне понравится по содержанию и по духу. Если кому нужны именно взаимные френды - это не ко мне. Если хочешь обратить мое внимание на свой журнал, оставь ссылочку, я посмотрю, но гарантии, что зафренжу, нет.
Частенько меня спрашивают: "Как ты так быстро всё ищешь в интернете?" Не понимаю, почему кто-то считает, что я быстро ищу. Это же элементарно. Посмотрим как это будет. Давайте попробуем найти с помощью разных поисковых систем одно и то же. Например описание тизерной рекламной компаннии Camel.…
Планировать время надо так. 1.Берём предположительное время работы. 2.Умножаем на два. 3.Прибавляем единицу. 4.Переводим в следующие единицы измерения. Таким образом, на часовую работу заказываем три дня.
Задача - контролировать работу 1С сервера. В случае нештатной работы службы 1С скрвера, выдать тревогу через Zabbix, учитывая, что надо контролировать большое количество серверов.
Не буду описывать Zabbix, надеюсь спецы знают. Для других поясно. Это сервис контроля за состоянием разнообразных параметров серверов, сетевого оборудования, обычных компьютеров. Система бесплатная и используется во многих организациях. В случае обнаружения определенных условий, она умеет отправить сообщение администратору с описанием проблемы. Те, кому не нужно, под спойлер.
Создаем в заббиксе новый шаблон VM 1C. Выставляем частоту опроса 60s и срок хранения 7d/ Создаём элемент данных 1C state Вводим ключ service.info[1C:Enterprise 8.3 Server Agent (x86-64),state] 1C:Enterprise 8.3 Server Agent (x86-64) - название windows службы сервера 1С. Сохраняем ключ.
Теперь триггер. Создаём триггер 1C state Alarm Вводим выражение last(/VM 1C/service.info[1C:Enterprise 8.3 Server Agent (x86-64),state],#1)<>0 Состояние службы равному нулю - всё в порядке, остальное - нас не устраивает. Значит будем реагировать на ненулевое значение. Если нужно реагировать на другие состояния, вот остальные значения.
0 - запущен 1 - пауза 2 - ожидание старта 3 - ожидание паузы 4 - ожидание продолжения 5 - ожидание остановки 6 - остановлен 7 - неизвестно 255 - такой службы не существует Выставляем важность события. Я выставляю в критическое, это вызовет сообщение админу. Сохраняем триггер. Всё, теперь можно быть уверенным, если служба встанет, я узнаю это сразу.
Можно отслеживать и по запущенному процессу, например avp.exe - это Касперский. У него в имени службы указана версия, приходится проверять запущен ли процесс. proc_info[avp.exe,wkset,sum] - сумма размера памяти всех процессов Касперского
Для тестирования аппаратуры используем преустановленный на флеш диск Proxmox. На него устанавливаем утилиту stress-ng.
stress-ng
Установка
apt-get install stress-ng
Тестирование процессоров
Тестируем все ядра, время теста 1 час, максимальная нагрузка, выдавать параметры температурных датчиков каждую секунду (тест работы с числами с плавующей точкой).
stress-ng -matrix 0 --timeout 3600 --maximize --thermalstat 1 --metrics
stress-ng может запустеть несколько тестов параллельно. По умолчанию,он будет запускать их параллельно, например, два теста CPU, одну копию матричного теста и три копии тестов очереди сообщений. в течении 5 минут.
cpu - тест CPU
cpu-cache - инструкции и кэш CPU
io - общий ввод/вывод
interrupt - тестирование прерываний
filesystem - активность файловой системы
memory - группа тестов на истпользование памяти
network - TCP/IP, UDP и UNIX тесты сокетов
scheduler - ускоренное переключение контекстов
vm - виртуальная память (тест страниц памяти системы виртуализации)
Основные высоконагруженные тесты
Использовать все процессоры, размер матрицы 64*64? собирать температурные режимы, время
stress-ng --matrix 0 --matrix-size 64 --tz -t 60
Полного листинга команд не буду приводить. Его можно посмотреть командой stress-ng --help
Дисковая подсистема
При тестировании нового сервера, дисковую подсистему можно проверять с помощью "виктории" или использовать встроенные тесты дисков RAID контроллеров Adaptec. При наличии времени, рекомендуется провести оба вида тестов.
Тест GPU
Работу GPU лучше мониторить. Пока обнаружил вот такую статью. nvtop и radeontop Это еще требует исследования.