Лог-файлы
Вы можете получить доступ к содержимому лог-файлов двумя способами:
- 1.Получить доступ к лог-файлам на серверах хранения по протоколу FTP. Эта возможность предоставляется в рамках сервиса Raw Access Logs.
- 2.Получать логи с Платформы в режиме реального времени по протоколу Syslog. Эта возможность предоставляется в рамках сервиса Real-time Logs Streaming.
Каждому обработанному Платформой пользовательскому запросу в лог-файле соответствует строка следующего вида:
$remote_addr $host [$time_local] "$request" $status $upstream_cache_status "$upstream_addr" $body_bytes_sent "$http_referer" "$http_user_agent" "$request_time" "$gzip_ratio" "$ssl_protocol/$ssl_cipher" "$connection_requests/$connection" $bytes_sent "$upstream_response_length" "$upstream_header_time" "$upstream_response_time" "$upstream_status" $geoip_country_code $request_id $server_port
где:
- remote_addr – IP-адрес источника запроса;
- host – значение заголовка Host в запросе;
- time_local – время запроса (GMT);
- request – первоначальная строка запроса целиком;
- status – HTTP-код ответа;
- upstream_cache_status – статус объекта, например, HIT для объекта, отданного из кэша, или MISS для объекта запрошенного с сервера оригинации;
- upstream_addr – адрес сервера оригинации, в случае если объект отсутствует к кэше;
- body_bytes_sent – размер тела HTTP-запроса (указывается в байтах);
- http_referer – значение заголовка Referer;
- http_user_agent — значение заголовка User-Agent;
- request_time — время обработки запроса в секундах с точностью до миллисекунд; время, прошедшее с момента чтения первых байт от клиента до момента записи в лог после отправки последних байт клиенту;
- gzip_ratio — степень сжатия от 1 до 9;
- ssl_protocol/ssl_cipher — версия SSL/SSL-шифр в случае, если используется защищенное соединение;
- connection_requests/connection – порядковый номер запроса в рамках установленного соединения/порядковый номер соединения;
- bytes_sent – полное количество переданных байт (с учетом HTTP-заголовков);
- upstream_response_length – размер полученного ответа с сервера оригинации;
- upstream_header_time — время получения заголовков ответа с сервера оригинации;
- upstream_response_time — время получения всего объекта с сервера оригинации;
- upstream_status – HTTP-код ответа от сервера оригинации;
- geoip_country_code — двухбуквенный код страны, которой принадлежит IP-адрес пользователя;
- request_id — уникальный идентификатор запроса пользователя;
- server_port — порт сервера, обработавшего запрос.
При анализе лог-файлов обращайте внимание на следующие показатели:
- HTTP-код ответа (HTTP status code). Коды ответа из диапазонов 400-499 и 500-599 свидетельствуют о проблемах получения данных конечными пользователями. Например, код ответа 404 возникает когда пользователь запросил несуществующий объект, а код ответа 503 обычно возникает, когда сервер перегружен. В этих случаях необходимо обратить внимание на поле upstream_status. Если это поле не пустое, ошибка была получена с сервера оригинации. Пустое поле upstream_status и код ответа 504 означает, что истекло время ожидания подключения к серверу оригинации.
- Время обработки запроса (request_time). Этот показатель говорит о том, сколько времени была затрачено на обработку запроса с момента его получения. Чем меньше значение request_time, тем быстрее пользователь получил данные. Большое время обработки запросов может быть вызвано следующими факторами:
- Проблемы на сервере оригинации. Если запрашиваемых данных не оказалось в кэше сервера доставки NGENIX или данные оказались неактуальны, сервер доставки загружает их с сервера оригинации. Высокие значения показателей upstream_response_time и request_time означают медленную загрузку данных с сервера оригинации.
- Медленный пользователь. Если запрашиваемые данные были найдены в кэше сервера доставки, но показатель request_time высокий, это может свидетельствовать о проблемах подключения пользователя к интернету. Медленная скорость и прерывания доступа особенно актуальны для пользователей мобильных сетей.
- Статус кэширования объекта (upstream_cache_status). Значения MISS и EXPIRED означают, что запрос не был обслужен из кэша сервера доставки. Причинами большого количества таких запросов могу быть настройки в HTTP-заголовках директив Cache-Control и/или Expires, управляющих кэшированием. В этом случае проверьте настройки HTTP-заголовков на сервере оригинации.
- Отсутствие запросов. Отсутствие запросов от определенного пользователя в лог-файлах свидетельствует о наличии у пользователя проблемы при обращении к данным. Необходимо проверить на стороне пользователя работу протокола DNS и убедиться в отсутствии ошибок при установке защищенного соединения TLS (HTTPS).
При каждом HTTP-запросе к серверу оригинации серверы доставки NGENIX выставляют HTTP-заголовок X-Request-ID, содержащий соответствующий идентификатор запроса пользователя, например
f20270f7aa3dacdf8e3dadf0fef54.
Чтобы найти в лог-файлах Платформы соответствующий запрос пользователя к серверам доставки, используйте поиск по полю request_id.Рекомендуем настроить логирование HTTP-заголовков на сервере оригинации. Эта информация позволяет идентифицировать IP-адреса пользователей веб-ресурса и упрощает диагностику проблем.