eurobyte.ru - мощные сервера с Дата-центрами в Нидерландах и Москве. От 159 ₽/мес.

404 заглушка для несуществующих файлов

Начну с того, что этот пост, по сути, не несет какой-либо практической пользы для сайтов уже "установленных" на сервер и полностью готовых.

Делая как-то «один сайт», я скопировал его на локалку (всё, кроме медиафайлов), а на сайте было много картинок: минимум две к записи плюс галереи. Получалось, что ни страница, то минимум 2–3 картинки. Для того чтобы работать над сайтом, картинки мне не нужны, поэтому их я с сервера не брал. Таким образом, при работе на локалке на каждой странице у меня было минимум 2 битые ссылки на картинки, а то и 20.

Я заметил, что чем больше картинок на странице, тем дольше она грузится — вплоть до 10 секунд. Это стало раздражать, и пришлось разобраться в причине такого безобразия. Причина оказалась в том, что каждая битая ссылка на картинку «скрыто» генерировала 404 страницу. В качестве примера можете попробовать вписать ссылку типа: http://вашдомен/kartinka.jpg, и вы получите страницу с ошибкой, страницу со всем содержимым сайта, с сайдбаром(ами) и прочим...

Закрываем ненужные 404 страницы

Получается, чтобы сгенерировать страницу с одной битой ссылкой на файл, WordPress генерирует две страницы: саму страницу и страницу с ошибкой 404. Если на странице 2 битые ссылки, то будут созданы 3 страницы и т.д.

Конечно, на рабочем сайте битых ссылок обычно нет, поэтому и проблемы такой нет, но на локалке не грузить страницу 404, если это файл, очень может пригодиться. Впрочем, это может пригодиться и на рабочем сайте см. ниже.

Вариант на .htaccess (рекомендую)

Эту проблему можно решить, добавив следующий код в файл functions.php и сбросив правила ЧПУ:

# Добавим условия в .htaccess, которые будут выдавать 404 ответ сервера для несуществующих файлов.
# Заметка: чтобы код начал работать, нужно сбросить правила перезаписи (ЧПУ).
if( is_admin() ){

	add_filter( 'mod_rewrite_rules', 'block_nonexistent_files' );
	function block_nonexistent_files( $rules ) {

		$add_rules = '
		# 404 для несуществующих файлов.
		<IfModule mod_rewrite.c>
		RewriteEngine On
		RewriteBase /
		RewriteRule ^index\.php$ - [L]
		RewriteCond %{REQUEST_FILENAME} !-f
		RewriteCond %{REQUEST_URI} !^/robots\.txt$
		RewriteCond %{REQUEST_URI} \.(php|s?htm|shtml|css|js|yml|swp|txt|jpe?g|png|gif|ico|pdf)(.*)?$
		RewriteRule . - [R=404,L]
		</IfModule>
		';

		$add_rules = trim( $add_rules );
		$add_rules = preg_replace( '/^\t+/m', '', $add_rules );

		return "\n$add_rules\n\n" . $rules;
	}
}

Чтобы убедиться, что всё работает, пишем в браузере http://мой-домен/kartinka.jpg и видим 404 ответ:

Что делает код?

Как только запрашивается файл (страница содержащая в конце ссылки .jpg, .gif, .png, .zip...), он проверяется на физическое существование, если его нет, работа скрипта обрывается со статусом 404 и до PHP, а значит и WordPress дело вообще не доходит. Такая заглушка генерируется за доли секунды.

Задать шаблон 404 странице в этом случае можно через директиву ErrorDocument 404 /404.html и создание файла 404.html в корне сайта.

Вариант на PHP (не рекомендую)

Код нужно вставить в самое начало файла index.php в корневой директории сайта, там, где wp-config.php.

// Проверка на тип ошибки 404. Если это файл, не генерировать страницу,
// а просто писать об ошибке
$URIreq = $_SERVER['REQUEST_URI'];
if( preg_match('/\.(jpg|jpeg|gif|png|zip)(\?.+)?$/', $URIreq ) ){

	$PathToFileFromRoot = $_SERVER['DOCUMENT_ROOT'] . $URIreq;
	$PathToFileFromRoot = str_replace('//', '/', $PathToFileFromRoot);
	if( ! file_exists( $PathToFileFromRoot ) ){
		echo "<div style='margin:100px 10% 0 10%; padding:20px; text-align:center; border:1px solid #42A6FF; background:#DEF0FF; white-space:nowrap;'>
		<b>File not found:</b> $URIreq<br>
		<b>From Page:</b> <a href='{$_SERVER["HTTP_REFERER"]}'>{$_SERVER["HTTP_REFERER"]}</a><br>
		<div style='font-size:25px; padding-top:30px;'>Go to WebSite: <a href='http://{$_SERVER['HTTP_HOST']}'>http://{$_SERVER['HTTP_HOST']}</a></div>
		</div>";
		exit();
	}
}

Внимание для уже рабочих сайтов!

Такому же эффекту подвергаются:

  1. Битые ссылки на несуществующие файлы: картинки, вызываемые из CSS-стилей, и ссылки на CSS, JS и другие файлы.
  2. Несуществующие файлы, к которым нередко обращаются различные боты-сборщики, например example.com/absd.php.
  3. Ваши удалённые картинки, которые были скопированы и используются на других сайтах.

Поэтому, если чувствуете, что ваша страница грузится подозрительно долго, проверьте все ссылки со страницы. Я так находил по несколько битых ссылок и не раз. Для примера возьмём вот этот сайт: wordpressinside.ru, который, возможно, вам известен. Здесь, навскидку, я нашёл как минимум 2 битые ссылки, вот они (были до написания этой статьи smile ):

  1. http://wordpressinside.ru/wp-content/plugins/simple-counters/js/sc.js.php
  2. http://wordpressinside.ru/wp-content/plugins/simple-counters/js/jquery.qtip.js

Эти ссылки вшиты в шаблон, и при генерации любой страницы параллельно генерируются 2 страницы 404. Думаю, несложно представить, насколько дольше генерируется страница. О лишних, абсолютно ненужных нагрузках на сервер я уже и не говорю...

Для решения проблемы можно просто удалить битые ссылки — они просто не нужны.

33 комментария
Полезные - 1 Все
    Войти