Ошибки в файлах. Параллельное выполнение скриптов
Автор: Дмитрий Бородин
Здесь рассматривается вопрос, что бывает, если запустить некий скрипт
почти одновременно (что происходит, например, при большой нагруженности сервера)
несколько раз, т.е. запустить несколько копий одного и того же скрипта.
И к чему это может привести.
Ошибка программы простого текстового счетчика
Давайте сделаем такую программу. Итак, у нас есть какая-то страница,
на которой хочется повесить счетчик. Обсудим алгоритм:
- считать число из файла
- записать увеличенное число обратно
- вывести его на экран
Согласитесь, программа простая, но может привести к ошибке, что
и показано ниже.
<?php
// верхняя часть страницы
// код счетчика:
$counter=file("counter.txt"); // прочитали файл в массив $counter
$f=fopen("counter.txt","w+"); // открыли файл на запись
fputs($f,$counter[0]+1); // записали "число + 1"
fclose($f); // закрыли файл
echo $counter[0]+1; // вывели число на экран
// нижняя часть страницы
?>
|
Если вызывать данную программу очень часто, значение счетчика
иногда будет обнуляться. Это произойдет из-за того, что в некоторый
момент программа прочитает из файла пустое значение, к которому потом
прибавляется единица ("пусто" + число 1 = число 1). Собственно, это
и есть сброс счетчика.
Рассмотрим подробно, когда это произойдет. Представьте, что в один момент
времени стартовали 2 копии данного скрипта. Одновременно ничего нигде
не проиходит, в т.ч. и запуск скриптов, но время между запуском может
быть очень маленькое. Процессор выполняет скрипты с разной скоростью,
т.е. вы не должны удивляться тому, в каком порядке далее будут
рассматриваться команды. Итак, ход программы (на примере "скрипта N1"
и "скрипта N2"):
Скрипт |
Команда |
Комментарий (что сделает данная команда) |
1 |
запуск первого скрипта |
-- |
1 |
$counter=file("counter.txt"); |
в переменной (массиве $counter) теперь храниться текущее число счетчика.
Допустим, там было 1234, тогда это число будет в переменной $counter[0]. |
2 |
запуск второго скрипта |
-- |
1 |
$f=fopen("counter.txt","w+"); |
открывает файл
обнуляет его
если файл не был создан, создает его (если позволят права). Но файл создан нами заранее, этот вариант исключен. |
2 |
$counter=file("counter.txt"); |
читает содержимое пустого файла и записывает в массив $counter пустой массив.
Переменная $counter[0] не существует. |
1 |
fputs($f,$counter[0]+1); |
пишет в файл число 1234 (т.к. в $counter[0] лежит число 1234) |
2 |
$f=fopen("counter.txt","w+"); |
см. комментарий выше |
1 |
fclose($f); и конец работы |
-- |
2 |
fputs($f,$counter[0]+1); |
записывает в файл число 1, т.к результат сложения несуществующей переменной
и числа 1 равен числу 1 |
2 |
fclose($f); и конец работы |
-- |
Как видите, если 2 параллельно работающих скрипта, выполнять именно в такой
последовательности, то файл будет обнулен. Если вы попробуете
этого добиться, вылняя частую перезагрузку страницы в браузере,
то у вас скорее всего ничего не выйдет.
Чтобы убедиться, что файл будет таки обнулен, воспользуйтесь
утилитой ab (которая умеет генерировать, в течении длительного времени
большое число, параллельных запросов к скиптам),
либо впишите после каждой команды "sleep(1);" - команду остановки программы
на 1 секунду, и понажимайте "Обновить" в браузере. Во втором случае
вы это сразу и увидите.
Чтобы решить проблему, нужно исключить опасный момент. Другими словами
надо заблокировать доступ к файлу счетчика, чтобы все другие параллельно
запущенные скрипты, приостановили свою работу. Делается
это с помощью flock, который блокирует доступ из других PHP-скриптов
(но не из других процессов ОС). Другие скрипты при попытке
открыть файл остановятся и будут ждать снятия блокировки.
<?php
// верхняя часть страницы
// код счетчика:
$f2=fopen("counter.txt","r"); // чтобы файл заблокировать, его надо открыть
// открыли файл на чтение
flock($f2,2); // заблокировали файл
$counter=file("counter.txt"); // прочитали файл в массив $counter
$f=fopen("counter.txt","w+"); // открыли файл на запись
fputs($f,$counter[0]+1); // записали "число + 1"
fclose($f); // закрыли файл
echo $counter[0]+1; // вывели число на экран
flock($f2,3); // сняли блокировку (при закрытии снимается автоматически)
fclose($f2); // и закрыли файл (при выходе закрывается автоматически)
// нижняя часть страницы
?>
|
Программу с блокировкой можно было бы написать и в более красим (коротком) виде,
но и такой вариант сойдет. Цифры "2" и "3" в функции flock обозначают
следующее:
flock (дексриптор файла, режим)
Режим:
- 1 - другие процессы могут отрыть только в режиме чтения
- 2 - другие процессы ничего не могут
- 3 - снять блокировку
Итак, на простейшем примере (проще придумать трудно) показаны проблемы
параллельного запуска скриптов.