Кстати, в зависимости от содержимого, данный шаблон не даст 100% верный результат. С точки зрения логики, вам необходимо выбирать вхождения, начинающиеся после цифры с точкой до первой открывающейся угловой скобки.
Да, все верно! Сейчас как раз "сражаюсь" с конструкцией такого регулярного выражения
JustUserR пишет:
Более подробная информация по данному вопросу предоставлена здесь http://www.php.su/functions/?page=cat_xml
Это тоже верно очень много полезной информации ..ОЧЕНЬ МНОГО
Дайте конкретный совет чем пользоваться, а еще лучше конкретный пример реализации описанной мной задачи.
Лучше всего я обучаюсь на примерах, если Ваша цель на этот форуме, рально помочь. Спасибо
Спасибо movEAX, это немного не то, но думаю еще пригодится !
Спасибо, dima4321!
Работает !
Я правильно понял:
модификатор m - устанавливает обработку текста как многострочного
модификатор i - убирает регистрозависимость
^\s - выражение должно начинаться с пробела или символа перевода строки
^\s+ - выражение должно начинаться с пробела или символа перевода строки и символ должен быть один или более ?
[а-я.] класс символов, которые может содержать выражение
[а-я.]+класс символов, которые может содержать выражение и символ должен быть один или более ?
Использование предполагаемого вами браузера может приводить к форсированному кешированию локальных элементов ассоциированных с некоторым фиксированным URL-адресом - поэтому его использование для тестирования такой системы не целесообразно
возможно ли отключить кеширование или каким инструментом лучше пользоваться ?
Почитайте механизм капчи и поймете, что ваши действия проблему не решат.
можете подсказать конкретно, где есть хорошее описание ?
если каждый раз значение капчи генерится случайным образом, тогда зачем сервер хранит их ?
я сделал проверку - просто в браузере ввел адрес капчи 3-х дневной давности
После запуска ничего не происходит, отснифил запросы, вроде обращается к серверу mail.ru с моими данными, но прежде почему то обращается ко всем поисковикам, точнее к большинству.
- Это нормально, собирается статистика посещаемости сайта и все в таком духе
Если URL капчи однозначно преобразовывается в текст капчи - то грош цена такой капче.
не совсем понял что имеется ввиду ?
URL капчи не преобразовывается в вводимый текст
884d06ab17e408443271164 686c49603.png = 3782 (значение кода на картинке)
т.е. никакого явного соответствия между картинкой и кодом нет
алгоритмы оптического распознования, в данном случае не подходят
сайт может поменять начертание, шрифт и т.д. и работу прийдется переделывать заново
вот досмотрелся еще до одного момента
когда я отправляю свой GET /captcha/...
то не вижу его отображения в программе просмотра http заголовков
(пользуюсь Мозила + LiveHTTPHeaders)
но при этом в ответ получаю картинку ...
Задача: нужно сделать обход капчи Аналитика:
есть сайт ххх
я на нем успешно авторизуюсь, захожу в раздел объявления
и при подачи объявления существует защита в виде капчи
просмотрел заголовки, которыми обменивается браузер с сервером
1. GET на получение страницы подачи объявления
2. бла-бла-бла
3. GET /captcha/884d06ab17e408443271164 686c49603.png HTTP/1.1
т.е. если я правильно понимаю то капчу мы получаем отдельным запросом и потом она уже отображается в форме ввода объявления
Что попробовал: Вариант №1
Первое и самое простое. Открыл исходный код формы.
Нашел:
<divclass="required"title="Вы должны заполнить это поле для отправки формы">*</div>
</div>
поменял c3d2f19d9d39731827c14abc6a6eb472 .png на заведомо известное значение xxxxxxxxxxxxxxxxxxxxxxxxxxxxxxxx xx.png с этого же сайта и в значении input name="captcha_guess" указал заведомо известные цифры!
Не прокатило ...
По всей видимости на сервере хранится идентификатор отправленной капчи и после получения ответа с данными формы сравнивается с тем, что отдавалось (отправлялось)
Вариант №2
Добавил в свой скрипт вызов метода GET для запроса капчи с сервера
Понятно, что в запросе я запрашиваю заренее известную мне капчу.
Теоритически ... после получения нового GET captcha от меня, сервер должен был перезаписать идентификатор отправленной капчи на мой и тогда вариант №1 прокатил бы, значения сошлись
но это теоретически ..практически пока не прокатывает ...
помогите разобраться !
Убрал "лишние" символы и все заработало!
Спасибо, Мелкий!
Отдельное спасибо, JustUserR
Ваш уровень трактования параметров моего запроса отличный от требуемого элемента кодирования, что скорее всего, как вы сами понимаете, является прямым следствием использования специфического построения излагаемых данных на этапе формирования ответа. Подумайте над этим ...
+++RESP 35+++
HTTP/1.0 200 OK
Date: Fri, 14 Jan 2011 07:58:26 GMT
Server: Apache/2.2.3 (CentOS)
X-Powered-By: PHP/5.2.17
Expires: Thu, 19 Nov 1981 08:52:00 GMT
Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0
Pragma: no-cache
Content-Type: text/html
X-Cache: MISS from mx.cis.net.ua
Proxy-Connection: close
В самой форме авторизации вводятся всего два параметра:
логин и пароль
Логично было бы, если бы они передались как параметры метода POST
но как это происходит ...не пойму
в данном листинге никакие параметры не передаются или я ошибаюсь ?
+++RESP 3380+++
HTTP/1.0 302 Moved Temporarily
Date: Wed, 12 Jan 2011 12:08:55 GMT
Server: Apache/2.2.3 (CentOS)
X-Powered-By: PHP/5.2.17
Expires: Thu, 19 Nov 1981 08:52:00 GMT
Cache-Control: no-store, no-cache, must-revalidate, post-check=0, pre-check=0
Pragma: no-cache
Location: ../../
Content-Type: text/html
X-Cache: MISS from mx.cis.net.ua
Proxy-Connection: close
+++CLOSE 3380+++
В самой форме авторизации вводятся всего два параметра:
логин и пароль
Логично было бы, если бы они передались как параметры метода POST
но как это происходит ...не пойму
в данном листинге никакие параметры не передаются или я ошибаюсь ?
у нас стоит прокси сервер! и если через браузер (в котором прокси указан в настройках) мы переходим на внешние сайты без проблем, то для cURL нужно было указывать отдельно!