Добрый день.
Недавно потребовалось написать простой телефонный справочник на PHP используя ООП.
Требуемый функционал:
-Удаление
-Добавление
-Изменение
-Проверка на валидность введенных данных
-Вывод сообщений пользователю
-Поиск(Пока не реализовал)
Хотелось бы услышать конструктивную критику по данному коду, советы и предложения по его усовершенствованию так как задание очень важное хотя и не высокой сложности.
Есть контент страницы
в нем есть блок <div id="ctl00_ctl00_main_PlaceHolderMain_pnlResult">
надо спарсить его контент.
Парсингом контента раньше не занимался и поэтому не могу понять как это сделать, так как внутри этого блока есть другие блоки и ума не прилажу чем ограничивать поиск.
Прошу помощи, за ранее спасибо.
Бррр... давайте начнем сначала.
192.168.84.12 - - [11/Sep/2010:23:57:05 +0400] "GET /icons/blank.gif HTTP/1.1" 200 148
192.168.84.12 - - [11/Sep/2010:23:57:05 +0400] "GET /tools/ HTTP/1.1" 200 934
просто заключите в скобки отдельные элементы строк, которые нужно выбирать, а я сделаю свой вариант.
тут разобрался получиась вот такая вот штука: "/^(\S+) (\S+) (\S+) \[(\d+)\/(\S+)\/(\d+)\d+)\d+)\d+) ([^\]]+)\] \"(\S+) (\S+\.(\S+)|\S+) (\S+)\" (\S+) (\S+)$/"
но теперь другая проблема когда получаю расширение запрашиваемого файло то оно выдергивается вместе с запросом, ну например строка /denwer/Tools/dnsearch/search.pl?action=js и расширение получается pl?action=js, ну причины этого я сны сразу - (\S+\.(\S+)|\S+) ищим от точки до пробела пробовал сделать вот так (\S+\.(\S+)\?\S+|\S+\.(\S+)|\S+) но появляется нуевое поле в массиве. В общем помогите избавится от запроса
Пишу парсер лога apach
вот что получается "/^(\S+) (\S+) (\S+) \[(\d+)\/(\S+)\/(\d+):(\d+):(\d+):(\d+) ([^\]]+)\] \"(\S+) (.*?)\.(\S+) (\S+)\" (\S+) (\S+)$/"
пробема в том что lданная регулярка понимает тольок такие строки:
192.168.84.12 - - [11/Sep/2010:23:57:05 +0400] "GET /icons/blank.gif HTTP/1.1" 200 148
а вот такие
192.168.84.12 - - [11/Sep/2010:23:57:05 +0400] "GET /tools/ HTTP/1.1" 200 934 игнорирует из зи того что вот в этой части (.*?)\.(\S+) происходит разбор патча, тоесть я вытаскиваю расширение запрашиваемого файла и записываю его отдельно. А в данный запрос корневой и расширения фала нет как организовать ветвление в регулярке так чтобы вытаскивались и патч и расширение либо батч и пустое поле!
target=_blank onClick="cl(this)"
href="http://www.nirgos.com/" class=a1>Деревянные дома, Двери, Стройматериалы. Мебель дома и офиса. Матрасы и основания</a></td>
Нужно вытащить отсюда номер записи, ссылку на компанию, титлу и рейтинг.
Ну из этого кода должо получится чтото следущее:
1 http://www[dot]nirgos[dot]com/ Деревянные дома, Двери, Стройматериалы. Мебель дома и офиса. Матрасы и основания 3,996
2 http://www[dot]gwd[dot]ru/ компания "Good Wood" 2,240
Если есть знающие люди помогите плизз
с регулярками только начал знакомится и не как не получается написать
Пишу парсер выдачи для liveinternet.ru
требуется скрипт в который вводится ключевое слово и по этому слову вытаскивается информация(номер в вылаче, заголовок, ссылка, группа).
Тка вот как передать введенный в скрипт запрос в текстбокс поиска ливинтернет?
Недавно работаю с регулярными выражениями
Требуется написать регулярку которая будет вытаскивать со страницы все ссылки из тега <a>
и запись между >ТЕКСТ </a>
То есть если есть ссылки типа, <a href = "www.mpalkor.ru"> ТЕКСТ </a> и <a href = "www.mpalkor.ru/projects"> <img src="d/img/dsfdsf.jpg"></a>
собственно дописал найденную в интернете регулярку: '|<a(.*?)href[\"\'\s]{0,}=[\"\'\s]{0,}(.*?)[\"\'\s]{1}(.*?)>(.*?)</a[\s]{0,}>|is'
она дополнительно вытаскивает ссылку целиком все до href и после.
Но на некоторых сайтах например на приведенном мной mpalkor.ru работает некоректно.
Собственно помогите написать регулярку которая достает саму ссылку и титлу или img!
Пишу скрипт проверки целостности страниц. Паршу страницу на наличие url.
А затем проверяю работает ли ссылка или нет. При большом количестве ссылок получается довольно долго(особенно если ссылка домен не доступен. Как можно распараллелить выполнение проверки доступности url?