PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи

Страниц (1): [1]

> Найдено сообщений: 4
sozon Отправлено: 20 Апреля, 2007 - 21:54:19 • Тема: Все печатные символы + Русские символы • Форум: Регулярные выражения

Ответов: 8
Просмотров: 766
-SCHATTEN- пишет:
Ну а просто внести их в рег.выр нельзя ?


Т.е? Не понял вопрос.

Как мне можно записать рег. выражение, чтобы вытащить любые символы?

Чем можно заменить
<tr><td>([[:print:]а-яА-ЯЁё] )</td></tr>, чтобы использовать все символы ?
sozon Отправлено: 20 Апреля, 2007 - 20:41:09 • Тема: Все печатные символы + Русские символы • Форум: Регулярные выражения

Ответов: 8
Просмотров: 766
Опять проблема. На страницах сайта, который нужно отпарсить встречаются нестандартные символы, которые не удовлетворяют регулярному выражению [[:print:]а-яА-ЯЁё] например символы с кодами (по функции ord) 9 и 183

Можно ли написть регулярное выражение, которое бы соответствовало всем символам?

Т.е. например взять все, что находится между <td> </td>.
sozon Отправлено: 18 Апреля, 2007 - 17:10:45 • Тема: Все печатные символы + Русские символы • Форум: Регулярные выражения

Ответов: 8
Просмотров: 766
Спасибо. Зарабоало.
Класс дополнялся так: [[: print:]а-яА-ЯёЁ]

Особое спасибо -SCHATTEN-, если бы не подсказали про букву ё, я бы долго думал в один из моментов.
sozon Отправлено: 18 Апреля, 2007 - 14:06:15 • Тема: Все печатные символы + Русские символы • Форум: Регулярные выражения

Ответов: 8
Просмотров: 766
У меня такая проблема.
Нужно отпарсить страницу. Для этого понадобился класс [[:print:]] - все печатные символы. Но он не содержит кириллицу. А русские символы также необходимы в регулярном выражении.
Можно ли как то дополнить этот класс?

Т.е. например можно написать [0-9а-я] - цифровые символы дополняем русскими. А как поступить с классом [[:print:]] ? Можно ли дополнить его русскими символами. Или придется перечислять все заново (все цифры, буквы, знаки препинания, другие символы..) Может есть какой нибудь способ?

Поподробнее опишу задачу:
Есть страница, на которой есть название и описание товара. К примеру название обрамляется <p><a href=..........>Название</a></div>
и описание также обрамляется определенными тэгами.

Таким образом описав в регулярном выражении конструкуции
<p><a href=..........>
и </a></p> Мне нужно вытащить то, что между ними.
ereg('[0-9]+">([[:print:]]+)</a></div>',$page,$arr)

([[:print:]]+) и должно дать название, но проблемы начинаются, когда в названии встречаются русские символы.

Страниц (1): [1]
Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB