Надо проверить искомый текст на присутствие любой ссылки из $url_text.
Причем искомый текст может быть как txt-формате, так и в html-формате. Например:
<p>на сайте <a href="http://kgjtu.net/my-page/jfhgy.html">вот здесь</a></p>
';
Еще раз мой вопрос.
Как проверить $iscomiy_text на присутствие/отсутствие любой ссылки из массива $url_text ? Причем, ссылка в искомом тексте может иметь вид 'http://kgjtu.net/my-page/jfhgy.html',
а в массиве $url_text - 'http://kgjtu.net/'
GoDr
Отправлено: 15 Января, 2015 - 14:35:10
Посетитель
Покинул форум
Сообщений всего: 446
Дата рег-ции: Янв. 2015 Откуда: Тамбов
<p>на сайте <a href="http://kgjtu.net/my-page/jfhgy.html">вот здесь</a></p>
';
foreach($url_textas$value){
echo'Адрес: <b>'.$value.'</b>. Число вхождений: <b>'.substr_count($iscomiy_text,$value).'</b><br>';
}
(Добавление)
результат:
Адрес: http://jghty.com. Число вхождений: 0
Адрес: http://kgjtu.net. Число вхождений: 2
Адрес: http://kfjfyt.org. Число вхождений: 0
Адрес: http://nvhgy.jfhty.org. Число вхождений: 0
Покинул форум
Сообщений всего: 28
Дата рег-ции: Июнь 2011
Помог: 0 раз(а)
Я понимаю....
простите, а какой функцией можно вытащить все ссылки из $iscomiy_text ?
LIME
Отправлено: 16 Января, 2015 - 06:30:57
Активный участник
Покинул форум
Сообщений всего: 10732
Дата рег-ции: Нояб. 2010
Помог: 322 раз(а)
Не надо ничего вытаскивать
Это еще накладнее получится
Можно регуляркой через | поискать если охота
GoDr
Отправлено: 16 Января, 2015 - 11:24:47
Посетитель
Покинул форум
Сообщений всего: 446
Дата рег-ции: Янв. 2015 Откуда: Тамбов
Помог: 17 раз(а)
LIME пишет:
Не надо ничего вытаскивать
Это еще накладнее получится
ну не скажи.. Именно регуляркой вытащить только ссылки и уже в этом маленьком тексте искать что нужно. Регулярка пройдёт только один раз огромный текст, а дальше будет легко и быстро..
LIME пишет:
Можно регуляркой через | поискать если охота
Боюсь что если ссылок будет очень много всё подвиснет... хотя нужно провести тест...
Если допустить следующие правила
- ссылка начинается с http
- ссылка заканчивается пробельным символом или кавычками
то код можно переделать так:
Покинул форум
Сообщений всего: 10732
Дата рег-ции: Нояб. 2010
Помог: 322 раз(а)
Хотя это по условиям начинается с http?
Закончится может еще открытием тега и теоретически любым запрещенным для ссылки символом
GoDr
Отправлено: 16 Января, 2015 - 11:55:56
Посетитель
Покинул форум
Сообщений всего: 446
Дата рег-ции: Янв. 2015 Откуда: Тамбов
Помог: 17 раз(а)
Провёл маленький тест..
Сделал файл примерно 100000 срок (5,7Мб) с ссылками и мусором. Результат помещается в массив. Тесты проводил по несколько раз, брал минимальное и максимальное значение
Покинул форум
Сообщений всего: 10732
Дата рег-ции: Нояб. 2010
Помог: 322 раз(а)
А с увеличение текста и/или ссылок в нем будет наоборот
Как всегда палка о двух концах
Это еще упрощенная регулярка для вырезки текста (Добавление)
добавь окончание еще хоть на "<" вполне после текста ссылки может быть html
rafaello9 пишет:
Причем искомый текст может быть как txt-формате, так и в html-формате
непонятно могут ли быть ссылки просто текстом в html формате
еще сильно зависит от соотношения ссылок и остального текста
"#(" . $url . ")#is" скобки не нужны (Добавление)
LIME пишет:
Это еще накладнее получится
а вообще под этим подразумевались ссылки в общем виде
в своем разнообразии))
GoDr
Отправлено: 16 Января, 2015 - 13:36:34
Посетитель
Покинул форум
Сообщений всего: 446
Дата рег-ции: Янв. 2015 Откуда: Тамбов
Помог: 17 раз(а)
А вообще можно поставить "переключатель".. Используем код 1, начал тормозить - включаем код 2
В итоге нужно знать конечную цель.. тогда уже и решение подстраивать
Все гости форума могут просматривать этот раздел. Только зарегистрированные пользователи могут создавать новые темы в этом разделе. Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.