$n='При использовании замены по шаблону с использованием ссылок на подмаски может возникнуть ситуация, когда непосредственно за маской следует цифра. В таком случае нотация вида \\n приводит к ошибке: ссылка на первую подмаску, за которой следует цифра 1, запишется как \\11, что будет интерпретировано как ссылка на одиннадцатую подмаску. Это недоразумение можно устранить, если воспользоваться конструкцией \${1}1, указывающей на изолированную ссылку на первую подмаску, и следующую за ней цифру 1.
Пример 1. Использование подмасок, за которыми следует цифра
Результатом работы этого примера будет: April1,2003
Если во время выполнения функции были обнаружены совпадения с шаблоном, будет возвращено измененное значение subject, в противном случае будет возвращен исходный текст subject.';
проверил корректно работает со строками если они начинаются например только с заглавных.
Если и заглавные и не заглавные то тоогда надо применить Флаги сортировки
либо друнгую функцию сортировки (Добавление)
Ах да предварительно все строки надо обработать trim на наличие пробелов.
ребята а вы бы не могли написать мне простого паука..который собирает урлы кейворды и названия..прошу
а еще отдать ключи от своей квартиры и машины.
Юзай
регулярки preg_match_all
циклы while foreach
функции для работы с файлами: fopen, file, file_get_contents и прочее.
MYSQl куда все это добро будешь складывать.
Сначала надо искать просто слова , потом выбирать по массиву самые популярные (array_count_values) и вгонять самые популярные слова снова в текст захватывая с помощью регулярки ближайшие слова, затем снова array_count_values но уже на фразы как понимаете. Попадание в итоге где-то процентов 80-90.
Итак имеем повторов my friend --только 4 раза вместо 6. Как воплотить задачу в жизнь..??? надо задавать какое-то новое смещение в регулярке по циклу??
Вообще что можно сделать..?? как правильно прочитать текст и понять что там больше my friend и так же понимать что там много "hello my" и есть "goodbuy my"