Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770
Форумы портала PHP.SU :: Версия для печати :: Совпадение.
Форумы портала PHP.SU » » Вопросы новичков » Совпадение.

Страниц (1): [1]
 

1. Area - 14 Апреля, 2013 - 19:07:51 - перейти к сообщению
Задача, есть предложение. И есть ключевые слова, перечислены через запятую.

Нужно каждое ключевое слово. Сверить с предложением и найти сходство. Каждое слово по отдельности. Eсть ли возможно сразу все ключевые слова сверить с предложением?
Необходимо чтоб сходство было 1-1 со словом.

Пример:
Eсть 5000 предложений, 5 категорий в каждой категории свои ключевые слова.
Нужно за минимальный промежуток времени обработать каждое предложение.
Взяли 1 предложение, каждую категорию(ключевые слова). Сверили и если нашли, прекращаем работу с данным предложением. И присваиваем категорию ,переходим к следующему предложению.

Подскажите быстрый процесс(код), для такой задачи.

Скажем предложения в массиве. Используем цыкл, для работы с каждым.
Скажите, возможно ли такой количество предложений обработать скажем за 20 секунд? Растерялся
2. Medallion - 14 Апреля, 2013 - 19:27:46 - перейти к сообщению
Я не пойму механизм добавления.
Нужно одноразово пройти скриптом по 5000 предложениям, или постоянно на входе будут 5000 предложений?

Куда будет заносится, в базу MYSQL, в файлы?

Распиши подробно.
3. Area - 14 Апреля, 2013 - 19:37:57 - перейти к сообщению
Цель, как можно быстрей обработать. Будь-одноразово или по очереди каждое предложение, не важно. Главное чтоб верно присвоило id категории к предложениям.

Заноситься будит, а верней обновляться записи в таблице. Грубо говоря, 30 000 записей обновить за раз-либо убить мусикл либо ждать около 30 минут. Поэтому в планах, написать. Попытаться написать на с++, так чтоб не обновлять записи в таблице. Скажем удалять часть таблицы и вставлять новую часть.
Плюс в том, что затрагивать мусикл не придется, лишь файл таблицы.


Еше немного информации. Сервер будит постоянно получать по 10-30 предложений в секунду. Думаю лучше собрать все предложения и обработать, а не каждое по отдельности.

 

Powered by ExBB FM 1.0 RC1