Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: Совпадение.

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (1): [1]   

> Без описания
Area
Отправлено: 14 Апреля, 2013 - 19:07:51
Post Id


Частый гость


Покинул форум
Сообщений всего: 204
Дата рег-ции: Март 2013  


Помог: 0 раз(а)




Задача, есть предложение. И есть ключевые слова, перечислены через запятую.

Нужно каждое ключевое слово. Сверить с предложением и найти сходство. Каждое слово по отдельности. Eсть ли возможно сразу все ключевые слова сверить с предложением?
Необходимо чтоб сходство было 1-1 со словом.

Пример:
Eсть 5000 предложений, 5 категорий в каждой категории свои ключевые слова.
Нужно за минимальный промежуток времени обработать каждое предложение.
Взяли 1 предложение, каждую категорию(ключевые слова). Сверили и если нашли, прекращаем работу с данным предложением. И присваиваем категорию ,переходим к следующему предложению.

Подскажите быстрый процесс(код), для такой задачи.

Скажем предложения в массиве. Используем цыкл, для работы с каждым.
Скажите, возможно ли такой количество предложений обработать скажем за 20 секунд? Растерялся

(Отредактировано автором: 14 Апреля, 2013 - 19:19:22)

 
 Top
Medallion
Отправлено: 14 Апреля, 2013 - 19:27:46
Post Id



Частый гость


Покинул форум
Сообщений всего: 253
Дата рег-ции: Май 2012  
Откуда: Херсон, Украина


Помог: 7 раз(а)




Я не пойму механизм добавления.
Нужно одноразово пройти скриптом по 5000 предложениям, или постоянно на входе будут 5000 предложений?

Куда будет заносится, в базу MYSQL, в файлы?

Распиши подробно.
 
 Top
Area
Отправлено: 14 Апреля, 2013 - 19:37:57
Post Id


Частый гость


Покинул форум
Сообщений всего: 204
Дата рег-ции: Март 2013  


Помог: 0 раз(а)




Цель, как можно быстрей обработать. Будь-одноразово или по очереди каждое предложение, не важно. Главное чтоб верно присвоило id категории к предложениям.

Заноситься будит, а верней обновляться записи в таблице. Грубо говоря, 30 000 записей обновить за раз-либо убить мусикл либо ждать около 30 минут. Поэтому в планах, написать. Попытаться написать на с++, так чтоб не обновлять записи в таблице. Скажем удалять часть таблицы и вставлять новую часть.
Плюс в том, что затрагивать мусикл не придется, лишь файл таблицы.


Еше немного информации. Сервер будит постоянно получать по 10-30 предложений в секунду. Думаю лучше собрать все предложения и обработать, а не каждое по отдельности.

(Отредактировано автором: 14 Апреля, 2013 - 19:44:45)

 
 Top
Страниц (1): [1]
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« Вопросы новичков »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB