Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770
Форумы портала PHP.SU :: Версия для печати :: Скрипт рерайта и синонимайзера
Форумы портала PHP.SU » PHP » Программирование на PHP » Скрипт рерайта и синонимайзера

Страниц (1): [1]
 

1. andrweb - 10 Мая, 2010 - 22:08:25 - перейти к сообщению
Здрасьте.
Подскажите где можно скачать скрипт синонимайзера или рерайта, чтобы воткнуть его в админку?
Давно хотел такую штуку поставить. Раньше грабилка стояла на нескольких сайтах по тематике - 3 вылетели из позапрошлого апа, еще 4 позавчера. Сателлитов лучше - небыло.
Может у кого найдется мысля, пару идей подкинете? Закатив глазки
2. SAD - 10 Мая, 2010 - 22:15:53 - перейти к сообщению
А не пробовали в гугле или на яндексе поискать?
http://yandex[dot]ua/yandsearch?rdrn[dot][dot][dot]46510&lr=142
3. andrweb - 10 Мая, 2010 - 22:18:19 - перейти к сообщению
SAD пишет:
А не пробовали в гугле или на яндексе поискать?
http://yandex[dot]ua/yandsearch?rdrn[dot][dot][dot]46510&lr=142

А вы сами ставили что-нить подобное в админке?
В сети все платное и на пыхе ничего нету.
4. JustUserR - 11 Мая, 2010 - 10:57:09 - перейти к сообщению
andrweb пишет:
Раньше грабилка стояла на нескольких сайтах по тематике - 3 вылетели из позапрошлого апа, еще 4 позавчера. Сателлитов лучше - небыло
А если попробовать пустить грабилку через proxy-сервер который не заблокирован? Или попробовать заняться IP-spoofing-ом если конечно вы можете работать с сетевыми ресурсами на сервере
5. andrweb - 11 Мая, 2010 - 22:49:41 - перейти к сообщению
JustUserR пишет:
А если попробовать пустить грабилку через proxy-сервер который не заблокирован? Или попробовать заняться IP-spoofing-ом если конечно вы можете работать с сетевыми ресурсами на сервере

Грабилка - это только пол дела. Я теперь думаю сам написать скрипт на пхп. Кстати может у кого будет какая идея?
Я лично думаю сделать так:
- грабилка заносит текст (например сегодняшние новости) в один текстареа.
- затем при нажатии на кнопку в другом текстареа получается синомизированный текст.
- сами слова-заменители берутся из базы данных.

Вот хочу поинтересоваться, может кто-нить сталкивался с подобным и может подсказать будущие проблемы с кодингом и какие-нибудь идеи?.
6. JustUserR - 12 Мая, 2010 - 09:50:06 - перейти к сообщению
andrweb пишет:
Сами слова-заменители берутся из базы данных
Можно использовать специальный алгоритм типа Стеммера Портера для разбора слов в тексте и приведеия их в начальную форму - таким образом можно будет пользоваться словарем для синонимичных слов и потом таким же образом возвращать их обратно - чтобы текст выглядел как машинно-генерируемой без форм слов
7. andrweb - 15 Мая, 2010 - 23:55:19 - перейти к сообщению
JustUserR пишет:
andrweb пишет:
Сами слова-заменители берутся из базы данных
Можно использовать специальный алгоритм типа Стеммера Портера для разбора слов в тексте и приведеия их в начальную форму - таким образом можно будет пользоваться словарем для синонимичных слов и потом таким же образом возвращать их обратно - чтобы текст выглядел как машинно-генерируемой без форм слов

Отличный совет.
Так можно находить слово и заменять его на другое слово (или даже третье) из таблицы достаточно быстро. К примеру в тексте "шариковый", заменить на "шарик" найти в базе и подставить "шариковатый". Но это немного портит текст. Надо постарвться выбирать именно те слова, которые не портят читабельности всего текста.
Я вот думаю, что сейчас лучше использовать для читабельности текста некие вставки в текст таким образом: "у меня есть хороший трактор" шаменить на "у меня сейчас есть очень хороший трактор."
Так идельно можно изменять текст не изменяя его структуру читабельности, а для ПС это вообще супер.
Кто еще может что-нить предложить? Радость
8. JustUserR - 16 Мая, 2010 - 13:01:33 - перейти к сообщению
andrweb пишет:
Так идельно можно изменять текст не изменяя его структуру читабельности, а для ПС это вообще супер.
Вообще грамматический анализ текстов очень сложная задача - особенно русских поскольку сущетсвует много конструкций и правил преобразования словоформ Можно поступить так вы ищите прилагательный и приводите их в начальную форму с помощью Стеммера Портера - потом вы ищите в словаре тип прлагательного и если оно качественное то ставите его в превосходую форму или добавляете слово очень - также можно заменять такое прилагательное на краткую форму
Вообще в такой задаче надо делать упор на такие замены которые не приводят к грамматическому и синтаксическому изменению структуры приложения - то есть словоформа ли словосочетание всегда должно заменяться на грамматически ему эквивалетное
9. andrweb - 16 Мая, 2010 - 16:55:32 - перейти к сообщению
JustUserR пишет:

Вообще в такой задаче надо делать упор на такие замены которые не приводят к грамматическому и синтаксическому изменению структуры приложения - то есть словоформа ли словосочетание всегда должно заменяться на грамматически ему эквивалетное

Вот это именно я и хочу сделать. Таким способом я смогу вести десядку сайтов без особых усилий. Затем продавать спокойно ссылки с них. И парочку сдл порталов для наращивания популярности.
10. JustUserR - 17 Мая, 2010 - 01:01:15 - перейти к сообщению
andrweb пишет:
Вот это именно я и хочу сделать. Таким способом я смогу вести десядку сайтов без особых усилий. Затем продавать спокойно ссылки с них. И парочку сдл порталов для наращивания популярности.
В принципе это задача достаточно реальная хотя и не очень простая но весь смысл ее решения сводится к следующим шагам - во-первых нужно найти в тексте определенные слова которые можно будет заменить на другие грамматические формы или синонимы и при этом не должна меняется грамматическая форма подчиняемых или согласуемых с ними слов (Иначе говоря заменяемый глагол должен быть такой же переходности с тем же управляющий падежом - а что касается заменяемых существительных то они конечно могут быть другого рода но в таком случае надо меня формы всех согласуемых прилагательных) Во-вторых нужно лексический контроль слов в контексте (Поскольку если слова являются синонимами в одном контексте то они могут и не являться ими в другом - поэтому можно делать прямой запрос скажем в поисковик для проверки наличия такой словоформы и словосочетания)

 

Powered by ExBB FM 1.0 RC1