Форумы портала PHP.SU » Разное » Колонка администратора » Автоматическое исправление ошибок на сайте

Страниц (1): [1]
 

1. dcc0 - 23 Апреля, 2015 - 16:02:27 - перейти к сообщению
Интересно, это возможно ли и сложно ли сделать какую-то систему для php.su, которая периодически в часы низкой нагрузки на сайт будет ползать по базе данных и исправлять грубые грамматические ошибки.
(Добавление)
хотя бы в названиях тем.
2. esterio - 23 Апреля, 2015 - 16:10:02 - перейти к сообщению
Ох я себе представляю как даная система будет исправлять мои ибо русский не мой родной.
Но все же много кто пишет сокращенно фразы типа "мускуль", "юзать" и все понимают
3. LIME - 23 Апреля, 2015 - 16:18:35 - перейти к сообщению
dcc0 ты на что намекаешь?
какую такую технологию прочитал колись)))?
(Добавление)
dcc0 ничего не сложно сделать
вот ждем когда ребята обновят двиг
как обновят тогда можно задвигать идеи
а пока повремени
4. dcc0 - 23 Апреля, 2015 - 16:37:26 - перейти к сообщению
LIME, ничего не читал, думал и пришел к выводу, что много грамматических ошибок в названиях.
Я не знаю, как точно темы попадают в выдачу поисковиков, но в поисковиках оказываются эти же ошибки.


esterio, речь не идет о каком-то сложном алгоритме, который будет проверять все, т.е. если в словаре слова нет слова мускуль - оно не проверяется. Т.е. хотелось бы стандартную проверку орфографии русского языка и специальной терминологии, связанной с сайтом.

Я часто набираю в поисковике так:" php.su несколько ключевых слов "


Может, я вообще не прав и много хочу.
5. LIME - 23 Апреля, 2015 - 16:45:55 - перейти к сообщению
dcc0 нене
все ты верно говоришь
только чтоб выстроить внутренний поисковик это тебе не лайком по статьям прогуляться
тут немножечко сложнее
слишком много инфы для тупого мускула
тут надо индексировать с учетом языка
есть библиотеки для этого
сфинкс, апач люцен
много разных технологий
тут дядьки сидят не глупее нас)) потерпи
(Добавление)
dcc0 пишет:
орфографии русского языка и специальной терминологии,
Lucene
погугли это
должно быть интересно
(Добавление)
dcc0 хм)) начитался чтоли практик по высоконагруженных проектов?
там примерно так и происходит
никаких транзакций
периодически ходят скриптики и проверяют целостность данных
толь ко это все очень и очень примерно
6. dcc0 - 23 Апреля, 2015 - 17:18:43 - перейти к сообщению
Кстати, и вот наткнулся на такую запись
http://habrahabr[dot]ru/post/202908/
(Добавление)
Т.е. вообще это фреймфорк

http://en[dot]wikipedia[dot]org/wiki/Noisy_channel_model
7. esterio - 23 Апреля, 2015 - 17:27:17 - перейти к сообщению

dcc0 пишет:
Я часто набираю в поисковике так:" php.su несколько ключевых слов "

Открою небольшой секрет "несколько ключевых слов site:forum.php.su" и вуаля
8. dcc0 - 23 Апреля, 2015 - 17:30:37 - перейти к сообщению
esterio
А вообще, да.
Наверно, перебор.

P.S.
Мысли об обработке текста меня прямо преследуют
9. LIME - 23 Апреля, 2015 - 18:23:56 - перейти к сообщению
dcc0 ну если тебе так не терпится подумай о суффиксах окончаниях и прилагательных
такая катавасия есть только в русском языке
но благо есть библиотеки

 

Powered by ExBB FM 1.0 RC1