Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: Исправление опечаток

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (1): [1]   

> Без описания
Viper
Отправлено: 25 Августа, 2011 - 11:24:45
Post Id



Активный участник


Покинул форум
Сообщений всего: 4555
Дата рег-ции: Февр. 2007  
Откуда: Симферополь


Помог: 98 раз(а)




Собстно не совсем про кодировки...

Раньше как-то не сталкивался с таким, т.к. небыло необходимости. Задача следующего характеру.
Когда юзер вводит что-то в форму поиска и жмет "Отправить" ему выдаются результаты поиска. Как быть когда юзер забыл сменить раскадку клавиатуры и набрал вместо google.com пщщпдуюсщь ?

Интересуют следующие вопросы:
1. Юзабельность(имеется ввиду "А надо ли оно")
2. Реализация
3. Запросы юзера на разных языках


-----
Список фильмов с описанием, блекджеком и... для Joomla? -> https://киноархив[dot]com
Демо нового движка для сайта php.su -> php[dot]su, проект на гитхабе
 
 Top
EuGen Администратор
Отправлено: 25 Августа, 2011 - 11:31:46
Post Id


Профессионал


Покинул форум
Сообщений всего: 9095
Дата рег-ции: Июнь 2007  
Откуда: Berlin


Помог: 707 раз(а)




Viper пишет:
Юзабельность(имеется ввиду "А надо ли оно")

Если половина текста в нормальном виде, а остальное - нет (или, еще хуже, только два-три слова таких), то встает еще и задача определения того, что текст набран неверно. А вместе с этой задачей - и проблема превращения нормальных слов (например, каких-нибудь команд командной строки) в то, что не нужно.
Viper пишет:
2. Реализация

Весьма проста. В первом приближении - просто замена по массиву соответствия руссках и английских букв на клавиатуре
Viper пишет:
3. Запросы юзера на разных языках

И не пытайтесь. Скажем, у китайцев для ввода иероглифов есть куча всяких режимов письма и догадываться о том, что именно там включено у пользователя - задача неблагодарная.


-----
Есть в мире две бесконечные вещи - это Вселенная и человеческая глупость. Но насчет первой .. я не уверен.
 
 Top
White
Отправлено: 25 Августа, 2011 - 11:38:25
Post Id



Частый посетитель


Покинул форум
Сообщений всего: 830
Дата рег-ции: Июнь 2011  
Откуда: Днепропетровск


Помог: 28 раз(а)




1. смотря насколько крупный проект, и целевая аудитория. хотя полезность такой вещи достаточно сомнительна.
2. strtr(), реализация близка к транслитерации. использовать если найдено мньше n совпадений по нормальному запросу, и больше n совпадений по "переведенному" запросу. как вариант использовать словари.


-----
if(time()>1356048000) die();
 
 Top
EuGen Администратор
Отправлено: 25 Августа, 2011 - 11:40:02
Post Id


Профессионал


Покинул форум
Сообщений всего: 9095
Дата рег-ции: Июнь 2007  
Откуда: Berlin


Помог: 707 раз(а)




White пишет:
как вариант использовать словари.

Для "google.com" ? и как быть, если у нас есть неизвестные слова?
Ну и вопрос о том, >n или <n спорный, так как может быть, повторюсь, небольшой процент таких опечаток.


-----
Есть в мире две бесконечные вещи - это Вселенная и человеческая глупость. Но насчет первой .. я не уверен.
 
 Top
Viper
Отправлено: 25 Августа, 2011 - 12:51:24
Post Id



Активный участник


Покинул форум
Сообщений всего: 4555
Дата рег-ции: Февр. 2007  
Откуда: Симферополь


Помог: 98 раз(а)




Итак. После некоторых тестов yandex'a и googl'я выявил следующее:
1. Если яндекс не значет слова, то не знает. А именно запрос "[ev,fkfgenhf" естественно даже не привел к режиму "Возможно вы искали"
2. Гугль после совершения акта поиска предложил вариант "Did you mean: хумбалапутра"

Итог всего этого.
Яндекс = словарная база + сверка каждого слова
Гугл = чистый поиск + вариант на замену.

PS! Думаю остановится на варианте как у гугла, т.к. считаю оптимальным по соотношению производительность/результат.


-----
Список фильмов с описанием, блекджеком и... для Joomla? -> https://киноархив[dot]com
Демо нового движка для сайта php.su -> php[dot]su, проект на гитхабе
 
 Top
White
Отправлено: 25 Августа, 2011 - 13:46:07
Post Id



Частый посетитель


Покинул форум
Сообщений всего: 830
Дата рег-ции: Июнь 2011  
Откуда: Днепропетровск


Помог: 28 раз(а)




Гугл = чистый поиск + вариант на замену + база поисковых фраз.
сделайте преднамернную АшЫпку, получите исправленный результат, при чем не обязательно орфографически верный, а имеющий значительно больший рейтинг в базе(словаре).
П.С. Но так как исходников гугла никто не видел, остается только гадать...

(Отредактировано автором: 25 Августа, 2011 - 13:46:20)



-----
if(time()>1356048000) die();
 
 Top
Viper
Отправлено: 25 Августа, 2011 - 15:06:02
Post Id



Активный участник


Покинул форум
Сообщений всего: 4555
Дата рег-ции: Февр. 2007  
Откуда: Симферополь


Помог: 98 раз(а)




Хм... Прийдется для русского/украинского где-то мускульный словарь искать. И рыть землю дальше...


-----
Список фильмов с описанием, блекджеком и... для Joomla? -> https://киноархив[dot]com
Демо нового движка для сайта php.su -> php[dot]su, проект на гитхабе
 
 Top
Страниц (1): [1]
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« Кодировки и все смежное »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB