Warning: Cannot use a scalar value as an array in /home/admin/public_html/forum/include/fm.class.php on line 757

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/include/fm.class.php on line 770

Warning: Invalid argument supplied for foreach() in /home/admin/public_html/forum/topic.php on line 737
Форумы портала PHP.SU :: обсуждение машины времени [3]

 PHP.SU

Программирование на PHP, MySQL и другие веб-технологии
PHP.SU Портал     На главную страницу форума Главная     Помощь Помощь     Поиск Поиск     Поиск Яндекс Поиск Яндекс     Вакансии  Пользователи Пользователи


 Страниц (3): « 1 2 [3]   

> Без описания
DlTA
Отправлено: 05 Декабря, 2011 - 15:15:35
Post Id



Постоянный участник


Покинул форум
Сообщений всего: 2952
Дата рег-ции: Окт. 2010  


Помог: 53 раз(а)




tuareg пишет:
т.е записывать на сервер все от картинок и заканчивая js
реализация Teleport
 
 Top
tuareg
Отправлено: 05 Декабря, 2011 - 15:17:03
Post Id


Участник


Покинул форум
Сообщений всего: 1234
Дата рег-ции: Июнь 2010  


Помог: 69 раз(а)




Наверное Радость
 
 Top
Мелкий Супермодератор
Отправлено: 05 Декабря, 2011 - 15:18:14
Post Id



Активный участник


Покинул форум
Сообщений всего: 11926
Дата рег-ции: Июль 2009  
Откуда: Россия, Санкт-Петербург


Помог: 618 раз(а)




tuareg, так. Уже и меня запутал Ниндзя

tuareg пишет:
Все наоборот

Почему наоборот?


-----
PostgreSQL DBA
 
 Top
Ch_chov
Отправлено: 05 Декабря, 2011 - 15:29:54
Post Id



Постоянный участник


Покинул форум
Сообщений всего: 2121
Дата рег-ции: Июль 2008  
Откуда: из города


Помог: 90 раз(а)




Не пойму причем тут user script? HTML без CSS и JS в большинстве случаев выглядит криво. Если нужно иметь точную копию какой либо страницы в сети, то придется загружать её со всеми «потрохами». Нет критериев, по которым можно было бы отделять нужные файлы, которые относятся к тексту статьи от прочих. Причем очень важно подгрузить файлы также с внешних ресурсов. Многие публикации особенно на хабре хранят картинки на внешних файлхостингах. Как следствие вместе с нормальными картинками в копию попадую рекламные банеры и прочий мусор. Аналогично с CSS и JS файлами, которых может быть огромное кол-во.

Для отображения одной веб страницы на большинстве сайтов браузер выполняет от 30 до 80 http запросов. Общий размер этих файлов может превышать 1МБ.

Другая проблема связана с безопасностью. Что если в исходной статье вставить javascript с XSS иньекцией? Паук «съест» этот код и выполнит его на своём сайте, из под своего домена. Т.е. данный JS будет иметь полный доступ к кукам пользователя на этом сайте.
 
 Top
Stierus Супермодератор
Отправлено: 05 Декабря, 2011 - 15:34:40
Post Id



Рекордсмен по количеству сообщений за 7 дней


Покинул форум
Сообщений всего: 2132
Дата рег-ции: Дек. 2008  
Откуда: Москваль


Помог: 52 раз(а)




1. Чем кнопка "сохранить как html" в браузере хуже?

отметая первый вопрос, предложения по системе:
1. Создается Grease monkey скрипт, создающий кнопку "сохранить страницу". При нажатии на эту кнопку мы отправляем нашему крайлеру информацию об авторизации в нашей системе + url страницы + все пользовательские куки (на случай закрытого раздела)
2. Краулер скачивает страницу, запускает поиск js, картинок и css ... во всех css и js снова запускается механризм поиска картинок и других ресурсов - выкачевается все, выставляется статус закрытого документа.
3. Если пользователь хочет открыть доступ к какому-то документу сторонним людям - он должен открыть его (открыть можно для всех, либо открыть доступ по выставленному паролю ... пароль на конкретно этот документ указывается тут же, либо берется какой-то дефолтный, так же установленный пользователем ранее)
4. Документы закрываются средствами nginx, css и js открыты извне для чтения.


ps
Я себе представлял эту идею как бота, блуждающего по инету (как яндекс-бот) и сохраняющий все подряд Улыбка. В текущем виде смысл системы для меня не понятен - смотри вопрос 1.
 
My status
 Top
Ch_chov
Отправлено: 05 Декабря, 2011 - 15:35:27
Post Id



Постоянный участник


Покинул форум
Сообщений всего: 2121
Дата рег-ции: Июль 2008  
Откуда: из города


Помог: 90 раз(а)




Кстати, есть такая штука web.archive.org.
Если кому интересно, вот так выглядел это форум в 2006 г. Улыбка
 
 Top
Stierus Супермодератор
Отправлено: 05 Декабря, 2011 - 15:37:26
Post Id



Рекордсмен по количеству сообщений за 7 дней


Покинул форум
Сообщений всего: 2132
Дата рег-ции: Дек. 2008  
Откуда: Москваль


Помог: 52 раз(а)




Ch_chov, я думал, мы именно такого же писать и будем Улыбка
 
My status
 Top
Ch_chov
Отправлено: 05 Декабря, 2011 - 15:42:38
Post Id



Постоянный участник


Покинул форум
Сообщений всего: 2121
Дата рег-ции: Июль 2008  
Откуда: из города


Помог: 90 раз(а)




Делать такой паук на PHP можно лишь со скидкой на то, что проект учебный.
Точно не уверен, но мне кажется wget умеет качать страницы вместе с «потрохами». Теоретически можно сделать просто PHP обёртку для такой утилиты. Будет намного проще и практичней.
 
 Top
EuGen Администратор
Отправлено: 05 Декабря, 2011 - 15:47:30
Post Id


Профессионал


Покинул форум
Сообщений всего: 9095
Дата рег-ции: Июнь 2007  
Откуда: Berlin


Помог: 707 раз(а)




Ch_chov
Например,

Обертку написать.. хм.
PHP:
скопировать код в буфер обмена
  1. exec('wget -kbr -l='.(int)$_SERVER['argv'][1].' '.escapeshellarg($_SERVER['argv'][2]));

- готово


-----
Есть в мире две бесконечные вещи - это Вселенная и человеческая глупость. Но насчет первой .. я не уверен.
 
 Top
Мелкий Супермодератор
Отправлено: 05 Декабря, 2011 - 15:59:50
Post Id



Активный участник


Покинул форум
Сообщений всего: 11926
Дата рег-ции: Июль 2009  
Откуда: Россия, Санкт-Петербург


Помог: 618 раз(а)




Stierus пишет:
1. Чем кнопка "сохранить как html" в браузере хуже?

Тем, что она уже реализована! Закатив глазки
Вся эта идея - так же не нова и по крайней мере 1 раз реализована. Пару лет назад (кажется, всё на том же хабре) я и слышал про такой сервис.
У меня вообще перманентная меланхолия - всё уже реализовано.

Ch_chov пишет:
Что если в исходной статье вставить javascript с XSS иньекцией? Паук «съест» этот код и выполнит его на своём сайте, из под своего домена. Т.е. данный JS будет иметь полный доступ к кукам пользователя на этом сайте.

Отображать на другом домене?

Ch_chov пишет:
Не пойму причем тут user script?

Stierus пишет:
1. Создается Grease monkey скрипт, создающий кнопку "сохранить страницу". При нажатии на эту кнопку мы отправляем нашему крайлеру информацию об авторизации в нашей системе + url страницы + все пользовательские куки (на случай закрытого раздела)

Собственно, добавить нечего.

А мусор всякий - да, будет загружаться.


-----
PostgreSQL DBA
 
 Top
Самогонщик
Отправлено: 05 Декабря, 2011 - 16:22:55
Post Id



Посетитель


Покинул форум
Сообщений всего: 495
Дата рег-ции: Окт. 2011  


Помог: 8 раз(а)




Мелкий пишет:
все пользовательские куки (на случай закрытого раздела)
Маленький параноик внутри меня забился в самый дальний и тёмный угол.

(Отредактировано автором: 05 Декабря, 2011 - 16:23:48)

 
 Top
Stierus Супермодератор
Отправлено: 05 Декабря, 2011 - 16:33:36
Post Id



Рекордсмен по количеству сообщений за 7 дней


Покинул форум
Сообщений всего: 2132
Дата рег-ции: Дек. 2008  
Откуда: Москваль


Помог: 52 раз(а)




Самогонщик, сделаем галку вопрос "для доступа в закрытые разделы сайтов нам магут потребоваться ваши куки, согласны ли вы их предоставить? да \ нет " - это не принципиально Улыбка
 
My status
 Top
Мелкий Супермодератор
Отправлено: 05 Декабря, 2011 - 17:55:16
Post Id



Активный участник


Покинул форум
Сообщений всего: 11926
Дата рег-ции: Июль 2009  
Откуда: Россия, Санкт-Петербург


Помог: 618 раз(а)




Самогонщик пишет:
Маленький параноик внутри меня забился в самый дальний и тёмный угол.

+1

EuGen пишет:
wget -kbr -l=3 <url>

ох, пойду ман перечитаю. Может и кофе варить умеет...


-----
PostgreSQL DBA
 
 Top
Страниц (3): « 1 2 [3]
Сейчас эту тему просматривают: 0 (гостей: 0, зарегистрированных: 0)
« Прочее »


Все гости форума могут просматривать этот раздел.
Только зарегистрированные пользователи могут создавать новые темы в этом разделе.
Только зарегистрированные пользователи могут отвечать на сообщения в этом разделе.
 



Powered by PHP  Powered By MySQL  Powered by Nginx  Valid CSS  RSS

 
Powered by ExBB FM 1.0 RC1. InvisionExBB