1. pernik - 12 Февраля, 2019 - 18:10:14 - перейти к сообщению
Всем гуру PHP привет, пытаюсь спарсить эту http://david[dot]kh[dot]ua/ страницу, но на выходе получаю битую кодировку, может кто что подскажет.
2. Vladimir Kheifets - 13 Февраля, 2019 - 07:35:01 - перейти к сообщению
Добрый день!
Неплохо бы было увидеть Ваш pattern.
Вы не зaбыли добавить в pattern u ?
Например, '/................../u'
см.
https://maxivak[dot]com/working-with[dot][dot][dot]-strings-in-php/
Удачи!
Неплохо бы было увидеть Ваш pattern.
Вы не зaбыли добавить в pattern u ?
Например, '/................../u'
см.
https://maxivak[dot]com/working-with[dot][dot][dot]-strings-in-php/
Удачи!
3. pernik - 13 Февраля, 2019 - 11:42:46 - перейти к сообщению
Vladimir Kheifets пишет:
Добрый день!
Неплохо бы было увидеть Ваш pattern.
Вы не зaбыли добавить в pattern u ?
Например, '/................../u'
см.
https://maxivak[dot]com/working-with[dot][dot][dot]-strings-in-php/
Удачи!
Неплохо бы было увидеть Ваш pattern.
Вы не зaбыли добавить в pattern u ?
Например, '/................../u'
см.
https://maxivak[dot]com/working-with[dot][dot][dot]-strings-in-php/
Удачи!
Да там явно не UTF-8, я предпологаю что там кодируют html при обращении с другого сервера. Не знаю можно ли это как то обойти ?
4. Vladimir Kheifets - 13 Февраля, 2019 - 20:40:14 - перейти к сообщению
pernik пишет:
Да там явно не UTF-8, я предпологаю что там кодируют html при обращении с другого сервера. Не знаю можно ли это как то обойти ?
там явно не UTF-8? см. что там
CODE (html):
скопировать код в буфер обмена
скопировать код в буфер обмена
- <!DOCTYPE html>
- <html lang="ru-RU">
- <head>
- <meta charset="UTF-8">
- <title>Давид | Давид- наружная реклама Харьков</title>
- <meta name="viewport" content="width=device-width" />
- <link rel="shortcut icon" href="/favicon.png" type="image/x-icon">
- <link rel="icon" href="/favicon.png" type="image/x-icon">
- ..........................................................
- ..........................................................