Форумы портала PHP.SU

PHP.SU

Программирование на PHP, MySQL и другие веб-технологии

PHP.SU Портал

Главная

Помощь

Поиск

Поиск Яндекс Вакансии

Пользователи

Здравствуйте, Гость

( Вход · Регистрация · Правила форума )

Забыли пароль?

Форумы портала PHP.SU » Список сообщений, автором которых является kismedia

Страниц (3): [1] 2 3 »

Найдено сообщений: 34

kismedia

Отправлено: 10 Февраля, 2016 - 16:26:05 • Тема: Не могу составить регулярное выражение, не стандартный пример • Форум: Регулярные выражения

Ответов: 5
Просмотров: 561

Мелкий пишет:

Ещё раз - это XML. Не надо извращаться, надо его и читать как XML.
Для обработки XML, наверное, в любом языке есть штатные средства. А то, как в случае с PHP, и не одно средство.

Проще всего использовать simplexml. Прочитали файлик, изменили где нужно атрибуты, записали файлик.

Спасибо, но регуляпку все равно же придется строить?
Мне же не просто убрать тег или изменить, а изменить при условии что....

kismedia

Отправлено: 10 Февраля, 2016 - 15:37:21 • Тема: Не могу составить регулярное выражение, не стандартный пример • Форум: Регулярные выражения

Ответов: 5
Просмотров: 561

Мелкий пишет:

Это же XML, при чёт тут регулярки?

Да, но я обрабатываю этот файл регулярками, другого способа не знаю.
Допустим

PHP:
скопировать код в буфер обмена

$file = fopen('yandex_market.php', 'r');
$text = fread($file, filesize('yandex_market.php'));
$text = preg_replace("'<description[^>]*?>.*?</description>'si","",$text);

В примере как бы убрал тег <description>, все норм. И залил опять в в файл.

Подскажите, если я не прав, не силен в PHP.
Как осуществить правильно выше упомянутую задачу замены.

То есть мне нужно выставить атрибут available="true" на весь товар с производителем LEDO

Сам yandex_market.php' формируется Битриксом, покопался в коде, но это не мой уровень, не разберусь.

Поэтому просто решил запускать доп. обработчик на РHP.
Открывать, делать замены и записывать опять в файл.
Как то так.

kismedia

Отправлено: 10 Февраля, 2016 - 15:05:43 • Тема: Не могу составить регулярное выражение, не стандартный пример • Форум: Регулярные выражения

Ответов: 5
Просмотров: 561

Добрый день!
Уже ломаю голову несколько часов.

Суть условия:
В строке данных встречаются следующие конструкции
available="false">..произвольный текст, пробелы, вообщем все что угодно Улыбка

<vendor>LEDO</vendor>

Необходимо изменить атрибут available="false" на available="true"
но только при условии окончания на <vendor>LEDO</vendor>

Собственно часть содержимого для более наглядного представления:

CODE (htmlphp):
скопировать код в буфер обмена

<offer id="1278" type="vendor.model" available="false">
<url>
http://ledosveshenie.ru/catalog/ofisnoe-svetodiodnoe-osveshchenie/svetodiodnyy-svetilnik-ledo-001-24-2600/?offer_id=1278&utm_source=market.yandex.ru&utm_term=1278
</url>
<price>1538</price>
<currencyId>RUB</currencyId>
<categoryId>70</categoryId>
<picture>
http://ledosveshenie.ru/upload/iblock/ceb/svetodiodnyy_svetilnik_ledo_001_24_2600.jpg
</picture>
<typePrefix>Светильник светодиодный</typePrefix>
<vendor>LEDO</vendor>

Спасибо, если кто поможет.

kismedia

Отправлено: 11 Февраля, 2014 - 15:09:49 • Тема: Заключить, обернуть в теги определенную чать переменной • Форум: Регулярные выражения

Ответов: 3
Просмотров: 250

Первое решение от Мелкий к сожалению не сработало.
Ошибки нет, просто не пошла замена.

IllusionMH, Ваше решение выполнило мою задачу.
Все работает!

Спасибо огромное всем за помощь! Улыбка

Не большая поправка:

PHP:
скопировать код в буфер обмена

preg_replace('/(<b>Товары доступные в системе.*?\d\))/i', '<h2>\\1</h2>', $sInput);

А то оборачивает все вхождения "<b>..)"

Здесь наверное все можно было сделать проще? Не понял

PHP:
скопировать код в буфер обмена

$GrabStart = "<!--описание товара-->"; // от куда грабим 
    $GrabEnd = "<!--/дополнительная информация-->"; // до куда грабим 
    $GrabData = eregi("$GrabStart(.*)$GrabEnd", $data, $DataPrint); 
    $data_grab = $DataPrint[1]; 

Сам сделал, ну как бы все работает. Улыбка

kismedia

Отправлено: 11 Февраля, 2014 - 14:27:00 • Тема: Заключить, обернуть в теги определенную чать переменной • Форум: Регулярные выражения

Ответов: 3
Просмотров: 250

Всем привет!
Редко пишу на форум, бывает требуется немного "поковырять" php, справляюсь самостоятельно.
Но с данной задачей справится к сожалению не могу, в регулярных выражениях не силен.
Решений нигде готовых не нашел. Огорчение

Следующая задача:

PHP:
скопировать код в буфер обмена

$data = 'БЛА-БЛА-БЛА....<b>Товары доступные в системе</b>&nbsp;(ЗДЕСЬ ЧИСЛО НЕ ЗНАЕМ КАКОЕ)...БЛА-БЛА-БЛА';

Требуется найти и заключить в теги <h2>...</h2>
Вот эту чать: "<b>Товары доступные в системе</b> (ЗДЕСЬ ЧИСЛО НЕ ЗНАЕМ КАКОЕ)"
То есть от "<b>" и за ")" после числа.

Надеюсь, я корректно объяснил свою проблему.

Если не сложно, подскажите пожалуйста!

kismedia

Отправлено: 11 Октября, 2011 - 15:40:14 • Тема: Что означает данная ошибка обработки XML? • Форум: XML и его обработка

Ответов: 0
Просмотров: 2173

Здравствуйте!

Не смогу сам разобраться, да хотя бы знать в каком направлении решать проблему.
На моем сайте со вчерашнего дня пошла ошибка в работе парсера, до этого все работало.

Сможет ли кто-нибудь подсказать что означает данная ошибка и в чем может быть причина:

PHP:
скопировать код в буфер обмена

[11-Oct-2011 13:24:02] PHP Warning:  SimpleXMLElement::__construct() [<a href='simplexmlelement.--construct'>simplexmlelement.--construct</a>]: Entity: line 4: parser error : Specification mandate value for attribute D4B in /home/kismedia/public_html/info-runet.ru/wp-content/themes/katalog/parser/pr.php on line 169
[11-Oct-2011 13:24:02] PHP Warning:  SimpleXMLElement::__construct() [<a href='simplexmlelement.--construct'>simplexmlelement.--construct</a>]: harset>utf-8</charset><properties><_PassagesType>0</_PassagesType><lang>ru</lang in /home/kismedia/public_html/info-runet.ru/wp-content/themes/katalog/parser/pr.php on line 169
[11-Oct-2011 13:24:02] PHP Warning:  SimpleXMLElement::__construct() [<a href='simplexmlelement.--construct'>simplexmlelement.--construct</a>]: ^ in /home/kismedia/public_html/info-runet.ru/wp-content/themes/katalog/parser/pr.php on line 169
 

А вот собственно сама функция обработки XML:

PHP:
скопировать код в буфер обмена

function yan_sear($res_site)
{$res_url_enc=urlencode($res_site);
$xml_qr="<?xml version='1.0' encoding='utf-8'?>
<request>
    <query>url:$res_url_enc*  | url:www.$res_url_enc*</query>
    <page>0</page>
</request>";
global $yandex_key;
$xml_qr=str_replace("\r\n","\n",$xml_qr);
$xml_resp=sv_xml_url($yandex_key,$xml_qr);
$xml_res_strs=explode("\n",$xml_resp);
$xml_res_strs=array_slice($xml_res_strs,3,count($xml_res_strs)-6);
$xml_resp=implode("\n",$xml_res_strs);
$xmldoc = new SimpleXMLElement($xml_resp);
$found_all = $xmldoc->response->found;
$found_all=str_replace(" ","",trim($found_all));
$rs_num=str2num($found_all);
return $rs_num;
}

169 строка это:

PHP:
скопировать код в буфер обмена

$xmldoc = new SimpleXMLElement($xml_resp);

Спасибо, если кто подскажет!

kismedia

Отправлено: 24 Августа, 2011 - 10:31:15 • Тема: Требуется помошь по скрипту • Форум: Напишите за меня, пожалуйста

Ответов: 0
Просмотров: 38

Всем привет! Улыбка

Сможет ли кто-нибудь помочь довести до ума скрипт аналог сервиса BNAME.RU
Система раздачи счетчиков тИЦ и PR
А именно, корректно изменить функцию получения значения PR.
Вот установленный скрипт: http://cy-pr[dot]info-runet[dot]ru/
Определение показателя PR уже устарело и функция не актуальна.
Вот ее код:

PHP:
скопировать код в буфер обмена

// Google PR
define('GOOGLE_MAGIC', 0xE6359A60);
 
function nooverflow($a)
  {
  while ($a<-2147483648)
     $a+=2147483648+2147483648;
  while ($a>2147483647)
     $a-=2147483648+2147483648;
  return $a;
  }
 
function zeroFill ($x, $bits)
  {
  if ($bits==0) return $x;
  if ($bits==32) return 0;
  $y = ($x & 0x7FFFFFFF) >> $bits;
  if (0x80000000 & $x)
     {
     $y |= (1<<(31-$bits));
     }
  return $y;
}
 
function mix($a,$b,$c)
  {
  $a=(int)$a; $b=(int)$b; $c=(int)$c;
  $a -= $b; $a -= $c; $a=nooverflow($a); $a ^= (zeroFill($c,13));
  $b -= $c; $b -= $a; $b=nooverflow($b); $b ^= ($a<<8);
  $c -= $a; $c -= $b; $c=nooverflow($c); $c ^= (zeroFill($b,13));
  $a -= $b; $a -= $c; $a=nooverflow($a); $a ^= (zeroFill($c,12));
  $b -= $c; $b -= $a; $b=nooverflow($b); $b ^= ($a<<16);
  $c -= $a; $c -= $b; $c=nooverflow($c); $c ^= (zeroFill($b,5));
  $a -= $b; $a -= $c; $a=nooverflow($a); $a ^= (zeroFill($c,3));
  $b -= $c; $b -= $a; $b=nooverflow($b); $b ^= ($a<<10);
  $c -= $a; $c -= $b; $c=nooverflow($c); $c ^= (zeroFill($b,15));
 
  return array($a,$b,$c);
  }
 
function GoogleCH($url, $length=null, $init=GOOGLE_MAGIC) {
if(is_null($length)) {
$length = sizeof($url);
}
$a = $b = 0x9E3779B9;
$c = $init;
$k = 0;
$len = $length;
while($len >= 12) {
$a += ($url[$k+0] +($url[$k+1]<<8) +($url[$k+2]<<16) +($url[$k+3]<<24));
$b += ($url[$k+4] +($url[$k+5]<<8) +($url[$k+6]<<16) +($url[$k+7]<<24));
$c += ($url[$k+8] +($url[$k+9]<<8) +($url[$k+10]<<16)+($url[$k+11]<<24));
$mix = mix($a,$b,$c);
$a = $mix[0]; $b = $mix[1]; $c = $mix[2];
$k += 12;
$len -= 12;
}
 
$c += $length;
switch($len)
{
case 11: $c+=($url[$k+10]<<24);
case 10: $c+=($url[$k+9]<<16);
case 9 : $c+=($url[$k+8]<<8);
case 8 : $b+=($url[$k+7]<<24);
case 7 : $b+=($url[$k+6]<<16);
case 6 : $b+=($url[$k+5]<<8);
case 5 : $b+=($url[$k+4]);
case 4 : $a+=($url[$k+3]<<24);
case 3 : $a+=($url[$k+2]<<16);
case 2 : $a+=($url[$k+1]<<8);
case 1 : $a+=($url[$k+0]);
}
$mix = mix($a,$b,$c);
return $mix[2];
}
 
function strord($string) {
for($i=0;$i<strlen($string);$i++) {
$result[$i] = ord($string{$i});
}
return $result;
}
 
function get_pr($url) {
 
$result=array("",-1);
 
if (($url.""!="")&&($url.""!="http://")):
if (substr(strtolower($url),0,7)!="http://"):
$url="http://".$url;
endif;
 
$url="info:".$url;
$checksum=GoogleCH(strord($url));
$google_url=sprintf("http://www.google.ru/search?client=navclient-auto&ch=$ch&features=Rank&q=info:".$url,$checksum); // url to
$handle = @fopen($google_url, "rb");
$contents = '';
if ($handle) {
while (!@feof($handle)) {
 $contents.= @fread($handle, 8192);
}
fclose($handle);
$p=explode(":",$contents);
if (isset($p[2])):
$result=trim($p[2]);
endif;
} else {$result = 0;}
endif;
 
return($result!="" && (strlen($result)>0 && (strlen($result)<3))?$result:"0");
 
return($result!="" && (strlen($result)>0 && (strlen($result)<3))?$result:"0");
 
}
 
 
function cleanInput($string)
{
        $string = str_replace("<script","",$string);
        $string = str_replace("<frame","",$string);
        $string = str_replace("<object","",$string);
        $string = str_replace("<iframe","",$string);
        $string = str_replace("<applet","",$string);
        $string = str_replace("<meta","",$string);
        $string = str_replace("\|","",$string);
        $string = str_replace("\'","",$string);
        $string = str_replace("|","",$string);
        $string = str_replace("'","",$string);
        $string = stripslashes(strip_tags($string));
        if (strcmp("http://",substr($string,0,7))==0)
        {$string=substr($string,7,strlen($string)-7);}
        if (strcmp("https://",substr($string,0,8))==0)
        {$string=substr($string,8,strlen($string)-8);}
        $string = preg_replace("/\/(.*)/","",$string);
 
        return $string;
}
 
function getSqlRow($query) {
        $result = mysql_query($query) or echoErr();
        $row = mysql_fetch_array($result);
        mysql_free_result($result);
        return $row;
}
 
function getSqlNumber($sqlQuery) {
        $query=@mysql_query($sqlQuery);
        $result=@mysql_num_rows($query);
        @mysql_free_result($query);
        return $result;
}
 
function getFullDate($date) {
        $date = date('l dS of F Y h:i:s A', $date);
        return $date;
}
 
function getMinDate($date) {
        $date = date('d.m.Y', $date);
        return $date;
}
 

Есть рабочий скрипт получения показателя PR
Вот он:

PHP:
скопировать код в буфер обмена

$googlehost='toolbarqueries.google.com';
$googleua='Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US; rv:1.8.0.6) Gecko/20060728 Firefox/1.5';
 
//convert a string to a 32-bit integer
function StrToNum($Str, $Check, $Magic) {
    $Int32Unit = 4294967296;  // 2^32
 
    $length = strlen($Str);
    for ($i = 0; $i < $length; $i++) {
        $Check *= $Magic;       
        //If the float is beyond the boundaries of integer (usually +/- 2.15e+9 = 2^31), 
        //  the result of converting to integer is undefined
        //  refer to http://www.php.net/manual/en/language.types.integer.php
        if ($Check >= $Int32Unit) {
            $Check = ($Check - $Int32Unit * (int) ($Check / $Int32Unit));
            //if the check less than -2^31
            $Check = ($Check < -2147483648) ? ($Check + $Int32Unit) : $Check;
        }
        $Check += ord($Str{$i}); 
    }
    return $Check;
}
 
//genearate a hash for a url
function HashURL($String) {
    $Check1 = StrToNum($String, 0x1505, 0x21);
    $Check2 = StrToNum($String, 0, 0x1003F);
 
    $Check1 >>= 2;      
    $Check1 = (($Check1 >> 4) & 0x3FFFFC0 ) | ($Check1 & 0x3F);
    $Check1 = (($Check1 >> 4) & 0x3FFC00 ) | ($Check1 & 0x3FF);
    $Check1 = (($Check1 >> 4) & 0x3C000 ) | ($Check1 & 0x3FFF); 
        
    $T1 = (((($Check1 & 0x3C0) << 4) | ($Check1 & 0x3C)) <<2 ) | ($Check2 & 0xF0F );
    $T2 = (((($Check1 & 0xFFFFC000) << 4) | ($Check1 & 0x3C00)) << 0xA) | ($Check2 & 0xF0F0000 );
        
    return ($T1 | $T2);
}
 
//genearate a checksum for the hash string
function CheckHash($Hashnum) {
    $CheckByte = 0;
    $Flag = 0;
 
    $HashStr = sprintf('%u', $Hashnum) ;
    $length = strlen($HashStr);
        
    for ($i = $length - 1;  $i >= 0;  $i --) {
        $Re = $HashStr{$i};
        if (1 === ($Flag % 2)) {              
            $Re += $Re;     
            $Re = (int)($Re / 10) + ($Re % 10);
        }
        $CheckByte += $Re;
        $Flag ++;       
    }
 
    $CheckByte %= 10;
    if (0 !== $CheckByte) {
        $CheckByte = 10 - $CheckByte;
        if (1 === ($Flag % 2) ) {
            if (1 === ($CheckByte % 2)) {
                $CheckByte += 9;
            }
            $CheckByte >>= 1;
        }
    }
 
    return '7'.$CheckByte.$HashStr;
}
 
//return the pagerank checksum hash
function getch($url) { return CheckHash(HashURL($url)); }
 
//return the pagerank figure
function getpr($url) {
        global $googlehost,$googleua;
        $ch = getch($url);
        $fp = fsockopen($googlehost, 80, $errno, $errstr, 30);
        if ($fp) {
           $out = "GET /search?client=navclient-auto&ch=$ch&features=Rank&q=info:$url HTTP/1.1\r\n";
           //echo "<pre>$out</pre>\n"; //debug only
           $out .= "User-Agent: $googleua\r\n";
           $out .= "Host: $googlehost\r\n";
           $out .= "Connection: Close\r\n\r\n";
        
           fwrite($fp, $out);
           
           //$pagerank = substr(fgets($fp, 128), 4); //debug only
           //echo $pagerank; //debug only
           while (!feof($fp)) {
                        $data = fgets($fp, 128);
                        //echo $data;
                        $pos = strpos($data, "Rank_");
                        if($pos === false){} else{
                                $pr=substr($data, $pos + 9);
                                $pr=trim($pr);
                                $pr=str_replace("\n",'',$pr);
                                return $pr;
                        }
           }
           //else { echo "$errstr ($errno)<br />\n"; } //debug only
           fclose($fp);
        }
}
 
//generate the graphical pagerank
function pagerank($url,$width=40,$method='style') {
        if (!preg_match('/^(http:\/\/)?([^\/]+)/i', $url)) { $url='http://'.$url; }
        $pr=getpr($url);
        $pagerank="$pr/10";
 
        //The (old) image method
        if ($method == 'image') {
        $prpos=$width*$pr/10;
        $prneg=$width-$prpos;
        $html='<img src="http://www.google.com/images/pos.gif" width='.$prpos.' height=4 border=0 alt="'.$pagerank.'"><img src="http://www.google.com/images/neg.gif" width='.$prneg.' height=4 border=0 alt="'.$pagerank.'">';
        }
        //The pre-styled method
        if ($method == 'style') {
        $prpercent=100*$pr/10;
        $html='<div style="position: relative; width: '.$width.'px; padding: 0; background: #D9D9D9;"><strong style="width: '.$prpercent.'%; display: block; position: relative; background: #5EAA5E; text-align: center; color: #333; height: 4px; line-height: 4px;"><span></span></strong></div>';
        }
        
        $out='<a href="'.$url.'" title="'.$pagerank.'">'.$html.'</a>';
        return $pagerank;
}

Сможет ли кто помочь, проверить в чем ошибки в первом варианте, изменить функцию на основании второго рабочего скрипта.

Спасибо за помощь!

kismedia

Отправлено: 04 Июля, 2011 - 15:54:54 • Тема: Написать скрипт сбора внешних ссылок и их проверки • Форум: Напишите за меня, пожалуйста

Ответов: 0
Просмотров: 33

Всем привет! Улыбка

Требуется написать скрипт который выполняет следующие задачи:

1. При запуске анализирует заданный, скажем в переменной $url, сайт на предмет всех внешних ссылок, без ограничений по уровню вложенности, то есть все что есть.
Либо можно давать ему просто уже готовый sitemap.xml и тогда ограничится 1-ым уровнем (так думаю будет быстрее).

2. Теперь по всем этим внешним ссылкам необходимо перейти заданное количество раз и обязательно с заданным в скрипте рефералом (по-сути это текущий сайт со скриптом).
То есть в учете статистики трафика собранных сайтов (внешних ссылок) должен отобразится наш переход.

Вот собственно и все.
Надеюсь, что я правильно объяснил задачу. Думаю, она не очень сложная, но таких готовых, подобных решений я не нашел.

Спасибо за помощь!

kismedia

Отправлено: 13 Мая, 2011 - 06:41:41 • Тема: Удаление непонятных символов, неподдерживаемых текущей кодировкой • Форум: Регулярные выражения

Ответов: 3
Просмотров: 595

Текущая кодировка сайта UTF-8 а в переменной присутствует символ не поддерживаемый текущей кодировкой, вывести его нельзя, отображается это " � ".
Как я понимаю, искать нужно не " � " в буквальном смысле, это уже как следствие, а символы, код, которые отсутствуют в UTF.

Можно ли срезать через chr() некий диапазон символов, допустим удалить все кроме кода кирилицы? Как то вот так получается, надеюсь, я правильно понимаю сам проблему.

kismedia

Отправлено: 12 Мая, 2011 - 21:59:06 • Тема: Удаление непонятных символов, неподдерживаемых текущей кодировкой • Форум: Регулярные выражения

Ответов: 3
Просмотров: 595

Всем Привет! Улыбка

Не знаю как правильно выразиться, но вообщем, есть переменная $content
Содержимое, допустим такое: "выстраиваются в квадрат 5�5"

Вопрос, как убрать вот этот " � " не определенный символ, то есть символы которые не опознаны, не поддерживаются текущей кодировкой, как я понимаю.
Существует ли возможность такой проверки содержимого строки?
Убрать как бы все не валидные символы.

Надеюсь, Вы меня поняли.
Инормации по данному вопросу не нашел, да и собственно, что искать, как описать данную проблему.

Спасибо за помощь!

kismedia

Отправлено: 11 Мая, 2011 - 15:02:51 • Тема: Удаление всего содержимого, любых символов после искомого • Форум: Регулярные выражения

Ответов: 2
Просмотров: 197

Всем привет! Улыбка

Собственно задача, сама по себе звучит просто:
Пропустить содержимое через регулярку, в которой будет удалятся все (символы, цифры) повторяющиеся сколько угодно раз или не встречающиеся вообще, вообщем, любая комбинация, но после заданного слова, ключа.
Допустим все после фразы "Читать далее", желательно даже включая эту фразу.

Нигде не могу найти подобного, как реализовать? Огорчение

Подскажите пожалуйста!

kismedia

Отправлено: 17 Января, 2011 - 17:07:42 • Тема: Кэширование данных в .TXT файл (запись и вывод) • Форум: Программирование на PHP

Ответов: 3
Просмотров: 433

Спасибо, суть понял но нужно этот файл обработать соответствующим образом, найти в нем требуемое значение ,если оно уже имеется.

Давайте так, сколько будет стоить данное дополнение (функция) к моему парсеру?
Кто может помочь, написать.

kismedia

Отправлено: 17 Января, 2011 - 16:01:07 • Тема: Кэширование данных в .TXT файл (запись и вывод) • Форум: Программирование на PHP

Ответов: 3
Просмотров: 433

Всем здравствуйте! Улыбка

Знаю что можно хранить (получать) данные как в БД так и в в файлах, допустим в .TXT.

Опишу на своем примере и зачем это нужно мне.
Недавно в данной теме http://forum.php.su/topic.php?fo...1&topic=5966 я, не без помощи пользователей форума, написал следующую функцию:

PHP:
скопировать код в буфер обмена

function parstitle ($urlsape){
 
if($html_content = @file_get_contents('http://' .$urlsape. '')){
preg_match_all( "|<title>(.*)</title>|sUSi", $html_content, $titles);
$titles = $titles[1][0];
if (mb_check_encoding($titles, 'Windows-1251') && !mb_check_encoding($titles, 'UTF-8')){
$titles = mb_convert_encoding($titles, 'UTF-8', 'Windows-1251');
}
if ($titles = "301 Moved Permanently") {
$html_content = @file_get_contents('http://www.' .$urlsape. '');
preg_match_all( "|<title>(.*)</title>|sUSi", $html_content, $titles);
$titles = $titles[1][0];
if (mb_check_encoding($titles, 'Windows-1251') && !mb_check_encoding($titles, 'UTF-8')){
$titles = mb_convert_encoding($titles, 'UTF-8', 'Windows-1251');
}
}
echo $titles;
}else echo "Данные не доступны";
}

Что делаем, парсим содержимое тега <TITLE> заданной страницы $urlsape и выводим результат в правильной (соответствующей сайту) кодировке из переменной $titles.

Вот, собственно и задача:
Как дописать, реализовать кэширование переменной $titles учитывая значение $urlsape в некий текстовый файл, допустим построчно, и потом вытягивать это значение по условию наличия и соответственно выводить результат. Тем самым сократив количество постоянных обращений и бессмысленного повторного парсинга сайтов.

Вижу это так:

Переменная $titles в конце имеет некий результат, заголовок страницы сайта с адресом $urlsape

Необходимо организовать хранилище в файле с расширением .txt следующей структуры:
$urlsape - $titles
$urlsape - $titles
$urlsape - $titles
.......

Проверяем переменную $urlsape, если ее содержимое уже имеется в файле, скажем Cache.txt, то забираем ее значение $titles, и соответсвенно выводим.
Если такой записи нет, то парсим согласно выше приведенному коду и результат записываем в файл Cache.txt. После чего ее тоже выводим.

Насколько трудоемко дописать данный модуль кеширования и какие функции для этого использовать?

Время жизни кэша не имеет значения, данные не обновляются.

Спасибо!

kismedia

Отправлено: 16 Января, 2011 - 20:55:08 • Тема: Проверка кодировки содержимого заданной переменной или удаленного HTML документа • Форум: Программирование на PHP

Ответов: 5
Просмотров: 1152

Вообщем, нашел решение самостоятельно, использую в связке mb_check_encoding и mb_convert_encoding.

PHP:
скопировать код в буфер обмена

if (mb_check_encoding($titles, 'Windows-1251') && !mb_check_encoding($titles, 'UTF-8')){
$titles = mb_convert_encoding($titles, 'UTF-8', 'Windows-1251');
}

Ну и весь код функции с выше приведенным условием:

PHP:
скопировать код в буфер обмена

function parstitle ($urlsape){
 
if($html_content = @file_get_contents('http://' .$urlsape. '')){
preg_match_all( "|<title>(.*)</title>|sUSi", $html_content, $titles);
$titles = $titles[1][0];
if (mb_check_encoding($titles, 'Windows-1251') && !mb_check_encoding($titles, 'UTF-8')){
$titles = mb_convert_encoding($titles, 'UTF-8', 'Windows-1251');
}
echo $titles;
}else echo "Данные не доступны";
}

Парсим содержимое тега <TITLE> заданной страницы $urlsape и выводим результат в правильной (соответствующей сайту) кодировке.

Всем спасибо за помощь! Улыбка

kismedia

Отправлено: 15 Января, 2011 - 21:19:15 • Тема: Проверка кодировки содержимого заданной переменной или удаленного HTML документа • Форум: Программирование на PHP

Ответов: 5
Просмотров: 1152

Всем здравствуйте! Улыбка

написал вот я, такую небольшую функцию:

PHP:
скопировать код в буфер обмена

function parstitle ($urlsape){
 
if($html_content = @file_get_contents($urlsape)){
preg_match_all( "|<title>(.*)</title>|sUSi", $html_content, $titles);
$titles = $titles[1][0];
echo $titles;
}else echo "Данные не доступны";
}
 

Что делаем, да, собственно, просто парсим содержимое тега <TITLE> по адресу $urlsape. Все как бы работает, проблема только с кодировкой.
Если страница по заданному адресу в "cp1251" , то получаем на выходе "квадратики" (у меня на сайте "utf-8").

Можно сделать так:

PHP:
скопировать код в буфер обмена

$titles=iconv("cp1251", "utf-8", $titles);

Но а если страница и так уже в "utf-8"?

Вообщем, как проверить кодировку либо всей страницы , либо содержимого переменной $titles и уже в зависимости от этого сделать выше приведенную операцию?

Может есть способ по-проще? Спасибо!

Страниц (3): [1] 2 3 »