Вот нашел у difour код граббинга
<?
# урл, с которого будут браться данные
$source = file_get_contents('http://pda.weather.yandex.ru/index.xml?city_id=27346');
# если нет данных (сайты упал...), то продолжать не надо
if (!$source) die();
/**
* по шаблону получаем наши данные в массив
* $match[0] - будет садержать полное совпадение
* $match[1] - только (.*?) из $source
* \s+ - это новая строка или пробела, табы
*/
if (preg_match('|</span></td></tr>\s+</table>\s+<div>(.*?)</div>\s+</td>\s+</tr></table>|is', $source, $match))
{
/**
* мы должны добавить <div> в самом
* начале и конце, чтоб получить "более"
* правильный и валидный код
*/
$match[1] = '<div>'.$match[1].'</div>';
/**
* Чтоб сильно не нагружать Yandex
* и свой хостинг, для получения быстрых
* результатов
* мы будем кешировать запросы к нему
* и обращаться к этому скрипту только
* через крон, пару раз в день
*/
if (file_exists('weather.html'))
{
unlink('weather.html');
}
# сохраняем все в файл
file_put_contents('weather.html', $match[1]);
}
?>
только как этим воспользоваться? Не хочется юзать информеры