• Май 05, 2024, 01:44:26
• Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.
Не получили письмо с кодом активации?

Просмотр сообщений

В этом разделе можно просмотреть все сообщения, сделанные этим пользователем.


Темы - kuvshinov_v

Страницы: [1]
1
Созрел еще вопрос, можно ли сделать так чтобы граббер проверял (скажем в течении 1 дня после публикации статьи) не произошли ли изменения в статье источника (не изменился ли текст не поменялись ли картинки) и если изменения произошли, то граббер обновлял бы опубликованную статью на вашем сайте???

2
Доброго времени суток!
почемуто происходит такая тема: новость грабится отлично, сохраняется , но публикуется два раза...  и на сайте естественно появляется две одинаковых новости подряд, причем какие то новости публикуются по одной а какието по 2 принцип по которому так происходит я не так и понял.
почитал тут в форуме,  было написано про дубли статей и как бороться с ними (говорилось что при удалении статей они потом дублируются)  но я специально решил проверить, удалил новости с сайта, почистил базу граббера (сделал все с чистого листа так сказать) и все равно ...  несколько новостей по 2 штуки несколько по одной...
причем это видно в окне ЛОГА СОБЫТИЙ, там написано что сохранена статья а потом опубликована именно два раза... как вариант могу предположить что во время того как крон запускает один скрипт сохранения статей, кроном также запускается скрипт публикации, может что то там не успевает сохраняться или что то еще??? может такое быть???   как ето победить ????

может есть способ контроля публикаций???  чтобы опубликованные уже не публиковал поновой????

Заранее спасибо за ответ!!!   

3
Доброго времени суток!
не могу понять почему постоянно граббер показывает: " Тест HTML источника: Возвращено результатов: 0"  а конкретно на newsru.com. да и на большенстве сайтов.
Какую бы я ему страницу не указывал всегда 0 и все// даже когда страницу с самой новостью указываю всеравно 0.
пользуюсь простым шаблоном ///  тэст категории источника проходит на ура//  грабит все как надо а вто сам источник не может//  скажите что не правильно делаю???

Также в примерах на демо сайте //  больше половины НТМL источников не работают , а RSS грабит только анонс, а полностью статью не показывает. Помогите разобраться люди добрые :)

PS. Было бы неплохо еще ссылочку, где можно прочитать про регулярные выражения применимые к грабберу/ я не програмер, поэтому для меня актуально/

Заранее спасибо/

Страницы: [1]