• Апрель 13, 2021, 17:29:46
• Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.
Не получили письмо с кодом активации?

Автор Тема: я бы хотел както вырезать из полных новостей id='news-id-243'  (Прочитано 4366 раз)

Оффлайн FD

  • Владимир
  • Administrator
  • Full Member
  • *****
  • Сообщений: 109
  • -=ЧуКоТсКиЙ аДмИн=-
    • Просмотр профиля
    • FDSTAR
> Настроил грабер, грабит отлично! Единственно не разобрался как вырезать
> из кода ненужные элементы.
> Например в настройках "Категории источников", я использую регулярные
> выражения и новость грабится, но есть ненужные мне стили
> например <div id='news-id-243'>, т.е. я бы хотел както вырезать из
> полных новостей id='news-id-243'.
> Использование хака удаляющего стили не подходит, потому что тогда
> зачищаются нужные стили для оформления статьи например
> <div class="quote"> и т.д. Если как кокой-нибудь путь для решения этой
> ситуации.
> Может можно использовать:
> Замены, с помощью регулярных выражений

Да, это можно сделать заменой регулярным выражением, которая прописывается в
настройках категории. Для добавления нескольких замен, используются
кнопки "+" и "-"

Замены регулярными выражениями - Перл совместимые (PCRE): http://fdstar.net/download/preg_patterns.htm
Указанный код вырезать можно следующей заменой:

что заменяем:

#id='news\-id\-\d+'#i
заменяем: на пустоту или пробел

замены можно указывать отдельно для категории и источника, а также
одновременно и для категории и источника

Пояснение: \d соответствует числу, последующий символ "+" означает,
что числовой символ может встретиться один раз и более

символами "#" мы ограничили шаблон регулярного выражения
символ "i", идущий после "#" означает регистронезависимость шаблона
(подходит для БОЛЬШИХ и маленьких символов)
« Последнее редактирование: Май 25, 2010, 09:00:08 от FD »
http://fdstar.net/ - Создание сайтов
http://fdstar.com/ - Всё о музыке
http://fdstar.ru/ - Форум электронной музыки