FDE Grabber > Описание движка

Есть ли возможность или сколько стоит дописать

(1/2) > >>

Artes:
Существует ряд видов контента, когда должна парсится не только страница по ссылке, а и файлы с нее.
Пример

- Страница - лента новостей \ категори
-- Страница новости с фотогаллерей или документами
--- Сами фотографии фотогаллереи

Т.е граббер без проблем заходит и грабит страничку галлереи с маленькими картинками, а большие само-собой не получает, так вот сделать так что бы получал т.е некий хак для источника "получать картинки по ссылкам"

Stanislav:

--- Цитировать ---Страница - лента новостей \ категори
--- Конец цитаты ---

Это обычный граббинг html источника - такое давно есть в граббере


--- Цитата: Artes от Февраль 06, 2012, 22:42:00 ---Существует ряд видов контента, когда должна парсится не только страница по ссылке, а и файлы с нее.
Пример

-- Страница новости с фотогаллерей или документами
--- Сами фотографии фотогаллереи

Т.е граббер без проблем заходит и грабит страничку галлереи с маленькими картинками, а большие само-собой не получает, так вот сделать так что бы получал т.е некий хак для источника "получать картинки по ссылкам"

--- Конец цитаты ---

Если маленькие картинки показываются под ссылками на большие картинки - то можно использовать какой-то хак или замены регулярными выражениями.

А если картинки показываются, например, через отдельную промежуточную страницу, то на автомате этого, конечно, не сможет сделать ни один существующий граббер, позиционируемый как универсальный.
То, что вы описали относится к сложному граббингу на заказ, а-ля граббинг интернет магазина с дифференциацией контента по разным полям, как, собственно и граббинг галереи изображений, ведь для того, чтобы сграбить большую картинку галереи - парсеру придётся каким-то образом распознать ссылку на большую картинку, а следовательно нужен шаблон, а дальше ещё интереснее - ему потребуется перейти по ссылке, снова распознать нужную картинку и уже потом скачать, но это ещё не всё - ему потребуется вставить эту картинку в контент исходной новости в том виде, который нужен вам
Если это и можно сделать, то это можно сделать только хаком на заказ: http://fdstar.net/order.html

Artes:
тогда подскажите:

Страница галереи на которой 20+ маленьких фото снизу под каждым из фото прямая ссылка на большую картинку


--- Код: ---<div class="gallery_list">
<a href="/photo/femjoy/armida_00398/5716/16/2/">
<img src="/galsx4468/armida_00398/thumbnails/tnarmida_00398_2.jpg">
</a>
<br>
<a rel="gallery[gallery]" href="/galsx4468/armida_00398/armida_00398_2.jpg">file</a>
</div>

<div class="gallery_list">
<a href="/photo/femjoy/armida_00398/5716/16/3/">
<img src="/galsx4468/armida_00398/thumbnails/tnarmida_00398_3.jpg">
</a>
<br>
<a rel="gallery[gallery]" href="/galsx4468/armida_00398/armida_00398_3.jpg">file</a>
</div>


--- Конец кода ---

можно ли такую конструкцию как-то разобрать?

Stanislav:
конечно можно - достаточно использовать замену регулярным выражением

Artes:

--- Цитата: Stanislav от Февраль 08, 2012, 13:50:49 ---конечно можно - достаточно использовать замену регулярным выражением

--- Конец цитаты ---
готов даже заплатить за шаблон данного чуда через регулярные выражения

Навигация

[0] Главная страница сообщений

[#] Следующая страница

Перейти к полной версии