• Март 06, 2021, 01:02:33
• Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.
Не получили письмо с кодом активации?

Просмотр сообщений

В этом разделе можно просмотреть все сообщения, сделанные этим пользователем.


Сообщения - Artes

Страницы: [1]
1
конечно можно - достаточно использовать замену регулярным выражением
готов даже заплатить за шаблон данного чуда через регулярные выражения

2
тогда подскажите:

Страница галереи на которой 20+ маленьких фото снизу под каждым из фото прямая ссылка на большую картинку

<div class="gallery_list">
<a href="/photo/femjoy/armida_00398/5716/16/2/">
<img src="/galsx4468/armida_00398/thumbnails/tnarmida_00398_2.jpg">
</a>
<br>
<a rel="gallery[gallery]" href="/galsx4468/armida_00398/armida_00398_2.jpg">file</a>
</div>

<div class="gallery_list">
<a href="/photo/femjoy/armida_00398/5716/16/3/">
<img src="/galsx4468/armida_00398/thumbnails/tnarmida_00398_3.jpg">
</a>
<br>
<a rel="gallery[gallery]" href="/galsx4468/armida_00398/armida_00398_3.jpg">file</a>
</div>


можно ли такую конструкцию как-то разобрать?

3
Существует ряд видов контента, когда должна парсится не только страница по ссылке, а и файлы с нее.
Пример

- Страница - лента новостей \ категори
-- Страница новости с фотогаллерей или документами
--- Сами фотографии фотогаллереи

Т.е граббер без проблем заходит и грабит страничку галлереи с маленькими картинками, а большие само-собой не получает, так вот сделать так что бы получал т.е некий хак для источника "получать картинки по ссылкам"

4
Замеченные баги / Re: Проблема с UTF-8
« : Декабрь 17, 2011, 15:32:02 »
Понял, то ошибка была в том, то категории кодировка задана явно а источнику автоматом, вот они и загинались. Задал явно и там и там, все заработало.

Если можно еще вопрос, в базе граббера все статьи видны нормально, а на сайте выводятся кракозяблами. Проблема в неком несовпадении кодировок граббера и сайта? Нужно играться с настройками сайта в граббере (кодировки) или еще могут быть причины?

5
Замеченные баги / Re: Проблема с UTF-8
« : Декабрь 16, 2011, 20:29:26 »
Как пример бок с сайтом teleshow.com.ua/ Кодировка хоть и по тупому но указана в коде
<meta charset="UTF-8" />

По дефолту грабер определяет как 1251 и показывает крякозяблы.
Ставишь принудительно utf 8 вобще ничего не разбирает.

6
Замеченные баги / Проблема с UTF-8
« : Декабрь 16, 2011, 13:52:39 »
Добрый день.
Возникла проблема с 4.1
Есть сайты где не указана кодировка или указана UTF-8 но грабер ее не распознает
Если в автоматическом режиме он парсит кракозяблы т.к кодировка не та
Если источнику задавать четко UTF-8 даже тест не проходит, начинается загрузка и у граббера вместо результата тест пустая страничка открывается, вобще без до замен \ источник \ послк, вобщем не работает.

Сталкивались? И как исправить?

Страницы: [1]