• Апрель 13, 2021, 17:31:04
• Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.
Не получили письмо с кодом активации?

Просмотр сообщений

В этом разделе можно просмотреть все сообщения, сделанные этим пользователем.


Темы - FD

Страницы: 1 [2] 3 4 ... 6
16

>  на Денвере реально запустить программу FDE Grabber?

да, разумеется, но на денвере нет библиотек curl и mb_string

но их можно доставить, скачав с php.net для вашей версии php:
http://www.php.net/releases/ (zip package)

> ага и теперь его нужно как-то поставить ), Вот только как )

требуется:
1 - распаковать архив с дистрибутивом PHP во временную папку
2 - вытащить из папки ext dll файлы php_curl.dll и php_mbstring.dll
3 - скопировать в соответствующую папку денвера
4 - отредактировать php.ini денвера:

раскомментировать строки

;extension=php_mbstring.dll

так, чтобы получилось

extension=php_mbstring.dll


и

;extension=php_curl.dll


так, чтобы получилось

extension=php_curl.dll

5 - скопировать из нового дистрибутива PHP файлы libeay32.dll и ssleay32.dll в папку C:/WINDOWS/system32/
6 - перезапустить денвер



17

> ммм...я установил систему на Дэнвере -тест показывает все ok... проблема в том что после того как нажимаю на какое нибудь меню - вылетаю на страницу
> логина...снова захожу и попадаю на нужную страницу...пытаюсь что-то изменить и снова попадаю на страницу логина...где копать непонятно...
> домен http://dansxxxx/gra/index.php

домен должне быть ВАЛИДНЫМ
dansxxxx - не подходит
dansxxxx.com - подходит
Кроме того, можно обращаться по IP адресу



18
> парсю контент с блога на wp в DLE. У меня в полную новость добавляется краткая
> что может быть?

в вашем темплейте дле есть переменные вывода краткой новости и полной, переменную для вывода краткой нужно просто удалить, и оставить только вывод полной в расширенной новости

в темплейте с краткой новостью должно стоять только {short-story}
в полной - {short-story} ставить не нужно, должно стоять только {full-story}

19
> теги граббер расставляет или в вордпрессе 2.8 такая фича?

да, по умолчанию эта опция включена в конфиге:

для DLE
define('add_dle_tags', true);

Для остальных поддерживаемых CMS, например WordPress:
define('add_tags', true);

При этом, можно указать минимальную длину тега, который будет добавляться:
define('min_tags_length', 4);


Как это работает:
заголовок разбивается на слова по пробельным и пунктуационным символам, данные слова и добавляются как теги для облака меток и связываются с публикуемой статьёй

20

Если статьи при граббинге обрезаются - выполните запросы к базе, которые увеличивают максимальную длину статьи:

ALTER TABLE `fde_articles` MODIFY COLUMN `full_text` LONGTEXT NOT NULL;
ALTER TABLE `fde_articles` MODIFY COLUMN `short_text` LONGTEXT NOT NULL;

Примечание: в запросах предполагается, что префикс к таблицам граббера "fde_"

Если выполнение данных запросов проблематично, то:
1 - скопируйте файл update_grabber_longtext_articles.php из папки граббера корень_граббера/updates/  в папку корень_граббера/
2 - запустите скопированный файл из браузера
3 - удалите скопированный файл

21
> Здравствуйте, у меня вопрос по граберу, в связи с чем может быть связано то, что грабер усекает слишком длинный урл, хотя при тесте источника всё
> нормально, а когда дело доходит до граба, то он идёт грабить по усеченному урлу и ругается что парсинг эррор(
> в БД crontab_feeds.php их заносит уже в усеченном виде.
> длина усеченого урл получается 255 символов, можно ли это как-то обойти?

можно, если версия вашего MySQL сервера - 5 и выше, то поможет запрос к базе, вида:

ALTER TABLE `fde_articles` MODIFY COLUMN `address` varchar(1000) default NULL;
если версия ниже 5, то запрос:

ALTER TABLE `fde_articles` MODIFY COLUMN `address` text default NULL;
Примечание: в запросах предполагается, что префикс к таблицам граббера "fde_"


22
> Пользуясь случаем задам ещё один вопрос) Почему в краткой новости, когда в ней нет картинок, в результате появляется 1я по счету картинка из полной
> новости? Джумла 1.5

Это стандартное поведение граббера - для того, чтобы краткая новость обязательно содержала картинку.
Если это не желательно, то - отключите в конфиге настройку: "smart_enclosure", указав значение "false"

define('smart_enclosure', false);

23
> Как определить путь к моей CMS на сервере?

определить путь к CMS на сервере можно PHP скриптом, который требуется закачать в корень, где установлена CMS и запустить из браузера:

<?PHP
define('ROOT', rtrim(str_replace('\\', '/', dirname(__FILE__)), '/'). '/');
echo ROOT;
?>

Прямые слеши ("/") в конце путей, в конфиге,  требуется указывать обязательно.

24
> не публикуются картинки!!!

возможны следующие причины:

1 - неправильно указан путь к CMS на сервере в конфиге
Внимательно читайте ридми!

определить путь к CMS на сервере можно PHP скриптом, который требуется закачать в корень, где установлена CMS и запустить из браузера:

<?PHP
define('ROOT', rtrim(str_replace('\\', '/', dirname(__FILE__)), '/'). '/');
echo ROOT;
?>

Прямые слеши ("/") в конце путей, в конфиге,  требуется указывать обязательно.


2 - не выставлены права на запись на требуемые папки граббера и/или CMS (папка назначения, куда в итоге перемещаются картинки)


25

> Как переграбить полученные ранее статьи?

для этого, зайдите в раздел "поиск" в администраторском интерфейсе системы импорта новостей, найдите требуемые новости, и в результатах поиска нажмите на ссылку: изменить статус найденных статей на "ожидает получения"

26
> вот что странно - все статьи на сайте не видны

в каком плане?

> ну они в админке есть а на сайте их нет

вы модерацию включали?

> а где это?

в настройках категории граббера

> включено


При указании в настройках категории граббера параметра модерации "ДА" - статьи не публикуются на сайте, а постятся в CMS со статусом "ожидает модерации"
При указании параметра модерации "НЕТ" - статьи публикуются на сайте сразу, без модерации


27
> так а вот если я хочу в один сайт на е107 загонять множество новостей с разных источников то как быть? просто по очереди грабить по каждому источнику?

нет, для этого в конфиге требуется указать - получать статьи с каждого источника по очереди

 что для того, чтобы новости получались и постились в порядке:

новость источника1
новость источника2
новость источника3

новость источника1
новость источника2
новость источника3

новость источника1
новость источника2
новость источника3

новость источника1
новость источника2
новость источника3

...

в конфиге, параметр "receive_articles_by_feeds_order"
должен иметь значение "true":

define('receive_articles_by_feeds_order', true);





> а... супер то есть он по одной будет со всех брать и как бы все перемешано будет так?

да

28

> как синонимизацию запустить

Базы синонимайзера
В данном разделе вы можете импортировать/экспортировать базы данных для синонимайзера из файла/в файл
При этом, файл синонимов должен иметь формат:

слово_для_замены|синоним_1,синоним_2,синоним_3...
слово_для_замены|синоним_1,синоним_2,синоним_3...
слово_для_замены|синоним_1,синоним_2,синоним_3...
слово_для_замены|синоним_1,синоним_2,синоним_3...


Базовые версии баз данных для синонимайзера можно скачать отсюда:

http://fdstar.net/download/synonymizer/english_utf8_syn_base_0.1.zip - база английских синонимов
http://fdstar.net/download/synonymizer/russian_utf8_syn_base_0.1.zip - база русских синонимов


Для импортирования базы данных синонимайзера, необходимо распаковать архив в директорию на вашем сервере D:/FDE_ROOT/www/fde_grabber_4/uploads/synonymizer/import и в разделе импортирования баз для синонимайзера её импортировать.

Процесс импортирования - довольно ресурсоёмок, и может занять некоторое время.

Рекомендуется его проводить в то время, когда ваш сервер не сильно загружен, например, в ночное время.

При импортировании файла базы синонимайзера, необходимо правильно указать кодировку, в которой он записан.

Базовые версии файлов баз синонимайзера распространяются в кодировке UTF-8





после импорта синонимов необходимо включить синонимизацию в настройках категории граббера

Использовать синонимайзер?:  да     
Максимальная глубина синонимизации: процент синонимов от общего количества слов




иногда бывает такое:




> а синонимизацию где можно проверить?

в разделе тест синонимайзера

> не синонимизирует!

вы синонимы уже импортировали?

> да, еще при установке (далее идёт ссылка на админку граббера клиента... в раздел синонимов)

вы неправильно импортировали;
нужно было указывать кодировку UTF-8;
удалите базу и переимпортируйте с кодировкой UTF-8

> заработало, спасибо

29

> а он по 1,2,3 ...4 НЕ ПОЛЕЗЕТ В АРХИВ?
> тока с /news/ будет брать?

в граббере имеется возможность при настройке источника включить обход пейджера
1 2 3 4 5 6 7 8 9 10 > >>
это называется пейджером, от английского слова "page" (страница)
адреса имеют вид

http://www.xxx.ru/news/news.cgi?startrec=0
http://www.xxx.ru/news/news.cgi?startrec=10
http://www.xxx.ru/news/news.cgi?startrec=20
http://www.xxx.ru/news/news.cgi?startrec=30
...

грубо говоря, опять шаблон...

http://www.xxx.ru/news/news.cgi?startrec={page}

переменная {page} будет пробегать указанный диапазон значений

Кроме того, вместо обычного адреса источника - указывается шаблонный
Адрес источника: http://www.xxx.ru/news/news.cgi?startrec={page}
и включается обход пейджера в настройках источника:

Обход пейджера
Задействовать обход пейджера: да

30
> Подскажите как правильно залогиниться на сайт (dle) я указываю в "POST параметры для логинизации:" ?login=login&pass=pass , а при тесте выдаёт
> » Требуется логин
> » Ошибка логина: не получены куки логина

в граббере параметры логина указываются следующим образом:

http://warezed.ru/index.php?login_name=ЛОГИН&pass=login_password&login=submit
http://warezed.ru/index.php - страница, через которую будет происходить логин
?login_name=ЛОГИН&pass=login_password&login=submit - POST параметры логина

пусть вас не смущает то, что параметры указаны как GET параметры - таков синтаксис граббера

http://warezed.ru/index.php?login_name=ЛОГИН&login_password=ПАРОЛЬ&login=submit
ЛОГИН  и ПАРОЛЬ требуется иметь на сайте, с которого будете грабить - то есть, требуется предварительно там зарегистрироваться

!Важно: если адрес сайта указывается с www, то и параметры логина должны быть указаны с www. Если без, то без

Страницы: 1 [2] 3 4 ... 6