Форум Сообщества Практиков Конкурентной разведки (СПКР) » Библиотека источников и иструменты её создания и ведения » Индивидуальная настройка сайтов, ресурсов и папок |
<<Назад Вперед>> | Печать |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 12 января 2012 0:51 Сообщение отредактировано: 6 октября 2019 18:57
В версии 7.4.4 от 12.01.12 программы SiteSputnik News реализована новая функция, позволяющая прописывать "индивидуальные" настройки для ссылок, найденных в процессе мониторинга источников информации (сайтов). Настройки предназначены для выбора из содержания ссылок значимой информации. Они применяются, когда автоматический выбор какого-то фрагмента значимой информации невозможен. Настройки могут быть прописаны сайтам, ресурсах или принадлежащим им папкам, в которые "попадают" ссылки. Они принадлежат к контекстно-зависимому типу. Описание новой функции. К значимой информации относятся: очищенное от мусора смысловое содержание ссылки (контент), дата публикации, автор контента, источник. По мере развития программы SiteSputnik News этот список будет расширяться. В настоящей версии программы реализованы следующие контекстно-зависимые условия выбора значимой информации.
На картинке ниже приведен фрагмент базы данных "Настройка сайтов" (красная стрелка). Она вложена в базу данных "Настройка поиска". Значения настроек можно прямо живьём вводить в таблицы базы данных. Для этого используйте иконки, на которые указывает синяя стрелка: левый плюсик - создать строку в верхней таблице, правый - в нижней. Можно для ввода и редактирования настроек воспользоваться иконками, на которые указывает зеленая стрелка. В этом случае появится картинка, размещенная ниже. Особенности работы с контекстно-зависимыми настройками.
Отладка настроек. Для того, чтобы правильно определить значения настроек, используйте специальный режим отладки. Он не влияет на результаты основной работы программы. Для его включения в "Настройки - Параметры - вкладка News" установите галочку для параметра "Создавать отладочные файлы на рабочем столе для "Настройка сайтов"". Параметр размещён в правом нижнем углу вкладки. Это приведет к тому, что на рабочем столе перед моментом выделения значимого контента ссылок создастся папка с именем "SiteSputnik Work", в которую будут записываться контенты ссылок. Именно в них рационально искать настройки сайтов. Например, если начало новости в автоматическом режиме определено неправильно, то Вам следует найти её заголовок в тексте, затем взять впереди стоящий тег, его часть или несколько тегов, проверить является ли эта конструкция единственной до заголовка и перекопировать её в столбец Начало контента (новости). Смысл отладочного режима в следующем. Текст новости уже упрощён. Он пошёл предварительную обработку, в частности, приведен к единой читабельной кодировке на русском языке, несодержащей аброкадабр. Знание языка html не требуется - понимать смысл конструкций этого языка при определении настроек нет необходимости. Искать настройки следует только в программе "Блокнот". Другие программы могут "приукрашивать" (искажать) реальный html-код текста. Подробнее на ссылке о настройке сайтов в СайтСпутнике. Структура базы данных "Настройка сайтов" с несколькими настройками прикреплена к сообщению. Поместите ее в папку "Alias\Internet\Настройка поиска" и обновите структуру: "Ящик - Иерархия Ящиков - Обновить". Это можно сделать пользователям, у которых +News уже установлена и работает. В дальнейшем эта база данных будет находиться в дистрибутиве на своем месте. Прикрепленный файл (Настройка сайтов.rar, 9259 байт, скачан: 429 раз) |
<<Назад Вперед>> | Печать |
Форум Сообщества Практиков Конкурентной разведки (СПКР) » Библиотека источников и иструменты её создания и ведения » Индивидуальная настройка сайтов, ресурсов и папок |
Самые активные 20 тем | |