Форум Сообщества Практиков Конкурентной разведки (СПКР) » Библиотека источников и иструменты её создания и ведения » Мастер подключения поисковиков, сайтов и RSS-потоков |
![]() |
Вперед>> | Страницы: 1 2 3 4 5 6 7 8 9 | Печать |
tungus1973
Модератор форума
Откуда: г. Санкт-Петербург Всего сообщений: 795 Рейтинг пользователя: 11 Ссылка Дата регистрации на форуме: 3 июля 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 23 мая 2011 10:13 Сообщение отредактировано: 23 мая 2011 10:14 Vinni написал: У Outlook'а простой язык правил попадания в рубрику, поэтому мусор неизбежен. Я, например, пользуюсь RSS-агрегатором в Outlook2007 В "СайтСпутнике Ньюс" же можно задавать не только слова, но и расстояние между словами, можно указать огромное множество правил попадания в рубрику. В этом его несомненная сила. |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Дополнительно к сказанному tungus1973: 1) Вряд ли где-то автоматически выделяются контенты новости из всего содержания ссылки, что само по себе удобно, а также влияет на точность. 2) Кроме RSS ещё можно подключить встроенные поиски и произвольные страницы. Подключение произвольных страниц можно рассматривать как моделирование RSS-потоков. Оно может быть применено на тех страницах, где RSS-потоков нет или когда не вся интересная информация с источника попадает в RSS-поток. |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
tungus1973 написал: У Outlook'а простой язык правил попадания в рубрику, поэтому мусор неизбежен. Правильно - функциональность есть, но ее возможности ограниченные (изначально было заявлено, что такая функциональность только в СайтСпутнике ![]() ![]() И в RSS-агрегаторах на число правил что-то я не видел ограничений ![]() |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
Алексей Мыльников написал: 1) Вряд ли где-то автоматически выделяются контенты новости из всего содержания ссылки, что само по себе удобно, а также влияет на точность. Ну как же. Есть небезызвестный проект Скиур, который позволяет эмулировать RSS для новостных лент произвольных сайтов. С его помощью можно создать RSS-поток для большого числа сайтов (но не для всех ![]() ЗЫ Покажите, например, пошагово как подключить новостную ленту compromat.ru к СайтСпутнику как произвольную страницу ![]() |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 23 мая 2011 12:30 Сообщение отредактировано: 23 мая 2011 12:31 Vinni написал: ЗЫ Шаги следующие. 1. Беру ссылку compromat.ru/ и помещаю её в окно на первой вкладке Мастера. 2. Убираю галочку, так как это подключение не поиска, а произвольной страницы (никакие ключи поиска не нужны). 3. Нажимаю правую кнопку мышки на "Открыть". Жду. 4. На второй вкладке в ручном режиме ввожу признаки: <BR><B> и >01</A> 5. На третьей вкладке ввожу имя источника: "ГлавнаяСтр", по нему будет обращение к этому подключению. Можно проверить его правильность на этой вкладке. 6. Регистрирую на 4-ой вкладке в новом сценарии с именем "Compromat" это подключение. В прикрепленном файле полученное подключение. Его можно импортировать и опробовать. Прикрепленный файл (Сценарий~Compr, 455 байт, скачан: 607 раз) |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
В продолжение предыдущего сообщения: в прикрепленном файле автоматически полученная полнотекстовая новостная лента с главной страницы Компромата.Ру. Её можно разнести по Рубрикам. Прикрепленный файл (Новости_13.rar, 645249 байт, скачан: 445 раз) |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Таким образом RSS-поток с главной страницы Компромата.Ру смоделирован. Изначально RSS-потока на этой страницы нет. |
Vinni
Администратор
Всего сообщений: 2136 Рейтинг пользователя: 22 Ссылка Дата регистрации на форуме: 5 июня 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 23 мая 2011 13:28 Сообщение отредактировано: 23 мая 2011 13:29 Алексей Мыльников написал: <BR><B> Спасибо! ![]() Но в вашем варианте пропускается первая новость на странице (вы берете строчку, которая принадлежит концу предыдущей новости вместе с началом строки дляследующей новости). ![]() Там чуть посложнее выражение - <b>(<BR>|) В полноценном RSS-потоке нужно автоматически указывать дату-время публикации (на этом сайте указывается только дата - как определить время автоматически?) У Вас я не вижу такого - нужно смотреть дату публикации вручную по тексту... Плюс что делать с новостями, для которых вместо даты указан крестик, если будете автоматически выделять дату? ![]() |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Если на странице несколько признаков начала новости или сниппета, то её можно подключить несколько раз в одном сценарии. В целом, то что Вы отметили в предыдущем сообщении, со временем "подрихтую". |
tungus1973
Модератор форума
Откуда: г. Санкт-Петербург Всего сообщений: 795 Рейтинг пользователя: 11 Ссылка Дата регистрации на форуме: 3 июля 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 23 мая 2011 14:51 Сообщение отредактировано: 23 мая 2011 14:54 Vinni написал: Если тем мониторинга и запросов единицы, то - да, достаточно простого RSS-агрегатора. Когда тем несколько десятков, работать с простым агрегатором становится тягостно. Когда количество потоков переваливает за сотню, просматривать весь мусор не представляется возможным. Тем не менее, в большом числе случаев достаточно и простого списка ключевых слов. Конечно, следует признать, что на процесс сильно влияет специализированность источника и употребимость ключевых слов. Если источник информации специализированный - мусора не будет, все сообщения полезны. Если источник, кроме нужной Вам темы, публикует сообщения других сфер (например, РИА "Новости"), мусора может быть много. Если ключевые слова специализированные, например, мономолекулярная реакция распада азометана, значит ссылок будет немного. Если же слова общеупотребимые - мусора будет ОГО-ГО! Для работы с малым количеством специализированных источников и при отслеживании специализированных ключевых слов достаточно простого RSS-агрегатора новостей. Иначе - рекомендую "СайтСпутник Ньюс" - сэкономите немало времени. |
Вперед>> | Страницы: 1 2 3 4 5 6 7 8 9 | Печать |
Форум Сообщества Практиков Конкурентной разведки (СПКР) » Библиотека источников и иструменты её создания и ведения » Мастер подключения поисковиков, сайтов и RSS-потоков |
![]() |
Самые активные 20 тем |
![]() |