Форум Сообщества Практиков Конкурентной разведки (СПКР) » Разработчик СайтСпутник, документация, где скачать » SiteSputnik: итоги развития программы за 2010 год |
![]() |
<<Назад Вперед>> | Печать |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Программа SiteSputnik: итоги развития за 2010 год. Подробно здесь - sitesputnik.livejournal.com/1193.html |
Игорь Нежданов
Модератор форума
Прагматик Откуда: Советский Союз Всего сообщений: 1025 Рейтинг пользователя: 13 Ссылка Дата регистрации на форуме: 7 июня 2009 |
Коллеги, добавлю немного... Так понимаю пользующихся этим блоком в СайтСпутнике не много, а зря :) Вот мои впечатления от дополнительного модуля "News" ( с моего блога КР в РФ. Новости) -попробовал я таки дополнительный блок под названием "News". Это, я вам скажу, выход на новый уровень. Сама по себе программа позволяет экономить массу времени и не напрягаясь решать массу задач, но наличие новостного модуля открывает еще ряд возможностей. Теперь можно работать не только со ссылками и сниппетами, но и с полными текстами найденного. Согласитесь - это совсем другие возможности. Во первых появляется авторубрикация найденного, а во вторых - возможность работы с полным текстом новостей. В общем настоятельно рекомендую всем, кто профессионально занимается поиском информации в интернете иметь СайтСпутник в своем арсенале со всеми его дополнительными модулями. ---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ... Лаборатория Перспективных Разработок |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Да, ещё один итог 2010 года с перспективой на следующие годы - это начало работ не только со ссылками и сниппетами, но и с контентами ссылок. Такая работа имеется в вариантах программы SiteSputnik Pro+News и SiteSputnik Pro+Contacts, вышедших в 2010 году. Сделаю, на мой взгляд, важное уточнение для SiteSputnik Pro+News. Оно связано с понятием "Новость". Под новостью понимается не только собственно новостной контент ссылки, берущейся из новостных источников, но и другие разновидности контента, берущиеся из других источников. Примеры других разновидностей новостного контента: - вакансии и анкеты предендентов с рекрутинговых сайтов, - описание коммерческих предложений и лотов с досок объявлений и торговых площадок, - объекты недвижимости с сайтов купли-продажи недвижимости, - тому подобные ссылки из периодически обновляемых сайтов. Программе не важно какой смысл контента, главное, что и "Новость" с Газета.ру, и "Вакансия" с Superjob.ru, и многие "Сообщения" из ЖЖ и форумов, ... удовлетворяют ограниченному количеству контекстно-зависимых условий и, соответственно, могут быть автоматически выделены из html-текста ссылки. Многие, но не все, например, если брать выдачу с Яндекса, Google и некоторых других средств поиска, берущих информацию из огромного числа произвольных источников, то мы столкнемся с контестно-свободными условиями и, по моим оценкам, основанным на эксперименте, выделить новость (смысловой контент ссылки) удастся с разным успехом: бывает у 80%, бывает и только у 20% ссылок. При выделении Новостей с тематических сайтов процент правильного выделения новости более, чем 90%. Новость (очищенный от "мусора" смысловой контент ссылки) хороша тем, что с ней, в отличие от полного контента ссылки, можно продолжить работать с большим успехом. Например, рационально применить Рубрикацию. Используя правило попадания новости в Рубрику, можно с очень хорошей точностью разбросать новости по темам и подтемам. Рубрики имеют древовидную структуру. Ещё одно действие, которое уже умеет делать СайтСпутник, - это автоматическое формирование двух специальных списков: 1)"Ссылка-Правила" - для каждой ссылки, приводится перечень всех правил из всех рубрик, которым она удовлетворяет; 2)"Правило-Ссылки" - для каждого правила, приводится перечень всех ссылок, которые ему удовлетворяют. В частности, первый список показывает выполнение (пересечение) на одной ссылке нескольких правил (логических условий), которым удовлетворяет ссылка. |
<<Назад Вперед>> | Печать |
Форум Сообщества Практиков Конкурентной разведки (СПКР) » Разработчик СайтСпутник, документация, где скачать » SiteSputnik: итоги развития программы за 2010 год |
![]() |
Самые активные 20 тем |
![]() |
Мелочи |