SiteSputnik: итоги развития программы за 2010 год

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Разработчик СайтСпутник, документация, где скачать »   SiteSputnik: итоги развития программы за 2010 год
RSS

SiteSputnik: итоги развития программы за 2010 год

<<Назад  Вперед>>Печать
 
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 826
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Программа SiteSputnik: итоги развития за 2010 год.
Подробно здесь - sitesputnik.livejournal.com/1193.html

Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1055
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009
Коллеги, добавлю немного... Так понимаю пользующихся этим блоком в СайтСпутнике не много, а зря :)
Вот мои впечатления от дополнительного модуля "News" ( с моего блога КР в РФ. Новости) -попробовал я таки дополнительный блок под названием "News". Это, я вам скажу, выход на новый уровень. Сама по себе программа позволяет экономить массу времени и не напрягаясь решать массу задач, но наличие новостного модуля открывает еще ряд возможностей. Теперь можно работать не только со ссылками и сниппетами, но и с полными текстами найденного. Согласитесь - это совсем другие возможности. Во первых появляется авторубрикация найденного, а во вторых - возможность работы с полным текстом новостей. В общем настоятельно рекомендую всем, кто профессионально занимается поиском информации в интернете иметь СайтСпутник в своем арсенале со всеми его дополнительными модулями.

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 826
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Да, ещё один итог 2010 года с перспективой на следующие годы - это начало работ не только со ссылками и сниппетами, но и с контентами ссылок.
Такая работа имеется в вариантах программы SiteSputnik Pro+News и SiteSputnik Pro+Contacts, вышедших в 2010 году.

Сделаю, на мой взгляд, важное уточнение для SiteSputnik Pro+News. Оно связано с понятием "Новость".

Под новостью понимается не только собственно новостной контент ссылки, берущейся из новостных источников, но и другие разновидности контента, берущиеся из других источников.
Примеры других разновидностей новостного контента:
- вакансии и анкеты предендентов с рекрутинговых сайтов,
- описание коммерческих предложений и лотов с досок объявлений и торговых площадок,
- объекты недвижимости с сайтов купли-продажи недвижимости,
- тому подобные ссылки из периодически обновляемых сайтов.

Программе не важно какой смысл контента, главное, что и "Новость" с Газета.ру, и "Вакансия" с Superjob.ru, и многие "Сообщения" из ЖЖ и форумов, ... удовлетворяют ограниченному количеству контекстно-зависимых условий и, соответственно, могут быть автоматически выделены из html-текста ссылки.

Многие, но не все, например, если брать выдачу с Яндекса, Google и некоторых других средств поиска, берущих информацию из огромного числа произвольных источников, то мы столкнемся с контестно-свободными условиями и, по моим оценкам, основанным на эксперименте, выделить новость (смысловой контент ссылки) удастся с разным успехом: бывает у 80%, бывает и только у 20% ссылок.
При выделении Новостей с тематических сайтов процент правильного выделения новости более, чем 90%.

Новость (очищенный от "мусора" смысловой контент ссылки) хороша тем, что с ней, в отличие от полного контента ссылки, можно продолжить работать с большим успехом.
Например, рационально применить Рубрикацию. Используя правило попадания новости в Рубрику, можно с очень хорошей точностью разбросать новости по темам и подтемам. Рубрики имеют древовидную структуру.
Ещё одно действие, которое уже умеет делать СайтСпутник, - это автоматическое формирование двух специальных списков:
1)"Ссылка-Правила" - для каждой ссылки, приводится перечень всех правил из всех рубрик, которым она удовлетворяет;
2)"Правило-Ссылки" - для каждого правила, приводится перечень всех ссылок, которые ему удовлетворяют.

В частности, первый список показывает выполнение (пересечение) на одной ссылке нескольких правил (логических условий), которым удовлетворяет ссылка.

<<Назад  Вперед>>Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Разработчик СайтСпутник, документация, где скачать »   SiteSputnik: итоги развития программы за 2010 год
RSS

Последние RSS
Не все VPN-сервисы одинаково полезны
«Яндекс» научился выдавать в поиске не скрытые Google-документы. Правда лавочку
War and marketing: 1937 July 7th vs. 2018 July 1st
Историческое. Агентурная разведка
Open Source Intelligence (OSINT) Tools and Resources Handbook
Top tips on gathering information about companies by using free online sources
Новое на блоге HRразведка
Безопасность данных в MS Access
Слово как улика
20 Recon and Intel Gathering Tools used by InfoSec Professionals
What’s Changed?
10 альтернативных поисковиков
Ситуационный центр главы Республики Коми
Развёртывание ситуационных центров на базе технологии Avalanche
Как принимать сложные решения. Советы бывшего оперативника ЦРУ.
Открытая информация о "Новичке" из сети интернет.
Ген. директор "ОЗХО" Ахмет Узюмдж о "Новичке" и хим. атаке в Сирии
Онлайн-сервисы для Twitter
Коллекция для Twitter
Приложение Opera VPN закрывается

Самые активные 20 тем RSS
Новости блогов
Не все VPN-сервисы одинаково полезны