SiteSputnik: итоги развития программы за 2010 год

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Разработчик СайтСпутник, документация, где скачать »   SiteSputnik: итоги развития программы за 2010 год
RSS

SiteSputnik: итоги развития программы за 2010 год

<<Назад  Вперед>>Печать
 
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 798
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Программа SiteSputnik: итоги развития за 2010 год.
Подробно здесь - sitesputnik.livejournal.com/1193.html

Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1055
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009
Коллеги, добавлю немного... Так понимаю пользующихся этим блоком в СайтСпутнике не много, а зря :)
Вот мои впечатления от дополнительного модуля "News" ( с моего блога КР в РФ. Новости) -попробовал я таки дополнительный блок под названием "News". Это, я вам скажу, выход на новый уровень. Сама по себе программа позволяет экономить массу времени и не напрягаясь решать массу задач, но наличие новостного модуля открывает еще ряд возможностей. Теперь можно работать не только со ссылками и сниппетами, но и с полными текстами найденного. Согласитесь - это совсем другие возможности. Во первых появляется авторубрикация найденного, а во вторых - возможность работы с полным текстом новостей. В общем настоятельно рекомендую всем, кто профессионально занимается поиском информации в интернете иметь СайтСпутник в своем арсенале со всеми его дополнительными модулями.

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 798
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Да, ещё один итог 2010 года с перспективой на следующие годы - это начало работ не только со ссылками и сниппетами, но и с контентами ссылок.
Такая работа имеется в вариантах программы SiteSputnik Pro+News и SiteSputnik Pro+Contacts, вышедших в 2010 году.

Сделаю, на мой взгляд, важное уточнение для SiteSputnik Pro+News. Оно связано с понятием "Новость".

Под новостью понимается не только собственно новостной контент ссылки, берущейся из новостных источников, но и другие разновидности контента, берущиеся из других источников.
Примеры других разновидностей новостного контента:
- вакансии и анкеты предендентов с рекрутинговых сайтов,
- описание коммерческих предложений и лотов с досок объявлений и торговых площадок,
- объекты недвижимости с сайтов купли-продажи недвижимости,
- тому подобные ссылки из периодически обновляемых сайтов.

Программе не важно какой смысл контента, главное, что и "Новость" с Газета.ру, и "Вакансия" с Superjob.ru, и многие "Сообщения" из ЖЖ и форумов, ... удовлетворяют ограниченному количеству контекстно-зависимых условий и, соответственно, могут быть автоматически выделены из html-текста ссылки.

Многие, но не все, например, если брать выдачу с Яндекса, Google и некоторых других средств поиска, берущих информацию из огромного числа произвольных источников, то мы столкнемся с контестно-свободными условиями и, по моим оценкам, основанным на эксперименте, выделить новость (смысловой контент ссылки) удастся с разным успехом: бывает у 80%, бывает и только у 20% ссылок.
При выделении Новостей с тематических сайтов процент правильного выделения новости более, чем 90%.

Новость (очищенный от "мусора" смысловой контент ссылки) хороша тем, что с ней, в отличие от полного контента ссылки, можно продолжить работать с большим успехом.
Например, рационально применить Рубрикацию. Используя правило попадания новости в Рубрику, можно с очень хорошей точностью разбросать новости по темам и подтемам. Рубрики имеют древовидную структуру.
Ещё одно действие, которое уже умеет делать СайтСпутник, - это автоматическое формирование двух специальных списков:
1)"Ссылка-Правила" - для каждой ссылки, приводится перечень всех правил из всех рубрик, которым она удовлетворяет;
2)"Правило-Ссылки" - для каждого правила, приводится перечень всех ссылок, которые ему удовлетворяют.

В частности, первый список показывает выполнение (пересечение) на одной ссылке нескольких правил (логических условий), которым удовлетворяет ссылка.

<<Назад  Вперед>>Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Разработчик СайтСпутник, документация, где скачать »   SiteSputnik: итоги развития программы за 2010 год
RSS

Последние RSS
Социнжиниринг в военной пропаганде
Тут будем жаловаться
Новое на блоге HRazvedka
История создания ИГИЛовской спецслужбы ЭМНИ (Emni)
«МИРУ-МИР» (Короткометражный фильм) 2017
Парсер для сайта Реформа ЖКХ
Darknet, Deep Web. Как посещать закрытые сайты?
Баланс банковской карты по её номеру
Сборка инструментов для OSINT
This Week SCIP Is in India
Яндекс запустил открытое бета-тестирование Яндекс.Медианы
Яндекс представит свой новый поиск
Kaspersky Who Calls
DarkNet
Книга "Наружное наблюдение"
Larina, SPKR and US 2016 Election
Засветились...
Экономический шпионаж с китайской спецификой
Обновление на блоге HRazvedka
Как найти email нужного человека: инструменты, хитрости, тактика

Самые активные 20 тем RSS
Мелочи
Тут будем жаловаться
Социнжиниринг в военной пропаганде