SiteSputnik: итоги развития программы за 2010 год

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Разработчик СайтСпутник, документация, где скачать »   SiteSputnik: итоги развития программы за 2010 год
RSS

SiteSputnik: итоги развития программы за 2010 год

<<Назад  Вперед>>Печать
 
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 835
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Программа SiteSputnik: итоги развития за 2010 год.
Подробно здесь - sitesputnik.livejournal.com/1193.html

Игорь Нежданов
Модератор форума
Прагматик
Откуда: Советский Союз
Всего сообщений: 1055
Рейтинг пользователя: 13


Ссылка


Дата регистрации на форуме:
7 июня 2009
Коллеги, добавлю немного... Так понимаю пользующихся этим блоком в СайтСпутнике не много, а зря :)
Вот мои впечатления от дополнительного модуля "News" ( с моего блога КР в РФ. Новости) -попробовал я таки дополнительный блок под названием "News". Это, я вам скажу, выход на новый уровень. Сама по себе программа позволяет экономить массу времени и не напрягаясь решать массу задач, но наличие новостного модуля открывает еще ряд возможностей. Теперь можно работать не только со ссылками и сниппетами, но и с полными текстами найденного. Согласитесь - это совсем другие возможности. Во первых появляется авторубрикация найденного, а во вторых - возможность работы с полным текстом новостей. В общем настоятельно рекомендую всем, кто профессионально занимается поиском информации в интернете иметь СайтСпутник в своем арсенале со всеми его дополнительными модулями.

---
Есть вопрос - спрашивайте. На прямой вопрос будет прямой ответ...
Лаборатория Перспективных Разработок
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 835
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Да, ещё один итог 2010 года с перспективой на следующие годы - это начало работ не только со ссылками и сниппетами, но и с контентами ссылок.
Такая работа имеется в вариантах программы SiteSputnik Pro+News и SiteSputnik Pro+Contacts, вышедших в 2010 году.

Сделаю, на мой взгляд, важное уточнение для SiteSputnik Pro+News. Оно связано с понятием "Новость".

Под новостью понимается не только собственно новостной контент ссылки, берущейся из новостных источников, но и другие разновидности контента, берущиеся из других источников.
Примеры других разновидностей новостного контента:
- вакансии и анкеты предендентов с рекрутинговых сайтов,
- описание коммерческих предложений и лотов с досок объявлений и торговых площадок,
- объекты недвижимости с сайтов купли-продажи недвижимости,
- тому подобные ссылки из периодически обновляемых сайтов.

Программе не важно какой смысл контента, главное, что и "Новость" с Газета.ру, и "Вакансия" с Superjob.ru, и многие "Сообщения" из ЖЖ и форумов, ... удовлетворяют ограниченному количеству контекстно-зависимых условий и, соответственно, могут быть автоматически выделены из html-текста ссылки.

Многие, но не все, например, если брать выдачу с Яндекса, Google и некоторых других средств поиска, берущих информацию из огромного числа произвольных источников, то мы столкнемся с контестно-свободными условиями и, по моим оценкам, основанным на эксперименте, выделить новость (смысловой контент ссылки) удастся с разным успехом: бывает у 80%, бывает и только у 20% ссылок.
При выделении Новостей с тематических сайтов процент правильного выделения новости более, чем 90%.

Новость (очищенный от "мусора" смысловой контент ссылки) хороша тем, что с ней, в отличие от полного контента ссылки, можно продолжить работать с большим успехом.
Например, рационально применить Рубрикацию. Используя правило попадания новости в Рубрику, можно с очень хорошей точностью разбросать новости по темам и подтемам. Рубрики имеют древовидную структуру.
Ещё одно действие, которое уже умеет делать СайтСпутник, - это автоматическое формирование двух специальных списков:
1)"Ссылка-Правила" - для каждой ссылки, приводится перечень всех правил из всех рубрик, которым она удовлетворяет;
2)"Правило-Ссылки" - для каждого правила, приводится перечень всех ссылок, которые ему удовлетворяют.

В частности, первый список показывает выполнение (пересечение) на одной ссылке нескольких правил (логических условий), которым удовлетворяет ссылка.

<<Назад  Вперед>>Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Разработчик СайтСпутник, документация, где скачать »   SiteSputnik: итоги развития программы за 2010 год
RSS

Последние RSS
шантаж, угрозы по Интернету
Практически весь интернет становится русскоязычным
SiteSputnik. Об одном подходе к мониторингу Телеграм
Безопасность при работе на ПК
Книги о критическом мышлении
Наказывать за вмешательство в частную жизнь, Верховный суд
CI Academic Materials
CiMi.CON Evolution USA
Поиск в КЭШ поисковиков по запросу и пакету запросов
СайтСпутник: Многоязычность, Юникод, MS ACCESS
Новый курс OSINT от АИС
Год тюрьмы за отказ удалять
Книга "Строим доверие по методикам спецслужб"
аналог "Консультанта" о зарубежном законодательстве
Открытые данные ФНС
Получаем информацию по VIN
Competitive-Market Intelligence Conference, Berlin 2018
Не все VPN-сервисы одинаково полезны
«Яндекс» научился выдавать в поиске не скрытые Google-документы. Правда лавочку
War and marketing: 1937 July 7th vs. 2018 July 1st

Самые активные 20 тем RSS