Поиск с учетом регистра,по аббревиатуре,фильтры по сниппетам

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Приемы работы с программой СайтСпутник (SiteSputnik) »   Поиск с учетом регистра,по аббревиатуре,фильтры по сниппетам
RSS

Поиск с учетом регистра,по аббревиатуре,фильтры по сниппетам

<<Назад  Вперед>>Печать
 
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 835
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Для целей, указанных в заголовке темы, в SiteSputnik 6.4.3 используйте следующие четыре конструкции:

1. +++слово - до и после этой конструкции могут быть другие ключевые слова (запрос)
2. +++"фраза" - до и после этой конструкции могут быть другие ключевые слова (запрос)
3. запрос ++слово - конструкция ++слово, не относится к запросу, поэтому располагайте ее исключительно после запроса
4. запрос --слово - конструкция --слово, не относится к запросу, поэтому располагайте ее исключительно после запроса и после конструкции ++


Пояснение на примерах (все примеры чисто демонстрационные, а не методические).
1. +++ВолГУ - отфильтрует в любом поисковике: "продал старую Волгу ГАЗ-3110", "новый мост через Волгу в г. Волгограде", оставив информацию, связанную только с волгоградским госуниверситетом, сокращенно ВолГУ. Поиск по аббревиатуре.
2. +++"Мыльников Алексей" - отфильтрует в любом поисковике: "Иван Мыльников, Алексей Кудрин", оставив информацию только о моих однофамильцах и тезках.
3. ОСМП | OSMP ++Україна - оставит только те сниппеты из запроса "ОСМП | OSMP", в которых встречается слово Україна (написано по-украински).
4. +++GE --.ge/ - отфильтрует в любом поисковике грузинские сайты (обратите внимание на точку перед знаками — и наклонную черту после них, точка и черта здесь обязательны). Также отфильтруются Ge, ge и gE слова. Останется информация только о фирме GE (General Electric (специально для Петряшова)).
5. +++ВолГУ --volsu.ru - информация об университете не с сайтов Волгоградского госуниверситета, а из других источников.

Замечания.
1. Пока поиск с учетом регистра (с различием строчных и прописных букв) сделан для одного ключевого слова или для одной ключевой фразы, взятой в кавычки. Думаю, этого достаточно для многих жизненных случаев.
2. Это программное моделирование поиска, построенное на особенностях html-кода сниппетов, выдаваемых поисковиками. Оно часто требует прописывания достаточно глубокого поиска по количеству страниц, - это минус; зато не потребовалось открытие страниц, - это плюс.

Вопросы к форумчанам.
1. Есть ли еще варианты применения подобных конструкций?
2. Есть ли конкретные задачи, в которых после выполнения запроса (пакета запросов) может потребоваться скачивание и анализ контента страниц. Два варианта подобных действий в SiteSputnik(е) уже есть. Это "Мониторинг СМИ и новостных источников" и "Поиск контактной информации для списка предприятий".

Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 835
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

Alexei Mylnikov написал:
[q]
Есть ли еще варианты применения подобных конструкций?
[/q]

По Нику иногда очень удобно, например, для CI-KP пакет:

+++"CI-KP" ^^Здесь KP - на английском
+++"CI-КР" ^^Здесь KP - на русском

Попробуйте выполнить этот пакет с +++ и с +, для того, чтобы увидеть разницу. Но, предварительно, подкачайте версию 6.4.3.2

Николаич
Модератор форума

Откуда: г. Ростов-на-Дону
Всего сообщений: 768
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
7 июня 2009
Понадобилось мне отыскать все почтовые ящики на домене.
Вначале использовал стандартный пакет "Почтовый ящик"
Получил 463 ссылки, среди которых было столько мусора, что не стал и рыться.
Тогда, по образу и подобию, я написал пакет "Почтовые ящики на домене", использовав вот эту конструкцию:
+++"@domain.zone"

Пока я экспериментировал, Яндекс "наложил на меня епитимию".
И все же. При прочих равных условиях я получил 49 уникальных ссылок, без всяких "примесей".

Не сомневаюсь, что и остальные конструкции также удачны.
Спасибо!
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 835
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Николаич предложил в предыдущем топике способ сбора всех "засветившихся" почтовых ящиков на домене.

Еще одно применение конструкций из первого сообщения - поиск расшифровок аббревиатуры. Примеры запросов:

SCIP ++(S
СПКР ++(С
РОПКР ++(Р
"ЦОРИ КМ" ++(Ц

Лучше искать поглубже, например:

SCIP ++(S || Метапоиск=30

можно еще строже:

+++SCIP ++(S || Метапоиск=30

Работает следующим образом. СайтСтутник ищет аббревиатуру и оставляет только те сниппеты, в которых кроме нее обязательно есть открывающаяся скобка, после которой следует первая буква первого слова в аббревиатуре. Как правило, это и есть расшифровка. Поиск выполняется очень быстро, практически весь мусор отсеивается. Часто удается найти несколько расшифровок одной и той же аббревиатуры или ее новое и старое значение.

tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 794
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009
Вопрос по оператору "++".
Точно такой же оператор "++слово" есть в языке запросов Яндекса. Он означает, что это слово обязательно должно присутствовать в любом месте странички.

Применяя этот оператор в Яндекс-запросах "СайтСпутника", я рискую получить нерелевантные результаты. Т.к. программа оставит мне только запросы, в сниппетах которых встречается указанное слово. Если же слово было на страничке, но не попало в сниппеты, то ссылку я не увижу :sad:

Что делать?
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 835
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

tungus1973 написал:
[q]
Вопрос по оператору "++".
Точно такой же оператор "++слово" есть в языке запросов Яндекса.
[/q]

Не знаю (еще раз посмотрел в Яндексе и не нашел) такой конструкции. Знаю +слово. Если это так, то противоречия нет.

Доктор ТуамОсес
Молчун

Всего сообщений: 44
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
2 сен. 2013
[q=Алексей Мыльников]Пояснение на примерах (все примеры чисто демонстрационные, а не методические).
1. +++ВолГУ - отфильтрует в любом поисковике: "продал старую Волгу ГАЗ-3110", "новый мост через Волгу в г. Волгограде", оставив информацию, связанную только с волгоградским госуниверситетом, сокращенно ВолГУ.[/q]
А если использовать белый список, чтобы отфильтровать "реку Волгу" записав в белом списке слово "ВолГУ", то сниппеты в которых нет "ВолГУ" (но есть "Волгу") все равно остаются в выдаче :tuktuk:
Почему-то.
Т.е. черный и белый списки, которые как казалось бы являются логическим продолжением операторов +++ и --- оказались регистро НЕ зависимыми

---
Я разработчик новых концепций, от которых содрогнется вся цивилизация
doctortuamoses.0pk.ru
<<Назад  Вперед>>Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Приемы работы с программой СайтСпутник (SiteSputnik) »   Поиск с учетом регистра,по аббревиатуре,фильтры по сниппетам
RSS

Последние RSS
шантаж, угрозы по Интернету
Практически весь интернет становится русскоязычным
SiteSputnik. Об одном подходе к мониторингу Телеграм
Безопасность при работе на ПК
Книги о критическом мышлении
Наказывать за вмешательство в частную жизнь, Верховный суд
CI Academic Materials
CiMi.CON Evolution USA
Поиск в КЭШ поисковиков по запросу и пакету запросов
СайтСпутник: Многоязычность, Юникод, MS ACCESS
Новый курс OSINT от АИС
Год тюрьмы за отказ удалять
Книга "Строим доверие по методикам спецслужб"
аналог "Консультанта" о зарубежном законодательстве
Открытые данные ФНС
Получаем информацию по VIN
Competitive-Market Intelligence Conference, Berlin 2018
Не все VPN-сервисы одинаково полезны
«Яндекс» научился выдавать в поиске не скрытые Google-документы. Правда лавочку
War and marketing: 1937 July 7th vs. 2018 July 1st

Самые активные 20 тем RSS