Кейс. Восстановление быстро стертой информации в Интернете

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Технологии работы и инструменты конкурентной разведки »   Кейс. Восстановление быстро стертой информации в Интернете
RSS

Кейс. Восстановление быстро стертой информации в Интернете

<<Назад  Вперед>>Печать
 
CI-KP
Администратор

Откуда: Екатеринбург
Всего сообщений: 5565
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
15 мая 2009
Кейс. Восстановление быстро стертой информации, почти исчезнувшей из кэша поисковиков.

yushchuk.livejournal.com/319888.html

Ситуация интересная. До сих пор, мне не приходилось таким образом восстанавливать удаленные из интернета тексты, поэтому расскажу подробнее. Тем более, что автор материала, который я восстанавливал, не возражает.

Итак, в блоге Платона Маматова (kaisi) я увидел текст недельной давности, с названием: "Тут был текст про политоту, но я его стер, ибо надоело".

Обычно в подобных случаях достаточно просто забраться в кэш Яндекса или Гугла, чтобы прочитать удаленный материал. Однако в данном случае, автор настолько быстро его удалил, что это не сработало.
"Насколько быстро стер - не помню. Четко помню что перечитал свой блог, подумал "заебало, тошнит", и стер", - рассказал мне Платон.


Ситуация в кэше Яндекса сложилась любопытная. При запросе

' inurl:kaisi.livejournal.com/783970.html '

картинка в основной выдаче Яндекса была такой:



Я взял из полученного текста фразу "Маленький Феодор, который накопытил себе мешок бабла богоугоднейшими методами" и далее стал работать с ней.

Основная выдача Яндекса, при запросе по этой точной фразе, сниппеты показала:



А основная выдача Гугла - нет:



Выдача Яндекса по блогам - показала, но очень своеобразно.

Сниппеты были видны:




Но вот при попытке раскрыть, и посмотреть полный текст - выскакивала уже новая версия поста, хотя и со старым (первоначальным) заголовком:



Попытка открыть из поиска по блогам Яндекса "сохраненную копию" выдавала уже измененный текст:



И попытка открыть сохраненную копию из основной выдачи Яндекса давала такой же отрицательный для меня результат:



Не буду делать скриншотов, а просто скажу, что остальные известные, и не очень известные поисковики, в которые я раздавал этот запрос, не смогли справиться с задачей - они вообще не видели этого текста. В базу данныз Айкубаз этот текст также не успел попасть - ни в новом, ни в старом виде.

Тогда я сделал запрос в Гугл не по точной фразе, а с помощью оператора inurl. Результат получился любопытный. Страница нашлась.
При этом, кэш Гугла, как и кэш в Янлексе, содержал новую версию страницы и ничем помочь мне не мог:



Но у Гугла была еще и нетекстовая информация - скриншот поста, сохраненного в его кэше. И этот скриншот был явно сделан с первоначального текста:



Качество изображения там, однако, таково, что разобрать весь текст не представляется возможным. Но отдельные слова, все же, читабельны.



Получается, что Гугл имеет скриншот первоначального текста и показывает его пусть и трудночитаемым, но зато целиком.
В то же время, Яндекс хранит и умеет показывать весь первоначальный текст и готов показывать его в виде сниппетов, но только не весь одновременно.

Я провел эксперимент, который оказался удачным: стал брать по одному-два слова из каждого абзаца на скриншоте и ставить их в поиск по блогу kaisi через расширенный поиск.
Вот как это выглядело.

Первый абзац и так показан Яндексом - его не надо было восстанавливать:

Маленький Феодор, который накопытил себе мешок бабла богоугоднейшими методами (от беззастенчивой пропаганды в интересах власти и информационного шантажа до откровенного рейдерства)

Второй абзац был восстановлен по слову "рулит":




Славный Федя, который рулит чернушным и абсолютно аморальным "Политсоветом".

Третий абзац - по слову "письма":



Добрый друг Феденька, сующий свое рыльце в чужие письма, и сливающий их потом на сторону.

Четвертый абзац - по слову "Крашенинников":



Наш славный Федя Крашенинников написал моральную программу для оппозиции.

Пятый абзац состоит из одного слова "Охуеть", которое и так видно.

Шестой абзац восстановлен по слову "особенности":



Ну и вишенкой на тортике - августейшее одобрение оной программы высокоморальнейшим Леонид Михалычем, который знает обо всех милых особенностях своего друга и соратника.

Седьмой абзац читабелен на скриншоте Гугла: "Ох, отцы иезуиты. Как красиво. Мне очень нравится"

Восьмой абзац - восстановлен по слову "сном":



Пойду, забудусь сном.

Итак, текст, который в данный момент выглядит вот так:

Тут был текст про политоту, но я его стер, ибо надоело
Тезисно: Федя - мудак, кто ему верит - наивные кретины

Восстановлен в первоначальном виде:

Отцы иезуиты
Маленький Феодор, который накопытил себе мешок бабла богоугоднейшими методами (от беззастенчивой пропаганды в интересах власти и информационного шантажа до откровенного рейдерства)
Славный Федя, который рулит чернушным и абсолютно аморальным "Политсоветом".
Добрый друг Феденька, сующий свое рыльце в чужие письма, и сливающий их потом на сторону.
Наш славный Федя Крашенинников написал моральную программу для оппозиции.
Охуеть
Ну и вишенкой на тортике - августейшее одобрение оной программы высокоморальнейшим Леонид Михалычем, который знает обо всех милых особенностях своего друга и соратника.
Ох, отцы иезуиты. Как красиво. Мне очень нравится
Пойду, забудусь сном.


Полагаю, что специалистам Конкурентной разведки, равно как и юристам, собирающим уничтоженные улики в Интернете, такой способ однажды может пригодиться.

И еще раз подтвердилась идея о важности сочетания текстовой, и нетекстовой информации при поиске в Интернете.

---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru
Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь.
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Не прибегая к программированию, в прикрепленном файле прилагаю вспомогательный пакет с параметрами для восстановления части ссылки по сниппетам. Его можно запускать как "затравку", по которой уже руками дорабатывать полное (насколько это возможно) содержание удаленной ссылки по методу Ющука.

Если прибегнуть к программированию (реализовать отдельную процедуру в программе SiteSputnik), то можно будет полнее восстановить содержание ссылки. Для этого на базе упомянутого пакета придется сделать три вещи.

1. Запускать для ссылки поиски по первому и последнему слову каждого сниппета (рекурсивно до тех пор пока такие сниппеты и слова будут находиться). По предварительным наблюдениям при поиске по последнему слову часто "подтягивается" следующий за ним текст.

2. Удалить содержание сниппетов, встретившееся повторно.

3. Составить из разрозненных сниппетов монолитный текст, соединяя совпадающие хвосты и головы сниппетов.

В принципе, реализовать такую процедуру реально. Можно будет добавить ее к базовым функциям SiteSputnik Invisible. Первые "впечатления" таковы.

Чтобы опробовать пакет, перепишите прикрепленный файл в папку "Condition Forms" и вызовите его, подставив адрес исследованной Евгением Ющуком ссылки или другой ссылки (можно попробовать специально для этого создать и удалить ссылку (я не пробовал)).
Результат для исследованной ссылки - на картинке (смотрите список "Все сниппеты").


Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Прикрепить пакет не удалось. Привожу его текст живьём. В папке "Condition Forms" создайте файл "Восстановление содержания ссылки по сниппетам.txt" и перекопируйте в него следующий ниже текст.


^^Восстановление содержания ссылки по сниппетам - вспомогательный пакет

^^Параметры:

^^<1>=; //Адрес ссылки
^^<3>=Yandex;Метапоиск;//Чем искать
^^<5>=1;4;100;20 //Глубина поиска в страницах

site:<1> в || <3>=<5>
site:<1> и || <3>=<5>
site:<1> который || <3>=<5>
site:<1> ещё || <3>=<5>
site:<1> для || <3>=<5>
site:<1> абсолютно || <3>=<5>
site:<1> от || <3>=<5>
site:<1> или || <3>=<5>
site:<1> как || <3>=<5>
site:<1> очень || <3>=<5>

CI-KP
Администратор

Откуда: Екатеринбург
Всего сообщений: 5565
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
15 мая 2009
Спасибо, Алексей.

---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru
Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь.
Семёныч
Модератор форума
Городской Охотник
Всего сообщений: 926
Рейтинг пользователя: 10


Ссылка


Дата регистрации на форуме:
8 июня 2009
Я фигею! Применить для таких целей СайтСпутник - круто!!! А ведь и верно - раз это можно делать руками, то почему бы не автоматизировать, тем более, что СайтСпутник многие процессы поиска автоматизировал. :super-puper

---
Нет такой безвыходной ситуации,в которую невозможно вляпаться... (с)
CI-KP
Администратор

Откуда: Екатеринбург
Всего сообщений: 5565
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
15 мая 2009

Семёныч написал:
[q]
А ведь и верно - раз это можно делать руками, то почему бы не автоматизировать, тем более, что СайтСпутник многие процессы поиска автоматизировал
[/q]

Алексей вообще молодец что пытается автоматизировать то, что делается вручную. Другое дело - насколько актуально такое действо в данном редко встречающемся случае. Если все равно вводить слова - какая разница - в Яндекс или в СайтСпутник?

---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru
Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь.
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009

CI-KP написал:
[q]
... пытается автоматизировать то, что делается вручную. Другое дело - насколько актуально такое действо в данном редко встречающемся случае. Если все равно вводить слова - какая разница - в Яндекс или в СайтСпутник?
[/q]


Случай действительно редкий, поэтому сделаю его на "досуге".

Но слова вводить не надо. Вводится только адрес ссылки. А слова стандартные. Они уже введены в пакет с параметрами по умолчанию, а именно: в, и, который, ещё, для, абсолютно, от, или, как, очень.

Эти слова есть практически в контенте любой ссылки. Их надо подобрать более тщательно. По ним "вытягиваются" разные сниппеты (повторы и пересечения по контенту конечно есть) для исследуемый ссылки. Это видно на картинке - посмотрите, там где был запрос с указанными словами, они выделены жирным шрифтом.

Как я писал выше, на этой стадии не надо программировать, но если заняться синтезом контента ссылки из ее сниппетов посредством генерации десятков или сотен запросов к ней, то можно добиться того, что часть контента ссылки будет восстановлена автоматом по ее адресу. Единственно, что использовать эту возможность будут очень мало пользователей и очень редко. Это больше маркетинговый ход, чем реальное дело, я так предполагаю.

CI-KP
Администратор

Откуда: Екатеринбург
Всего сообщений: 5565
Рейтинг пользователя: 24


Ссылка


Дата регистрации на форуме:
15 мая 2009

Алексей Мыльников написал:
[q]
Но слова вводить не надо. Вводится только адрес ссылки. А слова стандартные. Они уже введены в пакет с параметрами по умолчанию, а именно: в, и, который, ещё, для, абсолютно, от, или, как, очень.
[/q]

:good: :hi:

---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru
Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь.
<<Назад  Вперед>>Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Технологии работы и инструменты конкурентной разведки »   Кейс. Восстановление быстро стертой информации в Интернете
RSS

Последние RSS
Англоязычный интерфейс программы "Сайт Спутник"
Учебник по конкурентной разведке
Конкурентная разведка: маркетинг рисков и возможностей
Книга "История частной разведки США"
Книга "Нетворкинг для разведчиков"
Поиск и сбор информации в интернете в программе СайтСпутник
Новые видеоуроки по программе СайтСпутник для начинающих
Технологическая разведка
SiteSputnik. Мониторинг Телеграм
СайтСпутник: возврат к ранее установленной версии
SiteSputnik. Доступ к результатам работы из браузера
Анализ URL
Браузер для анонимной работы
Топливно-энергетический комплекс
Профессиональные сообщества СБ
Несколько Проектов в одном, выполнение Проектов по частям
SiteSputnik-Bot: Боты в программе СайтСпутник
К вопросу о телеграм
SiteSputnik: Автозамены до и после Рубрикации или Перевода
Демо-доступ к ИАС социальных сетей

Самые активные 20 тем RSS