Форум Сообщества Практиков Конкурентной разведки (СПКР) » Предложения по программе для допроса Интернета СайтСпутник » Аналитическое вычитание |
<<Назад Вперед>> | Страницы: 1 2 3 4 | Печать |
tungus1973
Модератор форума
Откуда: г. Санкт-Петербург Всего сообщений: 795 Рейтинг пользователя: 11 Ссылка Дата регистрации на форуме: 3 июля 2009 |
На семинаре, посвященном СайтСпутнику, мы с коллегами обсуждали применение операции противоположной "Аналитическому объединению", которую мы условно назвали "Аналитическое вычитание". Кратко разъясню суть операции. Предположим, у Вас есть 2 проекта. Проект 1 Проект 2 Выполняя "Аналитическое объединение" вы соединяете все найденные списки из двух проектов в один. Проект 1 + Проект 2 = АО Но вот, допустим, Вам потребовалось не объединить списки, а вычесть из одного списка ссылок ссылки из другого списка. То есть, нужно выполнить такую операцию: Проект 2 - Проект 1 = АВ Когда может пригодиться эта функция? Ну, например, собираете Вы информацию про "Алексея Ивановича Федорова". И, чтобы собрать данные более полно, Вы проверяете, а не упоминается ли искомый человек в сочетании "Алексей Фёдоров"? И вы делаете отдельный пакет и собираете все ссылки на странички, где упоминается гр-н. Фёдоров. Предположим, что таких ссылок собралось более 1000 шт. Но! Как выяснилось, у нашего Фёдорова очень много однофамильцев, в том числе и очень известных личностей. И вот Вы просматриваете собранные сниппеты и видите, что очень часто упоминаются "Алексей Петрович Фёдоров" (примерно 500 ссылок) и "Алексей Васильевич Фёдоров" (тоже примерно 300 из всех ссылок). Вы знаете, что где-то среди оставшихся 200 ссылок есть и Ваш "Алексей Иванович Фёдоров", но просматривать из-за него все 1000 ссылок Вам уже как-то не хочется. Что делать? Логично было бы запустить отдельные пакеты для поиска "Васильевича" и "Петровича" Фёдоровых, а потом уже вычесть результаты из общего пакета. А оставшиеся 200 (а может уже и меньше) ссылок просмотреть, и даже выкачать на свой компьютер. Вот здесь нам и пригодилась бы функция "Аналитическое вычитание"! На страничке СайтСпутника написано, что в программе уже реализована аналогичная функция как "Взятие разности"("метавычитание"). Уважаемый Алексей Борисович, можно ли в этой ветке форума рассказать о том, как выполнить "Аналитическое вычитание" методами, уже реализованными в программе? И если такая операция на поверку оказывается сложновыполнимой, нельзя ли предусмотреть в СайтСпутнике специальную функцию для такой операции? |
Искендер
Администратор
Всего сообщений: 5925 Рейтинг пользователя: 43 Ссылка Дата регистрации на форуме: 7 июня 2009 |
Да-да-да! Дайте две! Совсем, вот, недавно - мало того, что объект персонаж медийный, да еще и с распространенными ФИО. Почти 4 тысячи ссылок! Думал - глаза выпадут! Алексей! Не дайте зрения лишиться! |
CI-KP
Администратор
Откуда: Екатеринбург Всего сообщений: 5565 Рейтинг пользователя: 24 Ссылка Дата регистрации на форуме: 15 мая 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 21 мая 2010 16:41 Сообщение отредактировано: 21 мая 2010 16:41
Насколько я понимаю, эта-то опция вообще не требует особо время тратить на ее создание. Ежели оно что-то с чем-то складывает, то и вычесть может это же самое без проблем. Или я неправ? ---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь. |
CI-KP
Администратор
Откуда: Екатеринбург Всего сообщений: 5565 Рейтинг пользователя: 24 Ссылка Дата регистрации на форуме: 15 мая 2009 |
Искендер написал: ало того, что объект персонаж медийный, да еще и с распространенными ФИО. Почти 4 тысячи ссылок! Думал - глаза выпадут! Алексей! Не дайте зрения лишиться! А нефиг мониторить Сергея Безрукова. Мониторь Эммануила Папандопуло - и тебе не понадобятся никакие приблуды в СайтСпутник ---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь. |
petryashov
Администратор
Откуда: Москва Всего сообщений: 480 Рейтинг пользователя: 9 Ссылка Дата регистрации на форуме: 7 июня 2009 |
Очень нужная функция. БЫло бы замечательно, если бы она была реализована |
Искендер
Администратор
Всего сообщений: 5925 Рейтинг пользователя: 43 Ссылка Дата регистрации на форуме: 7 июня 2009 |
CI-KP написал:
Что делать - не фанат я Папандопуло... |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
tungus1973 написал: На страничке СайтСпутника написано, что в программе уже реализована аналогичная функция как "Взятие разности"("метавычитание"). Да, "Взятие разности", упомянутое на сайте делает именно то, что написал tungus1973. А = "Проект 1" - "Проект 2" и Б = "Проект 2" - "Проект 1", не равны друг другу, более того, не имеют не одной общей ссылки. Но А и Б не выделены в отдельные списки. Их можно руками выделить следующим образом. Отметить, превратив маленькие серые шарики в зеленые, затем нажать большой зеленый шарик и получить список "Отмеченные". Отмечать для А надо те ссылки, которые вошли только и только в "Проект 2", для Б только и только в "Проект 1". Ссылки идут подряд. Делать я этого не стал - итак "получаю" за "сложные места", а здесь, если берется разность только двух проектов, еще два непонятных списка. Если проектов несколько, то там вообще можно окончательно запутать пользователя. |
tungus1973
Модератор форума
Откуда: г. Санкт-Петербург Всего сообщений: 795 Рейтинг пользователя: 11 Ссылка Дата регистрации на форуме: 3 июля 2009 |
Alexei Mylnikov написал: Руками - это долго. Взять, к примеру, задачу Искендера - 4000 ссылок! Вручную особо не наотмечаешься... Их можно руками выделить следующим образом. А, в принципе, насколько сложно автоматизировать эту функцию? Как заметил ув. CI-KP Наверняка он прав. Ежели оно что-то с чем-то складывает, то и вычесть может это же самое без проблем. |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
tungus1973 написал: А, в принципе, насколько сложно автоматизировать эту функцию? Уважаемый СI-KP прав. Сделать несложно. Сомневаюсь, что нужно. Зачем лишние списки или лишнии опции. По-моему, это надумано. |
CI-KP
Администратор
Откуда: Екатеринбург Всего сообщений: 5565 Рейтинг пользователя: 24 Ссылка Дата регистрации на форуме: 15 мая 2009 |
Alexei Mylnikov написал: По-моему, это надумано. Не. Ну, если уже двое ПРАКТИКОВ говорят, что надо, то наверное таки надо. ---
Ющук Евгений Леонидович, профессор УрГЭУ. www.razvedka-internet.ru; www.ci-razvedka.ru Не всегда нужно стремиться совершать кражу со взломом там, где можно войти через дверь. |
<<Назад Вперед>> | Страницы: 1 2 3 4 | Печать |
Форум Сообщества Практиков Конкурентной разведки (СПКР) » Предложения по программе для допроса Интернета СайтСпутник » Аналитическое вычитание |
Самые активные 20 тем | |