Проблемы при подключении новых источников информации

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Библиотека источников и иструменты её создания и ведения »   Проблемы при подключении новых источников информации
RSS

Проблемы при подключении новых источников информации

<<Назад  Вперед>>Страницы: 1 2
Печать
 
Семёныч
Модератор форума
Городской Охотник
Всего сообщений: 926
Рейтинг пользователя: 10


Ссылка


Дата регистрации на форуме:
8 июня 2009
1.Последнее время при подключении нового источника информации, при определении "По подсказке" выделяю сниппет, а программа пишет: "Не обнаружена подсказка, а именно, не выделено местоположение пункта или следующей страницы." Но оно ведь выделено! Несколько десятков раз опробовал. Приходится всё время лезть в хтмл код и определять всё в ручную. А это время! Пропадение автоматизации!
И проверка количества переходов как-то глючить стала. Выделил из хтмл кода признак начала новости, вставил в поле, жму №, а оно показывает ноль. А при проверке всё отрабатывается отлично. Раньше нажимал на №, показывает, например, 10 - считаешь количество новостей на странице - 10, значит всё правильно. А теперь ноль.

2. Опробовал функцию "Сбор информации об объекте" Круто! Есть несколько замечаний "со своей колокольни".
Сперва про 10-тизначные номера телефонов. В России телефонный код страны из одной цифры - 7. Плюсь семизначный номер и двузначный код оператора = десять. В Беларуси код страны из трёх цифр - 375. В Украине тоже из трёх - 380. Нельзя ли как-то это учесть? Во-первых, бесполезный поиск вбитый в сценарий, когда белорусские или украинские номера ищутся с приставленной в начале цифрой 7. Во-вторых, невозможно искать по полному номеру белорусского и украинского формата телефонного номера. Например: 375 17 123 45 67. В таком формате номер просто невозможно ввести. А номер пишут или 8 017 123 45 67, или 375 17 123 45 67.
Ещё одно. В принципе не принципиально. Но уж очень много строчек в левой таблице поиска программы получается. Каждый вариант поиска по телефонному номеру образует отдельную строчку, а потом эти строчки, путём АО объединяются. В итоге при поиске информации по одному объекту у меня добавилось около 40 строчек. А переход в этой таблице быстрый только к первой и последней строке. Если надо подняться или лпуститься на 20-30 строчек - вспотеешь. При этом очень неудобно плодить за один запрос сразу по 40 строчек в таблице. Может телефоны одним пакетом искать?

---
Нет такой безвыходной ситуации,в которую невозможно вляпаться... (с)
tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 795
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009

Семёныч написал:
[q]
1.Последнее время при подключении нового источника информации, при определении "По подсказке" выделяю сниппет, а программа пишет: "Не обнаружена подсказка, а именно, не выделено местоположение пункта или следующей страницы."
[/q]
Я тоже сталкивался с такой проблемой, но решал её вручную - залазил в html-код.
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
По первому пункту.
Бывают такие страницы, на которых не срабатывает пункт "По подсказке". Есть еще вариант - просто щелкните мышкой по главной ссылке сниппета, возможно, что это сработает. Если неручные варианты не сработали, то надо лезть в html-код и там искать "Признак начала сниппета". Да, таковы технические особенности html-кода. Это было и в последнее время, и в первое время. Что можно предпринять с моей стороны - сделать очередной "подход" к автоматическому определению "Признака начала сниппета", чтобы уменьшить количество поисков, подключаемых через просмотр html-кодов.

По второму пункту.
Поиск объектов сделан по российским реквизитам. Кроме телефона на Украине, например, ИНН, ОГРН тоже другие и называются по-другому и на украинском языке . Скорее всего, здесь для каждого государства нужны свои пакеты поиска. В будущем "развяжу" этот узел. Пока пишите номера в поля "Любые точные фразы", тогда и строк будет меньше, да и номера будут искаться удовлетворительно: мусора и потерь будет немного.

По поводу "Ещё одно" (большое количество строчек).
Можно делать поиск в рабочем Ящике (папке). Потом очищать его. Строки нужны для того, чтобы запросы по реквизитам сделать по-отдельности. Это позволяет, не открывая ссылок, вверх вытолкнуть те ссылки, на которых найдено больше всего реквизитов, то есть наиболее релевантные ссылки. Если же Вы хотите все выполнить в одной строке, то это можно сделать - нажмите вторую слева кнопку. Но не советую делать этого за редким исключением. Лучше не пожалеть строчек в таблице, чем свое время.

Замечание от 23.08.12.
В версии 8.1.1.5 от 23.08.12 проблема "строчек" решена. Смотрите здесь - forum.razved.info/index.php?t=2970&p=33908#pp33908

Семёныч
Модератор форума
Городской Охотник
Всего сообщений: 926
Рейтинг пользователя: 10


Ссылка


Дата регистрации на форуме:
8 июня 2009

Алексей Мыльников написал:
[q]
Бывают такие страницы, на которых не срабатывает пункт "По подсказке".
[/q]

Этот пункт у меня теперь не срабатывает на всех страницах. Больше полсотни страниц испробовано, на всех постоянно результат отрицательный.


Алексей Мыльников написал:
[q]
Кроме телефона на Украине, например, ИНН, ОГРН тоже другие и называются по-другому и на украинском языке .
[/q]

Дело не в названии реквизита, а в возможности ввести его корректно. Пусть в России он называется ИНН, в где-то по-другому. Но пусть не будет ограничении в количестве вводимых знаков. Особенно это актуально с номером телефона. Абсолютно стандартный элемент поиска и наиболее часто применяемый, но из-за жёстких рамок становиться бесполезным при поиске в Беларуси и Украины. Не надо изобретать языковые пакеты, проще подкорректировать имеющийся пакет и сделать его универсальным. Это проще и быстрее, чем охват большого количества стран и языков.

---
Нет такой безвыходной ситуации,в которую невозможно вляпаться... (с)
shturman
Новичок (писатель)

Всего сообщений: 6
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
7 авг. 2012
А что это за функция "Сбор информации об объекте", которую вы обсуждаете?

---
Навигация - основа мореплавания
Искендер
Администратор

Всего сообщений: 5925
Рейтинг пользователя: 43


Ссылка


Дата регистрации на форуме:
7 июня 2009

shturman написал:
[q]
А что это за функция "Сбор информации об объекте", которую вы обсуждаете?
[/q]

forum.razved.info/index.php?t=2970

---
I`m not a Spy! I can do much better!
Информационные войны "под ключ"
Семёныч
Модератор форума
Городской Охотник
Всего сообщений: 926
Рейтинг пользователя: 10


Ссылка


Дата регистрации на форуме:
8 июня 2009
Вчера вечером мучился с сайтом _ttp://minsknews.by Ни автоматическое определение, ни По подсказке, ни при кликаньи по сниппету (при этом вообще зависает на минуту), ни даже вручную из html-кода я не смог определить начало пункта. Лучшее, что у меня получилось - это 11 признаков начала пункта, а новостей 10. Убил больше часа времени! :crazy: Автоматизация этого процесса занимает секунды, а вот лазание по html-коду - от 3 мин до полного ступора и желания найти того, кто этот сайт так сделал "Кто так строит?.. "(с) :reful:

---
Нет такой безвыходной ситуации,в которую невозможно вляпаться... (с)
tungus1973
Модератор форума

Откуда: г. Санкт-Петербург
Всего сообщений: 795
Рейтинг пользователя: 11


Ссылка


Дата регистрации на форуме:
3 июля 2009

Семёныч написал:
[q]
Вчера вечером мучился с сайтом _ttp://minsknews.by
[/q]

Попробуйте признак начала новости
<div class="gsc-webResult gsc-result">
или
<div class=""gsc-webResult gsc-result"">
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Для: Семёныч
В Вашем сайте поиск реализован не собственными процедурами, а через поиск Google.
Здесь на форуме описана чисто "механический" способ подключения таких поисков. См. здесь - forum.razved.info/index.php?t=1851
В прикрепленном файле результат применения этого способа.

Прикрепленный файл (Поисковик~%D, 618 байт, скачан: 647 раз)
Алексей Мыльников
Долгожитель форума

Откуда: Волгоград
Всего сообщений: 877
Рейтинг пользователя: 6


Ссылка


Дата регистрации на форуме:
22 июня 2009
Для: Семёныч
И ещё Вы выше писали, что в Белоруссии телефоны могут написать так:
8 017 123 45 67 или
375 17 123 45 67,
то есть, во втором случае нолик пропадает? Код междугородний внутри страны 017, а при наборе по международному формату надо набирать 17?
Так принято во всех странах, или только в СНГ, или только в Белоруссии?

<<Назад  Вперед>>Страницы: 1 2
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Библиотека источников и иструменты её создания и ведения »   Проблемы при подключении новых источников информации
RSS

Последние RSS
Англоязычный интерфейс программы "Сайт Спутник"
Учебник по конкурентной разведке
Конкурентная разведка: маркетинг рисков и возможностей
Книга "История частной разведки США"
Книга "Нетворкинг для разведчиков"
Поиск и сбор информации в интернете в программе СайтСпутник
Новые видеоуроки по программе СайтСпутник для начинающих
Технологическая разведка
SiteSputnik. Мониторинг Телеграм
СайтСпутник: возврат к ранее установленной версии
SiteSputnik. Доступ к результатам работы из браузера
Анализ URL
Браузер для анонимной работы
Топливно-энергетический комплекс
Профессиональные сообщества СБ
Несколько Проектов в одном, выполнение Проектов по частям
SiteSputnik-Bot: Боты в программе СайтСпутник
К вопросу о телеграм
SiteSputnik: Автозамены до и после Рубрикации или Перевода
Демо-доступ к ИАС социальных сетей

Самые активные 20 тем RSS