Форум Сообщества Практиков Конкурентной разведки (СПКР) » Библиотека источников и иструменты её создания и ведения » Проблемы при подключении новых источников информации |
<<Назад Вперед>> | Страницы: 1 2 | Печать |
Семёныч
Модератор форума
Городской Охотник Всего сообщений: 926 Рейтинг пользователя: 10 Ссылка Дата регистрации на форуме: 8 июня 2009 |
1.Последнее время при подключении нового источника информации, при определении "По подсказке" выделяю сниппет, а программа пишет: "Не обнаружена подсказка, а именно, не выделено местоположение пункта или следующей страницы." Но оно ведь выделено! Несколько десятков раз опробовал. Приходится всё время лезть в хтмл код и определять всё в ручную. А это время! Пропадение автоматизации! И проверка количества переходов как-то глючить стала. Выделил из хтмл кода признак начала новости, вставил в поле, жму №, а оно показывает ноль. А при проверке всё отрабатывается отлично. Раньше нажимал на №, показывает, например, 10 - считаешь количество новостей на странице - 10, значит всё правильно. А теперь ноль. 2. Опробовал функцию "Сбор информации об объекте" Круто! Есть несколько замечаний "со своей колокольни". Сперва про 10-тизначные номера телефонов. В России телефонный код страны из одной цифры - 7. Плюсь семизначный номер и двузначный код оператора = десять. В Беларуси код страны из трёх цифр - 375. В Украине тоже из трёх - 380. Нельзя ли как-то это учесть? Во-первых, бесполезный поиск вбитый в сценарий, когда белорусские или украинские номера ищутся с приставленной в начале цифрой 7. Во-вторых, невозможно искать по полному номеру белорусского и украинского формата телефонного номера. Например: 375 17 123 45 67. В таком формате номер просто невозможно ввести. А номер пишут или 8 017 123 45 67, или 375 17 123 45 67. Ещё одно. В принципе не принципиально. Но уж очень много строчек в левой таблице поиска программы получается. Каждый вариант поиска по телефонному номеру образует отдельную строчку, а потом эти строчки, путём АО объединяются. В итоге при поиске информации по одному объекту у меня добавилось около 40 строчек. А переход в этой таблице быстрый только к первой и последней строке. Если надо подняться или лпуститься на 20-30 строчек - вспотеешь. При этом очень неудобно плодить за один запрос сразу по 40 строчек в таблице. Может телефоны одним пакетом искать? ---
Нет такой безвыходной ситуации,в которую невозможно вляпаться... (с) |
tungus1973
Модератор форума
Откуда: г. Санкт-Петербург Всего сообщений: 795 Рейтинг пользователя: 11 Ссылка Дата регистрации на форуме: 3 июля 2009 |
Семёныч написал: Я тоже сталкивался с такой проблемой, но решал её вручную - залазил в html-код. 1.Последнее время при подключении нового источника информации, при определении "По подсказке" выделяю сниппет, а программа пишет: "Не обнаружена подсказка, а именно, не выделено местоположение пункта или следующей страницы." |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 15 августа 2012 12:32 Сообщение отредактировано: 23 августа 2012 13:16
По первому пункту. Бывают такие страницы, на которых не срабатывает пункт "По подсказке". Есть еще вариант - просто щелкните мышкой по главной ссылке сниппета, возможно, что это сработает. Если неручные варианты не сработали, то надо лезть в html-код и там искать "Признак начала сниппета". Да, таковы технические особенности html-кода. Это было и в последнее время, и в первое время. Что можно предпринять с моей стороны - сделать очередной "подход" к автоматическому определению "Признака начала сниппета", чтобы уменьшить количество поисков, подключаемых через просмотр html-кодов. По второму пункту. Поиск объектов сделан по российским реквизитам. Кроме телефона на Украине, например, ИНН, ОГРН тоже другие и называются по-другому и на украинском языке . Скорее всего, здесь для каждого государства нужны свои пакеты поиска. В будущем "развяжу" этот узел. Пока пишите номера в поля "Любые точные фразы", тогда и строк будет меньше, да и номера будут искаться удовлетворительно: мусора и потерь будет немного. По поводу "Ещё одно" (большое количество строчек). Можно делать поиск в рабочем Ящике (папке). Потом очищать его. Строки нужны для того, чтобы запросы по реквизитам сделать по-отдельности. Это позволяет, не открывая ссылок, вверх вытолкнуть те ссылки, на которых найдено больше всего реквизитов, то есть наиболее релевантные ссылки. Если же Вы хотите все выполнить в одной строке, то это можно сделать - нажмите вторую слева кнопку. Но не советую делать этого за редким исключением. Лучше не пожалеть строчек в таблице, чем свое время. Замечание от 23.08.12. В версии 8.1.1.5 от 23.08.12 проблема "строчек" решена. Смотрите здесь - forum.razved.info/index.php?t=2970&p=33908#pp33908 |
Семёныч
Модератор форума
Городской Охотник Всего сообщений: 926 Рейтинг пользователя: 10 Ссылка Дата регистрации на форуме: 8 июня 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 16 августа 2012 9:42 Сообщение отредактировано: 16 августа 2012 9:44 Алексей Мыльников написал: Бывают такие страницы, на которых не срабатывает пункт "По подсказке". Этот пункт у меня теперь не срабатывает на всех страницах. Больше полсотни страниц испробовано, на всех постоянно результат отрицательный. Алексей Мыльников написал: Кроме телефона на Украине, например, ИНН, ОГРН тоже другие и называются по-другому и на украинском языке . Дело не в названии реквизита, а в возможности ввести его корректно. Пусть в России он называется ИНН, в где-то по-другому. Но пусть не будет ограничении в количестве вводимых знаков. Особенно это актуально с номером телефона. Абсолютно стандартный элемент поиска и наиболее часто применяемый, но из-за жёстких рамок становиться бесполезным при поиске в Беларуси и Украины. Не надо изобретать языковые пакеты, проще подкорректировать имеющийся пакет и сделать его универсальным. Это проще и быстрее, чем охват большого количества стран и языков. ---
Нет такой безвыходной ситуации,в которую невозможно вляпаться... (с) |
shturman
Новичок (писатель)
Всего сообщений: 6 Рейтинг пользователя: 0 Ссылка Дата регистрации на форуме: 7 авг. 2012 |
А что это за функция "Сбор информации об объекте", которую вы обсуждаете? ---
Навигация - основа мореплавания |
Искендер
Администратор
Всего сообщений: 5925 Рейтинг пользователя: 43 Ссылка Дата регистрации на форуме: 7 июня 2009 |
shturman написал: А что это за функция "Сбор информации об объекте", которую вы обсуждаете? forum.razved.info/index.php?t=2970 |
Семёныч
Модератор форума
Городской Охотник Всего сообщений: 926 Рейтинг пользователя: 10 Ссылка Дата регистрации на форуме: 8 июня 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 17 августа 2012 10:17 Сообщение отредактировано: 17 августа 2012 10:17
Вчера вечером мучился с сайтом _ttp://minsknews.by Ни автоматическое определение, ни По подсказке, ни при кликаньи по сниппету (при этом вообще зависает на минуту), ни даже вручную из html-кода я не смог определить начало пункта. Лучшее, что у меня получилось - это 11 признаков начала пункта, а новостей 10. Убил больше часа времени! Автоматизация этого процесса занимает секунды, а вот лазание по html-коду - от 3 мин до полного ступора и желания найти того, кто этот сайт так сделал "Кто так строит?.. "(с) ---
Нет такой безвыходной ситуации,в которую невозможно вляпаться... (с) |
tungus1973
Модератор форума
Откуда: г. Санкт-Петербург Всего сообщений: 795 Рейтинг пользователя: 11 Ссылка Дата регистрации на форуме: 3 июля 2009 |
Семёныч написал: Вчера вечером мучился с сайтом _ttp://minsknews.by Попробуйте признак начала новости <div class="gsc-webResult gsc-result"> или <div class=""gsc-webResult gsc-result""> |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Для: Семёныч В Вашем сайте поиск реализован не собственными процедурами, а через поиск Google. Здесь на форуме описана чисто "механический" способ подключения таких поисков. См. здесь - forum.razved.info/index.php?t=1851 В прикрепленном файле результат применения этого способа. Прикрепленный файл (Поисковик~%D, 618 байт, скачан: 662 раза) |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 17 августа 2012 11:38 Сообщение отредактировано: 17 августа 2012 11:43
Для: Семёныч И ещё Вы выше писали, что в Белоруссии телефоны могут написать так: 8 017 123 45 67 или 375 17 123 45 67, то есть, во втором случае нолик пропадает? Код междугородний внутри страны 017, а при наборе по международному формату надо набирать 17? Так принято во всех странах, или только в СНГ, или только в Белоруссии? |
<<Назад Вперед>> | Страницы: 1 2 | Печать |
Форум Сообщества Практиков Конкурентной разведки (СПКР) » Библиотека источников и иструменты её создания и ведения » Проблемы при подключении новых источников информации |
Самые активные 20 тем | |