Версия для печати

-   Форум Сообщества Практиков Конкурентной разведки (СПКР) http://forum.razved.info/
--  Библиотека источников и иструменты её создания и ведения http://forum.razved.info//index.php?f=79
--- Проблемы при подключении новых источников информации http://forum.razved.info//index.php?t=3506




-- Семёныч написал 15 августа 2012 11:46
1.Последнее время при подключении нового источника информации, при определении "По подсказке" выделяю сниппет, а программа пишет: "Не обнаружена подсказка, а именно, не выделено местоположение пункта или следующей страницы." Но оно ведь выделено! Несколько десятков раз опробовал. Приходится всё время лезть в хтмл код и определять всё в ручную. А это время! Пропадение автоматизации!
И проверка количества переходов как-то глючить стала. Выделил из хтмл кода признак начала новости, вставил в поле, жму №, а оно показывает ноль. А при проверке всё отрабатывается отлично. Раньше нажимал на №, показывает, например, 10 - считаешь количество новостей на странице - 10, значит всё правильно. А теперь ноль.

2. Опробовал функцию "Сбор информации об объекте" Круто! Есть несколько замечаний "со своей колокольни".
Сперва про 10-тизначные номера телефонов. В России телефонный код страны из одной цифры - 7. Плюсь семизначный номер и двузначный код оператора = десять. В Беларуси код страны из трёх цифр - 375. В Украине тоже из трёх - 380. Нельзя ли как-то это учесть? Во-первых, бесполезный поиск вбитый в сценарий, когда белорусские или украинские номера ищутся с приставленной в начале цифрой 7. Во-вторых, невозможно искать по полному номеру белорусского и украинского формата телефонного номера. Например: 375 17 123 45 67. В таком формате номер просто невозможно ввести. А номер пишут или 8 017 123 45 67, или 375 17 123 45 67.
Ещё одно. В принципе не принципиально. Но уж очень много строчек в левой таблице поиска программы получается. Каждый вариант поиска по телефонному номеру образует отдельную строчку, а потом эти строчки, путём АО объединяются. В итоге при поиске информации по одному объекту у меня добавилось около 40 строчек. А переход в этой таблице быстрый только к первой и последней строке. Если надо подняться или лпуститься на 20-30 строчек - вспотеешь. При этом очень неудобно плодить за один запрос сразу по 40 строчек в таблице. Может телефоны одним пакетом искать?


-- tungus1973 написал 15 августа 2012 11:58

Семёныч написал:
[q]
1.Последнее время при подключении нового источника информации, при определении "По подсказке" выделяю сниппет, а программа пишет: "Не обнаружена подсказка, а именно, не выделено местоположение пункта или следующей страницы."
[/q]
Я тоже сталкивался с такой проблемой, но решал её вручную - залазил в html-код.


-- Алексей Мыльников написал 15 августа 2012 12:32
По первому пункту.
Бывают такие страницы, на которых не срабатывает пункт "По подсказке". Есть еще вариант - просто щелкните мышкой по главной ссылке сниппета, возможно, что это сработает. Если неручные варианты не сработали, то надо лезть в html-код и там искать "Признак начала сниппета". Да, таковы технические особенности html-кода. Это было и в последнее время, и в первое время. Что можно предпринять с моей стороны - сделать очередной "подход" к автоматическому определению "Признака начала сниппета", чтобы уменьшить количество поисков, подключаемых через просмотр html-кодов.

По второму пункту.
Поиск объектов сделан по российским реквизитам. Кроме телефона на Украине, например, ИНН, ОГРН тоже другие и называются по-другому и на украинском языке . Скорее всего, здесь для каждого государства нужны свои пакеты поиска. В будущем "развяжу" этот узел. Пока пишите номера в поля "Любые точные фразы", тогда и строк будет меньше, да и номера будут искаться удовлетворительно: мусора и потерь будет немного.

По поводу "Ещё одно" (большое количество строчек).
Можно делать поиск в рабочем Ящике (папке). Потом очищать его. Строки нужны для того, чтобы запросы по реквизитам сделать по-отдельности. Это позволяет, не открывая ссылок, вверх вытолкнуть те ссылки, на которых найдено больше всего реквизитов, то есть наиболее релевантные ссылки. Если же Вы хотите все выполнить в одной строке, то это можно сделать - нажмите вторую слева кнопку. Но не советую делать этого за редким исключением. Лучше не пожалеть строчек в таблице, чем свое время.

Замечание от 23.08.12.
В версии 8.1.1.5 от 23.08.12 проблема "строчек" решена. Смотрите здесь - forum.razved.info/index.php?t=2970&p=33908#pp33908



-- Семёныч написал 16 августа 2012 9:42

Алексей Мыльников написал:
[q]
Бывают такие страницы, на которых не срабатывает пункт "По подсказке".
[/q]

Этот пункт у меня теперь не срабатывает на всех страницах. Больше полсотни страниц испробовано, на всех постоянно результат отрицательный.


Алексей Мыльников написал:
[q]
Кроме телефона на Украине, например, ИНН, ОГРН тоже другие и называются по-другому и на украинском языке .
[/q]

Дело не в названии реквизита, а в возможности ввести его корректно. Пусть в России он называется ИНН, в где-то по-другому. Но пусть не будет ограничении в количестве вводимых знаков. Особенно это актуально с номером телефона. Абсолютно стандартный элемент поиска и наиболее часто применяемый, но из-за жёстких рамок становиться бесполезным при поиске в Беларуси и Украины. Не надо изобретать языковые пакеты, проще подкорректировать имеющийся пакет и сделать его универсальным. Это проще и быстрее, чем охват большого количества стран и языков.


-- shturman написал 16 августа 2012 20:36
А что это за функция "Сбор информации об объекте", которую вы обсуждаете?


-- Искендер написал 16 августа 2012 21:59

shturman написал:
[q]
А что это за функция "Сбор информации об объекте", которую вы обсуждаете?
[/q]

forum.razved.info/index.php?t=2970


-- Семёныч написал 17 августа 2012 10:17
Вчера вечером мучился с сайтом _ttp://minsknews.by Ни автоматическое определение, ни По подсказке, ни при кликаньи по сниппету (при этом вообще зависает на минуту), ни даже вручную из html-кода я не смог определить начало пункта. Лучшее, что у меня получилось - это 11 признаков начала пункта, а новостей 10. Убил больше часа времени! :crazy: Автоматизация этого процесса занимает секунды, а вот лазание по html-коду - от 3 мин до полного ступора и желания найти того, кто этот сайт так сделал "Кто так строит?.. "(с) :reful:



-- tungus1973 написал 17 августа 2012 10:44

Семёныч написал:
[q]
Вчера вечером мучился с сайтом _ttp://minsknews.by
[/q]

Попробуйте признак начала новости
<div class="gsc-webResult gsc-result">
или
<div class=""gsc-webResult gsc-result"">


-- Алексей Мыльников написал 17 августа 2012 11:13
Для: Семёныч
В Вашем сайте поиск реализован не собственными процедурами, а через поиск Google.
Здесь на форуме описана чисто "механический" способ подключения таких поисков. См. здесь - forum.razved.info/index.php?t=1851
В прикрепленном файле результат применения этого способа.


-- Алексей Мыльников написал 17 августа 2012 11:38
Для: Семёныч
И ещё Вы выше писали, что в Белоруссии телефоны могут написать так:
8 017 123 45 67 или
375 17 123 45 67,
то есть, во втором случае нолик пропадает? Код междугородний внутри страны 017, а при наборе по международному формату надо набирать 17?
Так принято во всех странах, или только в СНГ, или только в Белоруссии?


-- Семёныч написал 17 августа 2012 14:18

Алексей Мыльников написал:
[q]
Так принято во всех странах, или только в СНГ, или только в Белоруссии?
[/q]

За все страны не скажу, но в Беларуси всё именно так. Если через 8-код оператора, то нолик в коде присутствует. Если через +375, то нолик в коде оператора выпадает.

Отдельное спасибо tungus1973 и Алексею Мыльникову за варианты подключения сайта. :hi: Сайт для меня, в принципе, не сильно важный, я его больше для примера привёл. Но всё же, благодарю. Подключу его.


-- Ed написал 17 августа 2012 15:15

Алексей Мыльников написал:
[q]
Так принято во всех странах, или только в СНГ, или только в Белоруссии?
[/q]


См. Телефонные планы нумерации в различных странах (http://corporacia.ru/pages/page/show/410.htm).


-- CI-KP написал 17 августа 2012 19:49

Алексей Мыльников написал:
[q]
Так принято во всех странах, или только в СНГ, или только в Белоруссии?
[/q]

Так почти везде. Это дело с нулями похоже на то, как в России может быть +7... а может 8...


-- Алексей Мыльников написал 22 августа 2012 11:44
Спасибо за советы.
Ответил в теме "Сбор информации об объекте" здесь - forum.razved.info/index.php?t=2970&p=33888#pp33888


Этот форум работает на скрипте Intellect Board
© 2004-2007, 4X_Pro, Объединенный Открытый Проект