Обновления программы

Форум Сообщества Практиков Конкурентной разведки (СПКР)

Конкурентная разведка, Бизнес-разведка, Корпоративная разведка,
Деловая разведка по открытым источникам в бизнесе.
Работаем строго в рамках закона.

Дезинформация и активные мероприятия в бизнесе
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Форум программы для мониторинга Интернета - Аваланч »   Обновления программы
RSS

Обновления программы

  Вперед>>Страницы: 1 2 3
Печать
 
petryashov
Администратор

Откуда: Москва
Всего сообщений: 490
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009
версия 2.5.0.855, выпущена 1 августа 2009

Регулярные выражения в тонкой настройке для извлечения и модификации ссылки.
Помощник по освоению Avalanche и Spider - Совет дня.
версия 2.5.0.787, выпущена 1 июля 2009

Существенное ускорение рубрикатора за счет индексации документов и двоичного поиска по нему.
Безопасность. Изменена конфигурация входящего в состав дистрибутива MySQL Server.
Документация. Добавлена глава, посвященная базе данных Avalanche и средствам создания отчетов в Microsoft Office и OpenOffice.
версия 2.5.0.692, выпущена 20 мая 2009

Изменение в ядре. Сделана поддержка DOM Document, DOM Parser, DOM Encoder.
Добавлен новый метод автоматического извлечения текста новости.
В шаблоне тонкой настройки сделана поддержка \n и \t (для обозначения новой строки и табуляции соответственно).

Взято zazhigin.ru/node/3
petryashov
Администратор

Откуда: Москва
Всего сообщений: 490
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009
версия 2.5.0.1346, выпущена 15 декабря 2009

Сделана авторизация пользователей.
Реализован поиск по странице документа с подсветкой.
Загрузка обновлений из Интернет и их обновление.
Сделано автообновление программы из Интернет.
Добавлены новые дополнения CacheViewer и SQLite Manager.
Закончена стыковка системы с базой данных Oracle.
версия 2.5.0.1205, выпущена 15 ноября 2009

Реинжиниринг системы, построена интерфейсная модель.
Закончен перенос и тестирование системы для Linux Ubuntu.
Закончен перенос и тестирование системы для MacOS (Intel).
версия 2.5.0.974, выпущена 1 сентября 2009

Добавлены специальные рубрики для ведения досье персоны и компании.
Добавлена возможность формирования групп источников.
Сделана поддержка регулярных выражений во всех операторах тонкой настройки.
Реализован новый метод автоматического извлечения текста новости.
zazhigin.ru/node/3
Vinni
Администратор

Всего сообщений: 2710
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009
Ну вот - теперь он наконец начинает приобретать черты корпоративного (стыковка с Oracle - хорошо :good: ) и удобного продукта.
Кто-нибудь живьем пробовал последнюю версию?
petryashov
Администратор

Откуда: Москва
Всего сообщений: 490
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009
Для: Vinni
У меня все великолепно работало до последнего релиза. После его установки у меня вылазит сообщение "TypeError: Components.classes['@interrussoft.com/authorization;1'] is undefined" и на этом работа заканчивается. Блин...

Vinni
Администратор

Всего сообщений: 2710
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009
У меня под Вистой вроде все нормально - ищет нормально. Только это версия от 15 ноября. :wink:

Регулярные выражения несколько своеобразно ввели. Но использовать при желании можно :wink:

А вот с RSS как-то не до конца сделали (да и формат чуток неправильный).

petryashov
Администратор

Откуда: Москва
Всего сообщений: 490
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009
Для: Vinni
Написал Андрею, тот посоветовал снести все через кнопку "Пуск", а затем поставить заново. Заработало!
Vinni
Администратор

Всего сообщений: 2710
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009
Давай какой-нибудь проблемный для тонкой настройки сайт разберем для проверки работоспособности регулярных выражений (конструкция (...)/match) :wink:

petryashov
Администратор

Откуда: Москва
Всего сообщений: 490
Рейтинг пользователя: 9


Ссылка


Дата регистрации на форуме:
7 июня 2009
Для: Vinni
В соседней теме я безуспешно пытался настроиться на expert.ru : forum.razved.info/index.php?t=168 Ты тогда написал, что Аваланч в том виде не годится. Может быть, сейчас получится?
Berckut
Новичок (писатель)

Всего сообщений: 10
Рейтинг пользователя: 0


Ссылка


Дата регистрации на форуме:
15 июня 2009

Vinni написал:
[q]

Давай какой-нибудь проблемный для тонкой настройки сайт разберем для проверки работоспособности регулярных выражений (конструкция (...)/match)

[/q]

я этим пользуюсь с момента, как появилось, но приручить пока удалось только url. Пытался изменять формат даты, но работать не хочет.
Вот пример (адреса с ххтп естесствено надо поправить, иначе форум зарежет и не покажет):
Ссылка:
_ttp://www.altapress.ru/rss.xml

Шаблон ссылки на новость:
<item>(...)<title>(title)</title>(...)<link>_ttp://www.altapress.ru(url|(.*)|/pda$1)</link>(...)<pubDate>(date)</pubDate>(...)</item>

Шаблон текста новости:
<div class="story_container">(text)<div class="return">

В результате Аваланч уходит на страницу, на которой кроме новости нет ничего лишнего.


Хотелось бы увидеть вот какое изменение:
Большинство сегодняшних сайтов имеют элементы, которые появляются случаным образом на странице, например, фотография из фотогалереи, банер с рекламой и т.д. Так как контрольная сумма берётся не полученного после обработки текста новости, а со всей страницы, то постоянно идёт ложные срабатывания - Авалач считает, что новость обновилась и заслуживает нового внимания. В результате, приходится каждый раз просматривать все новости заново.

P.S. Использую версию от 15 ноября
P.S.S. А ещё хотелось бы, чтобы у настроек прокси сервера появился логин и пароль :)
Vinni
Администратор

Всего сообщений: 2710
Рейтинг пользователя: 22


Ссылка


Дата регистрации на форуме:
5 июня 2009

Berckut написал:
[q]
P.S.S. А ещё хотелось бы, чтобы у настроек прокси сервера появился логин и пароль :)
[/q]


Эта проблема решается просто - поставьте локальный прокси на базе 3proxy и сконфигурируйте в нем свой корпоративный прокси (в 3proxy можно указывать пароль :wink: )


Berckut написал:
[q]
я этим пользуюсь с момента, как появилось, но приручить пока удалось только url.
[/q]


Так скажите 1-2 проблемных сайта. Давайте посмотрим на них

Кстати, насчет PDA не соглашусь - есть еще более усеченный вариант "для печати"
У меня заработал такой шаблон (привожу нужный фрагмент) <link>(...)/(url|(.*)|/$1?story_print=1)</link>

С датой действительно проблемы, так как месяц указан с помощью буквенной аббревиатуры.
Для такой даты подходит примерно такой шаблон (проверен в Regex Coach) ^.+(\d\d)\s+(\S+)\s+(\d\d\d\d)\s+(\d\d\:\d\d\:\d\d).+$

Но похоже с регулярными выражениями у него глюки - после его применения вообще перестают находиться новости. :wonder1:
Так что можно пока считать что такой функциональности для даты нет...



Berckut написал:
[q]
Хотелось бы увидеть вот какое изменение:
Большинство сегодняшних сайтов имеют элементы, которые появляются случаным образом на странице, например, фотография из фотогалереи, банер с рекламой и т.д. Так как контрольная сумма берётся не полученного после обработки текста новости, а со всей страницы, то постоянно идёт ложные срабатывания - Авалач считает, что новость обновилась и заслуживает нового внимания. В результате, приходится каждый раз просматривать все новости заново.
[/q]


Тут выход только один - писать шаблон выделения новости как таковой, чтобы в новость включался только ее текст.


Berckut написал:
[q]
я этим пользуюсь с момента, как появилось, но приручить пока удалось только url.
[/q]


Так, насколько я понимаю, одно из основных причин введения регулярных выражений является то, что надо преобразовывать URL к нормальному виду.


  Вперед>>Страницы: 1 2 3
Печать
Форум Сообщества Практиков Конкурентной разведки (СПКР) »   Форум программы для мониторинга Интернета - Аваланч »   Обновления программы
RSS

Последние RSS
Open Source Intelligence (OSINT) Tools and Resources Handbook
Top tips on gathering information about companies by using free online sources
Новое на блоге HRразведка
Безопасность данных в MS Access
Слово как улика
20 Recon and Intel Gathering Tools used by InfoSec Professionals
What’s Changed?
10 альтернативных поисковиков
Ситуационный центр главы Республики Коми
Развёртывание ситуационных центров на базе технологии Avalanche
Как принимать сложные решения. Советы бывшего оперативника ЦРУ.
Открытая информация о "Новичке" из сети интернет.
Ген. директор "ОЗХО" Ахмет Узюмдж о "Новичке" и хим. атаке в Сирии
Онлайн-сервисы для Twitter
Коллекция для Twitter
Приложение Opera VPN закрывается
О работе разведки
Deep web и 11 поисковиков по нему
Об изначальной "лживости" любых документов
Обновление на блоге HRазведка

Самые активные 20 тем RSS
Стандартные источники информации в СайтСпутнике
Слово как улика
Open Source Intelligence (OSINT) Tools and Resources Handbook