Форум Сообщества Практиков Конкурентной разведки (СПКР) » Приемы работы с программой СайтСпутник (SiteSputnik) » Конвертация потоков для экспорта в Excel, Access, ... |
![]() |
<<Назад Вперед>> | Страницы: 1 2 | Печать |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 14 декабря 2012 14:09 Сообщение отредактировано: 9 января 2018 9:45
По заявке Игоря Нежданова в версии 8.2.2 от 14.12.2012 реализована конвертация информационных потоков, создаваемых программой SiteSputnik News, в табличный формат, который затем может быть импортирован в Excel, в базу данных на Access и, возможно, в другие программые продукты.
![]() то СайтСпутник конвертирует эти потоки в формат, который умеют импортировать самые различные приложения, например, Excel и Access.
table:C:\Users\AB\Desktop D:\Документы\Фирма\Негатив table:D:\Документы\Фирма\Негатив table:abm@mails.ru abm02@mails.ru table:http://sitesputnik.ru/Stream/ В первом операторе прописан экспорт конвертированного в табличное представление потока прямо на рабочий стол моего компьютера, во втором - в папку D:\Документы\Фирма\Негатив будет отправлен неконвертированный поток, в третьем - в эту же папку - конвертированный поток, в четветром - конвертированный поток будет оправлен на указанный е-майл. в пятом - неконвертированный поток - на другой е-майл. в шестом конвертируемый поток отправится на сайт sitesputnik.ru/ в папку /Stream/ Количество папок экспорта неограничено. Количество видов папок три: папка локального компьютера или локальной сети, е-майл ящик, папка глобальной сети (на сайте). Эта возможность программы СайтСпутник предназначена для создания баз данных на заданную тему или общей базы.
В настоящее время табличная форма выдачи такова: ![]() Добавлены столбцы: Автор - автор сообщения или новости. Tc - время события. Дата поиска. Тп - время поиска. Рубрики - (!) список Рубрик, в которые попало сообщение или новость. Объекты/кол-во - список ЮЛ и ФЛ, обнаруженных в сообщении или новости, после наклонной черты указано количество упоминаний ЮЛ и ФЛ. Домен 2-го уровня - источник, на котором размещено сообщение или новость. Ещё одно замечание. Если вместо префикса table: использовать excel:, то конвертация произойдет в формат Excel, расширение xlsx.
Префикс json: обеспечивает конвертацию Рубрик и Чистых потоков в формат json, который может быть получен «вручную» или автоматически. Кроме отправки полученного json-файла: в папку сайта, в локальную папку или на E-mail можно отправить его на сервер на API. Подробнее на ссылках: Работа на стороне сервера и Работа на стороне клиента. |
tungus1973
Модератор форума
Откуда: г. Санкт-Петербург Всего сообщений: 795 Рейтинг пользователя: 11 Ссылка Дата регистрации на форуме: 3 июля 2009 |
Спасибо Алексею Мыльникову и Игорю Нежданову за эту функцию! Теперь у СайтСпутника появилась возможность экспорта результатов в базу данных любого формата. Это позволяет использовать СайтСпутник совместно с любой другой аналитической программой. ![]() |
petryashov
Администратор
Откуда: Москва Всего сообщений: 480 Рейтинг пользователя: 9 Ссылка Дата регистрации на форуме: 7 июня 2009 |
Алексей, делаю вроде бы все по инструкции, но у меня появляются только заголовки таблицы, а сама она пустая |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
Ящик (Папку) уплотните, а то в нём дыры какие-то. Но это к Вашему вопросу не относится. Попробуйте на данных, полученных в новой версии. У Вас столбец с датой закрыт, может поток Вы выбрали очень старый. |
petryashov
Администратор
Откуда: Москва Всего сообщений: 480 Рейтинг пользователя: 9 Ссылка Дата регистрации на форуме: 7 июня 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 13 января 2013 0:04 Сообщение отредактировано: 13 января 2013 0:24
2 Алексей Мыльников Заработало, спасибо! И сразу вопрос: можно ли сделать так, чтобы в эту таблицу транслировались еще и следующие поля: 1. Название Рубрики (или рубрик), в которую (или которые) попал запрос. 2. Дату и время получения новости СайтСпутником из Интернета. Для упрощения обработки в СУБД дату и время лучше разнести по разным столбцам (это же относится и к дате публикации новости) 3. Домен второго уровня отдельным столбцом (для большего удобства группировки источников в СУБД) 4. Если можно, то в отдельном поле через разделитель выделенные в каждой новости Объекты. 5. Там, где есть возможность, желательно выделять еще и авторов публикаций в отдельном столбце. Чтобы не плодить огромные файлы, эти пункты можно выводить в файл только в том случае, если пользователь прямо на это укажет в настройках. Лично я буду обязательно указывать ;-) Все это существенно упростит обработку данных в СУБД и окажется востребованным аналитиками Кстати говоря, пункты 3,4 и 5 могут послужить основой для создания в СайтСпутнике (или СУБД) досье объектов, источников информации и авторов (экспертов) |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
В целом - да. Это всё понятно. Вроде, больше ничего и не придумаешь, разве что "Источник", который не всегда совпадает с доменом 2-го уровня. |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
В версии 8.2.4.1 от 15.01.2013 реализовано следующее. Дата поиска. Выводится в отдельный столбец. Время поиска (поиска, а не публикации) могу сделать легко, но стоит ли? Если стоит, то почему? Домен 2-го уровня. Выделен также в отдельный столбец. Рубрики. Через запятую в столбце таблицы перечисляются Рубрики, в которые попала Новость. Объекты. Не сделал по следующей причине. У Вас, скорее всего, список объектов фиксирован (конкретные конкуренты, или товары, или "Топы", или ![]() P.S. Не забудьте, что есть префикс table:. Если его поставить перед Клиентской папкой, то конвертация потоков и содержмого Рубрик в табличное представление будет выполнено автоматически и отправлено в заданные КП. |
tungus1973
Модератор форума
Откуда: г. Санкт-Петербург Всего сообщений: 795 Рейтинг пользователя: 11 Ссылка Дата регистрации на форуме: 3 июля 2009 |
Профиль | Игнорировать
NEW! Сообщение отправлено: 16 января 2013 8:21 Сообщение отредактировано: 16 января 2013 8:21 Алексей Мыльников написал: Время поиска нужно, если СайтСпутник мониторит тему несколько раз в день. Особенно актуально, например, во время предвыборных компаний. Если из источника поступает много сообщений и разрыв между публикацией новости и появлением её в поисковике значительный, то это сигнал, что нужно отдельно поставить этот источник на мониторинг. Время поиска (поиска, а не публикации) могу сделать легко, но стоит ли? Если стоит, то почему? В самом СайтСпутнике время проверки можно посмотреть в таблицах. Однако, если данные выгружаются для анализа в БД, то провести анализ временных разрывов будет невозможно. |
petryashov
Администратор
Откуда: Москва Всего сообщений: 480 Рейтинг пользователя: 9 Ссылка Дата регистрации на форуме: 7 июня 2009 |
Полностью согласен с tungus1973 |
Алексей Мыльников
Долгожитель форума
Откуда: Волгоград Всего сообщений: 877 Рейтинг пользователя: 6 Ссылка Дата регистрации на форуме: 22 июня 2009 |
petryashov написал: Полностью согласен с tungus1973 "Не согласен с обоими", - цитата из классики. Нужно не время поиска, а время события, иначе можно очень сильно ошибиться. |
<<Назад Вперед>> | Страницы: 1 2 | Печать |
Форум Сообщества Практиков Конкурентной разведки (СПКР) » Приемы работы с программой СайтСпутник (SiteSputnik) » Конвертация потоков для экспорта в Excel, Access, ... |
![]() |
Самые активные 20 тем |
![]() |