[Big Data] А вы все еще генерируете данные руками? Тогда GenRocket идет к вам

Автор Сообщение
news_bot ®

Стаж: 6 лет 9 месяцев
Сообщений: 27286

Создавать темы news_bot ® написал(а)
06-Янв-2021 22:31

На днях я наконец-то получила свой долгожданный сертификат по работе с сервисом для генерации тестовых данных GenRocket.  И теперь как сертифицированный специалист готова рассказать об этом сервисе.НО изначально необходимо очертить проблему, которую можно решить при помощи этого сервиса. Проблема генерации тестовых данных Генерация тестовых данных в достаточном количестве для покрытия минимально возможных необходимых вариантов сценариев становится проблемой для многих проектов. Почему "минимально возможных"? Потому что тут вспоминаются "Классы эквивалентности", которые сокращают количество тестовых данных от бесконечности до полезного набора.Почему "необходимых"? А тут вспоминаются "Тестовое покрытие", которое говорит, что тестовые данные должны вести к покрытию максимально возможных сценариев. Но, даже учитывая "Классы эквивалентности", генерация тестовых данных сейчас стала отдельной задачей для таких сфер, где работа идет непосредственно с данными, их обработкой и/или трансформацией.  Вариаций таких данных огромное количество, а еще необходимо тестировать не только конечный результат, но и промежуточные значения.Функциональность идеального сервиса генерации данныхИдеальный сервис по генерации тестовых данных должен иметь возможность:
  • генерировать данные в разных форматах (JSON, XML, CSV  и т.д.)
  • генерировать данные с зависимостями (parent, child)
  • генерировать сложные зависиммые данные (if a then 1 or 2 else 3 or 5)
  • генерировать большие обьемы данный за небольшой промежуток времени
Хотелось бы иметь возможность:
  • загрузки данные в прямо в БД
  • интерграции в CI/CD
  • создавать модель данных автоматом из схем
GenRocket университетСервис GenRocket предоставяет тренинг-университет, пройдя который вы ознакомитесь с основным базовым функционалом, установкой и настройкой. Изучить его я крайне рекомендую, первая половина - это чистая теория и немножно нудная, но вы узнаете все основные понятия, которыми оперирует сервис. Вторая же половина - это уже практические занятия с детализированным описание куда нажимать. Этот тернинг подойдет для любого уровня подготовки тестировщика, бизнес-аналитика или разработчика. GenRocket сервис
GenRocket - это сервис для генерации данных, созданный в 2011 году Hycel Taylor и Garth Rose для решения проблемы создания реалистичных тестовых данных для любой модели данных. Сервис обладает функциональностью генерировать данные для автоматического тестирования, для тестирования нагрузки, тестирования безопасности и др.Сервис состоит из двух частей: web часть и программная cli часть. В web части происходит создание сценария-инструкции для генерации данных, в программной cli части на самой машине происходит генерация данных. Что бы начать работу с GenRocket пользователь должен быть авторизирован, затем что бы начать работу с GenRocket необходимо скачать архив для Runtime* для cli части, распаковать его и прописать в системных переменных путь к папке с GenRocket в переменную GEN_ROCKET_HOME  и в переменно PATH  прописать %GEN_ROCKET_HOME%\bin значение. Затем открываем командную строку, набираем genrocket и видим картинку ниже.
GenRocket cli часть работает в двух режимах on-line и off-line, но для работы с off-line надо скачать сертификат, который будет валиден только 24 часа. GenRocket  домен и его атрибуты
Первые два из основных компонентов - это Домен и Атрибуты домена. Домен - это существительное, например, пользователь: адрес, кредитная карта и т.д. Каждый домен описывается атрибутами, например: имя, фамилия, e-mail, пароль и день рождения. На картинке ниже вы видите домент User (1), описанный атрибутами (2) и пример сгенерированных данных (3).Атрибуты к домену могут добавляться вручную по одному (2), с помощью блокнота или импортируя DDL, CSV, JSON или другие форматы. Если мы говорим о табличных данных, то можно сказать, что  домен - это таблица, а атрибуты - это клонки этой таблицы.  GenRocket генераторыСледующий компонент - генератор (generator) - это функциональность, которая непосредственно отвечает за  генерацию данных в различных форматах. Генераторов в GenRocket  150+ для различных типов данных. Например:
Каждому атрибуту домена GenRocket назначает свой генератор, опираясь на имя атрибута, автоматом. Например, для атрибута, который содержит слово Name, будет подобран генератор NameGen, а для атрибута с SSN будет подобран генератор SSNGen.С свойствах генератора можно установить специфичные для проекта параметры: диапазон значений, формат, способ сортировки данных.
 GenRocket получатель (receiver)Следующий компонент - получатель (receiver) - это функциональность, которая отвечает за выгрузку данных в необходимом формате: XML, JSON, SQL, CSV, JDBC, REST, SOAP.  В GenRocket 35+ подобных получателелей.
Так же получателем может быть база данных, для которой необходимо настроить JDBC соединение. Настройки для этого соединения настраивается в специальных properties файлах.  GenRocket сценарий (scenarios)Следующий компонент - сценарий (scenarios) - это набор инструкций, которые определяют сколько и в каком порядке будут созданы данные. Сценарии бывают одиночные (2) и сценарии-цепочки (1), которые позволяют генерировать данные для несколько связанных доменов одновременно.  За количество данных отвечает переменная loopCount в настройках домена. Причем у каждого домена значение этой переменной устаналивается отдельно, что позволяет генерировать разное количество данных для каждого домена в сценариях-цепочках. 
Сценарий выгружается в виде grs файла (3) и должен быть исполнен на машине, где был установлен GenRocket. Открываем командную строку и выполняем сценарий при помощи команды genrocket -r UserInsertScenario.grs. При выполнении сценария видим результат, в котором отображатеся время генерации данных. На изображении ниже 10 тыс записей были вставлены в таблицу за 26 сек:
Применение GenRocket на реальном проектеВозьмем небольшую схему данных, в которой есть таблицы user, grantHistory  и notificationSetting.
Используя импорт DDL создадим домен для user.
create table `user` (
  id              int(10) not null auto_increment,
  external_id     varchar(50) not null unique,
  first_name      varchar(25) not null,
  last_name       varchar(25) not null,
  middle_initial  char(1),
  username        varchar(100) not null,
  ssn             varchar(15) not null,
  password        varchar(255) not null,
  activation_date date,
  primary key (id));
После создания доменов GenRocket подбирает подходящие генераторы для каждого атрибута. При необходимости настраиваем специфичные генераторы или модифицируем существующие. Например, изменяем generationType на random и сохраняем изменения.
Аналогичные действия проделываем для grant_history и notification_setting. Сгенерированные данные будут сохраняться в базу данных, для которой настроено JBDC соединение. 
driver=org.h2.Driver
user=sa
password=sa
url=jdbc:h2:file:~/lms_course/lms_alpha;AUTO_SERVER=TRUE;
batchCount=1000
И так же для этой базы настраивается специфичные получатели H2InsertV2Receiver для вставки и SQLUpdateV2Receiver для модификации. После всех манипуляций с настройками получаем файлы сценарии InsertScenarioChain.grs для вставки и UpdateScenarioChain.grs для модификации, после выполнения которых получаем картинку ниже.
И вуаля, данные в таблицах:
Заключение Проведя иследование существующих на рынке предложений по сервисам генерации данных, могу сказать, что можно встретить два варианта сервисов:
  • бесплатный сервис, ограниченный в количестве генерируемых данных для несложных моделей данных
  • платный сервис с неограниченным количеством генерируемых данных и подходящие для сложных моделей данных, который может предоставляет ограниченный бесплатный функционал
Если у вас небольшой короткий проект с несложными данными, то данные для него можно получить при помощи «бесплатных» сервисов или при помощи самописного генератора. Но если проект долгосрочный с постоянно расширяющейся моделью данных, но идея покупки платного сервиса становится все привлекательней и привлекательней, но конечно решать вам. Ниже расценка на доступ для GenRocket
Для сравнения я приготовила несколько ссылок «бесплатных» сервисов: https://www.datprof.com/solutions/test-data-generation/ - только 14 дней бесплатного использования, похоже что цена договорнаяhttp://generatedata.com/ - бесплатно, но возможна генерация только 100 записейhttps://www.mockaroo.com/ - бесплатна возможна генерация только 1000 записей, остальное платно - для самого дорогого доступа $5000/year
===========
Источник:
habr.com
===========

Похожие новости: Теги для поиска: #_big_data, #_testing, #_testing_tools, #_data, #_generator, #_data_generation, #_big_data
Профиль  ЛС 
Показать сообщения:     

Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах
Вы не можете прикреплять файлы к сообщениям
Вы не можете скачивать файлы

Текущее время: 22-Ноя 19:07
Часовой пояс: UTC + 5