Synthetic Data Generation Pipeline (NVIDIA Omniverse)

Overview

Built a synthetic data generation pipeline in NVIDIA Omniverse for computer vision using a custom-authored data center digital twin, semantic labeling, multi-camera capture, and controlled camera perturbation to generate annotated RGB, segmentation, and bounding-box datasets.

Preview

Digital Twin Environment

A modular data center + office environment was built using OpenUSD principles, including:

Server racks and infrastructure zones
Office workstations and monitors
Support equipment (carts, cabinets)

Multi-Camera Capture System

Six strategically placed cameras capture distinct semantic zones:

Server aisles
Office workspace
Support areas

Each camera generates independent datasets with controlled jitter to simulate real-world variation.

Semantic Labeling

Objects were labeled using Omniverse Replicator:

Servers
Desks
Monitors
Chairs
Equipment

This enables automated generation of training-ready annotations.

Dataset Output

Each frame produces:

RGB images
Semantic segmentation
2D bounding boxes

Example Outputs

Server Dataset View

Office Dataset View

Semantic Segmentation

Pipeline Capabilities

Multi-camera dataset generation
Scoped camera jitter (controlled perturbation)
Lighting variation support
Structured dataset output for ML pipelines

Engineering Challenges Solved

Replicator instability → resolved via staged execution strategy
Camera targeting issues → solved with authored camera system
Scene coverage gaps → resolved via multi-camera architecture
Semantic labeling pipeline → implemented programmatically

Tech Stack

NVIDIA Omniverse USD Composer
Omniverse Replicator
OpenUSD (USD / USDA)
Python

Future Work

Domain randomization (materials, lighting, layout)
Large-scale dataset generation (1k–10k frames)
Integration with training pipelines (PyTorch / TensorFlow)

Key Insight

This project demonstrates how digital twins can replace real-world data collection by generating scalable, labeled datasets for computer vision.

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
images		images
media		media
output		output
output_cam_server_a_jitter		output_cam_server_a_jitter
output_cam_server_a_jitter_scoped		output_cam_server_a_jitter_scoped
output_multi_cam_full_safe		output_multi_cam_full_safe
output_multi_cam_lighting_var		output_multi_cam_lighting_var
output_multi_cam_medium_test		output_multi_cam_medium_test
output_multi_cam_safe_test		output_multi_cam_safe_test
output_multi_cam_scoped_jitter		output_multi_cam_scoped_jitter
output_randomized_cam		output_randomized_cam
output_randomized_cam_constrained		output_randomized_cam_constrained
output_targeted_cam		output_targeted_cam
output_zone_targeted_cam		output_zone_targeted_cam
usd		usd
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Synthetic Data Generation Pipeline (NVIDIA Omniverse)

Overview

Preview

Digital Twin Environment

Multi-Camera Capture System

Semantic Labeling

Dataset Output

Example Outputs

Pipeline Capabilities

Engineering Challenges Solved

Tech Stack

Future Work

Key Insight

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Folders and files

Latest commit

History

Repository files navigation

Synthetic Data Generation Pipeline (NVIDIA Omniverse)

Overview

Preview

Digital Twin Environment

Multi-Camera Capture System

Semantic Labeling

Dataset Output

Example Outputs

Pipeline Capabilities

Engineering Challenges Solved

Tech Stack

Future Work

Key Insight

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Packages