hadoop

Star

Here are 83 public repositories matching this topic...

tasiomendez / docker-spark

Star

Running Spark (and Hadoop) on Docker

docker spark hadoop cluster docker-spark

Updated Apr 30, 2020
Dockerfile

MuhamedHekal / Hadoop-HA-Cluster-on-Docker

Star

Hadoop3-HA-Docker is a production-ready, fault-tolerant Hadoop cluster deployed with Docker Compose. It automates the setup of a fully distributed Hadoop ecosystem with high availability (HA) features, designed for reliability, scalability, and real-world big data workloads

docker yarn hadoop docker-compose hdfs hadoop-cluster mapreduce

Updated May 22, 2025
Dockerfile

hibuz / hadoop-docker

Star

🐳 hadoop ecosystems docker image

docker spark hive hadoop docker-compose hbase data-engineering flink zeppelin

Updated Jul 14, 2025
Dockerfile

because-of-you / component

Star

一个低占用、动态伸缩、易拓展、个性化。应用于个人Kubernetes开发集群的大数据常用组件库。

kafka component hadoop zookee

Updated Feb 17, 2025
Dockerfile

Dragon1573 / Hadoop-in-Docker

Star

A template repository provides convenient Apache Hadoop instance in Dev Containers.

docker hadoop vscode hdfs devcontainers

Updated Nov 12, 2024
Dockerfile

sukumaar / hdfs-local-container

Star

HDFS local single node container for testing

docker distributed-systems hadoop hdfs containerization container-image

Updated Jul 25, 2025
Dockerfile

Zejnilovic / hadoop-docker

Star

Hadoop 2.7.5 in Docker

docker hadoop

Updated May 20, 2019
Dockerfile

guangie88 / hadoop-docker

Star

Dockerfile setup for Hadoop

dockerfile hadoop

Updated Dec 31, 2018
Dockerfile

jgoodman8 / docker-zeppelin

Star

Stack to run Zeppelin notebooks over Hadoop and Spark

docker spark hadoop zeppelin

Updated Oct 12, 2018
Dockerfile

Flyraty / docker_bigdata

Star

Hadoop等大数据相关组件镜像，便于搭建环境学习

docker kafka spark hive hadoop bigdata

Updated Jul 28, 2020
Dockerfile

timveil / docker-hadoop-core

Star

Base Docker image for all Apache Hadoop components

docker hadoop docker-compose

Updated Nov 25, 2020
Dockerfile

magnetsinc / magnetize-recommendations

Star

Recommendations and personalization service

docker hadoop python3 personalization magnetize

Updated Sep 8, 2023
Dockerfile

menazord / big-data-playground

Star

Local playground for Spark and Jupyter notebooks, plus Iceberg support

spark hive hadoop jupyter-notebook iceberg hive-metastore

Updated Apr 20, 2025
Dockerfile

Pirate-Emperor / BigData-Pipeline

Star

BigData Pipeline is a local testing environment for experimenting with various storage solutions (RDB, HDFS), query engines (Trino), schedulers (Airflow), and ETL/ELT tools (DBT). It supports MySQL, Hadoop, Hive, Kudu, and more.