apache-spark

Apache Spark is an open source distributed general-purpose cluster-computing framework. It provides an interface for programming entire clusters with implicit data parallelism and fault tolerance.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

apache-spark

Here are 56 public repositories matching this topic...

manojmallela / fun-spark

SalmaHisham / KafKa-Hadoop-Spark-cluster-for-Analytics

amirhosseinazami1373 / Book-Genre-Classifier

kaushik-prasad-dey / Lending_club_loan_analytics_pyspark

rmcg3 / Big-Data-Chicago-Crimes-2001-to-Present

Sharvari289 / Yelp-Restaurants-Recommendation-System-using-Apache-Spark

Aakash02A / Word-Count-Analyzer

Bachatero / ApacheSpark

SimoneBrancato / AudioMood

Lucky-akash321 / Data-Engineering-Taxi-Data

izlata / can_fed_election

AshkanM96 / EECS-4415-NYC-Taxi-Uber

bjam24 / agh-large-scale-data-analysis

itasli / accidents-circulation-routiere

hendhamdi / Sentiment-Analysis-Spark-NLP

tiwarishubham635 / Apache-Spark

Yash22222 / Olympic-Games-Analytics-Using-Apache-Spark

tseringjsherpa / pyspark-ml-housing-prices-pipeline

AdemirCastro / databricks-spark-sql_challenge1

mriusero / contract-management-spark-scala

Related topics