Resume K

Res

Uploaded by

karth.abbyanish

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

73 views2 pages

Resume K

Res

Uploaded by

karth.abbyanish

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 2

KOHISHA ARUGANTI

Washington, DC Ó +1 703-579-7117 varuganti.kohisha@gmail.com ¯ LinkedIn GitHub

Professional Summary
• Data Engineer with over 5 years of hands-on experience in developing and optimizing data solutions across various industries.
• Expertise in data modeling, warehousing, and ETL pipelines development to drive business growth and efficiency in large-scale, fast-paced
environments.
• Experienced in AWS solutions such as EC2, DynamoDB, S3, and Redshift, with strong hands-on skills in data visualization using Tableau
and QuickSight.
• Skilled in leveraging SQL, Python, and data mining techniques to analyze complex datasets and generate actionable insights for business
planning and decision-making.
• Proficient in infrastructure automation using Terraform and running CI/CD pipelines in Azure DevOps, ensuring seamless deployment of
infrastructure and continuous integration workflows.
• Adept at collaborating with stakeholders to align data strategies with business objectives, driving impactful results.

Work Experience
• Big Data Engineer | Celebal Technology Solutions | Washington, DC Mar 2024 - Present
◦ Integrated data from multiple sources into AWS S3 via Fivetran, managing JSON files and optimizing the pipeline using
Medallion Architecture, improving data processing efficiency by 30%.
◦ Automated the provisioning of AWS infrastructure and Databricks resources using Terraform, reducing manual effort by 40%
and accelerating deployment time by 50%.
◦ Developed and maintained CI/CD pipelines using Azure DevOps, automating infrastructure deployment and
version-controlled code management, increasing deployment efficiency by 35%.
◦ Created and deployed Databricks Asset Bundles, replicating notebooks across environments with version control, ensuring 100%
consistency across development, staging environments.
◦ Utilized Serverless SQL to reduce infrastructure costs by 30%, and optimized data processing workflows to ensure cost-effective
resource usage.
◦ Enhanced decision-making capabilities and operational efficiency, leading to a 40% increase in campaign success and a 20%
reduction in excess inventory.
◦ Managed data governance with AWS Secret Manager and VPC, ensuring compliance and protecting against data breaches.
◦ Developed Data transformation scripts and used Databricks to harmonize data formats and resolve schema inconsistencies,
ensuring seamless integration.
◦ Addressed additional client needs by integrating new reporting features and refining data processing based on feedback.
• Data Analyst | George Washington University | Washington, DC Jun 2022 - Dec 2023
◦ Developed a machine learning-based legal document categorization system using Python and advanced NLP techniques, aimed at
enhancing legal research efficiency.
◦ Processed and standardized diverse legal document data with Python libraries NLTK and SpaCy, preparing high-quality inputs
for model training.
◦ Engineered features using TF-IDF and word embeddings, applying Scikit-Learn for effective feature selection and model
development.
◦ Built and optimized classification models, including Naive Bayes, SVM, LSTM, and BERT, utilizing TensorFlow, Keras, and
Scikit-Learn.
◦ Achieved 92% classification accuracy, addressing complex legal text challenges and setting a new benchmark for document
categorization.
◦ Designed Tableau dashboards for visualizing results and compiled detailed reports, offering actionable insights to improve
document management.
◦ Automated data ingestion and model updates, establishing a scalable system capable of continuous learning and integration with
legal databases.
◦ Enhanced operational efficiency by 30%, significantly improving document retrieval speed and accuracy, and providing a valuable
tool for future legal research.
• Program Analyst | Cognizant Technology Solutions | Bangalore, India Nov 2019 - Jan 2022
◦ Processed and analyzed large-scale healthcare data for the Sanofi Group to generate daily reports for internal teams and external
stakeholders, ensuring data accuracy and timely delivery.
◦ Implemented real-time data ingestion using Apache Kafka, reducing data processing latency by 30% and improving data
streaming efficiency.
◦ Built custom batch data processing pipelines with AWS Glue, tailored to meet project-specific needs, improving data processing
speed and efficiency.
◦ Orchestrated and monitored data workflows using Apache Airflow, incorporating alert systems to reduce job failure resolution
time by 25%.
◦ Leveraged Apache Spark for high-performance data processing and transformation, achieving a 20% reduction in processing time,
with secure data storage in Amazon S3 and Snowflake.
◦ Built Power BI dashboards for operational reporting, resulting in a 15% increase in decision-making accuracy for the client.
Certifications
• Azure Data Engineer Associate
• AWS Certified Solutions Architect Associate
• Azure Data Fundamentals
• Databricks Accredited Apache Spark Programming
• Databricks Accredited AWS Platform Architect
• Databricks Accredited Platform Administrator

Skills
Version Control: Git, Azure Repos, GitHub
CI/CD: Azure DevOps (Pipelines, Repos)
Infrastructure as Code: Terraform, ARM Templates, CloudFormation
Programming Languages: Python, PySpark, SQL, R, MATLAB, Git
AI & Data Science Libraries: Pandas, Scipy, NumPy, Scikit-Learn, Matplotlib, Plotly, Seaborn, Keras, TensorFlow, PyTorch
ETL Tools: Apache Airflow, Glue
Data Visualization: Tableau, Power BI, AWS QuickSight
Big Data Ecosystem: Spark, Kafka
Cloud Environment: Azure, Amazon Web Services(S3, Redshift, DynamoDB)
Azure: Databricks, Data Lake, Blob Storage, Azure Data Factory, SQL Data Warehouse
Databases: Redshift, SQL Server, NoSQL

Projects
Hate Speech Analysis
•
Python, NLP, Deep learning, Machine Learning
◦ Identified the growing problem of hate speech on online platforms, which spreads negativity and causes harm to individuals and
communities.
◦ Acknowledged the challenges faced by existing solutions in accurately detecting and understanding the context of hate speech.
◦ Implemented robust preprocessing, including data cleaning, normalization, and feature engineering.
◦ Utilized Word2Vec, GloVe, and TF-IDF for effective word embedding, enhancing the model’s ability to understand context and
semantics.
◦ Employed a combination of CNN-LSTM and BERT to further enhance classification performance.
◦ Developed a dynamic data visualization tool with Streamlit, allowing users to interactively explore and analyze the model’s results.
◦ Enhanced model interpretability using the LIME Algorithm, providing clear insights into the decision-making process.

Netflix Data Analysis

•
AWS, Python, SQL, S3
◦ Collected and scraped Netflix data through APIs, creating a comprehensive dataset and automating data integration with AWS
and SQLite, enhancing operational efficiency.
◦ Reduced data processing time by 15% and identified viewer trends through exploratory analysis, leading to targeted content
recommendations.
◦ Developed an interactive Tableau dashboard for stakeholders to analyze key metrics and track performance indicators effectively.

Education
George Washington University Washington, DC
•
Master of Science in Data Science Dec 2023
SRI VENKATESHWARA ENGINEERING COLLEGE India
•
Bachelor of Technology in Computer Science Sep 2020

Nikhil Kyatham ATS PDF
No ratings yet
Nikhil Kyatham ATS PDF
3 pages
Albrin DataAnalyst Resume
No ratings yet
Albrin DataAnalyst Resume
2 pages
Avinash - Data Analyst
No ratings yet
Avinash - Data Analyst
3 pages
Devi Sricharan Buddhavarapu
No ratings yet
Devi Sricharan Buddhavarapu
2 pages
Tejaswai - Kondaveeti - Data Engineer
No ratings yet
Tejaswai - Kondaveeti - Data Engineer
2 pages
Asis Dash
No ratings yet
Asis Dash
6 pages
Data Analyst Resume: Skills & Experience
No ratings yet
Data Analyst Resume: Skills & Experience
1 page
Guruprasad Nagaroli v1 1714384746377 Guruprasad
No ratings yet
Guruprasad Nagaroli v1 1714384746377 Guruprasad
4 pages
Jishna M - Resume
No ratings yet
Jishna M - Resume
2 pages
Abhishek Kumar RESUME
No ratings yet
Abhishek Kumar RESUME
2 pages
Sai Vinay Resume
No ratings yet
Sai Vinay Resume
1 page
Data Scientist CV 2023 Addiel DeAlba
No ratings yet
Data Scientist CV 2023 Addiel DeAlba
5 pages
Data Analyst & Consultant Profile
No ratings yet
Data Analyst & Consultant Profile
1 page
Resume Pooja Jain PDF
No ratings yet
Resume Pooja Jain PDF
2 pages
Sambit Mohanty Resume
No ratings yet
Sambit Mohanty Resume
1 page
Resume Data Engineer
No ratings yet
Resume Data Engineer
8 pages
Hitanshi Shishodia - Data - Engineer
No ratings yet
Hitanshi Shishodia - Data - Engineer
1 page
Gerwin Niraj
No ratings yet
Gerwin Niraj
3 pages
CV Sumit Saxena 022024
No ratings yet
CV Sumit Saxena 022024
3 pages
CV - Vrunda Shah - Data Scientist - 2.5 Years Experience
No ratings yet
CV - Vrunda Shah - Data Scientist - 2.5 Years Experience
2 pages
Resume DINESHDADISETTY
No ratings yet
Resume DINESHDADISETTY
2 pages
Harika Prasanna
No ratings yet
Harika Prasanna
2 pages
Anjum's Resume
No ratings yet
Anjum's Resume
4 pages
Data Engineer Resume: Srikrishna Amaravadi
No ratings yet
Data Engineer Resume: Srikrishna Amaravadi
2 pages
Shami Shaji
No ratings yet
Shami Shaji
2 pages
Varsha Swaminathan Resume
No ratings yet
Varsha Swaminathan Resume
1 page
Merage MSBA Sample Resume-Akash-v2
No ratings yet
Merage MSBA Sample Resume-Akash-v2
2 pages
Joseph Manoj
No ratings yet
Joseph Manoj
5 pages
Abdul Hameed Mohamed
No ratings yet
Abdul Hameed Mohamed
7 pages
Resume - Tanmoy Munshi PDF
No ratings yet
Resume - Tanmoy Munshi PDF
2 pages
Resume Feroze Mohammed
No ratings yet
Resume Feroze Mohammed
1 page
Raghav Arora FlowCV Resume 20240318
No ratings yet
Raghav Arora FlowCV Resume 20240318
2 pages
Resume Pooja
No ratings yet
Resume Pooja
2 pages
Agam Kumar Resume
No ratings yet
Agam Kumar Resume
2 pages
Teja
No ratings yet
Teja
5 pages
Upsc Notes
No ratings yet
Upsc Notes
2 pages
Vijay Kanth - Azure Data Engineer
No ratings yet
Vijay Kanth - Azure Data Engineer
2 pages
Vikrant Chaudhary - Resume 2025
No ratings yet
Vikrant Chaudhary - Resume 2025
2 pages
Agrim Narayan Profile
No ratings yet
Agrim Narayan Profile
1 page
Vidya Resumee
No ratings yet
Vidya Resumee
2 pages
Akash Resume Data
No ratings yet
Akash Resume Data
2 pages
Vidhi Data Engineer
No ratings yet
Vidhi Data Engineer
4 pages
Anshul Yadav: Data Science Resume
No ratings yet
Anshul Yadav: Data Science Resume
1 page
LekhyaJ SrDE Resume
No ratings yet
LekhyaJ SrDE Resume
5 pages
Anish's Resume
No ratings yet
Anish's Resume
2 pages
CV - Sruti Ranjan - Azure de - Xebia
No ratings yet
CV - Sruti Ranjan - Azure de - Xebia
2 pages
Somesh Ghaturle Resume
No ratings yet
Somesh Ghaturle Resume
1 page
Shangari V - DE - 4yrs
No ratings yet
Shangari V - DE - 4yrs
2 pages
Farhan Data Engineer
No ratings yet
Farhan Data Engineer
9 pages
Sai Bharathi - Data Analytics
No ratings yet
Sai Bharathi - Data Analytics
5 pages
Ritika Mishra Resume
No ratings yet
Ritika Mishra Resume
2 pages
Data Scientist's Professional Profile
No ratings yet
Data Scientist's Professional Profile
2 pages
MD Zeeshan Raza Resume
No ratings yet
MD Zeeshan Raza Resume
3 pages
Venkat Preetham
No ratings yet
Venkat Preetham
3 pages
Avinash Kumar Data Modeler
No ratings yet
Avinash Kumar Data Modeler
3 pages
Malathi
No ratings yet
Malathi
3 pages
RajanSahResume PDF
No ratings yet
RajanSahResume PDF
2 pages
Cloud Data Engineer Resume
No ratings yet
Cloud Data Engineer Resume
2 pages
Unit I - Big Data Programming
No ratings yet
Unit I - Big Data Programming
19 pages
Ponnam R Mobile: 248 987 6154 Gmail ID:: Professional Summary
No ratings yet
Ponnam R Mobile: 248 987 6154 Gmail ID:: Professional Summary
6 pages
Cloudera CDSW
No ratings yet
Cloudera CDSW
122 pages
Databricks Certified Data Engineer Associate - 6
No ratings yet
Databricks Certified Data Engineer Associate - 6
10 pages
Building Batch Data Pipelines On Google Cloud
No ratings yet
Building Batch Data Pipelines On Google Cloud
18 pages
Big Data Platforms and Analytics
No ratings yet
Big Data Platforms and Analytics
20 pages
Akshay Pilania Resume PDF
No ratings yet
Akshay Pilania Resume PDF
1 page
Practical-1: Aim: Hadoop Configuration and Single Node Cluster Setup and Perform File Management Task in
No ratings yet
Practical-1: Aim: Hadoop Configuration and Single Node Cluster Setup and Perform File Management Task in
61 pages
4 Srihari Resume SDE
No ratings yet
4 Srihari Resume SDE
1 page
Vivek K DevOps (SRE)
No ratings yet
Vivek K DevOps (SRE)
7 pages
Apache Hive Overview & Architecture
No ratings yet
Apache Hive Overview & Architecture
27 pages
GCP Data Engineer Resume Examples For 2024 Resume Worded
No ratings yet
GCP Data Engineer Resume Examples For 2024 Resume Worded
1 page
Azure Data Engineering Interview Q & A - Topicwise
100% (1)
Azure Data Engineering Interview Q & A - Topicwise
57 pages
AWS Big Data Specialty
100% (1)
AWS Big Data Specialty
211 pages
Big Data Seminar Report Rahul Jain
No ratings yet
Big Data Seminar Report Rahul Jain
41 pages
Last Year Question Paper - Big Data - (BCS 061)
No ratings yet
Last Year Question Paper - Big Data - (BCS 061)
9 pages
Data Resume Snowflake
No ratings yet
Data Resume Snowflake
7 pages
Big Data & Hadoop Course Overview
No ratings yet
Big Data & Hadoop Course Overview
18 pages
Executive PG Programme in Data Science: Curriculum
No ratings yet
Executive PG Programme in Data Science: Curriculum
12 pages
02 - Data Analytics Prefessional Course
100% (1)
02 - Data Analytics Prefessional Course
16 pages
Unit-II (Big Data)
No ratings yet
Unit-II (Big Data)
20 pages
Formación Cloudera I - Intermedio - Ejercicios Con Soluciones
No ratings yet
Formación Cloudera I - Intermedio - Ejercicios Con Soluciones
29 pages
Threat Monitoring and Intelligent Data Analytics of Network Traffic
No ratings yet
Threat Monitoring and Intelligent Data Analytics of Network Traffic
8 pages
Big Data Analytics With Storm, Spark and GraphLab
100% (1)
Big Data Analytics With Storm, Spark and GraphLab
53 pages
Rakshit Resume
No ratings yet
Rakshit Resume
1 page
JD - Data Engineer With Data Science Expertise
No ratings yet
JD - Data Engineer With Data Science Expertise
2 pages
Comparative Analysis of Supervised Machine Learnin
No ratings yet
Comparative Analysis of Supervised Machine Learnin
10 pages
III-I SEM SYLLABUS Updated
No ratings yet
III-I SEM SYLLABUS Updated
30 pages
Turnitin Group Screening Interview Questions
No ratings yet
Turnitin Group Screening Interview Questions
4 pages
Unit 4 Iot II ..
No ratings yet
Unit 4 Iot II ..
19 pages

Resume K

Uploaded by

Resume K

Uploaded by

KOHISHA ARUGANTI

Washington, DC Ó +1 703-579-7117 varuganti.kohisha@gmail.com ¯ LinkedIn  GitHub

Netflix Data Analysis

You might also like

Washington, DC Ó +1 703-579-7117 varuganti.kohisha@gmail.com ¯ LinkedIn GitHub