0% found this document useful (0 votes)

48 views7 pages

Act2.1 FTM

Ensayo

Uploaded by

Fernanda Treviño

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

48 views7 pages

Act2.1 FTM

Ensayo

Uploaded by

Fernanda Treviño

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 7

UNIVERSIDAD AUTÓNOMA DE NUEVO LEÓN FACULTAD DE CONTADURÍA PÚBLICA Y ADMINISTRACIÓN

ACTIVIDAD 2.1

Materia: Análisis de datos

2.1 - Actividad 2.1: Reporte de análisis exploratorio de datos sobre una serie de
pandas.

Lic. En Administración
Semestre: 6to Grupo: DFA

Maestro: Figueroa Garza Federico Guadalupe

Alumna:

1977827 Fernanda Treviño Montemayor

Ciudad Universitaria, 18 de septiembre 2024

Introducción

El análisis de datos juega un papel crucial en la comprensión de patrones y tendencias

dentro de conjuntos de datos. En este caso, hemos explorado una serie de pandas que
contiene información sobre gastos semanales. Utilizando técnicas de análisis
descriptivo, hemos examinado la tendencia central y la dispersión de estos gastos para
obtener información valiosa. La serie de pandas nos permite gestionar y manipular datos
de manera eficiente, facilitando el análisis estadístico. Al identificar las semanas con los
mayores y menores gastos, así como la variabilidad en los mismos, podemos tomar
decisiones informadas sobre la gestión financiera y la planificación futura.

El análisis de datos se ha convertido en una herramienta esencial en múltiples

disciplinas, desde la economía hasta la ciencia, pasando por la salud y la educación.
Con la llegada de grandes volúmenes de datos, la capacidad para extraer información
significativa de estos conjuntos ha tomado una relevancia sin precedentes. La
biblioteca de Python, pandas, se presenta como una solución poderosa y versátil para
la manipulación y el análisis de datos. En este contexto, el uso de una serie de pandas
permite gestionar datos unidimensionales de manera eficaz, facilitando la realización
de operaciones estadísticas y el manejo de distintos formatos de datos.

Una serie de pandas es una estructura de datos similar a una lista, pero con la
capacidad de asociar etiquetas a cada elemento, lo que permite un acceso y análisis
más intuitivo. Esto es particularmente útil en el análisis de tendencias a lo largo del
tiempo, donde cada punto de datos puede corresponder a un período específico. En
este caso, hemos analizado una serie que representa gastos semanales, algo común
en la gestión financiera personal y empresarial. La tarea de desglosar estos gastos
semanales implica un enfoque sistemático que atraviesa desde la limpieza de datos
hasta la visualización de resultados.

El análisis descriptivo que realizaremos abarca varios aspectos fundamentales, como

la tendencia central, que incluye la media y la mediana, y la dispersión, representada
por la varianza y la desviación estándar. Estos conceptos nos ayudarán a comprender
no solo el gasto promedio, sino también la variabilidad y la consistencia a lo largo del
periodo analizado. A través de este análisis, es posible identificar patrones de
comportamiento en el gasto, así como relaciones potenciales que puedan existir con
eventos externos, como cambios de temporada, festividades o variaciones en los
ingresos.

Este análisis de la serie de pandas no solo es pertinente para evaluar los gastos
específicos en un plazo determinado, sino que también proporciona una base sólida
para futuras investigaciones y mejoras en la planificación financiera. Al mejorar
nuestra capacidad para interpretar los datos a través de técnicas analíticas rigurosas,
estamos mejor posicionados para enfrentarnos a los desafíos económicos, optimizar
recursos y, en última instancia, alcanzar una mayor estabilidad financiera.
Reporte de Análisis Exploratorio de Datos

1. Importación de Bibliotecas

python

import pandas as pd

import numpy as np

import matplotlib.pyplot as plt

import seaborn as sns

2. Carga de Datos

python

# Cargar tus datos en un DataFrame

data = pd.read_csv('ruta/a/tu/archivo.csv')

3. Resumen de Datos

- Forma del DataFrame: `data.shape`

- Primera fila: `data.head()`

- Descripción estadística: `data.describe()`

- Información del DataFrame: `data.info()`

4. Análisis de Datos Faltantes

python

missing_data = data.isnull().sum()

print(missing_data[missing_data > 0])

5. Análisis Univariante

- Distribución de columnas numéricas:

python

data.hist(bins=30, figsize=(15, 10))

plt.tight_layout()

plt.show()

- Visualización de columnas categóricas:

python

sns.countplot(x='nombre_columna', data=data)

plt.show()

6. Análisis Bivariante

- Correlación entre variables numéricas:

python

correlation_matrix = data.corr()

sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm')

plt.show()
- Gráficos de dispersión:

python

sns.scatterplot(x='columna_x', y='columna_y', data=data)

plt.show()

1. Cargar los Datos en una Serie de Pandas

Archivo “CSV”, contiene una columna llamada "gastos_semanales".

Serie:

python
import pandas as pd

# Cargar el archivo CSV

data = pd.read_csv('ruta/a/tu/archivo.csv')

# Cargar la columna en una Serie

gastos_semanales = pd.Series(data['gastos_semanales'])

2. Explorar los Datos

Para obtener información sobre la Serie, hay que verificar si hay valores faltantes o anomalías:

python
# Información de la Serie
print(gastos_semanales.describe())
print(gastos_semanales.isnull().sum()) # Contar valores faltantes
print(gastos_semanales[gastos_semanales < 0]) # Anomalías (si los gastos son negativos)

3. Cálculo de Estadísticos Descriptivos

Estadísticos de Tendencia Central:

-Media:

python
media = gastos_semanales.mean()
print(f"Media: {media}")

-Mediana:

python
mediana = gastos_semanales.median()
print(f"Mediana: {mediana}")
Estadísticos de Dispersión

Rango Intercuartílico (IQR):

python
iqr = gastos_semanales.quantile(0.75) - gastos_semanales.quantile(0.25)
print(f"Rango Intercuartílico: {iqr}")
```

Desviación Estándar:

python
desviacion_estandar = gastos_semanales.std()
print(f"Desviación Estándar: {desviacion_estandar}")

4. Interpretación de los Resultados

Analizar los resultados:

Gastos más altos y bajos

Identificar las semanas con los gastos más altos y bajos usando `nlargest` y `nsmallest`:

python
gastos_mas_altos = gastos_semanales.nlargest(5)
gastos_mas_bajos = gastos_semanales.nsmallest(5)
print("Gastos más altos:\n", gastos_mas_altos)
print("Gastos más bajos:\n", gastos_mas_bajos)

Variabilidad en los gastos:

La desviación estándar dará una idea de la variabilidad en los gastos. Un valor alto indica que
los gastos semanales varían ampliamente, mientras que un valor bajo indica que los gastos son
relativamente consistentes.

python
print(f"Desviación Estándar: {desviacion_estandar}")

Resumen de la Interpretación:

1. Gastos más altos y bajos: Los resultados de los gastos más altos y más bajos indicarán
cuáles semanas tuvieron esos extremos.
2. Variabilidad: Un rango intercuartílico (IQR) y una desviación estándar alta indicarían que hay
semanas con gastos significativamente distintos de los demás.
Conclusión:

El análisis de la serie de pandas reveló información clave sobre los gastos semanales.
Al calcular la media y la mediana, encontramos un punto central alrededor del cual se
distribuyen los gastos. Mientras tanto, el rango intercuartílico y la desviación estándar
nos proporcionaron una visión de la variabilidad en los gastos, indicando cómo se
distribuyen estas cifras a lo largo del tiempo. Las semanas con los gastos más altos y
más bajos nos ofrecen un contexto para entender influencias externas o decisiones de
gasto significativas. Este análisis no solo ayuda a identificar patrones en el
comportamiento financiero, sino que también puede ser esencial para establecer
estrategias de ahorro y optimización de recursos en el futuro. La capacidad de trabajar
con pandas facilita dicho análisis, convirtiéndolo en una herramienta indispensable para
el manejo de datos en diversas disciplinas.

Financial Analytics With Python
100% (1)
Financial Analytics With Python
40 pages
Python Finance & Trading Guide
No ratings yet
Python Finance & Trading Guide
11 pages
Univariate Analysis in Machine Learning
No ratings yet
Univariate Analysis in Machine Learning
17 pages
12 Ip Practical List With Solution Complete
No ratings yet
12 Ip Practical List With Solution Complete
5 pages
BDA File
No ratings yet
BDA File
26 pages
Data Analysis
No ratings yet
Data Analysis
20 pages
Python Data Analysis Basics
No ratings yet
Python Data Analysis Basics
32 pages
Descriptive Analytics - Ipynb - Colab
No ratings yet
Descriptive Analytics - Ipynb - Colab
9 pages
Py 10
No ratings yet
Py 10
5 pages
Dav Lab Manual Final
No ratings yet
Dav Lab Manual Final
16 pages
Data Manipulation With Pandas - Yulei's Sandbox
No ratings yet
Data Manipulation With Pandas - Yulei's Sandbox
18 pages
FDS LAB Record Print
No ratings yet
FDS LAB Record Print
45 pages
Unit 5 - Time Series Analysis and Predictive Modeling
No ratings yet
Unit 5 - Time Series Analysis and Predictive Modeling
21 pages
Class XII-IP-Practical File 1
No ratings yet
Class XII-IP-Practical File 1
28 pages
Pandas for Data Analysis Enthusiasts
No ratings yet
Pandas for Data Analysis Enthusiasts
9 pages
Data Analysis - 5th Unit
No ratings yet
Data Analysis - 5th Unit
14 pages
Pandas 1702216043
No ratings yet
Pandas 1702216043
86 pages
Data Visualization Lab Manual - Final
No ratings yet
Data Visualization Lab Manual - Final
14 pages
Practical File Class 12 2025-26
No ratings yet
Practical File Class 12 2025-26
19 pages
Python Code Longterm
No ratings yet
Python Code Longterm
5 pages
Python For Statistics
No ratings yet
Python For Statistics
40 pages
Set B
No ratings yet
Set B
8 pages
Bank Customer Segmentation Guide
No ratings yet
Bank Customer Segmentation Guide
53 pages
Informatics Practices Record Class 12
No ratings yet
Informatics Practices Record Class 12
60 pages
Week - 6-7
No ratings yet
Week - 6-7
9 pages
Index
No ratings yet
Index
1 page
Data Analyst Course
No ratings yet
Data Analyst Course
8 pages
Aiml Lab Manaual R23
100% (1)
Aiml Lab Manaual R23
10 pages
Pandas - Jupyter Notebook
No ratings yet
Pandas - Jupyter Notebook
23 pages
Data Science and Analtics Laboratory
No ratings yet
Data Science and Analtics Laboratory
21 pages
4 PythonPandas
No ratings yet
4 PythonPandas
8 pages
IP Practical
No ratings yet
IP Practical
24 pages
DVA Practical
No ratings yet
DVA Practical
19 pages
Practical No.-01
No ratings yet
Practical No.-01
25 pages
Mohit
No ratings yet
Mohit
19 pages
Pandas Research
No ratings yet
Pandas Research
14 pages
Pandas
No ratings yet
Pandas
25 pages
Httpsncert Nic Intextbookpdfleip102 PDF
No ratings yet
Httpsncert Nic Intextbookpdfleip102 PDF
36 pages
CS 3362 FDS
No ratings yet
CS 3362 FDS
53 pages
BasicAnalysis Using PYTHON
No ratings yet
BasicAnalysis Using PYTHON
6 pages
Unit 2 1
No ratings yet
Unit 2 1
54 pages
Data Visualization and Data Handling Using Pandas CLASS 12 - Aashi Nagiya
No ratings yet
Data Visualization and Data Handling Using Pandas CLASS 12 - Aashi Nagiya
19 pages
DAV Guidelines
No ratings yet
DAV Guidelines
4 pages
Time Series Analysis Group 9
No ratings yet
Time Series Analysis Group 9
16 pages
TSF - Rose Data
No ratings yet
TSF - Rose Data
31 pages
Data Analysis Lab with Python
No ratings yet
Data Analysis Lab with Python
11 pages
Data Science Cheat Sheet: KEY Imports
100% (1)
Data Science Cheat Sheet: KEY Imports
1 page
Dav Practicals
No ratings yet
Dav Practicals
33 pages
GVPCOEW-Pandas and Numpy For Data Analysis - DONE
No ratings yet
GVPCOEW-Pandas and Numpy For Data Analysis - DONE
110 pages
West Rox
No ratings yet
West Rox
29 pages
Lab Record IP
No ratings yet
Lab Record IP
13 pages
Pandas PDF
No ratings yet
Pandas PDF
25 pages
FDS Lab Question Bank
No ratings yet
FDS Lab Question Bank
11 pages
Profitanalysis
No ratings yet
Profitanalysis
18 pages
Practica 9
No ratings yet
Practica 9
24 pages
INDEX
No ratings yet
INDEX
16 pages
Exp 12 and 15
No ratings yet
Exp 12 and 15
4 pages
Prac 2
No ratings yet
Prac 2
11 pages
Dell Operations Management Analysis
No ratings yet
Dell Operations Management Analysis
42 pages
Gaming Giant VNG Names Acting CEO, Mum About Predecessor-Founder - VnExpress International
No ratings yet
Gaming Giant VNG Names Acting CEO, Mum About Predecessor-Founder - VnExpress International
3 pages
Basalte Brochure Basalte Home en
No ratings yet
Basalte Brochure Basalte Home en
40 pages
Institution Chapter 1-2
No ratings yet
Institution Chapter 1-2
193 pages
Pre-Spud Meeting On Site
100% (1)
Pre-Spud Meeting On Site
1 page
MLA 7 Edition) .
No ratings yet
MLA 7 Edition) .
4 pages
Tec 6076 2 User Manual Prizrak 510 520
No ratings yet
Tec 6076 2 User Manual Prizrak 510 520
16 pages
RC1602D Datasheet
No ratings yet
RC1602D Datasheet
1 page
Right To Constitutional Remedies
100% (1)
Right To Constitutional Remedies
33 pages
Blade MC Xs 300 Manual
No ratings yet
Blade MC Xs 300 Manual
20 pages
EMEAI FISHcatalog2011b
No ratings yet
EMEAI FISHcatalog2011b
186 pages
CH 25
No ratings yet
CH 25
11 pages
Hydran 201ti (Mark IV) Essential DGA Monitoring For Transformers
No ratings yet
Hydran 201ti (Mark IV) Essential DGA Monitoring For Transformers
2 pages
Coolant Safety & Handling Guide
No ratings yet
Coolant Safety & Handling Guide
7 pages
A-4 Coc-2
No ratings yet
A-4 Coc-2
13 pages
Adaptive Control Theory: Model Reference Adaptive Systems
No ratings yet
Adaptive Control Theory: Model Reference Adaptive Systems
16 pages
Seca 354 Digital Baby Weighing Scale Brochure
No ratings yet
Seca 354 Digital Baby Weighing Scale Brochure
2 pages
LCF Paper High Strength Steel-2024
No ratings yet
LCF Paper High Strength Steel-2024
12 pages
R1 ObliCon
No ratings yet
R1 ObliCon
7 pages
Anthelmintic Drugs - DSM
No ratings yet
Anthelmintic Drugs - DSM
25 pages
Geriatric Health Care and Roles
No ratings yet
Geriatric Health Care and Roles
14 pages
PGP 2 Case Study
No ratings yet
PGP 2 Case Study
3 pages
TDS Rate For The Fiscal Year 2025-2026 W.E f.1.7.2025 PDF
No ratings yet
TDS Rate For The Fiscal Year 2025-2026 W.E f.1.7.2025 PDF
29 pages
Lightweight Building Solutions
No ratings yet
Lightweight Building Solutions
4 pages
Food Borne Diseases - PPT Updated
No ratings yet
Food Borne Diseases - PPT Updated
31 pages
Siemens PCS 7 Alarm Engineering Guide
No ratings yet
Siemens PCS 7 Alarm Engineering Guide
41 pages
Phonic AM Series Compact Mixers Manual
100% (1)
Phonic AM Series Compact Mixers Manual
28 pages
Information Storage & Management Course
No ratings yet
Information Storage & Management Course
3 pages
400 Resonant Quartz Crystal Technology
No ratings yet
400 Resonant Quartz Crystal Technology
9 pages
Upi Response Codes
100% (1)
Upi Response Codes
20 pages