- 23 Mar, 2023
- read
- Karolinehc
Categories: Criptomonedas Análisis de Datos
Tags: Python Pandas Cripto Visualización BTC ETH Binance USDT Análisis Exploratorio Gráficos de Barras
El contenido presentado en este artículo está destinado únicamente para fines académicos. Las opiniones expresadas se basan en mi comprensión e investigación personal. Es importante tener en cuenta que el campo de los grandes datos y los lenguajes de programación discutidos, como Python, R, Power BI, Tableau y SQL, son dinámicos y están en constante evolución. Este artículo tiene como objetivo fomentar el aprendizaje, la exploración y la discusión dentro del campo en lugar de proporcionar respuestas definitivas. Se recomienda la discreción del lector.
Dado que cada cryptodata DataFrame contiene una columna de fecha y una de cierre, podemos concatenarlas a lo largo de las filas usando pd.concat() y obtener una sola DataFrame de datos que contenga todos los datos.
"import pandas as pd
# read in all data frames
BNB = pd.read_csv(r'D:\helen\Documents\PythonScripts\datasets\yahoocrypto\BNB-USD.csv')
BTC = pd.read_csv(r'D:\helen\Documents\PythonScripts\datasets\yahoocrypto\BTC-USD.csv')
ETH = pd.read_csv(r'D:\helen\Documents\PythonScripts\datasets\yahoocrypto\ETH-USD.csv')
USDC = pd.read_csv(r'D:\helen\Documents\PythonScripts\datasets\yahoocrypto\USDC-USD.csv')
USDT = pd.read_csv(r'D:\helen\Documents\PythonScripts\datasets\yahoocrypto\USDT-USD.csv')
# concatenate all data frames
merged_data = pd.concat([BNB, BTC, ETH, USDC, USDT], axis=0)
# check the shape of the merged data
print(merged_data.shape)
# check the head of the merged data
print(merged_data.head())"
OUTPUT

El código agrupa los datos combinados por la columna ‘Símbolo’ y luego cuenta las ocurrencias de cada “símbolo” dentro de cada grupo. Proporciona información sobre la frecuencia o la aparición de diferentes “símbolos” en el conjunto de datos.
merged_data.groupby(['Symbol'])['Symbol'].agg('count')
OUTPUT

El índice representa las etiquetas de fila del DataFrame. Entonces, x será una lista que contiene estos símbolos y el valor de la variable y, que es la matriz NumPy que contiene los valores de symbolData
x = list(symbolData.index)
x
OUTPUT
['BNB', 'BTC', 'ETH', 'USDC', 'USDT']
y = symbolData.values
y
OUTPUT
array([61, 72, 61, 50, 61], dtype=int64)
import matplotlib.pyplot as plt
%matplotlib inline
plt.bar(x, y, color='green')
plt.xlabel("Cryptocurrencies")
plt.ylabel("Count-Prices ")
plt.title("Distribution of Prices against Cryptocurrencies")
plt.show()
OUTPUT
