Criptomonedas análisis: recuperación de datos, manipulación

El contenido presentado en este artículo está destinado únicamente para fines académicos. Las opiniones expresadas se basan en mi comprensión e investigación personal. Es importante tener en cuenta que el campo de los grandes datos y los lenguajes de programación discutidos, como Python, R, Power BI, Tableau y SQL, son dinámicos y están en constante evolución. Este artículo tiene como objetivo fomentar el aprendizaje, la exploración y la discusión dentro del campo en lugar de proporcionar respuestas definitivas. Se recomienda la discreción del lector.

Dado que cada cryptodata DataFrame contiene una columna de fecha y una de cierre, podemos concatenarlas a lo largo de las filas usando pd.concat() y obtener una sola DataFrame de datos que contenga todos los datos.

"import pandas as pd

# read in all data frames

BNB = pd.read_csv(r'D:\helen\Documents\PythonScripts\datasets\yahoocrypto\BNB-USD.csv')
BTC = pd.read_csv(r'D:\helen\Documents\PythonScripts\datasets\yahoocrypto\BTC-USD.csv')
ETH = pd.read_csv(r'D:\helen\Documents\PythonScripts\datasets\yahoocrypto\ETH-USD.csv')
USDC = pd.read_csv(r'D:\helen\Documents\PythonScripts\datasets\yahoocrypto\USDC-USD.csv')
USDT = pd.read_csv(r'D:\helen\Documents\PythonScripts\datasets\yahoocrypto\USDT-USD.csv')

# concatenate all data frames
merged_data = pd.concat([BNB, BTC, ETH, USDC, USDT], axis=0)

# check the shape of the merged data
print(merged_data.shape)

# check the head of the merged data
print(merged_data.head())"


OUTPUT

image


El código agrupa los datos combinados por la columna ‘Símbolo’ y luego cuenta las ocurrencias de cada “símbolo” dentro de cada grupo. Proporciona información sobre la frecuencia o la aparición de diferentes “símbolos” en el conjunto de datos.

merged_data.groupby(['Symbol'])['Symbol'].agg('count')


OUTPUT

image



El índice representa las etiquetas de fila del DataFrame. Entonces, x será una lista que contiene estos símbolos y el valor de la variable y, que es la matriz NumPy que contiene los valores de symbolData


x = list(symbolData.index)
x
OUTPUT
['BNB', 'BTC', 'ETH', 'USDC', 'USDT']
y = symbolData.values
y
OUTPUT
array([61, 72, 61, 50, 61], dtype=int64)


import matplotlib.pyplot as plt
%matplotlib inline
plt.bar(x, y, color='green')
plt.xlabel("Cryptocurrencies")
plt.ylabel("Count-Prices ")
plt.title("Distribution of Prices against Cryptocurrencies")
plt.show()


OUTPUT

image