Python pandas : En este tutorial, vamos a aprender sobre la de trabajo de los datos que faltan en Python pandas .
Durante el uso de los pandas, si hay un punto de datos que faltan, los pandas se llenan automáticamente en ese punto que falta con class o NAN.
vamos a definir primero una trama de datos utilizando Numpy y pandas.
import numpy as np
import pandas as pd
d = {'A':[1,2,np.nan],'B':[3,np.nan,np.nan],'C':[4,5,6]}
df = pd.DataFrame(d)
print(df)
salida
A B C
0 1.0 3.0 4
1 2.0 NaN 5
2 NaN NaN 6
pandas proporcionar las siguientes opciones para trabajar con los datos que faltan,
valores de caída de NAN
# drops rows with null or NAN values
print(df.dropna())
'''
A B C
0 1.0 3.0 4
'''
# drops columns with null or NAN values
print(df.dropna(axis=1))
'''
C
0 4
1 5
2 6
'''
especificar un umbral de no soltar cualquier número de no-NA valores.
# Does not remove the 2nd row because,
# it has less than 2 NAN values.
print(df.dropna(thresh=2))
'''
A B C
0 1.0 3.0 4
1 2.0 NaN 5
'''
valores perdidos de relleno
print(df.fillna('empty'))
'''
A B C
0 1 3 4
1 2 empty 5
2 empty empty 6
'''