Python pandas – Datos que faltan

Python pandas : En este tutorial, vamos a aprender sobre la de trabajo de los datos que faltan en Python pandas .

Durante el uso de los pandas, si hay un punto de datos que faltan, los pandas se llenan automáticamente en ese punto que falta con class o NAN.

vamos a definir primero una trama de datos utilizando Numpy y pandas.

import numpy as np
import pandas as pd
d = {'A':[1,2,np.nan],'B':[3,np.nan,np.nan],'C':[4,5,6]}
df = pd.DataFrame(d)
print(df)

salida

     A    B  C
0 1.0 3.0 4
1 2.0 NaN 5
2 NaN NaN 6

pandas proporcionar las siguientes opciones para trabajar con los datos que faltan,

valores de caída de NAN

# drops rows with null or NAN values
print(df.dropna())
'''
     A B C
0 1.0 3.0 4
'''

# drops columns with null or NAN values
print(df.dropna(axis=1))
'''
   C
0 4
1 5
2 6
'''

especificar un umbral de no soltar cualquier número de no-NA valores.

# Does not remove the 2nd row because, 
# it has less than 2 NAN values.
print(df.dropna(thresh=2))
'''
     A B C
0 1.0 3.0 4
1 2.0 NaN 5
'''

valores perdidos de relleno

print(df.fillna('empty'))
'''
       A B C
0 1 3 4
1 2 empty 5
2 empty empty 6
'''


Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *