Tengo un conjunto de datos como este
number Shipment Date service desc amount
182692345 2/12/19 DUTIES & TAXES
IMPORT EXPORT DUTIES 561.01
IMPORT EXPORT TAXES 600.47
1827975839 2/12/19 DUTIES & TAXES
IMPORT EXPORT DUTIES 160.19
3229475633 2/12/19 DUTIES & TAXES
IMPORT EXPORT TAXES 600.47
IMPORT EXPORT DUTIES 561.01
5733894261 29/04/2020 Express
DUTIES TAXES PAID 25
FUEL SURCHARGE 3.28
1826995520 2/12/19 DUTIES & TAXES
IMPORT EXPORT TAXES 600.47
IMPORT EXPORT DUTIES 561.01
2998455062 4/5/20 Express
FUEL SURCHARGE 0.72
En formato de imagen se ve a continuación:
Lo que quiero es que para las filas en las que el número y la fecha_envío estén presentes, verifiquemos el servicio donde está "Express". Luego, para tales filas, quiero levantar la fila "Recargo por combustible" en desc col a la misma fila que el número y shipment_date
junto con el valor de la cantidad correspondiente.
Entonces algo como a continuación:
number Shipment Date service desc amount
182692345 2/12/19 DUTIES & TAXES
IMPORT EXPORT DUTIES 561.01
IMPORT EXPORT TAXES 600.47
1827975839 2/12/19 DUTIES & TAXES
IMPORT EXPORT DUTIES 160.19
3229475633 2/12/19 DUTIES & TAXES
IMPORT EXPORT TAXES 600.47
IMPORT EXPORT DUTIES 561.01
5733894261 29/04/2020 Express FUEL SURCHARGE 3.28
DUTIES TAXES PAID 25
1826995520 2/12/19 DUTIES & TAXES
IMPORT EXPORT TAXES 600.47
IMPORT EXPORT DUTIES 561.01
2998455062 4/5/20 Express FUEL SURCHARGE 0.72
que se ve a continuación en formato de imagen.
Al final, solo me preocupan las filas donde el servicio es "Express", por lo que si nos deshacemos de todas las filas donde el servicio no es express y obtenemos el formato anterior (solo para valores Express), sería ideal.
Creo que pandas ffill()
y transform serían las principales herramientas. Entonces estoy intentando algo como a continuación:
df1=df.copy()
df1[['number', 'shipment_date']]=df1[['number', 'shipment_date']].ffill()
df1.desc=df1.desc.fillna('')
df1.amount= df1.amount.fillna('')
s= df1.groupby(['number', 'shipment_date']).amount.transform(lambda x: ' '.join(str(x)))
df.loc[df.shipment_date.notnull(),'amount']=s
df.loc[df.shipment_date.isnull(),'amount']=''
Llene una línea en blanco con fillna(method='ffill')
, extraído por el servicio y obtenido por shift(-1)
. ¿Encaja esto con la intención de la pregunta?
df['service'] = df['service'].fillna(method='ffill')
df = df[df['service'] == 'Express']
df[['number','Shipment Date']] = df[['number','Shipment Date']].fillna(method='ffill')
df[['desc','amount']] = df[['desc','amount']].shift(-1)
df
number Shipment Date service desc amount
8 5.733894e+09 29/04/2020 Express DUTIES TAXES PAID 25.00
9 5.733894e+09 29/04/2020 Express FUEL SURCHARGE 3.28
10 5.733894e+09 29/04/2020 Express NaN NaN
14 2.998455e+09 4/5/20 Express FUEL SURCHARGE 0.72
15 2.998455e+09 4/5/20 Express NaN NaN
Lógicamente, tiene un conjunto de datos maestro / detallado clásico. Su conjunto de datos detallados no tiene una clave externa para el registro maestro. Agregue el FK y luego puede filtrar las condiciones en el maestro, filtrar las condiciones en los detalles y unir FK a PK
fillna
import numpy as np
data = '''number Shipment Date service desc amount
182692345 2/12/19 DUTIES & TAXES
- - IMPORT EXPORT DUTIES 561.01
- - IMPORT EXPORT TAXES 600.47
1827975839 2/12/19 DUTIES & TAXES
- - IMPORT EXPORT DUTIES 160.19
3229475633 2/12/19 DUTIES & TAXES
- - IMPORT EXPORT TAXES 600.47
- - IMPORT EXPORT DUTIES 561.01
5733894261 29/04/2020 Express
- - DUTIES TAXES PAID 25
- - FUEL SURCHARGE 3.28
1826995520 2/12/19 DUTIES & TAXES
- - IMPORT EXPORT TAXES 600.47
- - IMPORT EXPORT DUTIES 561.01
2998455062 4/5/20 Express
- - FUEL SURCHARGE 0.72'''
da = [[i for i in re.split("[ ][ ]+", l)] for l in data.split("\n")]
dfall = pd.DataFrame(da[1:], columns=da[0])
dfall["number"][dfall["number"]==""] = np.NaN
dfall = dfall.fillna(method="ffill")
pd.concat([dfall[dfall["desc"]=="FUEL SURCHARGE"], dfmaster[dfall["service"]=="Express"] ],
join="inner", keys="number"
).sort_values(by=["number","service"], ascending=[True,False])
Puede reenviar el llenado de los valores faltantes en la service
columna, luego comparar las Express
últimas shift
filas y columnas coincidentes en la lista por DataFrame.shift
y DataFrame.loc
:
mask = df['service'].ffill().eq('Express')
df.loc[mask, ['desc','amount']] = df.loc[mask, ['desc','amount']].shift(-1)
print (df)
number Shipment Date service desc \
0 182692345 2/12/19 DUTIES & TAXES
1 NaN NaN IMPORT EXPORT DUTIES
2 NaN NaN IMPORT EXPORT TAXES
3 1827975839 2/12/19 DUTIES & TAXES
4 NaN NaN IMPORT EXPORT DUTIES
5 3229475633 2/12/19 DUTIES & TAXES
6 NaN NaN IMPORT EXPORT TAXES 600.47
7 NaN NaN IMPORT EXPORT DUTIES
8 5733894261 29/04/2020 Express DUTIES TAXES PAID
9 NaN NaN FUEL SURCHARGE
10 NaN NaN
11 1826995520 2/12/19 DUTIES & TAXES
12 NaN NaN IMPORT EXPORT TAXES
13 NaN NaN IMPORT EXPORT DUTIES
14 2998455062 4/5/20 Express FUEL SURCHARGE
15 NaN NaN NaN
amount
0 None
1 561.01
2 600.47
3 None
4 160.19
5 None
6 None
7 561.01
8 25
9 3.28
10 None
11 None
12 600.47
13 561.01
14 0.72
15 NaN
La estrella de HGTV, Christina Hall, revela que le diagnosticaron envenenamiento por mercurio y plomo, probablemente debido a su trabajo como manipuladora de casas.
Recientemente salió a la luz un informe policial que acusa a la estrella de 'Love Is Blind', Brennon, de violencia doméstica. Ahora, Brennon ha respondido a los reclamos.
Conozca cómo Wynonna Judd se dio cuenta de que ahora es la matriarca de la familia mientras organizaba la primera celebración de Acción de Gracias desde que murió su madre, Naomi Judd.
Descubra por qué un destacado experto en lenguaje corporal cree que es fácil trazar "tales paralelismos" entre la princesa Kate Middleton y la princesa Diana.
Los inodoros arrojan columnas de aerosol invisibles con cada descarga. ¿Como sabemos? La prueba fue capturada por láseres de alta potencia.
Air travel is far more than getting from point A to point B safely. How much do you know about the million little details that go into flying on airplanes?
The world is a huge place, yet some GeoGuessr players know locations in mere seconds. Are you one of GeoGuessr's gifted elite? Take our quiz to find out!
¿Sigue siendo efectivo ese lote de repelente de insectos que te quedó del verano pasado? Si es así, ¿por cuánto tiempo?
Foto: Bill Kostroun / AP A veces parece que la NFL es una empresa dedicada al castigo, con algún que otro partido de fútbol americano. El receptor de Skins, DeSean Jackson, reveló a través de Instagram el miércoles que fue multado por usar tacos personalizados.
Tapas elásticas de silicona de Tomorrow's Kitchen, paquete de 12 | $14 | Amazonas | Código promocional 20OFFKINJALids son básicamente los calcetines de la cocina; siempre perdiéndose, dejando contenedores huérfanos que nunca podrán volver a cerrarse. Pero, ¿y si sus tapas pudieran estirarse y adaptarse a todos los recipientes, ollas, sartenes e incluso frutas en rodajas grandes que sobran? Nunca más tendrás que preocuparte por perder esa tapa tan específica.
Hemos pirateado algunas ciudades industriales en esta columna, como Los Ángeles y Las Vegas. Ahora es el momento de una ciudad militar-industrial-compleja.
Un minorista está enlatando su sección de tallas grandes. Pero no están tomando la categoría solo en línea o descontinuándola por completo.
El equipo está a la espera de las medallas que ganó en los Juegos Olímpicos de Invierno de 2022 en Beijing, ya que se está resolviendo un caso de dopaje que involucra a la patinadora artística rusa Kamila Valieva.
Miles de compradores de Amazon recomiendan la funda de almohada de seda Mulberry, y está a la venta en este momento. La funda de almohada de seda viene en varios colores y ayuda a mantener el cabello suave y la piel clara. Compre las fundas de almohada de seda mientras tienen hasta un 46 por ciento de descuento en Amazon
El jueves se presentó una denuncia de delito menor amenazante agravado contra Joe Mixon.
El Departamento de Policía de Lafayette comenzó a investigar a un profesor de la Universidad de Purdue en diciembre después de recibir varias denuncias de un "hombre sospechoso que se acercaba a una mujer".
Al igual que el mundo que nos rodea, el lenguaje siempre está cambiando. Mientras que en eras anteriores los cambios en el idioma ocurrían durante años o incluso décadas, ahora pueden ocurrir en cuestión de días o incluso horas.
Estoy de vuelta por primera vez en seis años. No puedo decirte cuánto tiempo he estado esperando esto.
Cómo mejoramos la accesibilidad de nuestro componente de precio, y cómo nos marcó el camino hacia nuevos saberes para nuestro sistema de diseño. Por Ana Calderon y Laura Sarmiento Leer esta historia en inglés.
“And a river went out of Eden to water the garden, and from thence it was parted and became into four heads” Genesis 2:10. ? The heart is located in the middle of the thoracic cavity, pointing eastward.