Trucos SAS. Identificar registros duplicados

29 Oct

29/10/200929/10/2009 rvaquerizo 4

Muy rápido, para identificar registros duplicados existen múltiples formas. Seguramente haré un monográfico sobre este tema pero de momento dejo una píldora:

data aleatorio; do i=1 to 100000; id=ranpoi(23456,56781); if ranuni(5)>=0.3 then output; end; run; proc sql; create table repes (where=(rep>1)) as select id, count(id) as rep from aleatorio group by 1; quit; proc sql; create table repes (where=(rep=1)) as select id, count(id) as rep from aleatorio group by 1; quit;

Contamos registros y empleamos where como opción de escritura. Muy fácil y perfectamente entendible. No puedo entretenerme más que mi hija me reclama…

4 respuestas a «Trucos SAS. Identificar registros duplicados»

luis dice:

29/05/2011 a las 10:47 pm

Saludos, me sirvio mucho el ejemplo para identificar duplicados, pero existe una forma de que ademas encontrar duplicados por alguna variable llave, que es el ejemplo que pusiste, y que ademas de que solo se duplique por ejemplo por la variable id, pero que resultara que otras variables son diferentes, es decir solo se repite id pero no otras y que por lo tanto los duplicados por id que en otras variables tengan datos vacios estos se actualicen con los datos del duplicado pero que estos si contienen algo en otras variables, uf espero darme a entender con lo que te comento, si por ejemplo tengo dos registros con las variable id, nombre direccion, saldo y estatus, ej:

1 luis . 100 cancelado
1 . mexico 100 normal

y al final solo deseo un solo registro actualizado es decir al final deseo tener lo siguiente:

1 luis mexico 100 normal

Tu me podrias orientar al respecto.

Responder
rvaquerizo dice:

01/06/2011 a las 4:16 am

Si tienes claro el orden haz un PROC SORT previo. Y después emplea IF LAST. Emplea esta entrada como ejemplo:
https://analisisydecision.es/monografico-first-y-last-ejemplos-en-data/

Responder
Zappabain dice:

08/03/2016 a las 10:13 am

Gracias; no había visto usar así el (WHERE= ) al crear una tabla. en PROC SQL.

Despista un poco que no comentes que el segundo PROC SQL es para obtener los que NO están duplicados.

Saludos!

Responder
Maggy dice:

28/01/2021 a las 10:41 am

Y si quisiera solo encontrar valores duplicados de una sola columna y con esos valores trabajar con las demás, es decir que de mi columna sueldo me identifique los valores que están iguales y me imprima la columna nombre apellido y edad de esos duplicados me puedes orientar .

Responder

4 respuestas a «Trucos SAS. Identificar registros duplicados»

Deja una respuesta Cancelar la respuesta