mercredi 2 septembre 2015

Eliminer des doublons d'un jeu de données sour R

#élimination des doublons dans un vecteur sous R
doublons <- which(duplicated(data$V2)) #quelles sont les séquences en double dans la colonne V2 de mon jeu de données?
data2<-data[-doublons,] #on enregistre un nouveau tableau "data2 ne contenant pas les lignes des doublons


#Pour comprendre la suppression des doublons avec un exemple simple
test<-c("a","a","ab","bb","b")
doublonstest<-which(duplicated(test))
test2<-test[-doublonstest]
test
test2

3 commentaires: