Voici une commande linux pour extraire des adresses email d’un fichier texte pour utiliser le fichier de sortie à autre chose.
grep -o ‘[0-9a-zA-Z-_]*@[0-9a-zA-Z-_.]*.[a-zA-Z]*’ infile > outfile.txt
où:
- infile est le fichier source (peu importe sa structure mais les adresses doivent y figurer en clair)
- outfile est le fichier de destination (une adresse par ligne)*
(extrait de http://ithacafreesoftware.org/forum/viewtopic.php?p=574)
Pour connaitre le nombre de lignes dans un fichier, tapez:
wc -l outfile.txt
Pour éliminer les doublons, tapez:
uniq outfile.txt >outfile1.txt
(Extrait de http://www.howtoforge.com/forums/showthread.php?t=1527)
Pour trier le document par ordre alphabétiques, tapez:
sort outfile1.txt >outfile2.txt