Gawk

Traiter les fichiers CSV sous Gawk

Traductions: FR, EN

Awk et Gawk sont des outils très puissants pour analyser des fichiers texte. Cependant, les fichiers CSV pose un problème particulier. Les champs sont séparés par des virgules ou des points virgules, selon les pays, mais on peut également retrouver ces séparateurs dans un champ entre guillemets doubles. Donc, impossible de découper les champs en se basant uniquement sur les séparateurs.

Use Gawk to process CSV files

Traductions: FR, EN

Awk and Gawk are very powerful tools to process text files. Yet, CSV files are especially difficult to process. Fields are separated by comma or semicolon, depending on the country. These separators can also be used in a field inside double quotes. Which makes it very difficult for Awk to split a line into fields. Moreover, a field with double quotes can contain line breaks, which makes it difficult for Awk to process it.

De l'art de surveiller les scripts...

Écrire un script, c’est bien, mais, si le script est lancé automatiquement, il est judicieux de disposer d’un journal permettant de s’assurer de son bon fonctionnement1

J’ai mis en place il y a peu un script chargé d’apprendre à spamassassin à reconnaître des messages indésirables. Ce script lance la commande sa-learn, et pour savoir s’il fonctionne bien, je veux savoir ce qu’a affiché sa-learn.