Lire et écrire des fichiers de données csv

Dans de nombreuses situations, il est préférable d'ouvrir les fichiers de type .csv via la librairie pandas !

Les fichiers csv sont des fichiers de données séparées par des virgules (ou point-virgules), pour “comma separated values”. Comme ceci :

1;0.1;3
2;0.3;5
3;0.5;7
4;0.6;11
5;0.9;21
6;1.5;39

Ils peuvent être facilement importés ou exportés de tableurs ou logiciels de graphiques scientifiques.

La librairie csv facilite la lecture et l'écriture de fichiers au format csv. Voici un programme effectuant une lecture d'un fichier csv, suivie d'une écriture (souvent bien sûr on n'utilisera qu'une seule de ces possibilités) :

exemple_simple-csv-02.py
#!/usr/bin/env python
# -*- coding: utf-8 -*-
""" pour la documentation sur le module csv (comma separated variable)
 de python, voir à partir de http://docs.python.org/lib/csv-examples.html
 Autres refs : http://www.linuxjournal.com/content/handling-csv-files-python
 http://code.activestate.com/recipes/577423-convert-csv-to-xml/
"""
 
import csv   # module nécessaire "comma separated values"
 
# fichier d'entrée
with open("Classeur1.csv", "rb") as ifile:
    reader = csv.reader(ifile, delimiter=';')
    # Classeur1.csv est un simple fichier texte, comme celui qui suit par exemple :
    # 1;0.1;3
    # 2;0.3;5
    # 3;0.5;7
    # 4;0.6;11
    # 5;0.9;21
    # 6;1.5;39
    rows=[]  # initialisation d'une liste qui contiendra les lignes à écrire
    for row in reader:  # on parcourt les lignes successives du fichier d'entrée
        print row   # facultatif : pour visualiser ces lignes
        rows.append(row)   # ajout à la liste de sortie
        for chaine in row:   # traitement des lignes
            nombre=float(chaine)   # on peut effectuer ici un calcul sur nombre...
            print float(nombre)     # ...ou simplement le visualiser
    print rows   # visualisation de la liste complète avant création du fichier de sortie
 
# fichier  de sortie
with open("Classeur-out.csv","wb") as ofile:
    writer = csv.writer(ofile, delimiter=';')
    writer.writerows(rows)
Pour satisfaire les contraintes d'un tableur, il est important de vérifier le séparateur utilisé , ainsi que l'usage ou non de “guillemets” :
  • delimiter = ' '
  • quotechar = '“'

Cf. la page http://docs.python.org/2/library/csv.html#dialects-and-formatting-parameters.

Références