PyDbLite est un moteur de base de données en mémoire, en pur Python, qui utilise les "list comprehensions" de Python comme langage de requêtes au lieu de SQL
Il consiste en un seul petit module, PyDbLite.py. Pour l'installer, il suffit de le télécharger et de le mettre dans le répertoire Lib/site-packages
de votre distribution Python
Utilisation :
- importer la classe
Base
du module PyDbLite : from PyDbLite import Base
- créer une instance de base de données,en passant un nom de fichier : db = Base('test')
- pour une nouvelle base, définissez les noms des champs : db.create('nom','age','taille')
Vous n'avez pas à définir le type des champs. PyDbLite accepte toute valeur qui peut être sérialisée par le module cPickle
: des chaînes de caractères, des chaînes Unicode, des entiers, réels, dates et dates-heures (instances des classes date
et datetime
dans le module datetime
), des instances de classes définies par l'utilisateur, etc
- si la base existe déjà, pour l'ouvrir : db.open()
- on peut passer un paramètre "mode" à la méthode
create()
, pour indiquer ce qu'il faut faire si la base existe déjà sur le disque
- mode = "open" : db.create('nom','age','taille',mode="open")
ouvre la base en ignorant la définition des champs
- mode = "override" : db.create('nom','age','taille',mode="override")
efface la base existante et en crée une nouvelle avec les définitions de champs
- si le mode n'est pas précisé et que la base existe déjà, une exception
IOError
est déclenchée
- insertion d'un nouvel enregistrement
- par mots-clés : db.insert(nom='homer',age=23,taille=1.84)
Si certains champs manquent, ils sont initialisés à la valeur None
- par arguments positionnels : db.insert('homer',23,1.84)
Les arguments doivent être fournis dans le même ordre que dans la méthode create()
- pour sauvegarder les changements sur le disque : db.commit()
Si vous ne confirmez pas les changements, les opérations d'insertion, de suppression et de mise à jour ne seront pas sauvegardés sur le disque
- En plus des champs passés à la méthode
create()
, un champ interne appelé __id__
est ajouté. C'est un entier, unique et inchangé pour chaque enregistrement, il peut donc être utilisé comme identifiant pour l'enregistrement
- un autre champ interne appelé
__version__
est également géré par le moteur de base de données. Il s'agit d'un entier qui est initialisé à 0 quand l'enregistrement est créé, et incrémenté de 1 à chaque fois que l'enregistrement est mis à jour. Ceci sert pour la détection des accès concurrents, par exemple dans une application web dans laquelle deux utilisateurs veulent mettre à jour le même enregistrement en même temps
- la sélection d'enregistrements utilise la syntaxe des "list comprehensions" de Python :
recs = [ r for r in db if 30 > r['age'] >= 18 and r['taille'] < 2 ]
retourne les enregistrements de la base pour lesquels l'âge est compris entre 18 et 30 ans, et la taille est inférieure à 2 mètres. L'enregistrement est un dictionnaire, où la clé est le nom de champ et la valeur est la valeur de ce champ
- la syntaxe des générateurs d'expression Python peut aussi être utilisée :
for r in (r for r in db if r['nom'] in ('homer','marge') ):
faire_qqch_avec(r)
itère sur les enregistrements dont le nom est 'homer' ou 'marge'
- pour itérer sur tous les enregistrements :
for r in db:
fais_qqch_avec(r)
- on peut accéder directement à un enregistrement par son identifiant : record = db[rec_id]
retourne l'enregistrement tel que record['__id__'] == rec_id
- finalement, un raccourci peut être utilisé pour les sélections simples :
db(cle1=val1,cle2=val2) renvoie la liste des enregistrements dont les clés prennent les valeurs données. C'est équivalent à [ r for r in db if r["cle1"]==val1 and r["cle2"]==val2], mais en beaucoup plus concis
- pour accélérer les sélections, un index peut être créé sur un champ : db.create_index('age')
Quand un index est créé, l'instance de la base de données a un attribut (ici _age
: noter le signe de soulignement initial, pour éviter les conflits de noms avec des noms internes). Cet attribut est un objet de type dictionnaire, où les clés sont les valeurs prises par le champ, et les valeurs sont les enregistrements dont le champ a la même valeur que la clé :
records = db._age[23] retourne la liste des enregistrements avec age == 23
Si aucun enregistrement n'a cette valeur, la recherche par cette valeur retourne une liste vide
L'index supporte l'itération sur les valeurs du champ, et la méthode keys()
retourne toutes les valeurs existantes pour le champ
- nombre d'enregistrements dans la base : len(db)
- pour supprimer un enregistrement : db.delete(record) ou, si vous connaissez l'identifiant : del db[rec_id]
- pour supprimer une liste d'enregistrements : db.delete(liste_d_enregistrements)
liste_d_enregistrements
peut être n'importe quel itérable (liste, tuple, set, etc) qui produit des enregistrements
- pour mettre à jour un enregistrement : db.update(record,age=24)
- pour ajouter un nouveau champ à une base existante et spécifier une valeur par défaut : db.add_field('nouveau_champ'[,default=v]). Si le défaut n'est pas fourni, la valeur du champ est
None
- pour supprimer un champ existant : db.drop_field('nom')
- pour connaître la liste des champs : db.fields