PYTHON facile

xhtmllib.py : Parseur de fichier XHTML.

 

Description

Le fichier xhtmllib.py contient deux classes: XHTMLParser et testXHTMLParser.

la classe XHTMLParser est la classe de base. Elle lit les données contenues dans un document conforme à la norme XHTML 1.0 Strict. Elle utilise la classe XMLParser de xmllib.py

La classe testXHTMLParser utilise XHTMLParser. Elle affiche le titre, la liste des liens et des images du document XHTML. Cette page html peut être utilisée comme document de test dont on peut voir plus loin un extrait du résultat.

Sinon pour convertir un document HTML vers XHTML on peut utiliser HTML-Kit ou HTML Tidy.

Cette classe a été testée avec Python 2.1.1 :

ActivePython 2.1.1, build 212 (ActiveState)
Python 2.1.1 (#20, Jul 26 2001, 11:38:51) [MSC 32 bit (Intel)] on win32

Resultat

 
>python xhtmllib.py xhtmllib.html

Titre du document XHTML: Python - xhtmllib.py - XHTMLParser - Classe de base

liste des liens:
[{'href': '../index.html', 'link': 'Acceuil', 'name': '', 'title': ''},
 {'href': '#resultat', 'link': 'Voir le résultat', 'name': '', 'title': ''},
 {'href': '#visualiser', 'link': 'Voir le script', 'name': '', 'title': ''},
 {'href': '#telecharger', 'link': 'Telechargement', 'name': '', 'title': ''},
 {'href': '#contact', 'link': 'Contact', 'name': '', 'title': ''},
 {'href': 'http://www.w3.org/TR/2000/REC-xhtml1-20000126/',
  'link': 'XHTML 1.0',
  'name': '',
  'title': ''},
 
 ...
 
{'href': '../python_file/xhtmllib.py',
  'link': 'Download',
  'name': '',
  'title': ''},
 {'href': 'mailto:lionel.grolleau @ free.fr',
  'link': 'E-mail',
  'name': '',
  'title': 'Envoyer un mail à lionel.grolleau @ free.fr'},
 {'href': 'http://validator.w3.org/', 'link': '', 'name': '', 'title': ''},
 {'href': 'http://jigsaw.w3.org/css-validator/',
  'link': '',
  'name': '',
  'title': ''}]

liste des images:
[{'alt': 'Valid XHTML 1.0!',
  'src': '../images/valid-xhtml10.png',
  'title': ''},
 {'src': '../images/valid-css.gif', 'alt': 'Valid CSS 2.0!', 'title': ''}]

Afficher le module

Pour visualiser le source du module avec coloration syntaxique : xhtmllib.py


Téléchargement

Source - V 0.3.0 - xhtmllib.py

Ce fichier source est en 'texte brut', utiliser la commande 'enregister-sous' de votre navigateur internet pour le copier.

xhtmllib.py - V 0.3.0 - Format zip - Format tar.gz - Format tar.bz2

Les fichiers sont compressés suivant différents formats. Après décompression on peux soit copier les fichiers soi-même dans son arborescence python, soit automatiser la procédure en tapant la commande : python setup.py install.

xhtmllib.py - V 0.3.0 - Installeur Windows

C'est un exécutable qui installe le module ou le package, généralement dans Lib/site-packages. il met aussi à jour la base de registre pour permettre la désintallation via le panneau de configuration.


Historique des versions


Bugs et limitations

Cette classe utilise le module xmllib qui est obsoléte depuis Python 2.0.


Contact

Pour tous renseignements et critiques: E-mail

Valid XHTML 1.0! Valid CSS 2.0!