Il y a également de belles réponses StackOverflow sur le sujet très pas drôle de "comment parser du HTML/XML avec des expressions régulières".