C'est similaire, si tu sais télécharger une page alors tu sauras télécharger autre chose, là n'est pas le problème. Le problème c'est d'extraire les chaines d'adresse web complète ou relative (http://www.monsite.fr/index/haut/monimage.jpg ou /index/haut/mapub.gif)
A partir de <img [...] src="(element)" /> ou {javascript}.src="(element)" ou...
Où on s'intéresse à 'element', on pourrait rechercher tous les
src ou
href pour du css par exemple en passant par leur index (String.IndexOf ou un truc comme ça) mais c'est assez chiant.
Ca donne un truc du genre:
Rechercher
src au point de l'index en cours dans la chaine
Extraire la sous chaine de l'index+5 de
src=" jusqu'au symbole
" suivant
Et retenir l'index (en cours) de la fin de la chaine pour ne pas boucler dans le vide
La meilleure solution c'est les expressions régulières où avec le pattern suivant:
src\s*=\s*(?:""(?<1>[^""]*)""|(?<1>\S+))
on arrive à retrouver nos belles adresses:
http://www.monsite.fr/index/haut/monimage.jpg
/index/haut/mapub.gif
en s'intéressant à l'endroit qu'on lui demande d'extraire (?<1> dans le pattern)
Ca devrait être possible aussi en VB6,
regarde là et
là, et bonne chance!