Vous ne trouvez pas de réponse à votre problème ? Alors posez la question dans le forum. Souvenez-vous qu'il n'y a jamais de question bête, mais rester dans l'ignorance parce que l'on n'ose pas poser une question, ça c'est une erreur !

Sujet : Extraire du texte d'un PDF avec layout [ Windows / ActiveX / COM ] (ZedMaTrix)

mardi 1 avril 2008 à 09:54:20 | Extraire du texte d'un PDF avec layout

ZedMaTrix

Bonjours à tous !

Je recherche actuellement le moyen de lire le contenu d'un PDF selon son organisation.
C'est à dire que mon PDF de test comporte des colonnes contenant du texte des dates et des nombres.
Le but final est de récupérer soit une chaine de caractères ayant un séparateur pour séparer les valeurs des colonnes soit un tableau.

Mes recherche mon permis de trouver l'OCX PDFLib qui m'as bien extrait tout le Texte du PDF, mais ne prenant pas en compte le layout du PDF, je me retrouve avec toutes valeurs sans séparateur...

Ensuite j'ai trouvé le programme PDFGrabber qui me ressort le texte cette fois ci en respectant le layout, et donc avec des espaces entre les colonnes ( qui me permet aussi de définir les séparations... seule hic ... c'est un programmes ... pas une OCX.
J'ai contacté l'équipe de développement de PDFGrabber .. mais ils ne fournissent pas d'OCX.

J'en suis donc à ce point ...

Connaitriez vous un OCX ( gratuit ou payant n'est pas un probleme ) me permettant d'extraire un texte d'un PDF en respectant la forme du contenue utilisable dans VB6 ?

ZedMaTriX

mercredi 2 avril 2008 à 07:41:17 | Re : Extraire du texte d'un PDF avec layout
mercredi 9 avril 2008 à 15:36:43 | Re : Extraire du texte d'un PDF avec layout

ZedMaTrix

Réponse acceptée !
C'est bon, mes recherches m'ont apporté ce que je cherchais.

Pour ceux qui sont dans le même cas que moi, je vais donner la solution ( Simpas hun ?? )

Il existait un outils, enfin ... un OCX développé par iSEQ : QuickPDF qui fait exactement ce que je désire :
Extraire le/les texts et valeurs d'un fichier PDF en les séparants !
( l'objet me retourne un string contenant la police utilisé, la couleur, la taille, les positions (X et Y selon un cadre, donc X1 - Y1, X2 - Y2, X3 - Y3, et X4 - Y4, puis le texte.

La dernière version officiel est la 5.11 ($50 la liscence perso utilisable à souhait ! ).

Mais une équipe fans continue le développement est en sont à la 6.02 Beta. ( Pas besoin de repayer une liscence. ).
Vous pourrez retrouver cette équipe sur leur forum : http://www.quickpdf.org/forum/

J'éspère que ce poste servira à d'autre !!

ZedMaTriX

jeudi 24 juillet 2008 à 18:51:32 | Re : Extraire du texte d'un PDF avec layout

daviddd

Merci pour ces infos ZedMaTrix j'avais exactement la meme problematique.



Cette discussion est classé dans : texte, ocx, pdf, extraire, layout


Répondre à ce message

Sujets en rapport avec ce message

recherche/extraction de texte d'un pdf [ par tgenty ] Bonjour,Je ne suis pas sûr d'avoir choisi le bon forum mais j'essaie :)Je dois faire un petit outil de recherche sur des pdf. Comme je suppose qu'il n Extraire un texte d'un fichier PDF [ par ebe_tic ] Comment extraire le texte contenu dans un fichier PDF ?J'ai des fichiers d'annonces en PDF. Ces annonces sont composées de texte.Pour les publier sur Extraire du texte entre balise d'un .txt et generer html avec ce texte [ par Akita95 ] Bonjour à tous,J'ai une petite application à faire et je ne trouve aucune source ou message sur le forum capable de m'aider dans mon développement.Je extraire données d'un fichier texte avec xml [ par emiraMh ] bonjour,chui en train de developper une application réseau ; écoute du port, enregistrement des paquets dans des fichiers textes (logs). mnt il va fal Extraire le TEXTE d'une page internet [ par z980x ] Salut a tous !J'ai déja posé cette question, mais personne ne répond, ou ne sait répondre....Je cherche à extraire le texte d'une page internet... Je pdf et fichier texte [ par audrey08 ] Bonjour à tous,J'aimerais savoir si il est possible de convertir un fichier texte en fichier pdf. Ceci est relativement urgent. Si oui pouvez m'aider. Utiliser Texte RTF [ par pattaressort ] Bonjour,Quelqu'un pourrait t'il me dire comment extraire le contenu d'un texte RTF  ? Concrètement, j'ai une base Access avec un lien ODBC sur une tab Extraire du texte d'un fichier txt [ par cruzy ] bonjour à tousje ne suis pas tres expérimenté en VBA excel, mais je souhaiterais faire ceci :- j'ai un fichier texte "test.txt" contenant qqchose de c Création de pdf depuis fichiers texte [ par bobolechef ] Bonjour,J'ai plusieurs fichiers texte et je voudrais les convertir en pdf.Je détaille : dans les fichiers texte, il y plusieurs champs délimités par d Extraire texte entre guillemets ... [ par nagstef ] Bonsoir !!!Pourriez-vous m'indiquer comment extraire de cette ligne, simplement ce qui est entre """C:\Program Files\DAEMON Tools\daemon.exe" -lang 10


Nos sponsors

Sondage...

CalendriCode

Juillet 2009
LMMJVSD
  12345
6789101112
13141516171819
20212223242526
2728293031  

Consulter la suite du CalendriCode

Téléchargements

Logiciels à télécharger sur le même thème :

Comparez les prix Nouvelle version

Photothèque Nouveau !



Développement réalisé par Nicolas SOREL (Nix) avec l'aide de : Cyril DURAND et Emmanuel (EBArtSoft), Merci à Vincent pour ses précieux conseils
CodeS-SourceS.com© Toute reproduction même partielle est interdite sauf accord écrit du Webmaster
CodeS-SourceS.com© est une marque déposée tous droits réservés
Temps d'éxécution de la page : 0,312 sec

Google Coop CodeS-SourceS Google Coop CodeS-SourceS


Certaines images présentes sur le site (notament certains avatars) sont issues des collections IconShock, donc si vous souhaitez utiliser ces icons vous devez les acheter, ne les copiez pas et ne utilisez pas dans vos sites et applications sans les avoir commandé.