Accueil > Forum > > > > prob de lecture des chaînes en unicodes
prob de lecture des chaînes en unicodes
mardi 22 novembre 2005 à 20:07:44 |
prob de lecture des chaînes en unicodes

sorcier_VB
|
j'ai écris un petit prog qui sert à récuperer des informations précies sur une page web, mais cette page est codé en UTF-8, j'ai utilisé WINSOCK pour récuperer ces informations et le sauvegarder en ficher HTML, mais le résultat est bizzard, la plus part des infomations sont correctes mais certaines signes spéciaux comme:é ç à ect sont mal affichés ou n'affichent pas. je pense c'est un problème de lecture et recodage de UNICODE, qui a une idée? - comment faire sauvegarder des informations en UNICODE tell qu'il est?? MERCI
|
|
mardi 22 novembre 2005 à 23:14:40 |
Re : prob de lecture des chaînes en unicodes

ciberrique
|
Winsock récupére les données, cependant si tu les enregistres dans une variable string alors ton unicode ne sera pas recodé ascii, dans ce cas tu dois faire une traduction des caractéres spéciaux toi meme. Autrement tu peux récupérer les bytes de la page web et seulement recréer le fichier sur ton pc, dans ce cas l'unicode devrait fonctionnner.
|
|
mercredi 23 novembre 2005 à 12:59:19 |
Re : prob de lecture des chaînes en unicodes
|
jeudi 24 novembre 2005 à 19:41:52 |
Re : prob de lecture des chaînes en unicodes

sorcier_VB
|
Merci Egyde,mais cela ne resoud pas mon probleme car c pas a cause le CODE HTML, c le UNICODE, mais merci tjs. :-)
|
|
dimanche 2 avril 2006 à 15:47:01 |
Re : prob de lecture des chaînes en unicodes

mkm570
|
Il existe une différence entre UTF-8 et Unicode. Les codes des caractéres sont les mêmes mais la représentation différe. Utf-8 utilise 1 à 4(ou même 6) octets alors qu'Unicode utilise 2 octets pour un caractère. Le code suivant permet de transformer une chaîne représentée en UTF-8 en une representée en ANSI. La seule fonction utile est Convert. Cette version se limite à un caractère representé en 3 octets.
Private Function UTF8_2(V1 As Integer, V2 As Integer) As Integer 'Cette fonction permet de retourner la valeur décimale d'un caractére 'en UTF-8 codé sur 2 octets; pour mieux comprendre le codage UTF-8, 'il faut se référer à une documentation bien appropriée. Dim Q%, R% Dim exp%, i% Dim Res$ Dim VAL% 'On convertit les chiffres en binaire Q = V2 While Q <> 0 R = Q Mod 2 Res = CStr(R) & Res Q = Q \ 2 Wend Q = V1 While Q <> 0 R = Q Mod 2 Res = CStr(R) & Res Q = Q \ 2 Wend 'on supprime les deux bits de poids forts des deux octets Res = Mid(Res, 3, 6) & Mid(Res, 11, 6) 'on reconvertit cette chaine binaire en un nombre décimal exp = 0 For i = Len(Res) To 1 Step -1 R = CInt(Mid(Res, i, 1)) VAL = VAL + (R * (2 ^ exp)) exp = exp + 1 Next i UTF8_2 = VAL End Function
Function Convert(chaine As String) As String Dim i% Dim code1%, code2%, code3% Dim VAL& Dim Res$, ch$ i = 1 While (i <= Len(chaine)) ch = Mid(chaine, i, 1) code1 = Asc(ch) If code1 <= 127 Then Res = Res & ch ElseIf code1 <= 223 Then i = i + 1 code2 = Asc(Mid(chaine, i, 1)) VAL = UTF8_2(code1, code2) Res = Res & ChrW(VAL) Else i = i + 1 code2 = Asc(Mid(chaine, i, 1)) i = i + 1 code3 = Asc(Mid(chaine, i, 1)) VAL = UTF8_3(code1, code2, code3) Res = Res & ChrW(VAL) End If i = i + 1 Wend Convert = Res End Function
Private Function UTF8_3(V1 As Integer, V2 As Integer, V3 As Integer) As Long 'Cette fonction permet de retourner la valeur décimale d'un caractére 'en UTF-8 codé sur 3 octets; pour mieux comprendre le codage UTF-8, 'il faut se référer à une documentation bien appropriée. Dim Q%, R% Dim exp%, i% Dim Res$ Dim VAL& 'On convertit les chiffres en binaire Q = V3 While Q <> 0 R = Q Mod 2 Res = CStr(R) & Res Q = Q \ 2 Wend Q = V2 While Q <> 0 R = Q Mod 2 Res = CStr(R) & Res Q = Q \ 2 Wend Q = V1 While Q <> 0 R = Q Mod 2 Res = CStr(R) & Res Q = Q \ 2 Wend 'on supprime les deux bits de poids forts des trois octets Res = Mid(Res, 5, 4) & Mid(Res, 11, 6) & Mid(Res, 19, 6) 'on reconvertit cette chaine binaire en un nombre décimal exp = 0 For i = Len(Res) To 1 Step -1 R = CInt(Mid(Res, i, 1)) VAL = VAL + (R * (2 ^ exp)) exp = exp + 1 Next i UTF8_3 = VAL End Function
|
|
Cette discussion est classée dans : lecture, récuperer, informations, chaînes, unicodes
Répondre à ce message
Sujets en rapport avec ce message
prob de lecture des chaînes unicodes [ par sorcier_VB ]
j'ai écris un petit prog qui sert à récuperer des informations précies sur une page web, mais cette page est codé en UTF-8, j'ai utilisé WINSOCK pour
prob de lecture des chaînes unicodes [ par sorcier_VB ]
j'ai écris un petit prog qui sert à récuperer des informations précies sur une page web, mais cette page est codé en UTF-8, j'ai utilisé WINSOCK pour
prob de lecture des chaînes unicodes [ par sorcier_VB ]
j'ai écris un petit prog qui sert à récuperer des informations précies sur une page web, mais cette page est codé en UTF-8, j'ai utilisé WINSOCK pour
VB6 récuperer les informations d'un formulaire fait sous word [ par Winneuts ]
Bonjour,J'ai créer un formulaire protegé sous word et j'y ai mis plusieurs types de champs.pour les champs texte je récupère les infos sans soucis, là
Récuperer des informations sur des fichiers. [ par EPS32HAY ]
Bonjour à tous,J'ai encore un léger problème.Comment peut on récupérer les différentes propriétés d'un fichier?Par exemple: la date de création
Lecture Fichier Txt [ par Lordanus ]
Bonjour, Débutant en Visual Basic J'aurais besoin d'un peu d'aide sur la lecture d'un fichier Txt.En fait dans mon fichier .txt j'ai plusieures inform
Lecture des arguments d'un raccourci [ par Skyfou ]
Bonjour, Pour créer un raccourci, j'utlise simplement l'objet adéquat de VBScript : Set oRaccourci = oShell.CreateShortcut("Toto.lnk" )
CPU Usage [ par gribouillex ]
Bonjour,J'ai créé un programme (lecteur de fichiers MIDI) .Dès que je lance la lecture d'un fichier MIDI, le CPU Usage atteint les 70 - 80 % et les ti
Lecture de code des fichiers .xls [ par MPi ]
Bonjour, Je me suis déjà créé une application VB qui me permet de faire une recherche de mots-clés dans le code de fichiers VB (.frm, .bas, .cls,...)
proxy [ par lex1111 ]
Salut a tous !!!J'utilise ce code : http://docvb.free.fr/codedetail.php?idc=115 pour récuperer le code source d'un url...Mais je ne
Livres en rapport
|
Derniers Blogs
GESTION D'EXCEPTION AVEC LES TASKSGESTION D'EXCEPTION AVEC LES TASKS par richardc
Nous avons vu dans un précédent article comment utiliser Task pour effectuer des opérations dans un autre thread.
Malheureusement, comme tout le monde n'est pas parfait, il se peut que cette exécution se passe mal et qu'une exception se produise.
La...
Cliquez pour lire la suite de l'article par richardc DéMARRONS AVEC LES TASKSDéMARRONS AVEC LES TASKS par richardc
Que vous le vouliez ou non, le développement multi-tâche est maintenant une obligation pour toute nouvelle application. Il est donc vital d'en comprendre les mécanismes et de s'y mettre le plus tôt possible.
En attendant le .NET Framework 4.5 avec le...
Cliquez pour lire la suite de l'article par richardc SLIDE & DéMO TECHDAYS 2012 - FAST & FURIOUS XAML APPSSLIDE & DéMO TECHDAYS 2012 - FAST & FURIOUS XAML APPS par Vko
Retrouvez les slides et les démo de ma session Fast & Furious XAML Apps. A ceux qui se posent la question : "est-ce que le code de la DataGrid est disponible?", je vous répondrais "pas encore". Je vais mettre en place un projet codeplex pour part...
Cliquez pour lire la suite de l'article par Vko XNA IS DEAD!XNA IS DEAD! par richardc
Depuis la semaine dernière (et grâce aux TechDays 2012), je me penche activement sur la nouvelle version de Windows, aka Windows 8. Vous me direz, il était temps puisque la première preview date de Septembre dernier.
OK. Remarquez, on n'en est qu'aux...
Cliquez pour lire la suite de l'article par richardc TECHDAYS PARIS 2012 : WINDOWS SERVER "8" QUOI DE 9 !TECHDAYS PARIS 2012 : WINDOWS SERVER "8" QUOI DE 9 ! par ROMELARD Fabrice
Speakers: Fabrice Meillon et Stanislas Quastana Cette session est basée entièrement sur celle donnée lors de la BUILD cet hiver. Il n'y a pas d'ajout d'information en rapport avec cet évènement passé. Windows 8 Server sera intégralem...
Cliquez pour lire la suite de l'article par ROMELARD Fabrice
Logiciels
DocTranslate (V3.1.0.0)DOCTRANSLATE (V3.1.0.0)DocTranslate est un traducteur de document Microsoft Word, PowerPoint et Excel. Il permet d'autom... Cliquez pour télécharger DocTranslate Tribler (2012)TRIBLER (2012)Tribler est un client pair à pair (P2P/Peer-to-Peer) open source avec la capacité de regarder des... Cliquez pour télécharger Tribler OneSwarm (2012)ONESWARM (2012)Le peer-to-peer qui protège votre vie privée, c'est OneSwarm.
Ce logiciel de peer-to-peer crypté... Cliquez pour télécharger OneSwarm PONAMEDIA PREMIUM - HELLLOOO FLASH DEMO (V8.4)PONAMEDIA PREMIUM - HELLLOOO FLASH DEMO (V8.4)PONAMEDIA TV DEVIENS HELLLOOO FLASH
LA TV SUR VOTRE ORDINATEUR.
Toute une plateforme Multi... Cliquez pour télécharger PONAMEDIA PREMIUM - HELLLOOO FLASH DEMO Academy System (17.2.1.0)ACADEMY SYSTEM (17.2.1.0)Logiciel de gestion des établissements.
- élèves/étudiants (inscription, dossier, absence...)
-... Cliquez pour télécharger Academy System
|