html_entity_decode ist eigentlich nicht die Methode die man immerzu braucht.. Aber nachdem ich jetzt ungelogen 6h damit zu gebracht habe und diese Funktion mich nun letztendlich erlöst hatte, möchte ich gern erzählen wo man sie brauch ^^
Ich arbeite gerade an einem Projekt wo ich Daten einer Webseite extrahieren muss um sie auf der eigenen entsprechend darstellen zu können. Dazu muss man der Seite für eine Suche daten senden, einen Link folgen, einen weiteren Link folgen und dann auf ALLE Anzeigen klicken können. Das klingt erstmal nicht aufregend – in dem konkreten Fall benötigte man aber eine Session ID usw.
Mein Problem war nun nicht das extrahieren der Daten oder die Cookies oder dergleichen. Sondern jedesmal wenn CURL den Link aufgerufen hat bekam ich die Startseite. Fügte ich die URL in den Browser ein kam die richtige Seite – da kann man echt verrückt werden.
das Problem bestand nun darin das CURL die HTML Entinies nicht versteht… mit Hilfe von html_entity_decode habe ich diese decodiert und der CURL übergeben.. nett von der Webseite das sie diese codiert haben..
html_entity_decode — Konvertiert alle benannten HTML-Zeichen in ihre entsprechenden Ursprungszeichen
Ja wehe es sagte einer “Ja klar, das weiß man” 😀