Parsing link reloaded

41 sec read

Tre anni fa ho scritto un articolo in tedesco con il titolo Backlinks gecheckt che riceve sorprendentemente ancora una notevole quantità di traffico. Devo ammettere che le informazioni sono già piuttosto vecchiotte e non rappresentano più una soluzione per diverse problematiche nel mondo attuale. Il parsing dei link con le regular expression in realtà è tutt’altro che una buona idea. HTML è context-free e le regular expression non trovano quasi regolarmente nulla.

Più promettenti sono le diverse funzioni DOM già disponibili dall’introduzione di PHP5. Ma l’utilizzo con i siti di oggi, che spesso si servono di codici non validi, presenta ancora qualche insidia. Per fortuna esiste una soluzione che uso da tempo e con la quale si possono evitare le problematiche descritte sopra: il PHP Simple HTML DOM Parser.

Il parsing dei link nei documenti HTML diventa con questa library un gioco da ragazzi. Con i meccanismi di WordPress che aiutano a rilevare pagine remote, chiunque abbia familiarità con la sintassi di jQuery si troverà benissimo. Il mio piccolo esempio mostra come si usa il parser da uno script al di fuori dell’installazione di WordPress. L’obiettivo è mostrare tutti i link della mia homepage con l’attributo nofollow:

PHP – Verso la versione 7

Il WordCamp Torino 2018 è purtroppo già alle spalle. E’ stato un altro bellissimo incontro della community italiana di WordPress. Ho potuto partecipare come...
realloc
5 min read

i18n & L10n for themes and plugins

La comunità italiana di WordPress è completamente rinata e con il WordCamp a Torino 2016 festeggia questo enorme successo. Sono fiero di potere fare parte...
realloc
5 min read

Menu item solo per user loggati

Solo ogni morte di papa c’è un nuovo post in questo blog… e poi anche così corto 😉 Lo snippet che trovate in questo articolo è stato...
realloc
33 sec read

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *

Questo sito usa Akismet per ridurre lo spam. Scopri come i tuoi dati vengono elaborati.

%d blogger hanno fatto clic su Mi Piace per questo: