Parsing link reloaded

Tre anni fa ho scritto un articolo in tedesco con il titolo Backlinks gecheckt che riceve sorprendentemente ancora una notevole quantità di traffico. Devo ammettere che le informazioni sono già piuttosto vecchiotte e non rappresentano più una soluzione per diverse problematiche nel mondo attuale. Il parsing dei link con le regular expression in realtà è tutt’altro che una buona idea. HTML è context-free e le regular expression non trovano quasi regolarmente nulla. Leggi tutto “Parsing link reloaded”