ссылки

Недавно встала необходимость спарсить из HTML документа все ссылки, не содержащие в себе атрибут rel=nofollow и не закрытые в noindex. Обычно, эти ссылки выглядят как то так: <noindex><a href=»http://wwwexample.com» rel=»nofollow»>текст ссылки</a></noindex> Задача, как может показаться тривиальная. И правда, отсечь можно простейшей регуляркой типа: <noindex.*?/noindex> Но вот nofollow заставил меня поломать голову. Для начала я решил…

Read More Парсим ссылки без nofollow и noindex