2019-06-19
См.также
https://en.wikipedia.org/wiki/Web_scraping
DOM:
https://ru.wikipedia.org/wiki/Document_Object_Model
CSS Selector:
https://www.w3.org/TR/selectors/ http://www.w3schools.com/cssref/css_selectors.asp https://ru.wikibooks.org/wiki/CSS/Селекторы
XPath:
https://ru.wikipedia.org/wiki/XPath https://addons.mozilla.org/ru/firefox/addon/firepath/ http://ejohn.org/blog/xpath-css-selectors/
Для разбора Веб-страниц HTML/XML текст представляют в виде дерева объектов (DOM), к элементам которого можно обращаться при помощи разных механизмов:
CSS XPath JQuery FireFox