Здравствуйте.
Помогите извлечь содержимое всех h2 и записать их в строку.
Только разбираюсь с регулярками и застряг на этом.
Часа 2 потратил, но так и не понял как сделать.
Есть следующий html:
CODE ( htm):
скопировать код в буфер обмена
...some code... <h1>header 1</h1> <h2 class='someclass'>header 2</h2 > <p> some text</p> <h3>header 3</h3> <p> some text</p> <h2 class='someclass' id='someId'>header 4</h2> <p> some text</p> <h2 id="someId">header 5< /h2> <p> some text</p>
Нужно получить одну строку, которая содержит:
header 2. header 4. header 5.
Понимаю что отталкиваться нужно от > і <, но как сделать чтобы получить только содержимое заголовка и исключить всевозможные id’ы, class’ы и пробелы.
|