Надо произвольную html-строку побить на части используя следующее правило: строка должна быть побита по пробелам без оставления пустых кусков (три пробела подря не трактуются как пять пустых строк между ними), за исключением текста заключенного в тэги , который может содержать пробелы, но в итоговом списке должен быть одной строкой.Пример:- строка="Однажды в <a href="qweqwe">студеную зимнюю пору\nСижу
за решеткой в темнице сырой"- результат
("Однажды", "в", "студеную зимнюю", "пору"), ("Сижу", "за решеткой в", "темнице", "сырой"))Я уже всю голову сломал пытаясь решить эту задачу красиво что с регекспами, что без них. Без них - и по пробелам бил, предварительно удалив все теги, а потом искал нужную последовательность (нет гарантии, что эта последовательность не появится в другом месте) и посимвольно проходился (совсем дурацкий способ с непонятны кодом - не уверен, что сам его пойму через месяц). В обещем, умные идеи в голову не идут.