Форум вопросов и ответов

Форум вопросов и ответов (https://www.otvetnemail.ru/)
-   Продолжение старого архива (https://www.otvetnemail.ru/prodolzhenie-starogo-arhiva-804/)
-   -   Как автоматически найти контент на странице (https://www.otvetnemail.ru/prodolzhenie-starogo-arhiva-804/kak-avtomaticheski-najti-kontent-na-stranice-391264/)

Guest 16.10.2011 16:25

Как автоматически найти контент на странице
 
Может кто подкинет идейку.необходимо найти на странице сайта (любого) контент и выделить его.думала может путем сравнения 2-5 страниц одного сайта, путем разбивания html-код на слова и сравнивать их. Допустить процентную погрешность, например, 20 слов совпадают потом 5 нет и снова 15 совпадают, то все вместе считать идентичным. А то что в эту идентичность не вписалось то и будет контентов. Но боюсь, что разница в оформление страниц может быть слишком велика.Можно еще считать контентом то где, предположим на 200 символов не более 10% иностранныхМожет есть какой-нибудь скрипт или хотя бы идея???количеству проституток, считающих себя принцессами.


Часовой пояс GMT, время: 23:26.


© www.otvetnemail.ru - Форум вопросов и ответов.