Форум вопросов и ответов

Форум вопросов и ответов (https://www.otvetnemail.ru/)
-   Продолжение старого архива (https://www.otvetnemail.ru/prodolzhenie-starogo-arhiva-804/)
-   -   определить наличие в тексте кириллицы (https://www.otvetnemail.ru/prodolzhenie-starogo-arhiva-804/opredelit-nalichie-v-tekste-kirillicy-388845/)

Guest 16.10.2011 15:41

определить наличие в тексте кириллицы
 
Здравстуйте, форумчане!собственно, сабжимеется скрипт, проверяет количество страниц домена в вебархиве.было бы неплохо знать, на каком языке текст на данном доменепродумывал вариант просто парсить кодировки, напримерcharset=windows-1251charset=iso-8859-5charset=koi8-rcharset=utf-8но сайты на utf-8 многие с нерусским контентом, ведь кодировка юникодвопрос. можно ли содержание страницы преобразовать побуквенно в какие-либо "коды символов"?ну например что-то вроде такого &#1042 &#1099 &#1073 &#1077 ,и парсить уже известные буквы кириллицы в этих кодах?Заранее спасибо :)


Часовой пояс GMT, время: 13:10.


© www.otvetnemail.ru - Форум вопросов и ответов.