определить наличие в тексте кириллицы

#1 16.10.2011, 15:41

Здравстуйте, форумчане!собственно, сабжимеется скрипт, проверяет количество страниц домена в вебархиве.было бы неплохо знать, на каком языке текст на данном доменепродумывал вариант просто парсить кодировки, напримерcharset=windows-1251charset=iso-8859-5charset=koi8-rcharset=utf-8но сайты на utf-8 многие с нерусским контентом, ведь кодировка юникодвопрос. можно ли содержание страницы преобразовать побуквенно в какие-либо "коды символов"?ну например что-то вроде такого &#1042 &#1099 &#1073 &#1077 ,и парсить уже известные буквы кириллицы в этих кодах?Заранее спасибо