Ответ
 
Опции вопроса Поиск в этом вопросе Опции просмотра
  #1  
Старый 16.10.2011, 15:41
Аватар для Guest
Guest
Вопрос
Сообщений: n/a
По умолчанию

Здравстуйте, форумчане!собственно, сабжимеется скрипт, проверяет количество страниц домена в вебархиве.было бы неплохо знать, на каком языке текст на данном доменепродумывал вариант просто парсить кодировки, напримерcharset=windows-1251charset=iso-8859-5charset=koi8-rcharset=utf-8но сайты на utf-8 многие с нерусским контентом, ведь кодировка юникодвопрос. можно ли содержание страницы преобразовать побуквенно в какие-либо "коды символов"?ну например что-то вроде такого &#1042 &#1099 &#1073 &#1077 ,и парсить уже известные буквы кириллицы в этих кодах?Заранее спасибо
Ответить с цитированием
Ответ



Похожие вопросы
Тема Автор Раздел Ответов Последний вопрос или ответ
ребят подскажите мне как сделать анализ балады ,и вообще что такое строфа и как она выделяетсяв тексте как определить Guest Новые вопросы и ответы 2 0 31.12.2011 19:13
Определить наличие файлов в директории. Guest Продолжение старого архива 0 16.10.2011 14:11
как определить наличие ЕСП Guest Продолжение архива вопросов 0 05.09.2011 22:52
Наличие в тексте Библии грамматических ошибок. Норма или тайный смысл? Guest Новый архив 3 0 05.09.2011 00:06
Как попроще определить наличие излучения 245нм? Guest Новый архив 3 0 04.09.2011 20:13



© www.otvetnemail.ru - Форум вопросов и ответов.