parser

Написать ответ на текущее сообщение

 

 
   команды управления поиском

Ошибка, если в PCRE приходит непонятная кодировка

Саян 29.12.2016 11:39

Привет, коллеги! Иногда клиент (скажем, странный встроенный броузер symbian) игнорирует требования кодировки и приходят вот такие запросы:
/autocomplete.htm?callback=jQuery1720487&term=�����%20��������,��
Когда я обрабатываю поле term регексом, например таким ^(.*?[аеиоуыэюя])(.*)$
выходит ошибка
UTF-8 validation failed during pcre_exec (-10).

Посоветуйте, как это можно красиво обойти?
- создать свой класс на основе regex, в котором игнорировать подобные ошибки? Выглядит пушкой по воробьям.
- делать автозамену до попадания строки в регекс? Я не знаю, что там за символы и сколько их. Таблица замены может получиться слишком большой и все равно неполной.