| Новости | FAQ | Авторы | Документация | В действии | Библиотека |
| Инструменты | Полезные ссылки | Хостинги | Скачать | Примеры | Форум |
dimolezhkin 20.07.2021 18:53 / 20.07.2021 19:15
и для работы парсера она не существенна.Вот это я как раз и пытаюсь выяснить боем, и вот во что я _пока_ воткнулся
$request:charset[utf-8]
$response:charset[utf-8]
$response:content-type[
$.value[text/plain]
$.charset[$response:charset]
]
$f[^file::load[binary;/UTF-8-test.txt]]
-- start --
^untaint{$f.text}
-- end --То получим только примерно 4кб текста вида: -- start --
UTF-8 decoder capability and stress test
----------------------------------------
Markus Kuhn <http://www.cl.cam.ac.uk/~mgk25/> - 2015-08-28 - CC BY 4.0
This test file can help you examine, how your UTF-8 decoder handles
various types of correct, malformed, or otherwise interesting UTF-8
...
2.1 First possible sequence of a certain length |
|
2.1.1 1 byte (U-00000000): "
-- end --Т.е. вывод споткнётся на строчке 2.1.1 стресс-тестового файла$LIMITS[ $.max_file_size(512*0x400*0x400) ... ]Причем, и в text/html куда нить в тег <pre></pre> или в <textarea></textarea> - эффект одинаковый. Грешить на "неотображение самим браузером не приходится", т.к. и wget выкачивает 4Кб ответ (да и пример файла с домашней страницы автора файла открывается вроде без проблем).
и
^untaint{$f.text}
и
$str[^taint[as-is][$f.text]]
$strРезультат одинаковый - вывод прерывается на п.2.1.1 этого файла.