parser

Написать ответ на текущее сообщение

 

 
   команды управления поиском

пожалуйста, сформулируйте изначальную задачу | закачка .doc файла

Александр Петросян (PAF) 06.08.2004 10:23 / 06.08.2004 10:29

задумайтесь: в .doc файле текст с форматированием или без?
скажем, есть в тексте сложная таблица.

какой «текст» вы хотели бы получить?
как там вам видится сложная таблица?

простой работающий вариант, если вёрстка не нужна:
просите пользователей закачивать вам .txt файл, рядом с формой для закачки положите картинку, где видно, как в File|Save as... переключать File type на "Plain text (.txt)"

простой работающий вариант, если вёрстка нужна, и хочется как-нибудь её сохранить:
просите пользователей закачивать вам .htm файл, ...

сложный работающий вариант, если нужна и вёрстка и метаданные, и хочется разбиться в лепёшку, но клиента удовлетворить:
MSOffice 2000+ умеет сохранять файлы в .xml формате. такой файл можно затем обработать, и получить из него всё, что угодно.


WIN32 hosting:
если есть минимальные навыки программирования на любом языке, то
пользователей можно не просить ничего делать, и позволить закачивать прямо .doc файл.
можно затем обработать его с помощью самого winword программным способом.
если вам это реально нужно, программка, делающее это, пишется за один вечер на чём угодно, хоть на… visual basic'е (потом вызывается из parser — file::exec).
[это реальный случай из жизни Студии]

обычно этого не нужно.

ещё сложнее случай: если hosting не win32, можно найти программку, достающую plain text из .doc файла. это отдельные усилия. готовую не знаю. а самому писать с нуля — нетривиально.
наличие готовой не означает, что она сумеет справиться с русскими буквами и последними версиями office.