PDA

Показать полную графическую версию : Microsoft Office 2010. Как редактировать документ, пролученный из PDF в DOCX


Страниц : 1 [2]

a_axe
13-05-2019, 19:59
flev45, полагаю между пунктами 3 и 4 у вас неизбежно должен возникнуть пункт "Распознать", иначе Finereader просто не даст сохранить pdf. Это краеугольный момент.

По нажатию этой кнопки весь текст вашего pdf переводится в картинку, а затем распознается. Над картинкой с отображением исходного текста помещается невидимый текстовой слой.Что характерно, если снаачала распознать документ, а потом применить ластик - страница становится нераспознанной,т.к. ластик просто замазывает изображение, а с текстом не работает.

При приближении текста в первом pdf гладкий, тк это действительно текст. В рпспознанном - текст уже состоит из квадратиков, тк это лишь изображение текста, которое вы видите, но скопировать не можете, а над ним - текстовой слой, который вы не видите, но можете выделить и скопировать. При этом текст может быть распознан неправильно - например с лишними пробелами или буквой не в той раскладке.

С практической точки зрения - в распознанном pdf в качестве подложки вставлена картинка, и размером она ровно в вашу страницу. Чтобы текст, расположенный над вашей картинкой, сместился, нужно вырезать кусок изображения в середине листа. Не думаю, что это возможно, но если да - вы все равно получите отдельный лист меньшего формата, который будет отдельным от листа перед и листа после. Это не тот результат, который вам нужен, а сделать иначе формат не позволяет, если только не собирать нужные фрагменты вручную, а потом распознавать.

Не вижу другого варианта, как сначала получить результат по содержанию (копируя из html или редактируя html), а потом переводить в pdf, и не вижу объективных причин, которые вынуждали бы вас делать по-другому.

Добавлено:
Кстати, если открыть редактированный pdf через word, там все это очень хорошо видно: и рамочка с невидимым текстом, которую можно сдвинуть относительно видимого текста, и картинка с текстом, которую можно обрезать - границы у нее по листу.

Iska
13-05-2019, 22:54
flev45, полагаю между пунктами 3 и 4 у вас неизбежно должен возникнуть пункт "Распознать", иначе Finereader просто не даст сохранить pdf. »
Именно pdf — даст. А вот так, как хочет автор — сохранить в html — действительно не позволит.

ПС: с autocad, в том числе, я работал 40 лет тому, на самых первых персоналках Apple... тогда ещё никому не известных »
«Нэ вэрю!»™. Во времена Шекспира Сорок лет назад не было сигарет «Друг» ёще не существовало программного продукта под названием AutoCAD.

a_axe
13-05-2019, 23:24
Iska, ну может быть и так - значит я не тот порядок действий выбрал :)
У меня любая попытка сохранить pdf - через кнопку отправить, или через меню "сохранить как" - давало диалог "Страница не распознана, распознать" и из опций либо распознать, либо отменить сохранение. По-раздумью, не в первый раз слышу, что через Finereader можно редактировать pdf, надо с этим поразбираться :)

Iska
14-05-2019, 18:03
a_axe, в восьмой версии это выглядит так:
https://i.imgur.com/0AMaCKd.png
в четырнадцатой версии так:
https://i.imgur.com/erDWHLE.png

По-раздумью, не в первый раз слышу, что через Finereader можно редактировать pdf, надо с этим поразбираться »
Неа, нельзя. Токмо после распознавания (если не считать редактированием использование Ластика [я — не считаю]).

a_axe
14-05-2019, 18:36
в восьмой версии это выглядит так: »
В 11 аналогично, но следующий шаг доступен только если документ распознан.
Если например открыть pdf и переставить местами странички, и попытаться сохранить через ctrl+alt+s, то попросит либо распознать, либо отказаться от сохранения.
Поэтому ТС в 11 версии обязательно должен был его распознать, иначе бы не сохранил.

Iska
14-05-2019, 19:03
a_axe, в четырнадцатой версии данная операция:
Если например открыть pdf и переставить местами странички, »
не вызвала необходимости распознавания при сохранении. В восьмой версии перемещение страниц из открытого pdf не поддерживается.

Vadikan
14-05-2019, 21:04
Закрываю, поскольку ТС открыл уже третью тему по вопросу, а здесь развели оффтоп.




© OSzone.net 2001-2012