Новини високих технологій
» » Не скопіювати текст з PDF: причини, способи зміни формату та поради фахівців

Не скопіювати текст з PDF: причини, способи зміни формату та поради фахівців

25-01-2019, 16:37
3 315
Бувало у вас таке, що вам необхідно, текст, присутній в якомусь PDF-документі, вставити в іншу програму для редагування, але в PDF, текст копіюється? Як би порадили вчинити в такій ситуації? Далеко не багато користувачів здогадуються про те, що можна скористатися не одним, а кількома простими способами, що дозволяють «розрулити» ситуацію. Але для початку давайте зупинимося на деяких стандартних випадках і їх причини, а потім спробуємо знайти найбільш відповідне рішення для кожного з них. Відразу варто відзначити, що змінювати оригінальний формат документа не завжди доцільно.

Чому текст з PDF не копіюється?

Отже, першою і основною причиною неможливості копіювання вмісту документів PDF більшість фахівців вважає, що встановлення різноманітних заборон на подібні дії в самих файлах.


Це можуть бути і паролі на відкриття, і заборони копіювання, і навіть захист документа при спробі виведення вмісту на друк. Ще одна не менш поширена ситуація, пов'язана з тим, що текст з PDF не копіюється, може бути пов'язана з пошкодженням самого файлу або порушенням його оригінальної структури. Рідше можна зустріти випадки, коли користувач використовує для отримання текстового вмісту з PDF-документа не зовсім підходяще додаток. Так, наприклад, дуже багато експертів сходяться на думці, що в Adobe Reader можливостей у порівнянні з Acrobat набагато більше. Тому, якщо текст з PDF не копіюється в «Акробата», насамперед спробуйте виконати аналогічну операцію у «Рідері». Цілком можливо, це дасть бажаний результат. Але в більшості випадків це, на жаль, не допомагає, оскільки вміст просто захищено від копіювання, а пароль схований глибоко всередині самого файлу. Як обійти такі обмеження розглянемо трохи пізніше, а поки зупинимося ще на одній ситуації, яка теж багатьох користувачів ставить у глухий кут.


Чому текст з PDF копіюєте ієрогліфами?

Тепер припустимо, що захист від копіювання в оригінальному документі не встановлена і все начебто нормально. Але чомусь при перенесенні вмісту в інший редактор текст з PDF копіюєте ієрогліфами. Пов'язано це з тим, що оригінал має відмінну від стандартної кодування. Найчастіше фахівці в такій ситуації пропонують найпростіший вихід, при якому навіть змінювати початковий формат документа не потрібно. Виходячи з того, що текст з PDF копіюється з неправильним кодуванням, її потрібно змінити.
Для цього найпростіше скористатися файловим меню будь-якого редактора PDF, вибрати пункт «Зберегти як» (Save As), а потім у вікні збереження натиснути кнопку параметри (Settings) і вибрати інше кодування. Зазвичай достатньо поміняти оригінальний стандарт на UTF-8. При повторному відкритті документа текст можна скопіювати і вставити в будь-який інший текстовий редактор в незмінному вигляді. Також перекодувати файл можна на якому-небудь інтернет-ресурсі начебто Decoder.

Як обійти заборону копіювання в самому файлі?

Тепер давайте подивимося, що можна зробити для обходу всіляких заборон і блокувань.
Якщо текст з PDF не копіюється ні під яким приводом, можете скористатися піратським методом, виконавши зняття обмежень або видалення встановлених паролів у програмі PDF Password Remover. Якщо це результату не дасть, можете зайти на якийсь спеціалізований сайт начебто PDFPirate або FreeMyPDF і спробувати зняти захист там. Однак кожен повинен розуміти, що у випадку з деякими офіційними документами така методика є протизаконною.

Відкриття файлу PDF в Word

Ще одна проста методика, рекомендована для усунення безлічі проблем з оригінальними документами PDF, які необхідно відредагувати, полягає в тому, щоб не копіювати вихідне вміст "переглядач" або редакторі PDF, а відкрити файл безпосередньо в тій програмі, з використанням якої передбачається проводити редагування.
У випадку з текстовими документами, найпростіше скористатися універсальним «Ворд» і відкрити потрібний документ у цьому додатку, вибравши відповідний тип файлу. Якщо документ без проблем, його можна буде і відредагувати і зберегти в потрібному форматі.

Як перетворити текст PDF в Word?

Але давайте припустимо, що вихідний документ у текстових редакторах не відкривається (мало що може бути) і в «рідних» редакторах текст з PDF не копіюється.
В цьому випадку для перетворення файлу саме в документ Word спробуйте PDF-редакторі вибрати не копіювання тексту, а копіювання файлу в буфер обміну цілком, після чого вставити вміст у Word. Спосіб, звичайно, далеко не самий зручний, оскільки вставка буде мати графічний формат, і відредагувати матеріал буде неможливо.
У цій ситуації оптимальним рішенням стане зміна формату вихідного документа на будь-який інший. В інтернеті викладено досить багато програм-конверторів, наприклад, PDF to Word Converter і ін. В обраному додатку зазвичай достатньо просто вказати початковий файл і кінцевий формат після перетворення. За допомогою таких аплетів, до речі, можна перетворити PDF не тільки в Word. Існують і програми для конвертування Excel.

Проблеми з самим текстом в PDF-документах

Іноді буває й так, що в оригінальному файлі текстове вміст могло бути спочатку створено шляхом сканування якогось друкованого документа. Цілком очевидно, що при такому підході текст був збережений саме в графічному форматі. При цьому і на нього могли бути встановлені заборони на копіювання або друк. Як вчинити в такій ситуації?

Використання системи оптичного розпізнавання

У цьому випадку на допомогу приходять системи оптичного розпізнавання OCR. Практично всі експерти сходяться на думці, що оптимальним варіантом буде вибір пакету ABBY Finereader. Звичайно, програма не безкоштовна, але на просторах Рунету можна знайти вже активовані (зламані) версії або модифікації з ключем активації.
В самому додатку в стартовому вікні вибрати перетворення PDF/зображення в документ Word. Система самостійно розпізнає текст з картинки і відправить його у Word, після чого можна буде виконати редагування і зберегти новий документ.

Конвертування в інші формати

Нарешті, якщо стоїть завдання перетворити текст в інші нестандартні формати, зазвичай для цих цілей рекомендується застосовувати всі ті ж конвертери, вибираючи або вузькоспрямовані програми (наприклад, PDF to JPEG для конвертування в графічні файли), або універсальні програми, що підтримують не один, а кілька форматів, серед яких буде той, що потрібен. Іноді можна використовувати і онлайн-сервіси, але це незручно з міркувань великих тимчасових витрат і обмежень за розміром доданих файлів (або їх кількості).

Висновок

Підводячи підсумки, можна виділити кілька основних моментів. По-перше, змінювати вихідний формат не завжди потрібно, оскільки виконати копіювання можна або в більш просунутому редакторі, як у випадку з «Акробатом» і «Рідером», або відкрити файл безпосередньо у тій програмі для роботи з текстовим вмістом, в яку потрібно вставити вихідний матеріал, як у випадку з Word. По-друге, для скидання паролів і заборон найкраще застосовувати спеціальні додатки (нехай навіть це і виглядає незаконно). По-третє, більшість перетворювачів у процесі перетворення форматів заборони, як правило, ігнорують, так що і їх використання виглядає досить перспективним. По-четверте, не варто скидати з рахунків і системи розпізнавання тексту, які іноді виглядають навіть краще, ніж все попереднє. По-п'яте, існує думка, що іноді перетворення можна виконати за допомогою віртуальних принтерів, але такий варіант годиться тільки для тих випадків, коли вихідний текстовий фрагмент потрібно перетворити в графіком.
Цікаво по темі
Як зняти захист з документа Word редагування: чотири простих і ефективних способу
Як зняти захист з документа Word редагування: чотири простих і ефективних способу
Іноді при відкритті файлів формату .doc або .docx, створених за допомогою програми Microsoft Word, виникає проблема з редагування або форматування.
Як редагувати PDF-файл: доступні способи
Як редагувати PDF-файл: доступні способи
Напевно ви не раз стикалися з файлами PDF. Це дуже популярний формат електронних книг, брошур, технічних документів і різних схем. Спочатку PDF-файли
Завис "Ворд": як зберегти документ? Можливі причини і способи розв'язання проблеми
Завис "Ворд": як зберегти документ? Можливі причини і способи розв'язання проблеми
Напевно, не потрібно говорити, як буває прикро, коли у «Ворді» користувач набирає текст, а програма в самий невідповідний момент зависає намертво,
Як з "Автокад" вставити креслення в "Ворд"? "Автокад" для чайників
Як з "Автокад" вставити креслення в "Ворд"? "Автокад" для чайників
Інженерний комплекс AutoCAD є одним з найбільш передових інструментів для проектування та рішення набагато більш складних завдань. Однак іноді
Як змінити текст в PDF-форматі: кілька простих методів
Як змінити текст в PDF-форматі: кілька простих методів
Сьогодні формат PDF, розроблений свого часу компанією Adobe Systems, є практично універсальним, оскільки саме в такому електронному вигляді
Як змінити напрямок тексту в "Ворді"? Верстається текст, таблиці та заголовків
Як змінити напрямок тексту в "Ворді"? Верстається текст, таблиці та заголовків
Програма Microsoft Word - найпоширеніший текстовий процесор. Такого широкого поширення, принаймні...