4 Cara Mengedit File PDF Hasil Scan Termudah


Ketika Anda kuliah, mungkin Anda pernah suatu saat menemukan sebuah buku yang mendukung tugas kuliah Anda. Nah ketika itu, Anda tidak ingin meminjam buku tersebut karena yang hanya dikutip dari buku tersebut hanya beberapa bagian saja. Jika difoto, Anda mau tidak mau harus mengetik ulang teks dari foto tersebut. Biar ga ribet, Anda bisa melakukan beberapa cara merubah file JPG ke PDF di Android yang sebelumnya kami bahas.

Nah, setelah Anda melakukan cara-cara yang pernah kami bahas tersebut, ternyata Anda mendapati ada beberapa teks di dalam buku yang tidak terbaca oleh aplikasi atau situs converter online, sehingga ketika Anda melihat hasil scannya di PDF, ada beberapa teks dari buku yang tidak tampak. Mulai dari adanya kata yang salah baca, ataupun ada kata yang hilang beberapa huruf. Oleh karena itu, pada artikel kali ini, kami akan memberikan informasi seputara cara mengedit file PDF hasil scan tersebut.

Semua cara yang akan kami bahas di bawah ini menggunakan teknologi OCR. Apaan sih OCR itu? OCR (singkatan dari Optical Character Recognition) adalah teknologi yang berfungsi untuk men-scan teks pada gambar dan mengubahnya menjadi file bentuk teks yang bisa dimodifikasi. Teknologi ini biasanya menjadi fitur pendukung dalam scanner. Dengan teknologi OCR, hasil scan yang memiliki teks bertulisan tangan, tulisan mesin ketik, atau teks ketikan komputer, dapat dimanipulasi. Teks yang di-scan dengan OCR dapat dicari kata per kata atau per kalimat. Setiap teks yang ditemukan dapat dimanipulasi, diganti, atau malah diberikan barcode.

Bisa dibilang, artikel ini adalah lanjutan dari artikel kami sebelumnya. Bukannya mantap tuh jika setelah buku tadi difoto, lalu di-scan, lalu hasil scan yang kurang diperbaiki? Jadi, kami akan berikan informasinya kepada Anda di bawah ini:

1. Menggunakan Software

Cara pertama ini adalah menggunakna software khusus editor PDF hasil scan yang sudah banyak dirilis di internet. Berikut ini software-softwarenya:

  • FreeOCR to Word

Software ini bisa dibilang adalah salah satu software OCR terbaik yang kami rekomendasikan, karena tingkat keakuratannya sangat besar, yaitu bisa mencapai 99,8%. Selain itu, software ini mampu mempertahankan format asli dari bagian dokumen. Judul, isi, dan format dari teks akan diubah ke dokumen Word yang dapat di-edit.

Software ini juga mendukung semua format gambar, termasuk file Photoshop (.PSD). Selain itu, software ini hanya tersedia untuk perangkat yang terinstal OS Windows dan Anda bisa mendownloadnya secara gratis.

  • gImageReader

Software ini membutuhkan Google Tesseract OCR Engine untuk bisa digunakan. Meskipun begitu, software ini memiliki tampilan yang bagus. Reader pada software ini dapat berfungsi sangat baik karena bisa mendeteksi page layout secara otomatis . Atau jika ada tata letak teks yang berantakan, Anda bisa menyesuaikannya sendiri.

googletag.cmd.push(function() { googletag.display(‘div-gpt-ad-1495635998525-2’); });

Tampilan hasil scan teks ditempatkan di sisi kanan layar gambar atau dokumen hasil scan, sehingga dapat memudahkan Anda untuk mencocokkan hasil scan teks dengan hasil scan sebelumnya. Tetapi cara ini tidak termasuk untuk pengeditan dasar text serta pemeriksa ejaan teks. Eitsss, Anda sebenarnya bisa melakukan hal tersebut jika mendownload kamus yang cocok.

  • Capture2Text

Software OCR ini memiliki dua fungsi utama. Pertama, Anda bisa menggunakannya sebagai tool screenshot yang bisa mengambil gambar dan menyalinnya sebagai teks ke clipboard Windows. Sehingga, Anda bisa menempelkan (paste) teks tersebut kemana saja yang Anda inginkan. Kedua, software ini memiliki teknologi Voice Recognition yang bisa mengubah ucapan kata-kata ke text. Sayangnya, fitur ini masih belum sempurna, jadi Anda jangan berharap lebih pada fitur ini. Apalagi, fitur biasanya hanya bekerja untuk bahasa Inggris saja.

  • Free OCR

Software OCR ini hanya tersedia untuk OS Windows saja. Selain itu, software ini hanya bisa digunakan untuk versi Windows Vista ke atas. Sedangkan, untuk Windows XP ke bawah, Anda masih bisa menggunakan aplikasi ini dengan cara menginstal beberapa add-ons tambahan.

googletag.cmd.push(function() { googletag.display(‘div-gpt-ad-1495635998525-1’); });

FreeOCR bisa bekerja untuk TWAIN scanner, file PDF, dan image TIFF, dan keluaran teks yang dihasilkan akan menjadi file Microsoft Word. Untuk bisa menggunakan software ini, Anda  juga harus mendownload Google Open Source Tesseract OCR engine (yang juga dibutuhkan oleh software gImageReader).

Nah, berikut ini cara-cara menggunakan Free OCR. Jika Anda menggunakan software OCR lainnya, Anda bisa menyesuaikan cara-cara di bawah ini dengan software yang Anda gunakan.

  • Download dan instal Free OCR di komputer atau laptop Windows Anda.
  • Jalankan Free OCR.
  • Pilih Load PDF, dan masukkan file hasil scan pdf yang akan di-edit teksnya
  • Pilih menu Page untuk memilih halaman berapa yang ingin Anda edit teksnya, Kemudian zoom in hingga 200%, dan pilih menu OCR.
  • Tunggu hingga proses OCR selesai.
  • File PDF hasil scan kini sudah berubah menjadi teks. Jangan lupa untuk mengkoreksi kembali hasil OCR. Biasanya, jika gambar teksnya kabur atau tidak jelas, maka hasil teksnya akan sedikit berantakan. Itulah mengapa Anda menggunakan OCR ini, yaitu untuk memperbaiki hasil yang berantakan tersebut.

2. Menggunakan Microsoft Office OneNote

Selain menggunakan beberapa software yang telah kami bahas di atas, ternyata Microsoft Office memiliki fitur untuk mengubah file PDF hasil scan menjadi bentuk teks. Fitur tersebut bisa Anda temukan di Microsoft OneNote. Berikut ini cara penggunannya:

  • Bagi yang sudah menginstal Microsoft Office, Microsoft OneNote sudah bisa langsung Anda pakai. Jika belum, simak cara install Microsoft Office di situs kami.
  • Buka softwarenya, lalu buat dokumen baru, dengan cara tekan Ctrl + N pada keyboard.
  • Pilih menu “Insert Picture”, kemudian pilih gambar hasil scan yang hendak diubah teksnya, lalu klik kanan dan pilih “Copy Text from Picture”
  • Kemudian coba lakukan paste di aplikasi pengolah kata, seperti Notepad atau Microsoft Word.

3. Menggunakan Situs Online

Jika Anda malas menginstal software tambahan, Anda juga bisa menggunakan layanan online OCR. Salah satu situs yang menyediakan fitur ini adalah Free Online OCR. Situs ini bisa membantu Anda untuk mengubah dokumen PDF, file gambar JPEG, PNG, GIF, TIFF, dan DjVu ke dalam bentuk teks. Selain itu, aplikasi online ini juga bisa menampilkan OCR sesuai dengan page layout dari dokumen yang Anda miliki. Anda cukup membuka situs dari aplikasi ini, kemudian upload file yang ingin Anda jadikan teks. Setelah proses konversi selesai, Anda bisa melihat hasil OCR di bawah gambar dokumen yang Anda upload. Anda juga bisa mendownload hasil konversi dengan mengklik tombol download, atau melakukan translasi bahasa mengugnakan Google Translate, Bing Translator, serta melakukan editing secara online.

4. Software Berbayar

Cara mengubah JPEG ke PDF satu ini mempunyai kemiripan dengan poin nomor satu, yakni sama-sama menggunakan software. Bedanya, software yang akan kita gunakan ini adalah software berbayar, yaitu Nitro PDF Pro. Jadi, bagi Anda yang menggunakan Nitro PDF Pro sebagai software PDF readernya, Anda tidak perlu repot-repot untuk menginstal software OCR lagi. Lalu jika Nitro PDF yang Anda instal tidak ada fitur tersebut gimana? Yah, upgrade dong ke versi Pro. Oke, berikut ini cara-caranya:

googletag.cmd.push(function() { googletag.display(‘div-gpt-ad-1495635998525-3’); });

  • Siapkan file JPG yang akan diubah ke bentuk teks dalam bentuk pdf.
  • Klik kanan file JPG yang akan diubah, pilih “Convert to PDF with Nitro”. Tunggu hingga proses konversi selesai
  • Setelah selesai, selanjutnya file tersebut akan otomatis terbuka di Nitro. Kemudian klik tab “Edit”, pilih OCR.
  • Pastikan Output Type-nya adalah “ Edittable Text” atau pilih “Make Searchable and Editable”. Terakhir, klik OK.
  • Tunggu hingga prosesnya selesai.
  • Setelah selesai akan terbuka tab baru hasil OCR. Sekarang Anda sudah bisa menyalin tulisan tersebut ke aplikasi pengolah teks seperti Microsoft Word, Notepad, dan lainnya.
  • Namun, jika Anda ingin mengubah seluruh file ke dalam Word, maka Anda tinggal melakukan Export to Word dengan cara menekan tombol Ctril + Shift + W dan pilih “Convert”.
  • Atau Anda bisa mengaksesnya melalui menu Home > Convert To Word. Selanjutnya akan muncul jendela “Convert PDF to Word”, lalu tekan “Convert”.
  • Tunggu proses konversi selesai
  • Selesai, sekarang file hasil konversi akan terbuka dalam bentuk Word.

Cara-cara di atas juga merupakan beberapa cara memindahkan file PDF ke Word yang pernah kami bahas sebelumnya di situs ini.

Jika gambar, file PDF, atau hasil scan tidak terbaca oleh software OneNote atau software OCR, biasanya hal tersebut karena posisi gambar (huruf atau angka di dalam gambar) tidak tegak atau miring). Oleh karena itu, sebaiknya Anda mengedit gambar atau hasil scan tersebut menggunakan salah satu dari macam-macam software grafis agar posisi menjadi lebih tegak. Karena pada prinsipnya, melakukan scan dan foto langsung itu sama saja. Perbedannya hanya pada kualitas saja.

Sekian artikel kali ini seputar cara mengedit file pdf hasil scan. Semoga artikel kali ini dapat menjadi inspirasi Anda.