Pernah bertanya-tanya bagaimana bisa dokumen dalam bentuk kertas bisa menjadi dokumen yang bisa dibaca oleh mesin? Jawabannya adalah adanya optical character recognition atau yang terkadang disebut sebagai text recognition atau pengenal teks.

Optical character recognition atau OCR mengambil sari dan mengolah ulang manfaat data dari dokumen yang sudah dipindai, gambar dalam kamera dan PDF berupa foto saja. Software dalam OCR memilih huruf dalam gambar, meletakkannya ke dalam kata-kata lalu menyusunnya ke dalam kalimat agar sanggup mengakses dan menyunting konten aslinya. Berkat kecanggihan inilah memasukkan data secara manual bisa dikurangi.

Bagaimana optical character recognition bekerja?

Optical Character Recognition

OCR menggunakan pemindai untuk memproses bentuk fisik suatu dokumen. Setelah semua halaman disalin, software OCR mengubah dokumen tersebut ke dalam versi dua warna atau hitam dan putih. Gambar yang dipindai kemudian dianalisis untuk mengetahui bagian yang cerah dan gelap. Area gelap diidentifikasikan sebagai karakter yang perlu dikenali sedangkan area yang cerah diidentifikasikan sebagai latarnya.

Bagian yang gelap lalu diproses untuk menemukan huruf alfabet atau angka numerik. Tahap ini biasanya  melibatkan penargetan terhadap satu karakter, kata atau blok teks pada satu waktu. Karakter kemudian diidentifikasikan menggunakan satu dari dua algoritma — pengenalan pola atau pengenalan fitur.

Pengenalan pola digunakan ketika program OCR diberi contoh dalam bentuk teks dalam berbagai bentuk huruf dan format untuk membandingkan dan mengenali karakter pada dokumen yang dipindai atau file gambarnya.

Deteksi fitur terjadi ketika OCR menerapkan aturan terkait fitur dari huruf atau angka tertentu untuk mengenali karakter dalam dokumen yang dipindai. Fitur-fitur tersebut mencakup angka dari garis miring, garis silang atau lengkungan dalam satu karakter. Sebagai contoh, huruf besar “A” disimpan sebagai dua garis diagonal yang bertemu dengan sebuah garis horizontal di tengah. Saat sebuah karakter teridentifikasi, karakter tersebut diubah menjadi kode American Standard Code for Information Interchange atau kode ASCII. Kode ini digunakan oleh sistem komputer untuk menangani manipulasi lebih lanjut.

Program OCR turut menganalisa struktur sebuah foto dokumen. Program ini membagi halaman tersebut menjadi elemen, seperti blok teks, tabel atau gambar. Baris tersebut dibagi ke dalam kata kemudian menjadi karakter. Setelah karakter digarisbawahi, program tersebut membandingkannya dengan serangkaian gambar pola. Setelah pemrosesan menghasilkan kesesuaian, program tersebut memproduksi teks yang bisa dikenali.

Sistem OCR memadukan hardware dan software untuk mengubah dokumen cetak menjadi teks yang bisa dibaca oleh mesin. Contoh hardware adalah pemindai optikal yang menyalin atau membaca teks kemudian software yang menangani proses berikutnya.

Software OCR memanfaatkan kecerdasan buatan untuk menerapkan lebih banyak metode lanjutan pengenalan cerdas karakter, seperti mengidentifikasi bahasa atau gaya penulisan.

Apa saja contoh penggunaan optical character recognition?

Optical character recognition sudah banyak kita gunakan sehari-hari. Contohnya adalah kita bisa mengedit, memformat dan mencari dokumen dalam bentuk PDF seolah-olah seperti melakukannya dalam format Word atau dokumen Google.

OCR kerapkali digunakan sebagai teknologi tersembunyi yang membantu banyak sistem dan layanan populer dalam hidup kita sehari-hari. Dalam hal ini contoh penggunaannya adalah memasukkan data secara otomatis, membantu orang dengan keterbatasan visual, hingga mengindeks dokumen untuk mesin pencarian, seperti paspor, tagihan, pernyataan bank, hingga kartu bisnis.

Optical character recognition membantu dalam optimalisasi pemodelan mahadata dengan mengubah kertas dan dokumen bergambar yang dipindai menjadi file PDF yang bisa dibaca dan dibaca oleh mesin. Memproses dan mendapatkan informasi berharga tidak bisa dilakukan secara otomatis tanpa terlebih dahulu menerapkan OCR ke dalam dokumen dimana lapisan teks belum tersedia.

Penggunaan OCR telah dilakukan oleh salah satu perusahaan IT di Jepang. Divisi HRD dan Keuangan perusahaan tersebut memakai OCD untuk mengidentifikasi dan memasukkan data kehadiran karyawan. OCD sangat membantu tenaga di perusahaan tersebut. Sebelumnya adanya OCD, perusahaan tersebut setiap bulan membutuhkan tiga hingga empat staf yang bekerja 35 jam untuk memasukkan data kehadiran karyawan mereka. Bahkan, perusahaan tersebut menggunakan tenaga tambahan untuk memproses tagihan dan pembayaran. Selain itu, OCD mengurangi potensi kesalahan memasukkan data. Proses pun berjalan lebih efisien dan menghemat anggaran.

Ada pula perusahaan penerbangan ternama Jepang yang memakai OCD untuk mempermudah proses memasukkan formulir pengajuan kartu kredit. Dalam setahun, data entry formulir pengajuan tersebut menembus 75 ribu dengan lebih dari 100 jenis formulir. OCD mempercepat proses memasukkan data, bahkan lebih akurat dibandingkan secara manual. OCD sanggup mengidentifikasi tulisan tangan pada formulir kertas atau teks digital dari file PDF. Dengan cara tersebut waktu melakukan entry data dapat berkurang hingga setengahnya.

Dari contoh pemakaian di atas dapat disimpulkan bahwa optical character recognition menghadirkan keunggulan, seperti memangkas biaya, mempercepat alur kerja, menjamin keamanan data, dan meningkatkan layanan dengan memastikan karyawan memperoleh informasi terbaru dan akurat.

Baca juga: Kenali Apa itu Intelligent Automation dan Manfaatnya Untuk Bisnis


Tertarik untuk memulai bisnis vending mesin? Monster Mac siap membantu kebutuhanmu !

Hubungi Kami