OCR(Optical Character Recognition) 이란 지폐, 수표, 티켓 등에 인쇄된 텍스트 정보를 컴퓨터가 인식할 수 있는 텍스트 정보로 바꾸는 기술을 말합니다.
기반 기술
1.전처리
OCR 은 인식 성공률을 높이기 위해 종종 전처리 과정을 거칩니다. 이미지에서 먼지 묻은 경우나, 기울어진 경우에는 적절한 처리를 하게 됩니다.
2. 문자 인식
OCR 알고리듬은 이미지와 가장 유사한 문자들을 골라내고 각각의 유사도를 기준으로 가장 적중 확률이 높은 문자와 그렇지 않은 문자들을 분류해 냅니다.
3. 후처리
OCR 정확도는 해당 위치에 들어갈 수 있는 문자를 한정하여 올릴 수도 있습니다. 이런 위치에 기반하여 해당 위치에 올 수 있는 문자의 목록을 lexicon이라고 합니다.
4. MICR 등의 특수 문자 처리
MICR (Magnetic Ink Character Recognition)과 같은 특수 문자는 명확히 정의된 문자 크기, 간격, 모양을 가지고 있습니다. 그렇기 때문에 이런 특수 문자들은 인식 성공률이 훨씬 높습니다. MICR은 티켓이나 수표에 흔히 쓰입니다.
OCR 결과의 전송
OCR 을 성공적으로 처리한 후에 해당 데이터를 전송해야 합니다. 전송에는 2가지 방법이 있습니다.
하나는 프린터입니다. OCR 성공 즉시 해당 이미지와 텍스트가 프틴터를 통해 인쇄됩니다.
컴퓨터를 이용할 수 있습니다. 해당 이미지와 텍스트가 컴퓨터에 저장됩니다. 이 정보는 필요할 때 찾아볼 수 있습니다.
일련번호 비교
조합권이란 진폐의 조각들을 이용해 만든 위조지폐를 말합니다. 마치 어릴 때 회수권 10장을 잘 오려 11장을 만들었던 경험을 생각하시면 됩니다. 진폐로 만들어졌기 때문에, 기존의 위조지폐 검출 방법으로는 조합권을 검출해 낼 수 없습니다.
SNC (Serial Number Comparison) 는 지폐 한 면에 있는 두 일련번호를 비교하여 서로 틀리면 위조지폐로 판별하는 기술입니다.
바코드 (티켓)
카지노나 극장, 버스 터미널 같은 곳에서는 법적으로 티켓을 일정 기간 카피하여 보관해야 할 때가 있습니다.
계수기와 바코드 관리 프로그램을 이용하면 바코드, MICR 등의 이런 관리 업무를 아주 쉽게 할 수 있습니다.
- 데모 영상