PDF 파일의 기본 포맷은 이미지 형식으로 이미지 내의 문자를 판독하려면 보통 OCR 프로그램을 이용하여야 합니다. 하지만 구글 계정만 있다면 몇 번의 클릭만으로 간단하게 이미지에서 문자를 추출할 수 있습니다. 아래와 같은 샘플 PDF 파일에서 문자를 추출해 보도록 하겠습니다. 1. 구글 계정에 로그인후 새로 만들기 구글 계정에 로그인한 다음 구글 드라이브 페이지로 이동합니다. 구글 드라이브 메인 페이지에서 드라이브로 이동 버튼을 눌러 자신의 구글 드라이브 계정 페이지로 이동합니다. 그다음 좌측 상단의 새로 만들기를 클릭합니다. 2. 문자를 추출할 PDF 파일 업로드 새로 만들기를 클릭한 다음 파일 업로드를 클릭합니다. 이때의 파일은 위에서의 샘플 PDF 파일처럼 문자를 추출할 PDF 파일을 의미합니다...
요즘은 많은 종류의 모바일 스캐너 및 OCR 어플들이 있습니다. 스마트폰을 이용해 도서 등을 촬영하면 이미지 부분과 텍스트 부분을 분리해 문자 형태의 이미지 부분은 실제의 워드 편집기의 문자 형태로 변환시키는 기능입니다. 그런데 이 기능의 진행을 방해하는 가장 큰 요소는 바로 촬영 시의 빛 반사 현상입니다. 일광이나 조명 등의 빛 반사 현상은 종이의 일부분을 뿌옇게 만들어 마치 촬영되지 않은 것 같은 상태로 만들어 버립니다. 따라서, 이러한 부분들은 당연하게 제대로 OCR 판독을 할 수 없게 되고 문자 변환 역시 불가능하게 됩니다. 아래의 이미지는 마이크로소프트 오피스렌즈를 이용해 서산 의료원 벽면에 게시되어 있는 간병인 안내 팸플릿을 촬영한 화면입니다. 가족의 입원으로 인해 사진의 병원 벽면의 안내 팸..
외국산 제품의 매뉴얼이나 상표 등에 붙어 있는 외국어로 표기된 이미지를 해석할 수 있는 방법에 대하여 알아보도록 하겠습니다. 간단히 구조를 설명하면 먼저 OCR 앱을 이용해 해당 이미지를 촬영한 다음 OCR 과정을 거쳐 클라우드에 전송합니다. PC에서 클라우드를 열고 변환된 텍스트를 구글 번역기 등에 돌리면 끝납니다. 1. 스마트폰에 오피스 렌즈 앱 설치 기본적으로 앱자체에서 이미지를 텍스트 형식으로 인식할 수 있는 OCR 기능을 갖추고 있는 대표적인 앱으로는 MS의 오피스 렌즈와 구글의 구글 렌즈가 있습니다. 어떤 것을 사용하든 기본적인 순서는 동일합니다. 저는 MS 워드를 사용중이므로 오피스 렌즈를 사용하였습니다. 2. 오피스 렌즈로 대상 촬영 오래전에 선물받은 우즈베크 산 보드카인 로열 엘리트를 대..
* 단축키는 한글/영문 대소문자로 이용 가능하며, 티스토리 기본 도메인에서만 동작합니다.