(작성 중)코딩을 몰라도, AI와의 대화만으로 OCR 도구를 만들 수 있어요
시작하게 된 계기
문서나 시험지, 필기 이미지에서 글자를 추출하는 OCR 작업을 할 때, 그동안은 외부 웹사이트에 이미지를 업로드해 왔습니다. 보안과 비용이 마음에 걸렸고, 무엇보다 문서 종류에 따라 결과 품질이 들쭉날쭉했습니다.
그래서 내가 원하는 방식대로 동작하는 OCR 도구를 직접 만들어 보기로 했습니다. 개발 지식은 없었지만, AI(Claude)와 대화하며 만들 수 있었습니다. 완성된 결과물은 파일 하나(index.html)를 여는 것만으로 동작하며, 별도의 설치나 서버가 필요 없습니다.
이 글에서 공유하고 싶은 것은 완성된 도구 자체보다, 그것을 만들어 간 과정입니다. 읽고 나서 "나도 내 업무에 필요한 도구를 이렇게 만들어 볼 수 있겠다"는 생각이 드신다면 충분합니다.
한 번에 완성된 것이 아닙니다
AI에게 한 번 요청해 보고 결과가 기대에 못 미치면, 거기서 멈추는 경우가 많습니다. 저의 첫 결과물도 완성품이 아니라 초안에 가까웠습니다.
중요한 것은 그다음이었습니다. 직접 써 보고, 불편한 점을 찾고, 다시 요청하고, 또 써 보는 과정을 반복했습니다. 이 과정을 열여섯 번 거치고 나니, 실제 업무에 쓸 만한 도구가 되어 있었습니다.
AI와의 협업은 완벽한 하나의 질문을 찾는 일이 아니라, 원하는 모습이 나올 때까지 조건을 더해 가는 대화에 가깝습니다.
만들어 간 과정
특별한 기술 용어 없이, 사용자로서 느낀 점을 그대로 전달한 것이 전부였습니다. 실제 흐름을 세 단계로 정리했습니다.
1단계 — 우선 만들어 보기
처음에는 "이런 OCR 도구를 만들어 달라"고 요청하되, 곧장 코드를 작성하지 말고 어떻게 만들지 구조부터 설명해 달라고 했습니다. 방향을 먼저 맞추고 시작한 덕분에 이후 수정이 수월했습니다. 그렇게 첫 초안이 완성되었습니다.
2단계 — 써 보며 드러난 요구사항
직접 사용해 보니 자연스럽게 질문과 요구가 생겼습니다.
- "키를 넣지 않고 실행하면 어떻게 되는가" 같은 동작 확인
- "복합기로 스캔하면 PDF로 나오는데, PDF도 처리되어야 하지 않겠는가" → PDF 지원 추가
- "이 도구를 쓰려면 비용이 드는가" → AI가 무료로 사용하는 방법까지 안내
- "그렇다면 키도 비용도 필요 없는 무료 엔진도 넣어 달라" → 무료 OCR 기능 추가
PDF 지원과 무료 엔진처럼 실제로 유용했던 기능들은, 모두 직접 써 보지 않았다면 떠올리지 못했을 필요에서 나왔습니다.
3단계 — 어색한 부분 다듬기
기능이 동작하더라도 어딘가 어색한 지점들이 있었습니다. 그런 부분을 하나씩 짚었습니다.
- 언어를 코드로 직접 입력하는 방식이 어렵다는 점(예: 중국어를 어떻게 표기해야 할지 알기 어려움) → 체크박스로 언어를 고르는 방식으로 변경
- OCR 결과를 확인할 때 원본을 함께 볼 수 있으면 좋겠다는 점 → 원본 확대 보기 추가
- 입력 이미지를 삭제하면 아래의 결과도 함께 사라지는 것이 자연스럽다는 점 → 동시 삭제 처리
- 무료 엔진을 쓸 때는 불필요한 설정이 화면에 보이지 않도록 정리
기능을 추가하는 일만큼이나, 이런 사용성의 일관성을 맞추는 일이 완성도를 좌우했습니다.
완성된 도구
- 이미지나 PDF를 끌어다 놓으면 글자를 추출합니다.
- 본인의 API 키를 넣어 사용하거나, 키 없이 무료 엔진으로도 쓸 수 있습니다.
- "영어 시험 문제용", "필기체 한글용", "표 추출용" 등 상황별 프롬프트를 골라 정확도를 높일 수 있습니다.
- 결과는 복사하거나 파일로 저장할 수 있고, 원본과 나란히 대조할 수 있습니다.
시험지, 필기, 표가 포함된 문서처럼 까다로운 자료도 비교적 정확하게 읽어냅니다.
권하고 싶은 점
이 도구는 개발 지식이 있어서 만든 것이 아니라, 필요한 것을 말로 설명할 수 있었기에 만들 수 있었습니다. 업무 중 "이런 도구가 있으면 좋겠다"고 생각했던 것이 있다면, AI에게 한번 이야기해 보시기를 권합니다.
- 코드 작성을 바로 요청하기보다, 어떻게 만들지 먼저 설명해 달라고 하면 방향을 맞추고 시작할 수 있습니다.
- 첫 결과물은 초안이라고 생각하는 편이 좋습니다. 진짜 완성은 그다음 대화에서 이루어집니다.
- 직접 써 보고 불편한 점을 그대로 전달하면 충분합니다. 정교한 표현이 필요하지 않습니다.
- 비용이나 제약도 솔직하게 물어보면, 더 나은 대안을 함께 찾을 수 있습니다.
궁금한 점이나 만들어 보고 싶은 도구가 있으시면 AI콘텐츠기획팀으로 문의 부탁드려요. 함께 고민해 보겠습니다.^^