사진에서 오답노트까지 한 번에

OCR로 문제를 인식하고, 오답을 체계적으로 관리하며, 복습까지 한 번에 해결하세요.

AI 모델 역할

비전 모델과 분석 모델을 분리해서 관리합니다

비전 OCR 모델

이미지를 직접 받아 문제 텍스트를 읽는 모델입니다. 사진을 입력으로 쓰기 때문에 비용이 커질 수 있어, 가능하면 저렴하고 빠른 비전 지원 모델을 등록해 주세요.

문제 분석 모델

OCR 결과 텍스트를 다시 읽고 과목, 단원, 실수 유형 같은 학습 정보를 정리하는 모델입니다. 이미지가 아니라 텍스트 중심으로 쓰기 때문에 비전 모델과 다른 provider를 써도 됩니다.

max output tokens는 기본값 1200을 권장합니다. 값을 높이면 긴 JSON 응답이 잘릴 가능성은 줄지만, 출력 토큰 비용이 늘어납니다. 값을 너무 낮추면 OCR 결과가 중간에 끊겨 부분 결과만 표시될 수 있습니다. 한글은 보통 1글자당 1토큰 안팎, 영어는 대략 3~4글자당 1토큰, 숫자·수식·특수문자는 1글자당 1토큰에 가깝게 잡히는 경우가 많습니다. 실제 값은 모델 tokenizer마다 달라집니다.

VISION

비전 OCR 모델

문제 사진을 보고 글자, 보기, 정답 후보를 읽어내는 모델입니다. OCR 실행 비용을 좌우하므로 가벼운 비전 지원 모델을 권장합니다.

기본값은 1200입니다. 높이면 응답 절단은 줄지만 모델 출력 비용이 증가합니다.

ANALYSIS

문제 분석 모델

비전 모델이 읽어낸 텍스트를 바탕으로 과목, 단원, 실수 유형, 해설 구조를 정리하는 모델입니다. 현재는 설정만 분리되어 있고 후처리 연결은 다음 단계에서 붙입니다.

기본값은 1200입니다. 높이면 응답 절단은 줄지만 모델 출력 비용이 증가합니다.

등록된 모델 설정

같은 용도의 새 설정을 저장하면 해당 용도의 이전 설정만 비활성화됩니다.

불러오는 중...