법률 문서 처리
법률 문서 처리 — 사용자 사전+교정 결합
법률 문서는 고정된 법률 용어 와 엄격한 표기 가 동시에 요구됩니다.
용어가 한 단어로 인식되지 않으면 조문 검색이 어긋나고, 표기가 흔들리면 문서 신뢰도가 떨어집니다.
바른은 사용자 사전으로 법률 용어를 고정하고, 맞춤법 검사로 표기를 다듬어 둘을 함께 해결합니다.
문제 상황
손해배상청구권,채무불이행같은 법률 용어가 여러 명사로 쪼개져 조문 검색이 빗나갑니다.- 오탈자·띄어쓰기 오류가 법률 문서의 정확성을 해칩니다.
- 법률 특유의 용어는 일반 사전에 없어 미등록단어로 빠지기 쉽습니다.
바른을 어떻게 적용하나
두 단계를 결합합니다. 먼저 맞춤법 검사 API(CorrectError) 로 표기를 정리하고,
그다음 법률 용어 사용자 사전(np_set) 을 적용한 형태소 분석으로 용어를 한 단어로 인식합니다.
용어를 사전으로 고정하는 절차는 도메인 사전 구축 워크플로를 참고하세요.
graph TD
DOC[법률 문서] --> COR[맞춤법 검사 CorrectError];
COR --> CLEAN[표기 정리된 문서];
CLEAN --> DICT[법률 용어 사용자 사전];
DICT --> TAG[바른 형태소 분석];
TAG --> RESULT[용어 정확 인식 + 색인];
법률 용어가 쪼개지지 않고 한 단어로 유지됩니다.
결과와 이점
| 단계 | 도구 | 효과 |
|---|---|---|
| 표기 정리 | 맞춤법 검사 API | 오탈자·띄어쓰기 보정 |
| 용어 고정 | 사용자 사전(np_set) |
법률 용어 한 단어 유지 |
| 색인·검색 | 형태소 분석 | 조문 검색 정합성 확보 |
맞춤법 검사는 유료 기능
바른의 맞춤법 검사기(CorrectError)는 클라우드 전용 유료 기능입니다.
형태소 분석과 함께 쓰면 입력 정제부터 용어 인식까지 한 흐름으로 처리할 수 있습니다.
자주 묻는 질문
Q. 교정과 분석 중 무엇을 먼저 하나요?
표기 오류가 형태소 분석을 방해할 수 있으므로, 교정을 먼저 한 뒤 형태소 분석을 하는 것이 안전합니다.
교정 결과의 revised 문장을 분석에 넘기세요.
Q. 법률 용어가 다른 사전과 충돌하면요?
같은 표제어가 여러 사전에 동시에 있으면 충돌이 발생할 수 있습니다.
CheckConflict로 사전 내 중복과 사전 간 충돌을 미리 점검하세요.
여러 사전을 함께 쓸 때의 우선순위는 사전 우선순위에서 다룹니다.
Q. 교정이 법률 용어를 잘못 바꾸지 않나요?
전문용어를 사용자 사전에 등록하면 분석 단계에서 보호됩니다. 교정 단계에서도 고유명사로 인식된 표현은 과도한 변경을 피하도록 처리됩니다.
Q. 법률 용어 사전은 어떻게 관리하고 버전 관리하나요?
법률 용어는 CustomDictionaryService API(UpdateCustomDictionary)로 등록·갱신합니다.
서버의 사전 파일은 서버가 관리하는 바이너리 형식이라 직접 편집하지 않습니다. 버전 관리는 보유한
용어 목록 소스(텍스트)를 Git으로 관리하고, 변경분을 API로 반영하는 흐름을 권장합니다.
관련 문서
- 맞춤법 검사 시작하기 —
CorrectError로 표기 정리 - 도메인 사전 구축 워크플로 — 법률 용어를 사전으로 고정
- 사전 우선순위 — 사전이 충돌할 때의 처리
도움이 되었나요?