콘텐츠로 이동

온용어 사전

온용어 사전 — 전문 분야 용어지식의 보강

바른은 우리말샘이 미처 다루지 못하는 전문 분야 용어를 온용어 사전 onterm-dict.fb로 보충합니다. 학술·기술·산업 분야의 용어처럼 일반 국어사전에 잘 오르지 않는 말을 인식해, 형태소 분석과 맞춤법 검사가 전문용어까지 따라갈 수 있게 합니다.

‘온용어’란

온용어국립국어원이 운영하는 전문 분야 용어지식 플랫폼입니다. 누구나 쉽게 용어지식을 찾아 활용할 수 있도록 기관별·분야별로 흩어져 있던 용어 자료를 한데 모아 분류하고, 형태와 개념이 같은 용어를 연결하여 통합했습니다. 또한 용어를 이해하고 사용하는 데 필요한 필수 정보(정의문, 예시, 원어 등)를 더해 나가고 있습니다. 바른은 이 전문 용어지식을 형태소 분석·교정에 활용합니다.

이 사전은 맞춤법 검사 기능이 포함된 빌드에 함께 담깁니다.

우리말샘이 못 다룬 전문용어를 채운다

우리말샘은 폭넓은 국어 어휘를 담지만, 빠르게 생겨나는 전문용어·신조어까지 모두 수록하지는 못합니다. 온용어 사전은 바로 이 빈틈을 메우는 역할을 합니다.

어휘 종류 예시
정보기술 용어 클라우드, 머신러닝, 오픈소스
학술·산업 용어 분야별 전문 술어
신조어·합성어 새롭게 자리 잡은 표현

두 사전의 역할 분담

우리말샘이 일반 국어 어휘의 기준이라면, 온용어 사전은 전문·최신 어휘의 보충입니다. 두 사전이 함께 작동해서, 일상어부터 전문용어까지 폭넓게 인식합니다.

FlatBuffer로 저장하고 표제어로 빠르게 조회

온용어 사전도 우리말샘과 마찬가지로 FlatBuffer 형식(.fb)으로 저장되고, 표제어를 키로 하는 사전 조회 구조로 찾습니다. 읽기 전용 사전을 빠르게 찾기 위한 구조입니다.

graph LR
  W[입력 단어] --> U{우리말샘에 있나?};
  U -- 있음 --> R1[IN_URIMALSAEM];
  U -- 없음 --> O{온용어에 있나?};
  O -- 있음 --> R2[IN_ON_DICT];
  O -- 없음 --> R3[OUT_OF_VOCAB 추측];

출처 표시 — IN_ON_DICT

온용어 사전에서 인식한 형태소에는 out_of_vocab 값으로 IN_ON_DICT가 붙습니다. 결과를 검토할 때 "이 전문용어는 온용어 사전에서 확인했다"는 근거가 됩니다. 우리말샘에서 온 단어(IN_URIMALSAEM)와 구별되므로, 어휘의 출처를 명확히 추적할 수 있습니다.

자주 묻는 질문

Q. 온용어 사전과 우리말샘 사전은 무엇이 다른가요?

우리말샘은 국립국어원의 일반 국어 어휘이고, 온용어 사전은 그 사전이 다루지 못한 전문용어·신조어를 보충합니다. 두 사전은 출처 값(IN_URIMALSAEM, IN_ON_DICT)으로 구별됩니다.

Q. 온용어 사전은 어떤 빌드에 포함되나요?

onterm-dict.fb는 맞춤법 검사가 포함된 빌드에 배포됩니다.

Q. 전문용어가 미등록단어로 나오면 어떻게 해야 하나요?

자주 쓰는 도메인 용어가 미등록단어(OUT_OF_VOCAB)로 분석된다면, 사용자 사전에 등록해 고유명사나 복합명사로 인식시키시면 됩니다. 사용자 사전은 CustomDictionaryService API로 관리합니다.

Q. 온용어는 온라인 용어를 뜻하나요?

아니요. 온용어는 전문 분야 용어지식 플랫폼의 고유명입니다. 기관별·분야별로 흩어진 용어 자료를 한데 모아 분류·통합하고, 정의문·예시·원어 같은 정보를 더한 전문 용어지식이며, 바른은 이를 형태소 분석과 맞춤법 검사기에 활용합니다.

도움이 되었나요?