비표준어 사전
비표준어 사전 — 비표준어 → 표준어 매핑 원리
바른은 방언·구어·잘못 굳은 표현 같은 비표준어를 표준어로 바로잡기 위해
비표준어 사전 non-std-dict.pb를 내장합니다. 비표준어와 그에 대응하는 표준어를
짝지어 두고, 맞춤법 검사에서 표준어로 바꿔주는 핵심 자료입니다.
이 사전은 맞춤법 검사 기능이 포함된 빌드에 함께 담깁니다.
비표준어 → 표준어 매핑
비표준어 사전은 "이 말은 저 말로 고친다"는 대응 관계를 담습니다. 국립국어원 표준국어대사전의 비표준어 규칙 체계를 활용해 구축하며, 우리말샘 어휘를 함께 근거로 삼습니다.
| 비표준어 | 표준어 |
|---|---|
| 짜장 | 자장 |
| 멕이다 | 먹이다 |
| 낌 | 낌새 |
교정된 결과의 범주는 STANDARD(표준어)로 표시되어, 표준어 규정에 따라 고쳤음을 알려줍니다.
고유명사는 함부로 바꾸지 않습니다
사람 이름이나 상호처럼 비표준 표기처럼 보여도 그대로 두어야 하는 말이 있습니다.
바른은 고유명사(NNP)로 분석된 어절은 확률 임계값으로 걸러,
과도한 교정이 일어나지 않도록 합니다.
교정 후 조사 자동 조정
비표준어를 표준어로 바꾸면 받침 유무가 달라져, 뒤에 붙는 조사가 어색해질 수 있습니다. 바른은 교정 후 받침 유무에 따라 후행 조사를 자동으로 조정해 자연스러운 문장을 만듭니다.
graph LR
A["낌을"] --> B[비표준어 교정];
B --> C["낌새 + 을"];
C --> D{받침 유무 확인};
D --> E["낌새를"];
낌을→ 비표준어낌을 표준어낌새로 교정 → 받침 없는낌새에 맞춰 조사을을를로 조정 →낌새를- 이렇게 단어만 바꾸는 데서 그치지 않고, 문장 전체가 자연스럽게 이어지도록 조사까지 손봅니다.
왜 조사까지 손보나요
단어만 표준어로 바꾸고 조사를 그대로 두면 낌새을처럼 어색한 결과가 나옵니다.
바른은 교정이 문장 전체에서 매끄럽게 읽히도록, 받침 변화에 맞춰 조사를 함께 다듬습니다.
자주 묻는 질문
Q. 비표준어 교정의 근거는 무엇인가요?
국립국어원 표준국어대사전의 비표준어 규칙 체계를 활용해 비표준어 사전을 구축하고,
우리말샘 어휘를 함께 근거로 삼아 비표준어와 표준어의 대응을 정합니다.
교정 결과는 교정 범주 STANDARD로 표시됩니다.
Q. 비표준어를 고치면 조사도 바뀌나요?
네. 표준어로 바꾼 뒤 받침 유무가 달라지면, 뒤따르는 조사를 자동으로 조정합니다.
예를 들어 낌을은 낌새를로 조사까지 자연스럽게 바뀝니다.
Q. 고유명사가 잘못 교정되지는 않나요?
고유명사(NNP)로 분석된 어절은 확률 임계값으로 걸러내, 사람 이름·상호 등이
과도하게 교정되지 않도록 합니다.
Q. 비표준어 사전은 어떤 빌드에 포함되나요?
non-std-dict.pb는 맞춤법 검사기를 포함하는 빌드에 함께 담깁니다.
형태소 분석만 쓰는 기본 빌드에는 들어가지 않으며, 비표준어 교정도 교정 기능과 함께 제공됩니다.
도움이 되었나요?