PDF인쇄 지난호보기
메인으로

겨레말 편찬 현장

남북 사전 올림말 비교해 표기법과 의미 차이 분석하는《겨레말큰사전》 통합자료 정비 작업

_ 김수현 / 겨레말큰사전 선임 연구원

  분단 이후의 남북 언어를 이야기할 때마다 어휘의 이질화 문제는 늘 논의의 중심에 서 있었다. 그러한 문제의식에도 불구하고 이질화 문제에 대한 총체적 접근과 해결 방안 모색은 늘 미뤄져 왔던 것이 사실이다. 통일 후의 언어 통합을 준비하는 과정에서 어휘의 이질화 문제를 다각도에서 진단하는 일은 더 이상 미룰 수 없다. ‘어디에서’, ‘얼마만큼’의 이질화가 나타나는지에 대한 총체적인 검토 없이는 언어의 통합 역시 기대할 수 없기 때문이다.

  그간 남북 언어(어휘)는 표기법과 의미 차이를 중심으로 지속적인 연구가 이루어져 왔으나, 대량의 데이터를 종합적으로 분석한 자료는 아직 이렇다 할 결과물이 없는 상황이다. 이에 《겨레말큰사전》에서는 남북의 대표적인 사전인 《표준국어대사전》과 《조선말대사전》을 비교하여 ‘어떤 어휘에서’, ‘얼마만큼’의 차이가 나는지를 분석하는 통합자료 정비 작업을 진행하고 있다.

1. 조사 대상과 방법

 《표준국어대사전》과 《조선말대사전》의 올림말 수는 총 810,873개이다. 양쪽 사전 모두에 올라 있는 올림말은 215,124개, 《표준국어대사전》에만 올라 있는 올림말은 275,837개, 《조선말대사전》에만 올라 있는 올림말의 수는 80,636개이다. 같은 의미의 올림말을 하나로 묶었을 때의 전체 올림말 수는 총 571,597개가 되는데, 이 어휘가 실질적인 남북 어휘의 총합이라고 할 수 있다. <남북 어휘의 차이 조사>는 이 571,597개의 올림말을 대상으로 한다.

  2011년 《겨레말큰사전》에서 진행한 <남북 어휘의 차이 조사 및 통합 자료 정비>는 두 가지 목표를 두고 진행되었다. 첫째는 어문 규범의 차이로 인해 표기법이 달라진 어휘가 ‘얼마만큼’ 되는가를 총체적으로 파악하는 것이다. 이 작업은 어휘의 총목록을 검토해야 하므로 571,597개의 전체 올림말을 대상으로 진행되었다. 작업은 1차로 표기 차이와 관련된 어휘들을 전산으로 추출하고, 2차 작업에서는 이 어휘만을 대상으로 하여 표기 차이를 일일이 판별하는 과정을 거쳤다. 이 과정을 거쳐 남북에 공통으로 있는 올림말, 남측 또는 북측에만 있는 올림말의 수를 각각 산출할 수 있었다. 아울러 남북 어휘의 ‘어디에서’, ‘얼마만큼’의 차이를 보이는지에 대한 데이터가 구축되어, 향후 남북이 표기 문제를 논의하는 데 매우 유용한 자료로 활용될 것으로 보인다.
  통합자료 정비 작업의 둘째 목표는 형태가 같은 어휘 중에서 의미 차이가 나타나는 어휘는 얼마나 되는지를 파악하는 데에 있다. 이 작업은 형태가 같은 어휘를 비교하는 것에 한정하고, 명사, 동사, 형용사 125,763개 쌍을 1차 작업 대상으로 삼아, 연구진이 직접 의미 차이를 검토하는 방식으로 진행되었다.

2. 차이가 나타난 남북의 올림말

2-1. 표기가 다른 올림말

  • ① 사이시옷
    • (1) 가겟방[가:게빵/가:겓빵], 뒷마당[뒨:마당](남) : 가게방[가게빵], 뒤마당[뒨마당](북)
    • (2) 남측에만 있는 어휘 : 머릿줄[머리쭐/머릳쭐], 수숫묵[수순묵]
    • (3) 북측에만 있는 어휘 : 수수짚[수수찝], 지게단[지게딴]
    • (4) 발음과 표기가 불일치하는 어휘 : 냉잇국[냉이꾹/냉읻꾹](남) : 냉이국[냉이국](북)
       남측은 1933년 <한글마춤법통일안>의 규정을 계승하여 사이시옷 표기를 인정하고 있으나, 북측은 이를 인정하지 않고 있다. 때문에 (1)과 같이 발음에서는 사잇소리가 동일하게 나타나지만 표기에서 차이를 보이는 어휘들이 많다. (2)와 (3)은 남측 또는 북측에만 있는 어휘들인데 이 역시 사잇소리는 동일하게 나타나고 표기에서만 차이를 보인다. (4)는 사잇소리와 사이시옷 표기 모두가 일치하지 않는 어휘이다. 사이시옷과 관련하여 차이를 보이고 있는 어휘의 수는 비교 대상 올림말 571,597개 중에서 약 4,900개로 분석되었다.
       이번 조사를 통해 사이시옷 표기 차이가 나타나는 비율을 확인할 수 있어 남북 논의 시 유용한 자료로 활용이 가능하다. 또한 남북 공통으로 올라 있는 올림말, 남측 또는 북측에만 있는 올림말의 사이시옷 표기 및 발음 현황 역시 파악이 가능하기 때문에 좀 더 객관적이고 정밀한 자료로서 가치가 있을 듯하다.
  • ② 두음법칙
    • (1) 연세(年歲), 내일(來日) : 년세, 래일
    • (2) 신여성(新女性), 비논리적(非論理的) : 신녀성, 비론리적
    • (3) 나열(羅列), 비율(比率), 구름양(--量), 가십난(gossip欄) : 나렬, 비률, 구름량, 가십란
    • (4) 녹두(綠豆), 나사(螺絲), 유리(琉璃) : 녹두, 나사, 유리
       (1)은 초성이 ‘ㄴ’, ‘ㄹ’인 한자음이 단어의 첫머리에 올 때 남측에서는 현실 발음을 존중하여 ‘ㅇ’, ‘ㄴ’으로 표기하고, 북측은 한자의 본음 그대로인 ‘ㄴ’, ‘ㄹ’로 표기하기 때문에 차이가 나타남을 보여 준다. 이러한 유형은 약 20,000개로 분석되고 있다. (2)는 접두사처럼 쓰이는 한자어가 결합한 합성어의 뒷말이 ‘ㄴ’, ‘ㄹ’로 시작되는 한자음일 때에 표기가 달라지는 예를 보인 것인데, 약 2,600개가 발견되었다. (3)은 한자음 ‘렬’, ‘률’, ‘량’, ‘란’이 쓰인 어휘에서 차이를 보이는 어휘이다. 남측에서는, 모음이나 ‘ㄴ’ 받침 뒤에 오는 한자음 ‘렬’, ‘률’을 ‘열’, ‘율’로, 고유어나 외래어 뒤에 오는 ‘량’, ‘란’은 ‘양’, ‘난’으로 표기하는 예외 조항을 두고 있다. 그러나 북측에서는 이러한 조항 없이 한자의 본음 그대로를 밝혀 표기하므로 차이가 나타난다. 이 유형에 속하는 어휘는 약 1,300개이다. (4)는 북측이 예외적으로 현실 발음을 인정하여 두음법칙을 표기에 반영한 예로서 남북의 표기에는 차이가 없다. 이 유형에 속하는 어휘의 수는 약 1,200개이다.
       이번 작업에서는 기존 논의에서 미약하게 다루어졌던 남측과 북측의 두음법칙 예외 규정에 해당하는 올림말들을 자세하게 분석하고 있다는 장점이 있다. 이 역시 북측과의 두음법칙 표기 단일화를 위한 합의에서 유용한 자료로 쓰일 수 있다.
  • ③ 형태 표기
    • (1) 낚시꾼(남) : 낚시군(북)
    • (2) 폐해(弊害)(남) : 페해(북)
    • (3) 거메지다(남) : 거매지다(북)
    • (4) 넓적코(남) : 넙적코(북)
       형태 표기가 다른 어휘는 남북의 어문 규범이 달라 표기의 형태가 달라진 것을 말한다. (1)은 접사 <-꾼/-군>의 표기가 다름을, (2)는 한자음 <폐/페>의 표기가 다름을, (3)은 활용 형태에서 모음 차이가 있음을 보여 준다. (4)는 어근 <넓적-/넙적->의 표기가 다른 예이다. 이런 유형으로 남북의 올림말에서 형태 표기 차이가 나는 어휘는 약 7,900개이다. 《겨레말큰사전》에서는 형태 표기가 다른 어휘들을 단일 표기, 혹은 복수 표기로 합의하는 과정을 진행하고 있다.(3)은 <거매지다>로, (4)는 <넓적코>로 합의된 올림말인데, 이와 같이 단일 표기로 합의된 올림말은 <붙임> 정보를 통해 합의 사항을 안내할 예정이다.
  • ④ 외래어
    • (1) 필름(film[영]) : 필림(film[[영])
    • (2) 나트륨(Natrium[독]) : 나트리움(Natrium[라])
       남측은 주로 영어권의 원어를, 북측은 주로 러시아권의 원어를 차용하여 표기하고 있다. 원어가 들어온 과정이 다르므로 같은 뜻의 어휘라 하더라도 표기에서는 차이를 보인다. 《표준국어대사전》과 《조선말대사전>에 올라 있는 외래어의 총 어휘 수는 41,877개인데, 《겨레말큰사전》에서는 이 중 인명, 지명, 표기가 같은 올림말을 제외한 목록을 대상으로 합의를 진행 중이다.
  • ⑤ 피ㆍ사동 차이
    • (1) 팔리다(남) : 팔리다, 팔리우다(북)
    • (2) 맞잡히다(남) : 대응 올림말 없음(북)
       남북은 피ㆍ사동과 관련한 문법 체계가 다르다. 피ㆍ사동과 관련하여 차이가 있는 어휘를 추출해 보니 총 324개의 어휘에서 차이가 발견되었다. (1)에서 <팔다>의 피동형인 <팔리다>는 남측과 북측 모두에 있는 올림말이지만, 접사 <-리우->와 결합한 <팔리우다>는 북측에만 있는 피동형이다. 이는 남측에는 없는 표현이므로 남북의 언어 차이로 볼 수 있다. (2) 역시 <맞잡히다>는 남측에만 있는 <맞잡다>의 피동형으로 북측에는 없는 어휘이다.

2-2. 어휘의 의미 차이

남북 어휘 의미의 이질화 정도를 파악하여 그 간격을 줄이는 방안을 모색하는 것은 남북의 언어통합 과정에서 매우 중요하다.
특히 같은 형태의 어휘는 통일 후 남북 언중들의 의사소통과 직결될 수 있다는 점에서 민감하게 다루어져야 한다. 동일 형태의 어휘를 해석하는 ‘의미’가 다르다면 의사소통에서 혼란이 일어나기 때문이다. 남측과 북측 사람이 만났을 때 <일없다>라는 말을 서로의 사전적 의미로 해석해 난감해 했다는 일화 역시 이러한 문제의 축소판을 보여 준다.
《겨레말큰사전》에서는 이러한 문제의식으로 남북 어휘의 의미 차이가 어느 정도인지를 분석하는 작업을 진행하고 있다. 우선 명사, 동사, 형용사 125,763개 어휘 쌍을 1차 대상 목록으로 선정하여 의미 차이를 살펴보았다.

<소행>
《표준국어대사전》 이미 해 놓은 일이나 짓. ∥ {소행이} 괘씸하다. 어느 놈의 {소행이냐}.
《조선말대사전》 해놓았거나 하는 일이나 행동. ∥ 옳바른 {소행}.

<소행>은 남측에서는 부정적 의미로 쓰이는 반면 북측에서는 긍정적 의미로 쓰여 차이를 보인다.
이렇듯 1차 작업에서 의미 차이로 분석된 어휘의 수는 약 17,000개이며, 현재 작업 결과물을 정제하는 작업이 진행 중이다. 이는 남북 어휘의 의미 이질화를 파악할 수 있는 중요한 데이터로서, 남북 어휘 의미의 합의를 위해 쓰이게 된다.

이상으로 《겨레말큰사전》에서 진행하는 남북의 형태 표기 차이와 어휘의 의미 차이 조사 등 통합자료 정비 작업에 대해 간단히 소개했다. 이 작업은 남북의 언어 차이를 한눈에 볼 수 있게 하는 것을 목표로 하여, 기존 논의에서 부분적으로 다루어져 왔던 남북의 언어 차이를 총체적으로 살펴본 데에 의의가 있다.
아울러, 북측과의 논의 시 객관적인 자료로 사용할 수 있는 데이터를 구축함으로써 《겨레말큰사전》편찬 작업의 효율적 진행에 기여한다는 데에도 의미가 있다 하겠다.