짝찾기 문제의 해결

미지언어 또는 한국어 일부가 빈칸으로 제시되어 있거나,
한국어 번역이 순서에 상관 없이 뒤섞여 있는 경우

가 존재합니다. 1번 경우의 빈칸은 뒤에서 문제의 일부분인 경우가 많습니다. 2번 경우와 같이 무작위로 제시하는 경우에는 반드시 “알맞게 짝지어라” 문제가 선행하게 됩니다. 이번 글에서는 이와 같은 짝찾기 문제의 해결 방법을 알아보겠습니다. 짝찾기 문제는 미지 언어의 통사론을 묻는 문제가 있고, 의미 조합에 따른 단어 형성을 묻는 문제가 있습니다. 이번 글에서는 의미론 범위의 짝찾기 문제를 설명하겠습니다.

다음은 짝찾기 문제의 가장 간단하고 전형적인 예시입니다.

서론

짝찾기 문제의 원리

짝찾기 문제를 처음 맞닥뜨리게 되면 당황할 수가 있습니다.

‘나는 오오드함어를 알아 듣지도 못하고,
오오드함어가 무슨 언어인지조차 모르는데
어떻게 오오드함어 단어가 무슨 뜻인지 맞힐 수가 있지?’

라고 생각할지도 모릅니다. 예를 들어, 우리가 알고 있는 영어 단어들과 한국어 번역이 무작위로 제시되어 있다면 우리가 가진 지식을 통해서 문제를 풀 수 있을 것입니다. 그렇지만 우리는 오오드함어 단어를 모르기 때문에 문제에 주어진 정보만으로 문제를 해결해야 합니다.

이런 예시를 들어봅시다. 다음은 ‘주식회사 언올’의 신입사원 9명의 얼굴과 생일을 모아둔 자료입니다.

만약 우리가 이 신입사원들의 얼굴과 생일의 짝을 맞춰보라는 과제가 주어진다면 해결할 수 있을까요? 이는 불가능합니다. 왜냐하면 얼굴과 생일의 정보는 전혀 관련이 없기 때문에, 얼굴에서 생일을 알아낼 수 있는 방법도, 생일에서 얼굴을 알아낼 수 있는 방법도 없기 때문입니다. 따라서 우리가 이 신입사원들의 정보를 개인적으로 알지 않는 이상 이 과제를 해결할 수 없습니다.

하지만 아래 세 명 중에서 ‘벤저민’이 누군지 맞혀보라고 하면 맞힐 수 있을까요?

왼쪽의 얼굴을 미루어 보아, 3명 중 1명은 남자, 2명은 여자라고 추측할 수 있습니다. 그리고 무작위로 제시된 이름 크리스티나, 벤저민, 아멜리아 중에서 남자 이름은 1개(벤저민), 여자 이름은 2개(크리스티나, 아멜리아)입니다. 이렇게 개수를 나눠보면, 우리는 맨 왼쪽의 검은 양복을 입은 남자가 ‘벤저민’이라는 것을 합리적으로 추측할 수 있습니다.

우리는 왼쪽의 얼굴 그림들에서 첫 번째 사람과 ‘남자’라는 정보를 연결지었고, 나머지 두 사람을 ‘여자’라는 정보와 연결지었습니다. 마찬가지로 오른쪽의 이름 데이터에서 가운데 ‘벤저민’이라는 이름을 ‘남자’라는 정보와 연결지었고, ‘크리스티나’와 ‘아멜리아’를 ‘여자’라는 정보로 연결지었습니다. 따라서, 우리는 위 신입사원 3명에 대한 사전 정보가 없음에도 불구하고, 누가 벤저민인지를 찾는 과제를 해결할 수 있었습니다.

마찬가지로, 언어학 올림피아드의 짝찾기 문제는 반드시 문제에 주어진 데이터 내에서 얻을 수 있는 정보를 통해 미지언어와 한국어 사이의 대응을 합리적으로 추측할 수 있게 설계가 되어 있습니다. 위의 ‘벤저민 찾기’ 문제에와 마찬가지로 우리의 전략은 다음과 같습니다.

미지 언어 데이터와 한국어 데이터를 각각 어떤 정보와 연결 짓고,
그 연결 관계를 통해 대응 관계를 추측한다.

이 때, 미지 언어의 데이터는 ‘벤저민 찾기’의 “얼굴”에 대응됩니다. 즉, 미지 언어의 단어들의 “겉모습”에 집중해야 합니다. 각각의 단어들이 어떤 “형태적인” 유사성을 가지고 있는지에 집중해야 합니다. 예를 들어, 한국어 단어들 중 동사들은 ‘공부하다’, ‘출근하다’, ‘치료하다’처럼 ‘~하다’로 끝난다는 공통점을 가지고 있습니다. 한국어를 전혀 읽을 수 없는 사람들도 이 셋이 모두 같은 두 글자로 끝난다는 것을 파악할 수 있습니다. 마찬가지로, 우리는 미지 언어를 모르기 때문에 미지 언어의 동사들이 어떻게 생겼는지는 알 수 없지만, 만약 미지 언어의 동사들이 같은 글자로 끝나는 공통점을 가지고 있다면, 무작위로 나열된 단어들 속에서 이들을 “겉모습”만으로 묶을 수가 있습니다.

반면 한국어 데이터는 ‘벤저민 찾기’의 “이름”에 대응됩니다. 우리는 ‘벤저민 찾기’ 문제를 풀 때 ‘벤저민’은 남자 이름이고, ‘크리스티나’와 ‘아멜리아’는 여자 이름이라는 지식을 가지고 있습니다. 마찬가지로, 짝찾기 문제를 풀 때, 우리는 한국어를 알기 때문에, 한국어 단어들이 각각 어떤 뜻을 가지고 있는지, 그리고 그들이 어떻게 연관지어져 있는지 알고 있습니다. 예를 들어, 한국어 데이터에 ‘팔뚝’, ‘손가락’, ‘종아리’ 라는 단어가 있다면, 우리는 한국어에 대한 지식을 이용해서 이들이 “신체 부위”라는 범주로 묶을 수 있다는 것을 알고 있습니다.

만약 ‘벤저민 찾기’ 문제에서 첫 번째 남자가 ‘벤저민’이 아닌 ‘크리스티나’라는 이름을 사용하고, 가운데에 있는 여자가 ‘벤저민’이라는 이름을 사용한다고 하면, 우리가 내린 추측(‘맨 왼쪽의 남자가 벤저민일 것이다’)은 틀린 것이 됩니다. 왜냐하면, 우리의 추측은 ‘남자는 남자 이름을 사용하고, 여자는 여자 이름을 사용할 것’이라는 가정을 하고 있기 때문입니다. 이 가정이 성립하지 않는다면, 사람들이 자신의 성별과 무관한 이름을 사용한다면 우리는 ‘벤저민 찾기’ 과제를 틀릴 수 밖에 없습니다.

짝찾기 문제에도 마찬가지의 가정이 존재합니다. 짝찾기 문제의 기저에 있는 가장 큰 가정은 아래와 같습니다.

두 미지 언어 단어의 형태(‘겉모습’)가 서로 연관이 있으면,
그 한국어 번역도 서로 연관이 있을 것이다.

이 가정이 성립하지 않고, 미지 언어의 단어들이 모두 무작위적인 뜻을 가지고 있다면 우리는 그 문제를 해결할 수가 없기 때문입니다. 따라서 위 가정을 가지고, 문제를 해결하도록 합니다. 이를 위해서 우리는 전략적으로 미지 언어의 형태적 유사성을 포착하고, 한국어 번역들이 서로 가지는 연관 관계, 포함 관계, 파생 관계 등을 최대한 많이 찾아내야 합니다.

그러면, 개인전 문제의 구성과 해결 순서에서 설명한 순서대로 위의 오오드함 문제를 해결해 보겠습니다.

문제 정보 파악하기

이 문제는 오오드함어의 의미 조합법을 묻는 문제입니다.

언어 정보 (주석) 파악하기

오오드함어의 어족과 사용자 수에 대한 정보를 얻었으나, 문제 풀이에 사용할 만한 정보는 보이지 않습니다.

기호 ː 가 장모음을 나타내는 기호라는 것을 알 수 있습니다. 답안을 작성할 시에 빼먹지 않도록 조심하여야 합니다.

한국어 번역 분석하기

여느 문제 풀이 순서와 마찬가지로, 미지 언어 데이터를 분석하기 전에 반드시 한국어 번역의 분석이 선행되어야 합니다. 한국어 데이터를 먼저 별도의 종이에 손으로 나열해 보도록 합시다. 이 때, 반드시 소문항에 포함되어 있는 단어들도 함께 나열하는 것을 잊지 말아야 합니다.

ᄀ. 구입하다
ᄂ. 계산기
ᄃ. 갈퀴질하다
ᄅ. 제빵하다
ᄆ. 돈
ᄇ. 제빵 도구
ᄉ. 빵
ᄋ. 세탁기
ᄌ. 깨끗한 옷
갈퀴
계산하다
빨래하다

위에서 언급한 바와 같이, 짝찾기 문제에서 핵심 중 하나는 이 단어들 사이의 연관, 포함, 또는 파생의 관계를 찾는 것입니다. 이를 위해 먼저 단어들을 가장 큰 범주로 나누어 보는 것이 좋습니다. 우리는 다음과 같은 분류를 시도해볼 수 있습니다.

동사
- ᄀ. 구입하다
- ᄃ. 갈퀴질하다
- ᄅ. 제빵하다
- 계산하다
- 빨래하다
도구
- ᄂ. 계산기
- ᄋ. 세탁기
- ᄇ. 제빵 도구
- 갈퀴
기타 물건들…
- ᄆ. 돈
- ᄉ. 빵
- ᄌ. 깨끗한 옷

위와 같은 분류를 하고 나면 우리에게 ‘도구’라는 큰 범주로 묶인 단어 네 개를 발견할 수 있게 됩니다. 그리고 각각의 도구들은 그 도구를 이용해서 수행하는 동작을 가리키는 동사가 ‘동사’ 범주에 존재하는 것으로 보입니다. 이들을 아래와 같이 화살표를 이용하여 그 연관/파생 관계를 정리해 보겠습니다. (회색은 소문항에 등장하는 단어들을 의미합니다.)

이렇게 우리는 한국어 단어 여덟 개의 상호 연관 관계를 파악할 수 있었습니다. 그 다음에 남아있는 단어를 보면 아래와 같습니다.

ᄆ. 돈
ᄉ. 빵
ᄌ. 깨끗한 옷
ᄀ. 구입하다

이 중에서 우리가 이미 분석한 여덟 단어와 관련지을 수 있는 단어 두 개가 눈에 띕니다. ‘빵’은 분명 ‘제빵하다’와 관련이 있고, ‘깨끗한 옷’은 ‘빨래하다’와 관련이 있을 것입니다. 그리고 각각의 명사들은 동사가 가리키는 동작을 통해 얻는 결과물을 의미하는 것을 알 수 있습니다. 우리는 이 두 단어를 다음과 같이 표에 추가할 수가 있습니다.

이렇게 총 열 개의 단어를 화살표를 통해 그 연관 관계를 파악해 보았습니다. 그러나 ‘갈퀴질하다’와 ‘계산하다’를 통해 얻어지는 결과물을 의미하는 단어는 없으므로 일단 공란(“?”)으로 남겨두겠습니다. 마지막으로 우리에게는 다음 두 단어가 남습니다.

ᄆ. 돈
ᄀ. 구입하다

분명히 ‘구입하다’도 ‘갈퀴질하다’, ‘계산하다’, ‘제빵하다’, ‘빨래하다’와 마찬가지로 동사의 하나이므로 위 표에서 가운데 열(‘X’를 하다) 밑에 넣을 수 있을 것입니다. 그렇다면 ‘돈’은 어디에 넣어야 할까요?

언뜻 봐서는 ‘돈’은 아예 다른 행에 속한다고 생각할지도 모릅니다. 그러나 우리는 돈이 ‘구입을 할 때 사용하는 도구’라는 것을 감안하여, ‘구입하다’의 오른쪽 열에 배치할 수 있을 것 같습니다. 구입을 할 때 돈이 생산되는 것이 아니므로 (돈을 사용해서 구입을 하기 때문에) ‘돈’은 ‘구입하다’의 왼쪽(‘X’를 하면 생기는 것)이 아닌 오른쪽 열(‘X’를 하는 데 사용하는 도구)에 배치되어야 하는 것을 알 수 있습니다.

그러면 우리는 한국어 단어의 분석을 모두 끝마칠 수 있고 그것은 아래와 같습니다.

이 중에서, 우리가 짝찾기 과제를 수행하기 위해, 소문항에 있는 단어들을 제외하고 무작위로 나열된 한국어 데이터에 존재하는 단어만 남겨놓고 완성된 표를 그려보겠습니다.

oodham-sol-5

이제 한국어 번역의 분석이 충분히 되었으므로 미지 언어 데이터 분석 단계로 넘어가도 좋습니다.

미지의 데이터 분석하기

미지언어 데이터를 분석하기에 앞서 제일 도움이 되는 것은 전체 데이터를 별도의 종이에 손으로 한 번 써보는 것입니다. 특히 이 문제는 데이터가 상당히 양이 적어 옮겨 적기 용이합니다. 미지언어 데이터를 옮겨 적으면 어떤 형태와 단어가 자주 등장하는지를 쉽게 관찰할 수 있습니다.

특히, 우리는 그 형태적 유사성을 매우 중요하게 포착해야 하는 문제이므로, 단어들을 알파벳순으로 나열하여 옮겨보겠습니다. (이 과정에서 단어가 누락되거나 중복되지 않도록 조심하세요.)

이렇게 나열된 데이터에서, 몇몇 단어들이 앞부분에 몇 글자를 공유하는 것을 관찰할 수가 있습니다. 위에서 언급한 바와 같이 한국어 동사가 ‘-하다’로 끝나듯, 이렇게 같은 글자로 시작되는 단어들이 의미적 연관성이 있을 것이라는 가정을 할 수 있습니다. 특히, 이 경우 겹치는 형태가 매우 길고 단어 전체에서 큰 부분을 차지하기 때문에 문법적 기능을 하기보다 단어의 어근을 나타내는 형태일 것이라는 추측을 해볼 수 있습니다. 어두의 형태를 기준으로 단어의 ‘겉모습’들을 분류해보면 아래와 같습니다. (‘벤저민 찾기’에서 사람들의 ‘겉모습’을 기준으로 분류하는 것을 생각해 보세요.)

이렇게 분류하고 나면, 그룹 내에 속해있는 단어들의 형태들이 그 어말에서 또다른 패턴을 가진다는 것을 알 수 있습니다. 무엇보다, –akud 로 끝나는 형태가 무려 4개나 보입니다. 따라서 이 부분을 접미사라고 가정하고, 단어에서 분리해냅니다. 손으로 문제를 풀 때에는 여기에 색칠을 하거나 동그라미, 밑줄 등을 치는 방식으로 표시할 수 있습니다.

oodham-sol-8

-akud 의 분리가 끝나면, 그 다음에 우리는 paːn, paːnt, paːntakud 의 관계에서, -t 라는 또다른 형태를 발견할 수가 있습니다. 마찬가지로 nolawt 의 마지막 t 도 같은 -t 일 것이라는 추측을 할 수 있습니다. 그것을 분리하면 아래와 같습니다.

oodham-sol-9

그렇다면 우리는 paːn, paːnt, paːntakud 세 단어는 paːn 으로 시작한다는 공통점이 있고, 또 어떤 단어들은 -t 를 가진다는 공통점, 어떤 단어들은 -t 와 -akud 를 가진다는 공통점이 있다는 것을 파악할 수 있습니다. -t 는 없고 -akud 만 있는 형태는 발견되지 않습니다. 이를 두 가지 행과 열로 나타내어 표를 만들면 아래와 같습니다.

oodham-sol-10

이제 미지의 데이터 분석이 모두 끝났습니다.

짝찾기

미지 언어 데이터와 한국어 데이터 분석한 것을 나란히 두고 비교해 봅시다.

oodham-sol-10

oodham-sol-5

이 두 표 사이에는 놀라운 구조적 유사성이 있다는 것을 파악할 수 있습니다. 예를 들어, 미지 언어 데이터의 각 열이 2개, 3개, 4개로 이뤄져 있는데, 마찬가지로 한국어 데이터도 2개, 3개, 4개로 이뤄져 있습니다. (‘벤저민 찾기’ 과제에서 남자가 1명, 여자가 2명이었던 것을 생각해 보세요.)

마찬가지로 어근을 이용한 분류를 했을 때 1개, 1개, 2개, 2개, 3개로 분류된다는 점에서도 두 표의 패턴이 일치한다는 것을 알 수 있습니다. 따라서 우리는 다음과 같은 합리적인 추측을 할 수 있습니다.

-∅ 로 끝나는 단어 = ‘X’를 하면 생기는 것
-t 로 끝나는 단어 = ‘X’를 하다
-takud 로 끝나는 단어 = ‘X’를 하는 데 생기는 도구

데이터에서 어근에 -t 가 붙고, -akud 가 붙는 과정이 오오드함어 단어 형성의 패러다임이라면, 한국어 데이터에서 “‘X’를 하다”가 기본형인 것을 수정하여. 생기는 결과물을 기본형으로 하고 동사를 파생된 단어로 하여 한국어 번역을 수정할 수 있습니다.

oodham-sol-11

이에 따라, 접미사 -t 와 -akud 의 의미를 다음과 같이 정리할 수 있습니다.

oodham-sol-12

이제 두 표를 완전히 겹칠 수가 있게 되었습니다. -t 형태 하나만 있는 golont 가 ‘갈퀴질하다’이고, -takud 형태 하나만 있는 kuintakud 가 ‘계산기’라는 것을 추측할 수 있습니다. 또, -∅, -t, -takud 형태 모두 있는 paːn, paːnt, paːntakud 는 각각 ‘빵, 제빵하다, 제빵 도구’임을 파악할 수 있습니다.

한국어 ‘빵’은 일본어 パン(pan)에서 온 것으로, 포르투갈어 pão 와 스페인어 pan 의 차용어입니다. 오오드함어가 미국과 멕시코 북부, 즉 스페인어 사용 문화권과 맞닿아 있다는 것을 생각하면 우리의 추측에 신뢰도를 더해줍니다.

이렇게 대응이 끝나면 아래와 같이 정답을 정리할 수 있습니다.

1. paːn	ᄉ. 빵
2. golont	ᄃ. 갈퀴질하다
3. paːntakud	ᄇ. 제빵 도구
4. kuintakud	ᄂ. 계산기
5. nolawtakud	ᄆ. 돈
6. paːnt	ᄅ. 제빵하다
7. nolawt	ᄀ. 구입하다
8. wakontakud	ᄋ. 세탁기
9. wakon	ᄌ. 깨끗한 옷

번역하기

‘갈퀴’는 ‘갈퀴질하다’라는 동작에 사용하는 도구이므로 golont 에 -akud 를 부착하여 golontakud 가 얻어집니다.
‘계산하다’는 ‘계산기’를 사용하여 수행하는 동작이므로 kuintakud 에서 -akud 를 빼서 kuint 가 얻어집니다.
‘빨래하다’는 ‘깨끗한 옷’를 만들어내는 동작이므로 wakon 에 -t 를 부착하여 wakont 가 얻어집니다. 또는, ‘세탁기’를 사용하여 수행하는 동작이므로 wakontakud 에서 -akud 를 빼서 wakont 가 얻어집니다.

최종적으로, 아래와 같이 답안을 정리하여 제출할 수 있습니다. 짝찾기 문제를 답할 때, 모든 데이터를 다시 제시할 필요 없이 그 번호만 나열하면 된다는 것을 유념하세요.

작성 김민규 감수 양재영