구글 실험실의 아랍어 발음부호 추가 도구 ‘타슈킬’

본 글은 원래 이글루스에 올렸던 글입니다. 이글루스가 종료되었기에 열람이 가능하도록 이곳으로 옮겼습니다. 기한이 지난 정보가 있을 수도 있고 사항에 따라 글을 쓴 후 의견이 바뀌었을 수도 있지만 오타 수정이나 발음 기호를 균일하게 고치는 것 외에는 원문 그대로 두었고 훗날 내용을 추가한 경우에는 이를 밝혔습니다. 외부 링크는 가능한 경우 업데이트했지만 오래되어 더이상 유효하지 않은 것은 그대로 남겨두었습니다. 날짜는 이글루스 게재 당시의 날짜로 표시합니다.

아랍어 한글 표기에 유용하게 쓰일 수 있는 도구를 우연히 발견해 소개한다. 구글 실험실(Google Labs)의 ‘타슈킬(Tashkeel)‘이란 베타 프로젝트인데 아랍어 글을 입력하면 발음부호를 추가해주는 도구이다(깨진 링크).

(아랍어와 아랍 문자를 모르면서 쓰는 글이기 때문에 특히 아랍 문자의 전사 같은 내용에서 틀린 부분이 있을 수 있습니다. 잘 아시는 분은 꼭 지적 부탁드립니다.)

2024. 5. 27. 추가 내용: 타슈킬의 새 주소. 하지만 현재 발음부호를 추가한 결과가 출력되지 않는 듯하다. 참고로 구글은 2011년에 구글 실험실을 폐쇄했다가 2023년에 부활시켰다.

완전한 발음을 보통 표기하지 않는 아랍 문자

아랍 문자는 보통 단자음과 장모음만 나타내기 때문에 철자만 보고는 발음에 대한 완전한 정보를 얻을 수가 없다. 이중자음이나 단모음은 글자 위나 아래 따로 조그맣게 부호를 써서 나타내지만 이런 보조 발음부호는 아랍어를 처음 배우는 학생들이나 어린이를 위한 글, 아랍어 사전, 낭독을 위해 정확한 발음을 나타내야 하는 경전 따위에서만 볼 수 있다. 간혹 비슷한 단어를 구분하기 위해 이중자음을 표시하는 부호를 쓰는 정도이다.

아랍어 발음을 아는 이들은 이중자음과 단모음을 표시하지 않은 글을 보아도 원 발음을 쉽게 짐작할 수 있지만 아랍어를 모르는 입장이라면 글을 보고도 발음을 몰라 답답할 수 밖에 없다. 아랍어 이름을 한글로 표기하려 해도 원 발음을 알려면 이중자음과 단모음까지 부호로 표기한 것을 참고해야 하는데 찾기가 쉽지 않다.

아랍어의 한글 표기 방법은 이미 수년 전 국립국어원에서 마련한 표기 시안이 있다. 당연한 이야기지만 이 표기 시안은 아랍어의 이중자음과 단모음까지 표기에 반영하기 때문에 부호 없이 쓰는 보통 아랍어 표기만 가지고는 적용할 수 없다.

아랍어의 모음 발음이 일정하지 않다는 어려움도 크게 작용한다. 표준 아랍어의 모음은 이론적으로 ‘아, 이, 우’ 셋 뿐이지만 방언마다 실제 나타나는 모음에서는 ‘에, 오’가 흔히 추가된다. 예를 들어 카타르의 수도 ‘도하’는 고전 아랍어로는 ‘다우하(Dawḥa)’이지만 ‘아우’가 ‘오’로 단순화되어 발음되기 때문에 ‘도하’로 알려지는 것이다. 그래서 아랍어 표기 시안은 표준 아랍어의 모음만 인정하며 ‘에이’, ‘오’로 발음이 관용화된 ay와 aw는 각각 ‘에이’, ‘오’로 적을 수 있다는 예외를 두었다. 하지만 각 지역의 현실 아랍어 모음이 표준 아랍어와 달라진 예는 이에 그치지 않는다.

정부 언론 외래어 심의 공동위원회 제88차 회의(2009년 12월 3일)에서는 모로코인 Nawal El Moutawakel (نوال المتوكل‎)의 표기를 ‘나왈 엘무타와켈’로 정했다. 표준 아랍어 모음을 확인하기가 어려워서였는지 몰라도 표준 아랍어 모음을 따르는 것은 포기하고 로마자 표기에 나타난 모로코 현지 발음을 따랐다.

‘타슈킬’ 시험하기

구글 실험실의 베타 프로젝트 가운데 하나인 ‘타슈킬’은 발음부호 없이 쓰인 아랍어에 발음부호를 자동적으로 더해주는 도구이다. 사용자들이 구글 실험실에 남긴 덧글들을 보니 아직 오류가 있는 듯하다. 특히 아랍어 문법에 따라 모음이 바뀌는 경우는 자동적으로 나타내기 힘든 모양이다. 하지만 우리가 관심을 가지는 고유명사의 경우는 모음이 바뀌는 경우가 드물 테니 믿어보기로 하자.

예전에 궁금했던 아랍어 이름 가운데 그리스어 ‘엘레판티네(Ἐλεφαντίνη)’에서 유래하여 영어로는 Elephantine이라고 알려져 있는 이집트의 지명을 입력해 보았다. Elephantine은 나일 강의 섬으로 오늘날 아스완 시의 일부이다. 영어판에서 언어 링크로 들어간 아랍어판 위키백과에 실린 아랍어 표기는 ‘جزيرة إلفنتين’이다. 아랍 문자를 그대로 로마자로 전사하면 ǧzyra ʾalfntyn이다.

이것을 구글 타슈킬에 입력해봤다. 가운데 창에 아랍어 표기를 복사해서 붙이고 밑의 단추를 누르니 발음부호를 더한 결과가 다음과 같이 나왔다.

아래 큰 글씨가 모음부호를 추가한 표기 ‘جَزِيْرَة إلْفِنَتَين’이다. 로마자로 전사하면 ǧazīrat ʾilfinatayn이다. 아랍어 표기 시안에 따라 한글로 적으면 ‘가지라트 일피나타인’, 즉 ‘일피나타인 섬’이다(jeltz님의 지적으로 표기 수정).

여기서 ‘섬’을 뜻하는 ǧazīra(t)는 로마자 전사 방식에 따라 jazīra가 될 수 있는데 ǧ가 이집트에서는 [g], 다른 곳에서는 보통 [dʒ]로 발음되기 때문이다. 아랍어 표기 시안에서도 이집트 이름에서만 ‘ㄱ’으로 적고 보통은 ‘ㅈ’으로 적도록 하고 있다. 카타르의 ‘알자지라(Aljazeera)’ 방송국 이름도 동일한 단어이다. ‘알’은 아랍어의 정관사이고 ‘(아라비아) 반도’를 뜻하는 줄임말로 ‘섬’이란 이름을 쓰는 것이다.

이것은 물론 표준 아랍어 발음을 따른 것이다. 이집트 구어체 발음은 어떨까? 이집트에서는 단모음 i가 [e]가 되고 이중모음 ay는 장모음 ee가 되는 듯하니 이집트 구어체 발음으로는 ‘엘페나텐(Elfenateen)’ 정도가 되지 않을까 추측해보지만 확인할 길이 없다. 사실 표준 발음도 제대로 알아낸 것인지 자신이 없다.

2024. 5. 27. 추가 내용: 여러 정보를 종합하면 إلفنتين의 표준 문어체 아랍어 발음은 إِلْفَنْتِين 즉 ʾIlfantīn ‘일판틴’으로 보인다. 이집트 구어체 아랍어 발음은 الفنتين Elfantīn ‘엘판틴’ 정도로 보인다.

‘나왈 엘무타와켈’로도 시험해 보았더니 nawāl al-mutawakkil이 나왔는데 아랍어 표기 시안을 따르면 ‘나왈 알무타왁킬’이다. 이중자음 kk를 따로 표시하지 않는 기존 관습으로는 ‘나왈 알무타와킬’이 무난할 것이다.

2024. 5. 27. 추가 내용: نوال المتوكل의 표준 문어체 아랍어 발음은 Nawāl al-Mutawakkil이 맞고 2020년에 본 웹사이트에서 공개한 문어체 아랍어의 한글 표기 권고안에 따르면 정관사 al-을 한글 표기에서 생략한 ‘나왈 무타와킬’이다. 대신 현대 모로코 인명이므로 통용 로마자 표기에 나타난 모로코 구어체 아랍어 발음에 따라 ‘나왈 엘무타와켈’로 적는 것이 좋겠다.

표준 발음이냐 현지 구어체 발음이냐

아랍어를 한글로 표기할 때 표준 발음과 현지 구어체 발음을 가운데 무엇을 따라야 할까? 아랍어를 공부하는 이들은 표준 아랍어부터 배운다. 또 표준 아랍어는 아랍어권 전역에 통한다는 장점이 있다. 아랍어권에서 교육을 받은 이들은 모두 표준 아랍어를 어느정도 구사할 수 있다.

그러나 실생활에서 쓰는 발음은 현지 구어체 발음이며 다른 문자권에 알려지는 표기도 현지 구어체 발음을 따를 때가 많다. 우리에게 낯익은 아랍어 이름은 현지 구어체 발음을 따른 것이 대부분이다. 이집트의 ‘나세르’, ‘엘알라메인’은 알아도 ‘나시르’, ‘알알라마인’은 낯설다. ‘히즈불라’보다는 ‘헤즈볼라’가 더 잘 알려져 있다.

그런데 만약 현지 구어체 발음을 따른다고 생각하면 이집트 아랍어, 레반트 아랍어, 사우디아라비아 아랍어, 걸프 아랍어, 이라크 아랍어, 수단 아랍어, 마그레브 아랍어 등 크게 잡은 분류로만해도 만만치 않은 여러 지역 발음을 연구해야 하는 어려움이 있다. 이들 발음에 대한 정보도 찾기 어려울 것이다. 다만 아랍어 이름이 로마자로 표기될 때는 보통 현지 구어체 발음을 따르니 로마자 표기를 참고하여 모음 표기를 따를 수 있을 것이다. 프랑스어권이기도 한 모로코, 알제리, 튀니지, 레바논의 아랍어 이름은 대부분 현지 구어체 발음에 따라 정해진 로마자 표기가 있다.

현재로서는 역사 인명, 종교 용어 등은 표준 발음을 따르고 현지 구어체 발음으로 더 잘 알려진 현대 인명이나 지명은 현지 구어체를 따르는 것이 무난할 것이다. 어느 쪽이든 올바른 발음 정보를 얻는 것이 급선무이다.

2024. 5. 27. 추가 내용: 아랍어권에서 쓰이는 고유 명사는 다른 언어에서 들어온 것이 많기 때문에 문어체 아랍어 발음 자체가 정해지지 않은 경우가 많다. 그러니 현대 인명, 지명은 구어체 발음에 따라 표기하는 것이 좋다는 입장이다.

공유하기

댓글 달기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다