베수비오 화산 폭발로 탄화된 고대 두루마리를 AI의 도움으로 읽다

본 글은 원래 페이스북에 올렸던 것으로 원문은 여기에서 확인 가능합니다. 날짜는 페이스북 게재 당시의 날짜로 표시합니다.

서기 79년 베수비오 화산 폭발로 인해 폼페이와 함께 화산재에 묻힌 고대 로마 도시 헤르쿨라네움(Herculaneum)에서 발견된 탄화된 파피루스 두루마리의 일부를 펼치지 않고도 AI 기술을 활용하여 읽는 경진 대회인 베수비오 챌린지(Vesuvius Challenge)에서 2023년 대상 수상팀을 발표했다. 이들은 주최측이 제공한 CT촬영 데이터에서 2000자 이상을 판독해내는 데 성공했다. 자세한 내용은 링크에서 볼 수 있다(사진도 링크에서 가져온 것이다).

헤르쿨라네움의 이른바 파피루스 저택(Villa dei Papiri/Villa of the Papyri)은 1752년에 발견되었는데 두루마리 1800개 이상을 보관한 도서관이 보존되어 있었다. 화산 폭발 때 산소가 부족한 공간에서 극심한 고온의 화산재에 덮이는 바람에 두루마리가 순식간에 탄화되어 발견 당시 그냥 숯덩이로 오해되었다. 그래서 일부는 버려졌는데 희미하게 글자가 적힌 것이 발견되면서 이들이 두루마리 뭉치였다는 것을 깨닫게 되었다.

그러나 탄화된 두루마리는 쉽게 부서졌기 때문에 이들을 펼쳐 읽으려는 과정에서 많은 두루마리가 손상되었으며 펼치자마자 잉크가 바래기 시작했기 때문에 읽기가 어려웠다. 그래도 여러 방법을 동원하여 20세기 중반까지 두루마리 585개가 완전히 펼쳐졌고 209개는 일부 펼치는 데 성공했다. 해독된 문서 가운데는 기원전 1세기 에피쿠로스학파 철학자이자 시인인 필로데모스(Φιλόδημος/Philodēmos, B.C.110?~B.C.40?/B.C.35?)의 고대 그리스어로 된 저작이 다수 발견되었다. 오늘날의 요르단 출신인 그는 헤르쿨라네움에서 생애를 마쳤기 때문에 파피루스 저택의 도서관은 필로데모스 본인이 집성한 것으로 추측하기도 한다.

21세기에 들어서면서 발전된 기술을 통해 두루마리를 펼치지 않고도 읽으려는 시도가 이루어졌다. CT촬영을 통해 단면의 영상을 추출할 수 있었지만 이 방대한 데이터에서 두루마리에 적힌 문자를 추출하려면 복잡한 계산이 필요했다. 그래서 2023년 3월 15일 미국의 냇 프리드먼(Nat Friedman [ˈnæt ˈfɹiːd.mən]), 대니얼 그로스(Daniel Gross [ˈdæn.jəl ˈɡɹoʊ̯s]), 브렌트 실스(Brent Seales [ˈbɹɛnt ˈsiːlz])는 100만 달러 이상의 상금을 내걸고 프랑스 학사원에 소장된 두루마리의 고해상도 CT촬영 데이터를 공개하여 2024년 1월 1일을 마감으로 140자 이상으로 된 구절 네 개를 판독하되 글자를 85% 이상 식별하는 것을 목표로 하는 베수비오 챌린지를 시작했다.

이집트의 유세프 나데르(Youssef Nader, 표준 문어체 아랍어: يوسف نادر Yūsuf Nādir, 이집트 아랍어: Yūsef Nāder), 미국의 루크 패리터(Luke Farritor [ˈluːk ˈfæɹ.ᵻt.əɹ]), 스위스의 율리안 실리거(Julian Schilliger [ˈjuːli̯a(ː)n ˈʃɪliɡɐ])로 이루어진 대상 수상팀은 기계 학습을 통해 자그마치 열다섯 단, 2000자 이상을 판독하여 목표를 초과 달성하였다. 다른 세 개 팀도 비슷한 분량을 판독하여 공동 2위를 수상하였다.

21세 대학생인 패리터는 작년 10월에 두루마리에서 온전한 단어 하나를 최초로 판독하여 첫 글자 상(First Letters Prize)을 수상한 바 있으며 베를린에서 박사 과정을 밟고 있는 나데르도 몇 주 후에 같은 단어를 판독하여 첫 글자 상 2위에 올랐다. 이들은 로봇공학 학생으로서 세분화 도구(Segmentation Tooling) 상 세 개를 받은 실리거와 힘을 합쳐 2023년 대상을 딴 것이다. 패리터와 나데르가 판독한 단어는 ‘자주색’을 뜻하는 ΠΟΡΦΥΡΑϹ(PORPHYRAS) ‘포르피라스’였다. 자주색을 뜻하는 고대 그리스어 πορφύρα(porphýra) ‘포르피라’의 단수 속격형 또는 복수 대격형 πορφύρας(porphýras) ‘포르피라스’로 보인다. 여기서 Ϲ는 고전기에 Σ로 썼던 그리스 문자 자모 시그마가 헬레니즘 시대 이후 필기체에서 단순화된 이른바 신월형 시그마(lunate sigma)로 자형은 비슷하지만 로마자 C와는 다르다. 원문은 대소문자 구별이나 발음 구별 기호, 공백이나 구두점 없이 썼으며 당대에 유행한 신월형 시그마 Ϲ를 썼다.

새로 판독된 글은 철학서의 일부로 보이며 어쩌면 필로데모스가 음악에 관하여 쓴 저작일 수도 있다. 베수비오 챌린지에서는 전문가들이 전사한 원문 일부를 공개했는데 마지막 부분에서는 쾌락(ἡδονή/hēdonḗ ‘헤도네’)에 대한 언급이 있다.

col. -2, ll. 2-8:
2 ἑ̣κάϲτηϲ κριτηρίων
θεωροῦνται. πρὸϲ δὲ
οὔτε καθόλου περὶ
5 ἡδονῆϲ ἐχόντων τι
λέγειν οὔτε περὶ τῆϲ
κατὰ μ̣έ̣ρο̣ϲ̣, ὅ̣τε ὡ-
8 ριϲμένον τι, ἀλλ’ οὖν

다음과 같은 해석을 제시한다.

“have nothing to say about pleasure, either in general or in particular, when it is a question of definition.”
‘정의하는 문제라면 일반적으로나 구체적으로나 쾌락에 대해 할 말이 없는’

고대 그리스 철학자 에피쿠로스(Ἐπίκουρος/Epíkouros, B.C.341~B.C.270)가 창시한 에피쿠로스학파는 쾌락을 인생 최고의 목표로 보는데 이들이 말한 쾌락은 고난을 줄이는 것에 중점을 두고 지나친 탐닉을 경계했기 때문에 오늘날 흔히 떠올리는 쾌락주의와는 거리가 있다.

이번에 판독된 내용은 두루마리 하나의 5%에 해당하는데 베수비오 챌린지는 두루마리 1호에서 4호까지의 각각 90%를 판독하는 것을 2024년 대상 목표로 삼았으며 장기적으로 나머지 800개 두루마리를 모두 판독하는 것을 목표로 삼고 있다. 사실 고대 철학을 연구하는 이가 아니라면 철학서보다는 아직 읽지 못한 두루마리 가운데서 오늘날 전해지지 않는 고대 문학 작품이라든지 역사서 따위를 찾을 수 있지 않을까 기대할 것이다. 또 언어에 관심이 있는 이들이라면 고대 이탈리아 남부에서 쓰인 언어였던 오스크어나 카르타고에서 쓰인 포에니어 등 잘 알려지지 않은 고대 언어로 된 글을 찾고 싶어할 것이다. 파피루스 등에 적은 문서는 세월이 지나면서 쉽게 파괴되기 때문에 오늘날 전하는 고대 문서는 금석문이나 고대 이집트 무덤 따위의 극도로 저습한 환경에서 운좋게 보존된 것이 아니라면 후대에 베껴 쓴 필사본으로 전해지는 것뿐이므로 아직까지 읽지 못했던 두루마리 수백 개의 비밀을 조만간 풀 수 있게 된다면 보물 창고가 열리는 셈이다. 하지만 지금까지 파피루스 저택에서 찾은 두루마리는 철학서 위주인 것으로 보이니 너무 큰 기대를 하면 실망도 클 수 있겠다.
———
폼페이와 헤르쿨라네움을 멸망시킨 화산을 《표준국어대사전》에서는 ‘베수비오-산(Vesuvio山)’으로 싣고 있으며 ‘베수비어스-산(Vesuvius山)’을 ‘베수비오산’의 영어 이름으로 싣고 있다. Vesuvio [veˈzuːvjo] ‘베수비오’는 이 화산의 이탈리아어 이름이다. 외래어 표기법에서는 이탈리아어의 철자 s가 [z]로 발음되더라도 [s]로 적는다. 이탈리아 남부에서는 s가 보통 [s]로 발음되기 때문에 현지 발음은 [veˈsuːvjo]이다.

이 이름은 라틴어 Vesuvius ‘베수비우스’에서 왔다. 고전 라틴어에서는 v가 [w]로 발음되었기 때문에 당시 발음은 [wɛˈsuː(w)ɪʊs] ‘웨수위우스’ 정도였을 것이지만 후에 통속 라틴어에서 유래한 이탈리아어를 비롯한 여러 로망어에서 v는 [v]로 바뀌었기 때문에(에스파냐어에서는 더 나아가 [b]로 바뀌었다) 외래어 표기법에서는 라틴어 v를 ‘ㅂ’으로 적는다. 그래서 Vesuvius는 ‘베수비우스’로 적는 것이 옳다. 원래 라틴어에서는 v와 u의 구별이 없이 V 비슷한 자형을 썼지만 중세에 이 자모가 자음으로 발음될 때 v, 모음으로 발음될 때 u로 구별하기 시작했다. 고전 라틴어에서 v가 [w]로 발음되었다는 것은 자음으로 쓰일 때의 일이고 u는 긴 모음 [uː] 또는 짧은 모음 [ʊ] 정도로 발음되었다.

영어에서는 Vesuvius를 라틴어 철자 그대로 쓰되 [vᵻ.ˈs(j)uːv.i‿əs] ‘비수비어스/비슈비어스’라고 발음한다. 여기서 [ᵻ]는 [ɪ] 또는 [ə]로 발음되는 약화된 모음을 나타내는 기호이니 ‘버수비어스/버슈비어스’로 쓸 수도 있다. 하지만 《표준국어대사전》에 실린 ‘베수비어스’는 엄밀히 말해서 외래어 표기법에 따른 표기가 아니다. 그러나 Helen [ˈhɛl.ᵻn] ‘*헬렌’, Kennedy [ˈkɛn.ᵻd.i] ‘*케네디’, Nebraska [nᵻ.ˈbɹæsk.ə] ‘*네브래스카’ 등 기존 표기에서 철자 e가 [ᵻ] 즉 [ɪ] 또는 [ə]로 발음되는 것을 그냥 ‘에’로 적은 관용 표기를 인정한 경우가 많다. 그러니 ‘베수비어스’도 비슷한 관용 표기로 볼 수 있다. 하지만 이탈리아에 있는 화산 이름을 한국어에서 구태여 영어 발음에 따라 표기할 이유는 없다.

아마도 현지에서 이탈리아어로 Vesuvio라고 부른다는 것은 알았는데 Vesuvius는 단순히 영어 이름이라고만 생각한 것으로 보인다. 하지만 Vesuvius는 라틴어 이름을 영어에서 그대로 가져온 것이다. 라틴어 표기 원칙에 따라 ‘베수비우스’로 적어야 한다.

산과 같은 자연 지형 이름을 고대어에 따라 적을지, 현대어에 따라 적을지는 조금 까다로운 문제이다. 중국 문명이 발상한 강은 외래어 표기법에 따르면 현대 중국어 이름 黄河/黃河[Huáng Hé] ‘황허’에 ‘~강’을 붙여 ‘황허강’으로 부르는 것이 원칙인데 특히 역사를 논할 때는 한국 한자음에 따라 그냥 ‘황화(黃河)’라고 부르는 것이 익숙한 이들이 많을 것이다. 현대 중국어 이름 泰山[Tài Shān] ‘타이산’에 ‘~산’을 붙인 ‘타이산산’은 ‘태산(泰山)’으로 훨씬 더 익숙하다.

한자 이름에 의미가 겹치게 ‘~강’, ‘~산’을 덧붙이는 문제는 논외로 하더라도 동아시아의 자연 지형 이름 가운데는 현대어 이름보다 예로부터 쓰인 한국 한자음 이름이 익숙한 경우가 많은 것처럼 고대 역사와 관련된 자연 지형 가운데는 현대어보다는 고대어 이름이 익숙한 경우가 종종 있다. 기원전 49년에 율리우스 카이사르(Julius Caesar)가 건넌 것으로 유명한 이탈리아 북부의 강도 현대 이탈리아어로 루비코네(Rubicone)강보다는 라틴어 이름인 루비콘(Rubicon)강으로 더 익숙하다(라틴어로는 Rubicon ‘루비콘’과 Rubico ‘루비코’가 둘 다 쓰였다). 동양에서 태산이 관용구에 쓰이는 것처럼 루비콘강을 건넌다는 표현이 서양에서 관용구로 쓰이기 때문에 현대어 이름을 쓰면 어색하다.

황허강/황하 얘기가 나온 김에 고대 세계의 주요 강 이름을 논하자면 고대 그리스어 Τῐ́γρης(Tígrēs) ‘티그레스’ 또는 Τίγρις(Tígris) ‘티그리스’, Εὐφράτης(Euphrā́tēs) ‘에우프라테스’, Ἰνδός(Indós) ‘인도스’에서 온 라틴어 Tigris ‘티그리스’, Euphrates ‘에우프라테스’, Indus ‘인두스’는 오늘날 영어에서 라틴어 철자를 그대로 쓴다. 대신 발음은 영어식인 Tigris [ˈtaɪ̯ɡ.ɹᵻs] ‘타이그리스’, Euphrates [ju.ˈfɹeɪ̯t.iːz] ‘유프레이티스’, [ˈɪndəs] ‘인더스’이다. 한국어에서 Tigris는 라틴어 발음에 따른 ‘티그리스강’으로 부르지만 Euphrates는 라틴어 발음을 따르되 첫부분은 영어 발음의 영향을 받은 ‘유프라테스강’, Indus는 영어 발음을 따른 ‘인더스강’으로 부른다. 이는 인더스강이 영어가 공용어 중의 하나인 파키스탄과 인도를 흐르기 때문일 것이다.

반면 고대 그리스어 Νεῖλος(Neîlos) ‘네일로스’, 라틴어 Nilus ‘닐루스’로 부른 강은 영어에서 프랑스어 Nile [nil] ‘닐’을 거친 Nile [ˈnaɪ̯l] ‘나일’로 쓰며 한국어에서도 영어 발음에 따라 ‘나일강’이라고 부른다.

현대어와 고대어 이름 가운데 어느 쪽을 한글로 표기할지 언제나 적용할 수 있는 통일된 기준을 마련하기는 쉽지 않을 테니 이 글에서 화산은 일단 《표준국어대사전》에서처럼 이탈리아어 이름에 따라 ‘베수비오 화산’으로 부르고 Vesuvius Challenge는 ‘베수비오 챌린지’로 옮겼다. 이를 라틴어 이름을 기준으로 ‘베수비우스 챌린지’로 옮긴 기사도 보이는데 영어에서 라틴어 철자를 그대로 쓰니 이도 물론 일리가 있다.

폼페이와 헤르쿨라네움의 유적은 오늘날의 나폴리(Napoli) 부근에 있다. 이 이탈리아 남부 지역은 기원전 8세기부터 그리스인들이 식민지를 많이 건설했으며 고대 그리스어가 많이 쓰였다. 이들 지역을 라틴어로는 ‘대(大)그리스’라는 뜻으로 Magna Graecia ‘마그나그라이키아’라고 불렀다. 이번에 판독된 글을 비롯하여 파피루스 저택에서 발견된 두루마리 가운데도 라틴어 문서보다 고대 그리스어 문서가 압도적으로 많다.

폼페이는 라틴어로 Pompeii라고 불렀고 [pɔmˈpei̯jiː]로 발음되었으니 라틴어 이름을 기준으로는 ‘폼페이이’로 적는 것이 더 가깝다. 외래어 표기법에서 장모음을 따로 표시하지 않기 때문에 ii는 ‘이’로 적어야 한다고 알고 있기도 하지만 Pom-pei-i로 음절이 나뉘므로 여기서 ii는 장모음이 아니다. 그러나 이탈리아어로는 Pompei [pomˈpɛi̯] ‘폼페이’이다. 영어로는 라틴어 철자 그대로 Pompeii라고 쓰지만 발음은 세 음절 [pɒm.ˈpeɪ̯.i(ː)] ‘폼페이이’와 두 음절 [pɒm.ˈpeɪ̯] ‘폼페이’가 혼용된다. 《표준국어대사전》에는 ‘폼페이(Pompeii)’로 실려있는데 영어 발음 가운데 두 음절로 발음한 것을 따랐거나 원어 표기와 달리 이탈리아어 Pompei를 따른 것으로 풀이할 수 있다.

참고로 ‘폼페이 사람’을 뜻하기도 하고 이름으로도 쓰인 Pompeius ‘폼페이우스’는 영어에서 Pompey로 줄여 부르는데 [ˈpɒmp.i] ‘폼피’로 발음하므로 철자 때문에 ‘폼페이’와 혼동하지 않도록 주의해야 한다.

‘헤르쿨라네움’은 라틴어 이름 Herculaneum을 따른 표기이고 이탈리아어로는 Ercolano ‘에르콜라노’라고 한다. 영어로 Herculaneum은 [ˌhɜːɹk.jᵿ.ˈleɪ̯n.i‿əm] ‘허큘레이니엄’이라고 발음하니 《표준국어대사전》의 ‘헤르쿨라네움(Herculaneum)’은 영락없이 라틴어를 원어로 본 표기이다.

오늘날의 북아프리카 튀니지에 있던 고대 도시 카르타고에서 쓴 언어를 영어로는 Punic이라고 부르는데 ‘카르타고의’를 뜻하는 라틴어 형용사형 Punicus ‘푸니쿠스’에서 나온 말이다. 이는 고대 그리스어 Φοῖνιξ(Phoînix) ‘포이닉스’에서 나온 Poenicus ‘포이니쿠스’의 후기 형태이다. 고대 그리스어 Φοινίκη(Phoiníkē) ‘포이니케’에서 나온 라틴어 지명 Phoenicia ‘포이니키아’와 관련되었다. 《표준국어대사전》에는 이중모음 oe [oe̯] ‘오이’가 [eː] ‘에’로 단순모음화된 후기 라틴어식 발음을 따른 표기인 ‘페니키아(Phoenicia)’로 실려있다. 오늘날의 레바논을 중심으로 하는 지중해 동부 해안에서 나온 페니키아인들이 카르타고를 식민지로 건설했기 때문에 카르타고에서는 아프리카·아시아 어족 셈 어파에 속하는 페니키아어를 썼는데 통상적으로 카르타고에서 쓴 후기 페니키아어는 영어에서 Phoenician 대신 Punic으로 부른다.

로마와 카르타고가 벌인 세 차례의 전쟁을 영어로 Punic Wars, 라틴어로 Bella Punica 또는 옛 형태로 Bella Poenica라고 부르는데 《표준국어대사전》에서는 ‘포에니^전쟁(Poeni戰爭)’으로 쓴다. 라틴어 표기 원칙에서 고대 그리스어 οι(oi) ‘오이’에 대응되는 라틴어 이중모음 oe [oe̯]는 ‘오이’로 적어야 하므로 ‘카르타고인’을 뜻하는 복수형 Poeni는 원칙적으로 ‘포이니’로 적어야 하겠지만 ‘포에니’가 관용으로 쓰이므로 여기서는 일단 카르타고에서 쓴 언어도 ‘포에니어’라고 썼다.

공유하기

댓글 달기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다