본문 바로가기
BI/인공지능

LLM에게 한국어 문헌을 떠먹여줘야 합니다

by wizmusa 2023. 6. 30.

아래와 같은 멋진 문구를 보게 되었는데, 출처와 저자를 알지 못해 검색을 했습니다. 검색결과 상단에서는 답을 찾을 만한 자세한 글이 나오지 않았습니다.

學者所患은(학자소환) 惟有立志不誠(유유입지불성)이요,
才或不足(재혹부정)은 非所患也(비소환야)니라.
無才而不妨爲君子(무재이불방위군자)요, 
有才而不免爲小人之歸(유재이불면위소인지귀)니,
只在爲學(지재위학)은 立志如何耳(입지여하이)니라.

배우는 사람이 근심할 바는 오직 뜻을 세움이 정성스럽지 못함에 있고
재주가 혹시 부족한 것은 근심할 바가 아니다.
재주가 없어도 군자가 되는데 방해가 되지 않고
재주가 있더라도 소인으로 되돌아 감을 면하지 못하니
다만 학문을 함은 뜻을 세움이 어떠한 가에 달려 있을 뿐이다.

[출처] 실용한문 | 작성자 BW

 

지푸라기를 잡는 심정으로 ChatGPT를 비롯한 LLM(Large Language Model) 챗봇에게 물어보았습니다. 할루시네이션(환각)이 작렬하는, 가관도 아닌 결과들이 나왔습니다.

 

퇴계 선생은 저런 책을 쓴 적이 없습니다. 고려시대 재상 이규보가 역사책인 '동국이상국집'을 쓰기는 했습니다.
퇴계 선생은 저런 책을 쓴 적이 없습니다. 자꾸 이황을 언급하는군요. 문헌에 많이 나온 양반이라 친근한가 보죠?
대망의 GPT-4는 뜬금 없이 1984년 운운합니다. 이언복을 검색해 보니 임진왜란 때 이야기만 나옵니다.

유망주 끌로드도 마찬가지로 난데없이 고려시대에 역사서 '제왕운기'를 저술한 이승휴를 들고 나왔습니다. 저런 얘기를 했다는 기록은 찾지 못했습니다.

한국어와 중국어의 차이라고 해도 이 정도는 아닐 텐데 무슨 일인가 싶어서 검색을 더더더 해보았습니다. 결국 저말이 나온 문헌을 언급한 글이 나왔습니다.

 

學者所患은 惟有立志不誠이요 才或不足은 非所患也니라. 無才라도 而不妨爲君子요 有才라도 而不免爲小人之歸니 只在爲學에 立志如何耳니라. ≪학봉집(鶴峯集)≫

[출처] 천재교육 한문교과서 원문(고등한문) | 작성자 천사79

 

저 문구는 조선시대 학자 김성일이 쓴 글을 모은 학봉집에 나왔고,

학봉집

조선시대 문신이자 학자 김성일의 시가와 산문을 1649년에 간행한 시문집

https://encykorea.aks.ac.kr/Article/E0060838

 

관련한 내용을 더 찾다 보니, '학봉집' 번역본이 한국고전종합DB에 있음을 찾아냈습니다. 찾았던 문구는 김성일이 글로서 남긴 게 아니라 평소에 했던 말을 후손들이 '행장'(https://encykorea.aks.ac.kr/Article/E0062834)에 기록한 것이었습니다.

 

한국고전종합DB
학봉집 내에서 문구를 검색하는 화면

아마 한국고전종합DB의 자료는 LLM 학습 데이터에 들어가지 못한 모양입니다. 정부가 보존하고 운영하는 데이터부터 상용과 오픈소스를 가리지 말고 LLM 학습에 제공해야 대한민국 전반적으로 경쟁력이 향상하게 될 겁니다. 특히 한글만이 아니라 한문으로 쓰인 자료가 외면 당하게 해서는 한국어 문헌 자료가 엄청나게 부족해집니다. 반만년 역사라면서 문헌은 빈약하다고 오해를 받기 십상입니다. 이대로 두면 겉은 자동번역으로 한국어일지라도 알맹이는 양코배기인 내용만 인공지능이 읊어댈지도 모릅니다. 결국은 외국인 관점에서 한국에 대한 이해도가 떨어질 것입니다. 저는 그런 꼴은 못 보겠습니다.


반응형

한국에서 의무교육을 받은 성인이라면 '배우는 사람이 근심할 바는 오직 뜻을 세움이 정성스럽지 못함에 있고 재주가 혹시 부족한 것은 근심할 바가 아니다' 같이 멋진 발언을 한 사람을 압니다. 처음 보는 이름이라고요? 아닐 겁니다. 스쳐지나갔을 뿐입니다. 김성일은 바로 임진왜란 전에 왜에 간 사신 중 하나로 풍신수길이 쳐들어오지 않을 것이라는 오판을 한 사람입니다. 참으로 아이러니한 일이었습니다. 조선 사신을 몇 달씩 기다리게 하며 무시하던 풍신수길에게 항의하며 면담을 성사시킨 것도 김성일이었습니다. 김성일이 아니었으면 조선 사신단은 아무런 소득 없이 귀국해야 했을 겁니다. 꽤나 존경 받던 사람이라 당대에는 심지어 왜란 중에도 워낙 공이 커서 사회적으로 매장 당하지는 않았지만, 후대에는 상대적으로 오판했던 일만 기억에 남아 그에 대한 비아냥이 조선왕조실록에 실릴 지경이었습니다. (https://sillok.history.go.kr/id/kua_11607008_002)

 

비록 김성일은 판단 착오를 했어도 왜란 발발 이후에는 정말 노력을 많이 했으며 결국은 임진왜란 격전지로서 둘째 가라면 서러울 진주성에서 병사했습니다. 행장에는 이 시기의 맥락을 모르면 뜬금 없게만 느껴질 정도로 곽재우 장군 이야기가 많이 나옵니다. 곽재우 장군이 누명을 쓴 상황에서 김성일이 적극적으로 변호하여 목숨을 건지게 한 미담이 길게 실렸습니다. 실제로 임진왜란 초기에는 최초로 승리를 거둔 장수 신각(申恪, https://encykorea.aks.ac.kr/Article/E0032600)이 조정의 성급한 오해로 참형을 당한 일(https://sillok.history.go.kr/id/kna_12505018_004 및 https://sillok.history.go.kr/id/kna_12712021_002)이 있었을 정도였기에 정말로 위급한 상황이었습니다. 행장을 쓴 후손들은 왜란을 막지 못한 원흉이라는 악담을 들었던 김성일이 충무공 이순신 장군 못지 않게 공이 큰 홍의장군 곽재우를 살렸다는 공을 부각하고 싶었을 것입니다.

반응형