작품작가작업 (piece-artist.work)

김나희
김나희는 서울과 뉴욕을 기반으로 활동하는 작가, 웹 프로그래머이다. 생명정치적인 관점에서 (사회적으로) 코드화된 인간의 섹슈얼리티와 생식과정에 관심을 가지고 있으며, 이를 바탕으로 인간의 성적 욕구에 대한 코드를 작성하거나 그것에 대한 실험적인 내러티브 영상, 웹페이지를 제작한다. 서울을 기반으로 활동하는 아티스트 콜렉티브 ‘업체eobchae’의 일원이다.

세마 코랄의 커미션 연구로, 미술작가 김나희는 서울시립미술관에 소장된 작품의 해제 텍스트를 자연어 처리(natural language processing) 알고리즘으로 분석해서, 작가 성별에 따라 단어 사용 양상이 어떻게 달라지는지 살펴보는 〈작품작가작업〉)(2021)을 제작했다.

〈작품작가작업 piece-artist.work 웹사이트의 메인 페이지에는 여성, 남성, 전체 성별 카테고리별로 해제에 다빈도로 등장한 단어 500개가 빈도순으로 나열되어 있다. 빈도수 1, 2, 3위의 ‘작품’, ‘작가’, ‘작업’처럼 전 카테고리에 걸쳐 유사한 단어 사용 양상이 보이는 듯하다가도 ‘역사’, ‘기억’, ‘현재’ 등의 단어에서는 성별에 따라 사용 빈도에 상당한 차이를 보인다. 이러한 차이를 발견하고 그 이유를 추측해보는 과정이 흥미롭다는 생각이 들어, 단어별로 사용 빈도를 쉽게 비교하고 실제로 단어가 포함된 작품과 텍스트를 바로 불러볼 수 있는, 일종의 툴로써 이 프로젝트를 기획 및 제작하게 되었다.

그러나 웹사이트를 통해 드러난 성별 단어 사용 양상의 차이를 작가 성별에 따른 해제 언어 선택의 차이로 읽어내기에는 다음과 같은 한계점이 존재한다. 우선 일부 소장품(전체 66.72%)에만 해제가 데이터로 저장되어 있다. 또한 해제 텍스트가 데이터화되는 과정에서 생기거나 수정하지 못한 맞춤법적 오류도 상당수 포함되어 있어, 자연어 처리 알고리즘에 의해 단어로 인식되지 못한 경우도 있었다. 알고리즘 자체의 문제점도 존재한다. 동음이의어를 구분하지 못해 모두 하나의 단어로 처리한 경우, 한 글자로 구성된 단어의 경우(ex. ‘수’) 두 글자 이상에 단어에 해당 단어가 포함되었을 때도 독립된 단어로 인식되는 경우(ex. ‘수’묵)가 있었다.

이렇게 한계점을 인식하고서도, 스크롤을 이리저리 움직이며 차이가 날 법한 단어들을 점찍어보고 수치를 비교해보는 과정에서 흡사 게임을 하는 것 같은 즐거움을 느꼈다. 개인적으로 진행한 데이터 감상 과정에서, 직관적으로 떠올렸던 가설들이(ex. 감정을 묘사하는 단어들은 여성 작가의 해제에서 더 자주 등장할 것이다.) 양적으로 적중하는지 살펴보고, 작품과 해제를 읽으며 내용적인 측면에서 가설이 어떻게 강화되거나 거부되는지 분석해보고자 했다. 이런 과정이 서로 다른 관점으로부터 수행되었을 때, 더 많은 것을 발견하고 이야기 할 수 있을 것 같아 협업자들의 도움을 받아 부가적으로 ‘코멘트(Comments)’ 기능을 운영하고자 한다. 이 기능을 통해 여러 분야에서 활동하고 있는 협업자들이 <작품작가작업>에서 주목하게 되었던 단어별로 남긴 감상과 의견을 공유할 예정이다. 협업자들의 코멘트는 2021년 10월 오픈 이후 약 3개월에 걸쳐 웹사이트에 꾸준히 추가될 계획이다.

—김나희 작가노트, 2021.