1. 서 론
컴퓨터 매개 커뮤니케이션(Computer-mediated Communication, 이하 CMC) 상황에서 사진, 비디오등 다양한 표현 수단을 이용할 수 있게 되었음에도 여전히 사람들은 텍스트를 가장 주된 소통 수단으로 사용한다. 채팅, 온라인 게시판 등의 CMC 상황에서는 일상적인 대면 커뮤니케이션(Face-to-Face Communication, 이하 FtF)에서는 사용되지 않는 독특한 텍스트가 흔히 사용된다. 그 이유 중 하나는 컴퓨터로 매개되고 있는 상태에서 감정을 충분히 표현하기가 힘들기 때문이다. FtF 상황에서는 어조, 얼굴 표정, 몸짓 등의 비언어적 표현을 사용하여 감정을 전달할 수 있으나 텍스트만 전달되는 CMC 상황에서는 말의 내용만이 전달되기 때문에 비언어적인 표현을 대체할 만한 부가적인 수단이 필요하다. 느낌표나 물음표와 같은 구두점의 활용, 얼굴 표정을 글자나 문자로 표현하는 이모티콘, 글씨체나 글씨 크기와 같이 텍스트가 화면에 표시되는 모양새를 활용하는 타이포그래피, 이미지나 애니메이션 형태의 아이콘 등은 텍스트 문장만으로는 충분하지 않은 감정 전달을 돕기 위한 도구들이다.
문화권마다 감정 표현 방식이 다르고 텍스트 기반의 표현에 동원할 수 있는 문자 환경도 다르기 때문에 CMC 상황에서 감정을 드러내는 방법은 나라마다 조금씩 차이를 보인다. 우리나라에서 두드러지게 나타나는 특징 중 하나는 한글의 자모음을 독립적으로 활용하는 방법을 사용한다는 점이다. 한글의 자음 또는 모음은 그 자체만으로는 아무런 의미도 지니지 않지만 한국의 인터넷 공간에서는 몇몇 자모음이 의성어 또는 의태어로써 감정표현의 역할을 담당한다. 대표적인 예로 ‘ㅋ’의 사용을 들 수 있다. “크크크”, “킥킥킥”과 같이 음절이 반복되는 의성어에서 최소한의 음소만을 남기고 생략한 결과 ‘ㅋ’을 연속적으로 사용하게 되었으며, 온라인 환경에서는 웃음소리를 묘사하는 관용구처럼 인식되고 있다[1]. 그 외에도 감정 표현을 위해 독립적으로 사용되는 대표적인 자모음으로 ‘ㅎ’, ‘ㄷ’, ‘ㅠ’, ‘ㅜ’ 등이 있다.
인터넷 용어는 유행에 따라 많이 사용되다가도 금방 사라지고 마는 경우가 많은 반면, 감정을 표현하기 위해 사용되는 ‘ㅋ’, ‘ㅠ’와 같은 자모음은 오랜 시간 지속적으로 사용되는 보편적인 용어가 되었다. 그럼에도 온라인에서 사람들이 자모음을 구체적으로 어떻게 사용하고 있는지에 대해서는 충분한 연구가 이루어지지 못했다. 기존의 연구들은 통신 및 인터넷 언어사용이라는 큰 범주에서 자모음 사용을 살펴보거나 외계어 사용이라는 문제적인 시각에서 바라보았지만[2-4], 구체적으로 자모음이 얼마나, 어떻게 쓰이고 있는지를 살펴보지는 않았다. CMC 환경에서 감정을 전달하기 위한 수단에 관한 연구들 역시 대부분 자모음이 아닌 기호를 활용한 이모티콘을 중심으로 이루어졌다[5,6]. 그러나 우리나라의 온라인 공간상에서는 기호를 활용한 이모티콘보다도 자모음의 사용을 더 흔히 발견할 수 있으며 이모티콘과는 다른 특징이 있음을 고려할 때, 자모음이 사용되는 양상을 더 자세히 살펴볼 필요가 있다. 따라서 이 연구에서는 우리나라 사람들이 온라인에서 감정을 표현하기 위한 수단으로 자음 및 모음을 어떻게 사용하는지를 살펴보고자 한다. 특히 온라인 공간 중 최근 가장 활발하게 사용되는 웹 서비스 중 하나이자 우리나라 사람들 사이에서 이루어지는 다양한 종류의 커뮤니케이션을 관찰할 수 있는 페이스북(Facebook)1)의 ‘페이지’를 대상으로 하여 자음 및 모음 사용에 관한 탐색적 연구를 실시하고자 한다.
2. 관련연구
2.1 텍스트 기반 온라인 커뮤니케이션에서의 특수한 언어적 표현
컴퓨터를 매개하여 이루어지는 온라인상의 커뮤니케이션은 주로 텍스트를 통해 이루어진다. 오직 문자로만 의사를 전달하는 상황과 대면 상태에서 직접적으로 의사를 주고받는 상황은 커뮤니케이션 방식이 서로 달라질 수밖에 없다. 가장 흔히 언급되는 차이점은 ‘Cues-filtered-out’ 이론에 따른 것으로 CMC 상황에서는 커뮤니케이션에 영향을 미치는 비언어적 단서가 부족하다는 관점이다. 이에 따르면 텍스트 기반의 CMC 상황에서는 실재하는 사람의 몸이 없으므로 제스쳐, 목소리, 얼굴 표정과 같이 상호작용을 하는 데 중요한 역할을 하는 단서가 부족하게 된다. 따라서 FtF 상황에 비해 커뮤니케이션 상에 여러 가지 제약을 가지고 있다고 본다[7].
커뮤니케이션 활동 중 감정을 전달하는 상황에 있어서 비언어적 단서는 더욱 중요해진다. Cues-filtered-out 이론에서 지적되었듯이 컴퓨터로 매개된 상황에서는 비언어적인 단서를 사용할 수가 없다. 그러나 CMC 상황에서도 감정을 표현해야 할 필요성이 있으므로 사람들은 활용 가능한 수단을 최대한 동원하여 표정, 어조 등을 보완함으로써 감정을 전달한다. 카네기멜론 대학의 Scott Fahlman 교수에 의해 1982년 처음 제안된 Smiley2)와 그 이후로 등장한 여러 종류의 이모티콘들이 CMC 상황에서 감정을 전달하기 위한 노력의 대표적인 예이다. Hancock 등[8]은 사람들이 CMC 상황에서 이견표시 빈도, 부정정서 단어사용 빈도, 구두점, 그리고 반응속도라는 네 가지 전략을 사용하여 긍정적/부정적 감정을 표현하고 있음을 발견하였다. Varnhagen 등[9]은 온라인 실시간 메시징에서 발견되는 새로운 언어를 관찰하여 세가지 카테고리로 정리하였는데, 이 때 하나의 카테고리를 차지하는 것이 감정을 표현하는 언어의 사용이었으며 단어, 약어, 그리고 특정 방식의 구두점 사용이 온라인 상 감정 표현용 신조어에 포함되었다.
CMC 상황에서 감정을 충분히 전달하기 위해서 사람들이 특수한 언어적 전략을 사용하는 모습을 보이는 것은 우리나라의 온라인 공간에서도 나타나는 현상이다. 박현구[6]는 우리나라의 온라인 환경에서도 이모티콘과 같은 유사언어적 표현을 활용해 최대한 매개되지 않은 실재감을 살리고 감정을 교환하여 사회적 현실을 만들어낸다는 것을 발견하였다. 한편 단순한 형태의 이모티콘 뿐 아니라 그림이나 애니메이션으로 이루어진 아이콘, 상황을 표현하는 배경음악을 사용하는 등 다양한 방식으로 감정을 전달하고자 하는 노력이 있으며, 감정 어휘를 인식하여 감정태그를 부여하는 것과 같이 기술적으로 감정 표현을 돕고자 하는 시도도 이루어지고 있다[10]. 그럼에도 여전히 가장 일상적으로 널리 사용되는 것은 글자와 기호를 사용하는 이모티콘이다.
2.2 우리나라 온라인 공간에서의 특수한 언어사용
비언어적 단서의 부재를 보완하기 위해 특수한 언어와 기호를 사용하는 것은 온라인 공간 어디서나 보편적으로 나타나는 현상이다. 그러나 구체적으로 어떤 표현방식이 사용되는지는 문화와 언어에 따라서 달라진다. 이를테면 감정을 인식하는 데 있어 서양 문화권에서는 입 모양을 주시하고 동양 문화권에서는 눈 모양을 주시하기 때문에 동서양의 온라인 공간에서 사용되는 이모티콘의 모양도 다르다는 분석이 있다[11]. 텍스트를 기반으로 커뮤니케이션이 이루어지는 만큼 언어와 문자의 종류에 따라서도 다른 표현전략을 보이게 된다.
박현구[1]는 우리나라 인터넷 환경에서 사용되는 온라인 언어 사례를 수집하고 형태와 의미에 따라 범주를 나누어 제시하였는데, 우리나라의 온라인 언어 사용의 사례들 중 의성어/의태어를 나타내기 위해 초성을 연속적으로 사용한다는 점은 주목할 만하다. 우리나라 온라인 공간에서는 이와 같이 자음 및 모음만으로 감정을 표현하는 양상이 두드러지게 나타난다. Varnhagen 등이 제시한 영어권의 온라인 언어사용에서는 자음 또는 모음만을 사용하여 감정적인 상태를 표현하는 양상이 나타나지 않는다[9]. 반면 우리나라는 특수기호를 활용하여 표현하던 이모티콘까지도 자음 또는 모음만을 사용하는 방식으로 대체되고 있는 양상을 보이고 있다[5].
우리나라의 인터넷 공간에서 자음 또는 모음만을 사용한 감정표현 방식이 사용되는 것은 한글의 특성, 인터넷 용어가 변천되어 온 과정, 혹은 자판이 가지는 인터페이스의 특징[1] 등이 복합적으로 작용한 결과일 것이다. 그 이유를 명확히 알 수는 없지만, 우리나라 인터넷 공간상에서 자모음이 매우 빈번하게 사용된다는 것은 분명한 사실이다. 이정복[4]은 ‘ㅋ’와 같은 형태의 의성어/의태어는 이제 인터넷 상의 언어로 감정과 상황을 전달하고 있음을 나타내는 하나의 상징기호처럼 여겨질 정도라고 보았다. 그럼에도 온라인에서의 자모음 사용을 진지하게 살펴보려는 시도는 거의 이루어지지 않아 구체적으로 이들이 얼마나, 어떻게 쓰이고 있는 지는 밝혀지지 않았다. 따라서 이 연구에서는 우리나라의 온라인 공간의 자모음 사용에 관한 기본 지식을 얻는 것을 목표로 탐색적인 연구를 실시한다.
2.3 탐색적 연구공간으로서의 페이스북
온라인 공간에서 사용되는 특수한 언어표현을 탐색적으로 살펴보고자 할 때 소셜 네트워크 서비스(SNS)는 현재 가장 적절한 관찰대상이라고 할 수 있다. 한국인터넷진흥원이 발행한 2012년도 한국인터넷백서에 따르면, 2009년까지는 우리나라 웹 환경에서의 개인 간 커뮤니케이션의 중심에 싸이월드3) ‘미니홈피’가 있었지만 2009년 말 스마트폰 열풍과 함께 글로벌 SNS인 페이스북과 트위터(Twitter)4)의 사용이 비약적으로 성장하였다[12]. 싸이월드 미니홈피의 사용은 점차 감소하고 페이스북과 트위터의 사용은 점차 증가하여 2011년 말에는 글로벌 SNS의 국내 순 방문자 수가 싸이월드 미니홈피의 순 방문자수를 역전한 것으로 나타났다. SNS가 탐색적 연구에 적합한 또 다른 이유는 방대한 양의 데이터를 수집할 수 있기 때문이다. 2012년 6월 기준으로 조사된 바에 따르면 트위터에는 하루 4억 건의 글이 생성되고, 페이스북에는 320억 건의 ‘좋아요’와 댓글 기능이 사용된다[12]. 이처럼 SNS 상에 사람들이 남겨놓은 대량의 텍스트 데이터를 수집, 분석함으로써 사람들이 실제로 커뮤니케이션하는 모습을 효과적으로 파악할 수 있다.
우리나라에서 사용되는 대표적인 글로벌 SNS 서비스인 트위터와 페이스북 중 이 연구에서는 페이스북을 관찰 대상으로 한다. 이용현황을 볼 때 2011년 12월의 순 방문자수 조사 결과 페이스북(23,133명)이 트위터(21,612명)보다 많은 것으로 나타났으며[12], 2012년 7-9 월에 걸친 조사에 있어서도 페이스북과 같은 프로필 기반 서비스의 이용(21.1%)이 트위터와 같은 마이크로 블로그의 이용(13.9%)보다 높은 것으로 나타났다. 즉 우리나라에서는 트위터보다는 페이스북이 더 많이 이용되는 서비스라고 할 수 있다. 또한 사람들이 트위터와 페이스북을 서로 다른 목적을 가지고 사용한다. 트위터는 빠른 정보를 얻기 위해서, 페이스북은 연결과 커뮤니케이션 등의 관계적인 목적을 위해서 사용되는 경우가 많다[13]. 이 연구에서는 우리나라 사람들이 온라인 커뮤니케이션 상황에서 감정을 전달하기 위해 사용하는 언어표현을 살펴보고자 하므로, 정보적 목적이 중심이 되는 트위터 보다도 커뮤니케이션 용도로 주로 사용되는 페이스북이 더 알맞은 관찰대상이 된다.
뉴스피드라는 하나의 게시 방식이 중심이 되는 트위터와는 달리 페이스북은 서비스 내에 비교적 여러가지 기능과 공간을 가지고 있다. 각각의 공간은 사람들이 작성하는 텍스트로 채워지는데, 상태 업데이트 란에서 작성되어 뉴스피드 형태로 게시되는 게시글의 텍스트와 그 텍스트에 대한 반응으로 작성되는 댓글, 개인 간 메시지 및 채팅 기능을 통해 작성되는 텍스트, ‘페이지’ 란에 작성되는 텍스트와 댓글 등이 있다. 이 연구에서는 ‘페이지’에 게시되는 게시물에 작성되는 댓글 데이터를 수집하였다. 페이스북의 ‘페이지’는 개인 계정과는 달리 회사나 조직, 유명인 등이 개설하여 해당 단체의 소식을 전하는 용도로 사용되며, 최근에는 일반인이 개설하되 특정 테마에 맞는 자료를 공유하는 커뮤니티 개념으로도 활용되고 있다. ‘페이지’에 ‘좋아요’를 누르게 되면 사용자 자신의 페이스북 첫 화면인 뉴스피드에서 해당 게시물을 확인 할 수 있으며, 이 사람은 해당 ‘페이지’를 구독하는 방식이다. ‘페이지’와 달리 상태 업데이트, 메시지, 채팅 등의 기능은 커뮤니케이션이 이루어지는 대상, 빈도가 비교적 제한적이다. 반면 ‘페이지’의 경우 훨씬 광범위하고 많은 사람들이 공유하고 교류할 수 있는 공간이다. ‘페이지’의 댓글 기능을 통해 사람들은 모르는 사람들과 같은 콘텐츠를 중심으로 의견과 감정을 주고받을 수 있으며, 동시에 태그 기능을 활용하여 친한 사람들과도 직접적인 소통이 가능하다. 이처럼 다양한 양상의 커뮤니케이션이 대량으로 발생하는 공간이므로 페이스북 ‘페이지’의 댓글은 이 연구의 목적과 부합하는 대상이라고 할 수 있다.
3. 데이터 수집
페이스북 상에는 수많은 페이스북 ‘페이지’들이 존재하지만, 본 연구에서는 한국어 댓글 분석을 위해 한국 페이스북 사용자들이 많이 사용하는 ‘페이지’로 그 대상을 한정하였다. 또한 온라인 감정 표현 언어의 주된 방식을 파악할 수 있을 만큼 충분히 많은 글이 작성되는 ‘페이지’를 선정하고자 하였다. 따라서, 한국인 접속자가 많은 ‘페이지’ 중 실질적인 댓글의 사용 빈도가 높고 감정 표현이 많은 ‘페이지’가 데이터 수집 대상이 되었다. ‘페이지’의 선정을 위해서 소셜 미디어 통계를 제공하는 사이트인 ‘소셜 베이커스’에서 국가별 페이스북 사용에 관한 순위 정보를 참조하였다. 수집에 사용된 ‘페이지’는 총 6개로, 2013년 6월 29일을 기준으로 ‘페이지’에 ‘좋아요’를 누른 사용자 수가 많은 순으로 선택하였고, 최종적으로 유머 동영상, 사진, 또는 읽을거리를 제공하는 ‘페이지’들이 선정되었다.
데이터 수집은 다음과 같이 이루어졌다. 선정된 총 6개 페이스북 ‘페이지’에서 1,703개 게시물에 달린 2,554,632개의 댓글을 수집하였다(표 1). 각 ‘페이지’당 최근 300개 내외의 게시물을 대상으로 하였으나, 이 중 댓글이 허용되지 않아 분석이 불가능하거나 기타 기술적인 문제로 수집되지 않은 게시물은 제외되었다. 수집한 데이터는 모두 페이스북 웹사이트에 공개된 데이터로, 페이스북 가입자 여부에 상관없이 누구나 접근할 수 있는 정보만을 대상으로 하였다. 수집을 위한 도구로는 페이스북에서 제공하는 ‘Facebook Graph API’를 사용하였으며, 수집에 사용된 프로그램은 Ruby 언어로 작성하였다. 해당 API를 사용하면 페이스북 사이트에 웹 브라우저를 통해 접근하지 않더라도 프로그램 언어를 통해 요청하는 정보를 전송받을 수 있다.
Table 1.Basic information regarding crawled Facebook pages
수집에 사용된 댓글의 예는 그림 1과 같다. 좌측과 우측은 서로 다른 성격을 띠는 두 개의 게시물에 달린 댓글을 캡쳐한 것인데, 댓글에 사용된 한글의 자모음과 이모티콘으로 게시물의 성격을 짐작할 수 있다. 게시물은 동영상 또는 사진과 함께 게시물 작성자가 적은 메시지가 함께 노출된다. 검은색 글씨로 표시된 것이 댓글 작성자가 남긴 내용이며 이러한 댓글 텍스트가 본 연구의 대상이 되었다. 본 연구의 대상으로 선정한 ‘페이지’는 방문자가 많은 ‘페이지’를 선정하였기 때문에 일반적으로 한 게시물에 평균 수백에서 수천 개의 댓글이 작성된다(표 1).
Fig 1.The comments from two posts posted on Facebook Pages.
분석에 사용될 자모음과 이모티콘을 선정하기 위한 예비 조사로써 위의 ‘페이지’ 중 세 개의 ‘페이지’(‘세상에서 가장 웃긴 동영상’, ‘피키캐스트’, ‘오늘의 웃긴 동영상’)에 게시된 388 개 게시물의 댓글을 일차적으로 분석하였다. 한글 자모음이 독립적으로 사용된 빈도를 카운트 하였고, 박자람 · 차미영[5]의 연구에서 소셜 미디어에서 가장 많이 사용되는 것으로 드러난 이모티콘들 중 본 연구에 부합하는 특수 문자로 이루어진 이모티콘을 선택하였다. 이를 통해 가장 빈번하게 사용된 총 10 종의 자음, 모음표현 및 기호 이모티콘을 분석 대상으로 선정하여 이들이 각각의 댓글에서 쓰인 횟수 등을 정량적으로 분석하였다(표 2). 예비 조사에서 표현들이 경우에 따라 단독으로 쓰이기도 하고, 수회에서 수십 회 연속으로 쓰이는 것이 관찰되었으므로, 각각 몇 회 연속으로 쓰였는지도 기록하였다. 해당 댓글이 달린 게시물의 고유 번호인 ID와 해당 게시물이 게시된 ‘페이지’의 주소도 함께 수집하였다.
Table 2.Usage of Korean consonants, vowels and emoticons in collected comments
4. 연구결과
4.1 자모음과 이모티콘의 사용
기본적인 자모음과 이모티콘의 사용양상을 살펴보기 위해 각 표현의 사용 횟수를 표와 막대그래프로 나타내었다. 표 2에는 사용 대상으로 선정된 10개의 자모음 및 이모티콘을 총 사용 횟수를 기준으로 내림차순으로 기록하고 그림 2에서 각 표현의 사용 횟수를 막대그래프로 나타내었다. 자음, 모음, 특수문자의 구분은 막대의 색으로 나타내었다. 그림 2를 보면 세로축을 로그 스케일로 나타냈음에도 사용 횟수가 뚜렷하게 세 그룹으로 나뉨을 확인할 수 있다.
Fig. 2.Bar graph of Korean consonants, vowels and emoticons usage in collected comments.
첫 번째로 가장 뚜렷하게 보이는 특징은 ‘ㅋ’의 총 사용 횟수가 8백만 건에 가까울 정도로 기타 다른 표현보다 월등히 높다는 점이다. 두 번째로, 한글 자모음이 기호 이모티콘보다 훨씬 빈번하게 사용되고 있음이 관찰되었다. 박자람 · 차미영[5]의 연구에서, 가장 많이 쓰이는 것으로 드러난 눈웃음을 나타내는 이모티콘인 ‘^^’조차도 다른 모든 한글 자모음보다 사용 횟수가 적었다. ‘^^’을 제외한 나머지 특수문자 이모티콘들은 약 1천 건 내외의 이용횟수를 보였다.
표 2에는 해당 표현이 사용된 댓글 비율이 나타나 있다. 이는 해당 표현이 하나라도 포함되어 있는 댓글의 수를 세고 전체 댓글 수로 나누어 구한 값을 기록한 수치이다. 여기에서도 특히 ‘ㅋ’의 사용 빈도가 다른 표현에 비해 월등히 많은 것을 알 수 있다. 전체 댓글의 3분의 1에 달하는 댓글에서 ‘ㅋ’가 하나 이상 사용되고 있는 것으로 드러났다.
표 2의 해당 댓글이 포함된 비율을 보면, 총 사용 횟수의 순위와 뒤바뀐 결과가 관찰된다. 사용된 총 횟수를 보면, ‘ㅠ’가 ‘ㅎ’보다 2만여 건이 더 많지만 ‘ㅠ’가 포함된 댓글은 2.79%로, 3.02%의 댓글에서 사용된 ‘ㅎ’보다 더 낮은 비율의 사용을 보인다. ‘ㄷ’와 ‘^^’의 경우도 마찬가지로, ‘ㄷ’도 ‘^^’보다 더 사용 횟수는 많지만 사용 비율은 낮다. 이렇듯 사용 비율에 비해 사용 개수가 높게 나타나는 ‘ㅠ’와 ‘ㄷ’의 경우 하나의 댓글에서 여러 번 반복적으로 사용되고 있다는 것으로 해석할 수 있다.
표 2의 가장 오른쪽 컬럼에는 하나의 댓글에서 평균 몇 번의 표현을 사용하는지를 표시하였다. 이는 해당 이모티콘이 하나 이상 포함된 댓글에서 해당 표현이 몇 번 관찰되는지 기록한 것이다. 이를테면 그림 1에서 보이는 댓글들에서 ‘ㅋ’만으로 전체 댓글 내용을 채우는 경우, ‘ㅋ’의 평균 사용 횟수가 높아지게 된다. 특수 문자로 된 이모티콘의 경우 평균 1회를 약간 상회하는 것으로 나타나며, ‘ㅋ’과 같은 경우는 하나의 댓글 안에서도 평균 9.48회가 사용되는 것을 볼 수 있다. 본 연구에 사용된 2백 6십만 여개의 댓글의 평균 길이는 16.37글자인 것을 고려하면, 댓글 내용의 절반 이상을 ‘ㅋ’으로 채우는 경우가 있음을 나타낸다.
4.2 자모음의 연속적 사용
한 댓글 안에서 하나의 표현이 여러 번 사용될 때, 여러 번에 나누어 쓰이는 경우도 있고 연속해서 쓰이는 경우도 있다. 예를 들어 하나의 댓글 안에서 여러개의 ‘ㅋ’이 쓰일 때 문장 중간에서 쓰이는 경우가 있고, ‘ㅋㅋㅋ’과 같이 연속적으로 사용되는 경우가 있다. 연속사용 여부에 따라 표현하고자 하는 감정의 강도나 의미의 차이가 발생할 수가 있다. 따라서 연속 사용 횟수를 계산하여 표 3과 그림 3에 표현하였다. 연속 사용 횟수에 따라 1회부터 4회, 그리고 5회 이상 다섯 개의 카테고리로 나누었으며, 백분율로도 나타내었다. 그 결과 연속 사용 횟수가 표현의 종류에 따라 달라지는 것이 관찰되었다.
Table 3.Continuous usage of Korean consonants, vowels and emoticons in collected comments
Fig. 3.Percentage of the continuous usage of Korean consonants, vowels and emoticons.
‘^^’와 같이 특수 문자를 이용한 이모티콘의 경우 대부분의 경우는 좀처럼 연속으로 쓰이지 않는 것을 확인 할 수 있다. 이런 이모티콘은 주로 얼굴의 모양을 표현한 것이기 때문에 여러 개를 연속으로 사용하는 것이 의미가 없음을 직관할 수 있다. 그러나 한글 모음으로 구성된 이모티콘의 경우 특수문자 이모티콘과는 차이가 있었다. 황당함이나 언짢음을 드러낼 때 사용하는 ‘ㅡㅡ’의 경우 ‘^^’와 마찬가지로 하나의 얼굴 표정을 나타내는 용도로 사용되며, ‘ㅡㅡㅡ’와 같이 3 회 이상을 연속하여 사용하는 경우는 희박했다. 그러나 ‘ㅜ’ 또는 ‘ㅠ’의 연속 이용패턴은 ‘ㅡ’나 ‘^^’와는 달리 하나의 얼굴 표정만을 나타내기 위해 사용되는 것이 아니라 ‘ㅠㅠㅠ’나 ‘ㅜㅜㅜㅜㅜ’와 같이 더 많은 개수가 연속적으로 사용되고 있는 것으로 나타났다. ‘ㅠ’와 ‘ㅜ’는 실제로는 우는 얼굴을 표현한 것임에도, 얼굴 표정 이모티콘보다는 ‘ㅎ’나 ‘ㄷ’와 같이 의성어를 축약한 자음의 연속 이용패턴과 더욱 유사한 사용양상을 보인다. 심지어 5회 이상 연속으로 사용되는 경우도 많음이 관찰된다.
그림 3을 보면 ‘ㅋ’의 경우 다른 한글 자모음과는 다른 독특한 패턴이 관찰된다. 다른 자모음은 1-2회의 연속사용에 집중된 경향을 보인다. 반면 ‘ㅋ’의 경우 5회 이상 연속적으로 쓰이는 경우가 특히 많은 것으로 분석되었다. ‘ㅋ’는 경우에 따라서 수십 회 반복하여 긴 길이로 사용되어 감정을 표현하게 된다. 이를 통해 짧게 표현했을 때와 구분되는 의미상의 강조를 나타내거나 의미의 변화가 있음을 예상할 수 있다.
4.3 댓글에서 사용되는 자모음 간의 관계
게시물의 내용이 다르면 여기에 달리는 댓글에 포함되는 표현도 다를 것이라는 가설을 세울 수 있다. 사용 용도가 비슷한 표현은 한 개의 게시물에 함께 존재할 가능성이 높고, 사용 용도가 다른 표현은 한 게시물에 존재하기 힘들 것이다. 예를 들면, 특정 감정을 유발하는 한 게시물에 두 가지 서로 다른 자모음이 포함된 댓글이 동시에 관찰되고, 다른 감정을 유발하는 게시물에는 두 표현 모두 관찰되지 않는다면 두 자모음의 용도가 비슷할 것임을 예상해 볼 수 있다.
표 4는 각각의 표현이 사용된 댓글의 비율을 변수로 하여 서로 간의 상관관계를 나타낸 것이다. 여기서 ‘ratio_x’와 같은 형태로 나타낸 영문 변수는 게시물에서 각 표현이 포함된 댓글이 차지하는 비율을 나타내는 것이다. 가장 높은 상관관계를 보이는 것은 ‘ㅜ’와 ‘ㅠ’로 .854의 정적 상관관계를 보였다. 이로부터 ‘ㅠ’와 ‘ㅜ’라는 두 모음은 서로 비슷한 감정을 표현할 것임을 짐작할 수 있다. 한편, ‘ㅋ’과 다른 표현들 간에는 부적 상관관계가 나타났다. ‘ㅋ’와 ‘ㅠ’ 또는 ‘ㅜ’의 사용은 약한 부적 상관관계를 드러내는데, 이는 웃음과 울음의 상반된 용도가 어느 정도 반영이 된 것임을 예상할 수 있다. 그러나 ‘ㅋ’와 ‘ㅎ’의 관계는 결과가 일반적으로 예상되는 바와는 달랐다. 두 자음이 내는 소리는 서로 다르지만 웃음소리를 표현할 때 쓰인다는 공통점이 있기 때문에 ‘ㅜ’와 ‘ㅠ’의 경우와 같이 정적 상관관계가 있을 것으로 예상되었다. 그러나 결과는 -.422 로 비교적 높은 부적 상관관계가 드러났다. 이에 반해 ‘ㅎ’와 ‘^^’는 .434 로 비교적 높은 정적 상관관계를 보였다. 즉 ‘ㅎ’와 ‘^^’의 경우 일반적으로 웃음을 나타내는 표현으로 여겨지며 실제로도 같이 사용되는 경우가 많음이 확인되었으나, ‘ㅋ’의 사용은 위의 두 표현과 용도가 구분되는 것으로 드러났다. 추후 이러한 현상의 원인에 대한 연구가 필요할 것이다.
Table 4.Correlation table of ten types of expressions(Korean consonants, vowels and emoticons)
그림 4는 앞서 사용 횟수가 가장 높은 것으로 나타난 한글 자모음 4개 ‘ㅋ’, ‘ㅎ’, ‘ㅠ’, ‘ㅜ’를 선택하여, 한 게시물에서 각 표현이 포함된 댓글의 비율을 시각화한 것이다. 왼쪽하단에는 산포도(scatter plot), 대각선에는 변수명과 함께 도수 분포 다각형(frequency polygon)을 나타내고, 오른쪽 상단에는 가로와 세로에서 만나는 두 변수 간의 상관관계를 숫자로 나타내었다. 산포도에서는 한 점이 하나의 게시물을 나타내며 직선은 선형회귀선을 나타낸다.
Fig. 4.Scatter diagram of ‘ㅋ(K)’, ‘ㅎ(H)’, ‘ㅠ(yu)’, ‘ㅜ(u)’ usage in collected comments.
‘ㅋ’의 밀도분포를 보면 가운데가 움푹하고 양 끝단이 높은 U자형 그래프를 보인다. 비율이 약 15%와 약 50% 부근에서 증가에서 감소로 바뀌는 극점이 존재하며, 약 35% 부근에서 감소에서 증가로 바뀌는 극점이 존재한다. 이는 ‘ㅋ’가 존재할 경우 아주 적게 존재하거나, 많이 존재하는 것으로 양분된다고 볼 수있다. ‘ㅋ’와 ‘ㅎ’의 상관관계 산포도를 보면 두 점이 모인 패턴이 둘로 갈린 것을 확인 할 수 있으며, ‘ㅋ’의 비율이 낮은 무리에는 ‘ㅎ’의 비율이 퍼져있지만 ‘ㅋ’의 비율이 높은 무리에서는 ‘ㅎ’의 비율이 낮은 곳에 모여 있는 것을 확인 할 수 있다. 두 변수 간의 부적 상관관계는 이러한 패턴에서 비롯된 것임을 짐작할 수 있다. ‘ㅋ’의 비율이 50% 부근의 높은 무리를 폭소를 유발하는 게시물로, 15% 부근의 무리를 미소를 유발하는 게시물로 가정한다면, 이러한 게시물에는 비교적 ‘ㅎ’의 사용 빈도가 높은 게시물도 존재하는 것으로 파악할 수 있다. 한편, 상관관계로 확인한 것처럼 ‘ㅜ’와 ‘ㅠ’는 비슷한 사용패턴이 산포도에서도 나타난다.
4.4 댓글에 포함된 자모음을 이용한 게시물의 분류
게시물의 댓글에 포함된 자모음의 데이터를 이용하여 해당 게시물의 성격을 대략 파악하여 이 게시물이 어떤 내용을 표현하는지 예측할 수 있는지 검증해 보고자 하였다. 그림 4로부터 ‘ㅋ’와 ‘ㅎ’, ‘ㅋ’와 ‘ㅜ’ 또는 ‘ㅠ’가 사용되는 게시물이 서로 다른 성격을 가졌음을 예측할 수 있었다. 게시물의 내용을 직접 확인하여 기록하지 않았기 때문에 게시물의 내용을 정확히 파악하는 것은 불가능하지만 표본으로 사용된 게시물은 6개의 서로 다른 ‘페이지’로부터 수집한 것으로, 각각의 ‘페이지’는 다른 성격을 지니고 있음을 알 수있다. 우리는 게시물의 내용을 구체적으로 알수 없지만 게시물의 출처에 따른 자모음의 패턴을 분석하고, 해당 게시물이 어떤 ‘페이지’에 속하는 것인지를 예측하는 것이 가능할 것으로 보았다.
조사한 ‘페이지’들 중 감정표현 텍스트 사용에 있어서 비교적 명백한 차이를 보이는 세 개의 ‘페이지’를 선택하였다. 남성 위주의 유머 게시물이 주를 이루는 ‘남자들의 동영상(menvideos)’, 주로 여성 이용자 간에 재미있는 게시물을 공유하는 ‘여대생의 정석(showmetheman)’, 그리고 감성적인 게시물이 주로 게시되는 ‘사랑할 때 알아야할 것들(saalcafe)’을 선정하였다. 수집한 전체 데이터 중에서 선택된 3개의 ‘페이지’에 해당하는 821개를 추려 분석에 사용했다.
첫 번째 단계로, 그림 5 (a)에는 ‘ㅋ’와 ‘ㅎ’, (b)에서는 ‘ㅋ’와 ‘ㅠ’를 게시물에 포함하는 댓글의 백분율간의 관계를 각각 산포도로 나타냈다. 여기서 한 점은 게시물 하나를 나타내며, 그 위에 밀도 도표(density plot)를 등고선(contour line)으로 덧그려 각각의 ‘페이지’에 포함된 게시물이 위치한 영역을 시각적으로 확인하기 쉽도록 표현하였다. 낮은 수치를 나타내는 부분에는 비교적 많은 게시물이 조밀하게 분포하고 있기 때문에 가로축과 세로축을 로그 단위로 고정하여 각 점 간의 거리를 쉽게 확인할 수 있도록 하였다. 나타난 것처럼 세 가지 ‘페이지’에 해당하는 게시물이 각각 구별되는 영역을 차지하고 있음을 대략적으로 확인할 수 있었다. ‘여대생의 정석’의 게시물은 상대적으로 ‘ㅋ’보다 ‘ㅎ’를, ‘ㅋ’보다 ‘ㅠ’를 많이 포함하며, ‘남자들의 동영상’에는 그 반대의 분포를 보이고, ‘사랑할 때 알아야할 것들’에는 두 경우 중간에 위치하는 것으로 보인다.
Fig. 5.Scatter diagram of the percentage of the comments from Pages’ posts including ‘ㅋ(K)’, ‘ㅎ(H)’, ‘ㅠ(yu)’, (a) Comments including ‘ㅋ(K)’ and ‘ㅎ(H)’, (b) Comments including ‘ㅋ(K)’ and ‘ㅠ(yu)’.
그리고 각 게시물이 속한 세 가지 페이지를 종속변수로, 각 게시물이 각 한글 자모음을 포함한 댓글의 빈도를 이용하여, 어떤 페이지에 속하는 게시물인지 예측할 수 있도록 판별분석을 통해 알아보았다. 선택한 세 가지 페이지에 해당하는 게시물의 사례수는 총 821개로 모두 누락 없이 유효 사례수로 판별분석에 사용되었다. 분석에 사용된 독립변수는 10개로, 게시물에서 ‘ㅋ’, ‘ㅎ’, ‘ㅜ’, ‘ㅠ’, ‘ㄷ’ 등 다섯 가지를 선정하여, 각 자모음이 포함된 댓글의 빈도, 댓글 내에서 사용된 개수의 평균을 대상으로 했다. 이 독립변수를 활용하여 각 3개의 페이지 중에 어떤 집단에 속하게 될지 판별분석(discriminant analysis)을 시행했다.
판별분석 방법을 결정하기 위해 먼저 Box검정을 시행하였는데 각 집단에 대한 공분산의 가설 검정 결과 유의확률이 .000미만으로 공분산이 동일하지 않으므로, 집단 내 공분산을 사용하였다. 도출된 정준 판별함수의 고유값은 1.059으로 판별함수의 설명력이 높은 편임을 알 수 있으며, Wilks의 람다 값은 .379(p<.000)로 집단 간 평균값의 차이를 상당히 보여주고 있어 판별분석이 의미가 있음을 확인하였다.
도출된 판별함수에 의한 판별적중률은 77.5%로 나타났다. 판별함수에 의한 분석 결과는 표 5에 제시되었는데, 이는 ‘남자들의 동영상(menvideos)’에 포함된 294개의 게시물 가운데 246개가 정확히 예측되어 83.7%의 적중률을 보였다는 의미이다. 게시물에 달린 댓글에 자모음이 포함된 비율과 댓글에 포함된 자모음의 개수를 통해 게시물의 성격을 어느 정도 파악할 수 있음을 확인하였다.
Table 5.Results of a discriminant analysis using Korean consonants and vowels usage included in comments of Pages' posts
5. 논의 및 향후 연구 방향
한글의 자음과 모음의 독립적 사용 양상을 분석하여 기존에 발견하지 못한 여러 특징을 찾을 수 있었다. 한글의 자모음이 독립적으로 사용되는 것은 댓글에서 상당한 빈도로 발견되며, 이는 기존의 이모티콘의 영문 사이트에서와는 차별적인 특징이다. 그리고 한 개의 표현이 아니라 여러 개를 반복적으로 표현함으로써 의미를 강조하거나, 특정한 감정을 부각하기도 한다. 각 자음과 모음 간에는 표현하는 의미의 유사성으로 인하여 사용빈도에 있어 서로 정적이거나 부적인 상관관계를 가지기도 한다. 또한 이러한 댓글에 포함된 자모음을 가지고 게시물이 표현하는 감정을 간접적으로 예측함으로써 해당 게시물이 어떤 종류의 ‘페이지’에 속해있는지 구분할 수 있음을 보였다.
탐색적 연구이니 만큼 향후에 추가적으로 연구할 만한 주제도 여러 가지 발견되었다. 한글의 자음과 모음의 사용이 반드시 감정 표현에 국한되어 사용되는 것은 아니다. 이를테면 적나라한 표현을 피하고자 할 때나 비밀스럽게 표현하고자 할 때 초성만으로 이루어진 표현을 사용하곤 한다. 또한 자판의 입력이 비교적 불편한 휴대 전화 등의 기기에서는 초성으로 검색을 하는 기능이 일반화되어있다. 본 연구에서는 감정 표현이 위주가 될 것이라고 예상되는 페이스북 ‘페이지’를 대상으로 하였지만 보다 엄밀하게 온라인에서 한글 자모음의 독립적인 사용 행태를 살펴보기 위해서는 다른 경우에 대한 분석 내용도 포함되어야 할 것이다.
한편, 본 연구에서 게시물의 출처에 따라 사용 행태가 다르다는 것을 밝혔지만 이러한 표현이 정확히 사람들의 어떤 정서나 기분을 표현하는지를 본 연구에서는 파악할 수가 없었다. 예를 들어 ‘ㅠ’를 사용한 댓글이 슬픔을 나타내는 것인지 감동을 나타내는 것인지를 본 연구에서 수집한 데이터만으로는 직접 구분할 수가 없다. 또한 ‘ㅋ’의 경우 웃음을 표현하지 않는 경우에도 습관적으로 사용하는 경우가 많은데, 이 역시도 본 연구에서 수집한 데이터만으로는 감정적 표현을 위한 사용과 구분하기가 어렵다. 이는 추후에 정성적인 연구를 추가하여 글의 의미를 실제로 기록하고 비교해 봄으로써, 어떤 감정을 드러낼 때 어떠한 문자가 주로 사용되는지 또는 연속적으로 쓰였을 때 의미적으로 어떤 차이가 있는지 밝힐 수 있을 것이다.
또한 한글의 자모음이 사용되는 데 영향을 주는 요인이나 그 배경에 관해서는 아직 명확히 밝히지 못하였다. 예를 들면 한글 자모음이 특수문자로 이루어진 이모티콘의 사용이 비슷한 용도로 이루어짐에도 불구하고, 그 사용량에서 크게 밀리고 있는 이유를 고찰해볼 이유가 있다. 주로 컴퓨터 키보드나 스마트폰을 통해 페이스북에 접속을 하게 된다. 한글 자모음이 한 번의 타이핑으로 입력이 되는 데에 반해 특수 문자는 컴퓨터 키보드에서도 시프트를 눌러야 하는 번거로움이 있다. 한편 휴대 전화나 스마트폰에서도 메뉴를 이동하는 버튼을 눌러야 하는 등의 단계를 거쳐야하므로 행동을 경제적으로 하려는 습성에서 나타난 것임을 추측해 볼 수 있다. 휴대전화 혹은 스마트폰의 보급 시점과 맞물려 시계열로 연구를 해본다면, 한글 자모음이 활발하게 사용되는 원인을 좀 더 명확히 파악하는 데에 도움이 될 수 있을 것이다.
본 연구에서는 페이스북에서도 ‘페이지’에 올라오는 댓글을 대상으로 분석하였다. 이는 비교적 개방적인 공간으로, 기존의 인터넷 게시판과 비슷한 성향을 띠는 것으로 보인다. 보다 사적인 대화의 공간인 ‘담벼락’에 남기는 글과 댓글, 혹은 개인 메시지 등을 분석하면 다른 결과를 볼 수도 있을 것이다. 트위터등의 다른 소셜 미디어와 비교하거나, 스마트폰의 보급과 함께 사용량이 급격히 증가하는 모바일 메신저에서의 사용 행태와 비교 분석해 본다면, 사용 디바이스에 따른 한글 자모음 및 이모티콘을 이용한 감정 표현의 방식이 어떻게 다르게 나타나는 지 분석해 볼 수 있을 것이다.
추가로 분석에 사용될 자모음 및 이모티콘을 선정하기 위해 페이스북의 댓글을 읽는 과정에서 발견한 것인데, 국내에서는 그림 1의 댓글에서 보이는 것처럼 자신의 지인을 태그(tag)하는 방식으로 정보를 공유하는 행태가 종종 발견되었다. 해외의 페이스북 ‘페이지’의 경우 의외로 이와 같은 현상이 거의 나타나지 않았다. 이것이 실제로 유의미한 차이가 있는지, 혹은 국가별로 어떠한 요소의 영향으로 이러한 공유 방식의 변화가 나타나는지 관찰해보는 것도 좋을 것이다. 이와 같이 한국 사용자들의 독특한 소셜 미디어 이용의 특징을 분석해보고, 다른 언어 사용권에서 비슷한 행태가 관찰되는지에 대한 연구도 시도해 본다면, 한국어 자판의 사용과 같은 도구적인 문제뿐만 아니라 문화적 연구로도 확장할 수 있을 것이다.
6. 결 론
컴퓨터에서 자모음이 분리된 한글을 표시하게 된 이래, 언젠가부터 한글 자모음이 독립적으로 활용이 되기 시작했으며 특히 CMC 상황에서 보편적으로 사용하는 행태로 자리 잡았다. 하지만 한글 자모음의 독립적 사용량에 비해 이를 학문적으로 접근하여 사용 행태를 분석하는 시도는 아직까지 많이 부족한 실정이다. 본 연구에서는 이러한 연구의 기초 정보를 파악하고자 온라인을 통한 소셜 미디어 데이터 수집 기술을 활용하여, 한글 자모음의 이용 행태를 시각적으로 표현하는 데 중점을 두었다. 온라인에서 흔히 사용되면서도 명확히 연구된 바가 드문 한글 자모음의 독립적 사용에 대한 연구를 발전시키기 위한 탐색적 연구로서 의의가 있다고 할 수 있다. 그리고 나아가 이러한 한글 자모음이 포함된 댓글과 댓글이 포함된 게시물의 내용을 패턴에 따라 분류하고 이를 회귀 분석을 통해 정량적으로 검증해보는 작업을 수행했다. 이 연구의 결과는 한글 이용자만의 독특한 특징을 분석하는 데 기여할 수 있을 것이다. 또한 본 논문에서 사용된 정량적 분석방법을 응용하여 향후 한글 문서의 내용에 포함된 정서를 간접적으로 유추하는데 있어 기초 연구가 될 수 있을 것이다.
References
- H. Park, "Online Interface and Convergence of Oral and Written," Speech & Communication, Vol. 6, pp. 45-69, 2006.
- H. Shin, "A Study of the Outside Language in Internet Communication Language," International Association of Language & Literature, Vol. 34, pp. 5-31, 2005.
- S. Lee, "The Language of Internet Board: User Perception and Usage Patterns," Journal of Communication Science, Vol. 4, Issue 1, pp. 177-211, 2004.
- J. Lee, "Usages, Research Trends, and Challenges of Net-language in the Smart-phone Era," The Sociolinguistic Journal of Korea, Vol. 20, Issue 1, pp. 177-211, 2012.
- J. Park and M. Cha, "The Usage of Emoticons in Online Social Media," Proceedings of HCI Korea 2013 Conference, pp. 537-539, 2013.
- H. Park, "Relationship between Emoticons and Nonverbal Behaviors in Online Chatting System: Emoticons as Relational Control Mechanism," Journal of Communication Science, Vol. 5, Issue 3, pp. 273-302, 2005.
- J. Kim, "Social Interaction in Computer Mediated Communication," Bulletin of the American Society for Information Science and Technology, Vol. 26, Issue 3, pp. 15-17, 2000.
- J.T. Hancock, C. Landrigan, and C. Silver, "Expressing Emotion in Text-based Communication," Proceedings of the SIGCHI Conference on Human Factors in Computing Systems, pp. 929-932, 2007.
- C.K. Varnhagen, G.P. McFall, N. Pugh, L. Routledge, H. Sumida-MacDonald, and T.E. Kwong, "Lol: New Language and Spelling in Instant Messaging," Reading and Writing, Vol. 23, Issue 6, pp. 719-733, 2010. https://doi.org/10.1007/s11145-009-9181-y
- S. Park and Y, Kee, "Mark-up for Representing Emotion," Proceedings of the Korea Multimedia Society Conference, pp. 487-490, 2004.
- M. Yuki, W.W. Maddux, and T. Masuda, "Are the Windows to the Soul the Same in the East and West? Cultural Differences in using the Eyes and Mouth as Cues to Recognize Emotions in Japan and the United States," Journal of Experimental Social Psychology, Vol. 43, No. 2, pp. 303-311, 2007. https://doi.org/10.1016/j.jesp.2006.02.004
- J. Choi, C. Han, Y. Hwang, B. Kim, S. Kang, H. Kwon, and et al., Korean Internet White Paper, Korea Internet & Security Agency, Seoul, 2012.
- S. Hong and J. Oh, "Comparative Analysis on Twitter and Facebook's Users Access," Proceedings of Korean Society for Internet Information Conference, Vol. 10, pp. 189-190, 2010.