• 제목/요약/키워드: 텍스트시각화

검색결과 233건 처리시간 0.025초

텍스트 마이닝을 이용한 2012년 한국대선 관련 트위터 분석 (Analysis of Twitter for 2012 South Korea Presidential Election by Text Mining Techniques)

  • 배정환;손지은;송민
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.141-156
    • /
    • 2013
  • 최근 소셜미디어는 전세계적 커뮤니케이션 도구로서 사용에 전문적인 지식이나 기술이 필요하지 않기 때문에 이용자들로 하여금 콘텐츠의 실시간 생산과 공유를 가능하게 하여 기존의 커뮤니케이션 양식을 새롭게 변화시키고 있다. 특히 새로운 소통매체로서 국내외의 사회적 이슈를 실시간으로 전파하면서 이용자들이 자신의 의견을 지인 및 대중과 소통하게 하여 크게는 사회적 변화의 가능성까지 야기하고 있다. 소셜미디어를 통한 정보주체의 변화로 인해 데이터는 더욱 방대해지고 '빅데이터'라 불리는 정보의 '초(超)범람'을 야기하였으며, 이러한 빅데이터는 사회적 실제를 이해하기 위한 새로운 기회이자 의미 있는 정보를 발굴해 내기 위한 새로운 연구분야로 각광받게 되었다. 빅데이터를 효율적으로 분석하기 위해 다양한 연구가 활발히 이루어지고 있다. 그러나 지금까지 소셜미디어를 대상으로 한 연구는 개괄적인 접근으로 제한된 분석에 국한되고 있다. 이를 적절히 해결하기 위해 본 연구에서는 트위터 상에서 실시간으로 방대하게 생성되는 빅스트림 데이터의 효율적 수집과 수집된 문헌의 다양한 분석을 통한 새로운 정보와 지식의 마이닝을 목표로 사회적 이슈를 포착하기 위한 실시간 트위터 트렌드 마이닝 시스템을 개발 하였다. 본 시스템은 단어의 동시출현 검색, 질의어에 의한 트위터 이용자 시각화, 두 이용자 사이의 유사도 계산, 트렌드 변화에 관한 토픽 모델링 그리고 멘션 기반 이용자 네트워크 분석의 기능들을 제공하고, 이를 통해 2012년 한국 대선을 대상으로 사례연구를 수행하였다. 본 연구를 위한 실험문헌은 2012년 10월 1일부터 2012년 10월 31일까지 약 3주간 1,737,969건의 트윗을 수집하여 구축되었다. 이 사례연구는 최신 기법을 사용하여 트위터에서 생성되는 사회적 트렌드를 마이닝 할 수 있게 했다는 점에서 주요한 의의가 있고, 이를 통해 트위터가 사회적 이슈의 변화를 효율적으로 추적하고 예측하기에 유용한 도구이며, 멘션 기반 네트워크는 트위터에서 발견할 수 있는 고유의 비가시적 네트워크로 이용자 네트워크의 또 다른 양상을 보여준다.

토픽모델링을 활용한 COVID-19 학술 연구 기반 연구 주제 분류에 관한 연구 (A study on the classification of research topics based on COVID-19 academic research using Topic modeling)

  • 유소연;임규건
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.155-174
    • /
    • 2022
  • 2020년 1월부터 2021년 10월 현재까지 COVID-19(치명적인 호흡기 증후군인 코로나바이러스-2)와 관련된 학술 연구가 500,000편 이상 발표되었다. COVID-19와 관련된 논문의 수가 급격하게 증가함에 따라 의료 전문가와 정책 담당자들이 중요한 연구를 신속하게 찾는 것에 시간적·기술적 제약이 따르고 있다. 따라서 본 연구에서는 LDA와 Word2vec 알고리즘을 사용하여 방대한 문헌의 텍스트 자료로부터 유용한 정보를 추출하는 방안을 제시한다. COVID-19와 관련된 논문에서 검색하고자 하는 키워드와 관련된 논문을 추출하고, 이를 대상으로 세부 주제를 파악하였다. 자료는 Kaggle에 있는 CORD-19 데이터 세트를 활용하였는데, COVID-19 전염병에 대응하기 위해 주요 연구 그룹과 백악관이 준비한 무료 학술 자료로서 매주 자료가 업데이트되고 있다. 연구 방법은 크게 두 가지로 나뉜다. 먼저, 47,110편의 학술 논문의 초록을 대상으로 LDA 토픽 모델링과 Word2vec 연관어 분석을 수행한 후, 도출된 토픽 중 'vaccine'과 관련된 논문 4,555편, 'treatment'와 관련된 논문 5,791편을 추출한다. 두 번째로 추출된 논문을 대상으로 LDA, PCA 차원 축소 후 t-SNE 기법을 사용하여 비슷한 주제를 가진 논문을 군집화하고 산점도로 시각화하였다. 전체 논문을 대상으로 찾을 수 없었던 숨겨진 주제를 키워드에 따라 문헌을 분류하여 토픽 모델링을 수행한 결과 세부 주제를 찾을 수 있었다. 본 연구의 목표는 대량의 문헌에서 키워드를 입력하여 특정 정보에 대한 문헌을 분류할 수 있는 방안을 제시하는 것이다. 본 연구의 목표는 의료 전문가와 정책 담당자들의 소중한 시간과 노력을 줄이고, 신속하게 정보를 얻을 수 있는 방법을 제안하는 것이다. 학술 논문의 초록에서 COVID-19와 관련된 토픽을 발견하고, COVID-19에 대한 새로운 연구 방향을 탐구하도록 도움을 주는 기초자료로 활용될 것으로 기대한다.

과시된 효심: 국립중앙박물관 소장 <인왕선영도(仁旺先塋圖)> 연구 (Showing Filial Piety: Ancestral Burial Ground on the Inwangsan Mountain at the National Museum of Korea)

  • 이재호
    • 미술자료
    • /
    • 제96권
    • /
    • pp.123-154
    • /
    • 2019
  • 국립중앙박물관 소장 <인왕선영도(仁旺先塋圖)>(덕수5520)는 그림과 발문(跋文) 열 폭으로 이루어진 병풍으로, 작가는 조중묵(趙重黙)(1820~1894 이후), 주문자는 박경빈(朴景彬)(생몰년 미상), 발문을 쓴 사람은 홍선주(洪善疇)(생몰년 미상), 제작연대는 1868년이다. 국립중앙박물관은 낱장으로 보관되어 온 <인왕선영도>를 병풍으로 복원하고 특별전 '우리 강산을 그리다: 화가의 시선, 조선시대 실경산수화'에서 최초로 공개하였다. <인왕선영도>에는 오늘날 서울특별시 서대문구 홍제동과 홍은동을 아우르는 인왕산 서쪽 실경이 묘사되어있고 원경에는 북한산 연봉이 그려져 있다. 화면 속에는 인왕산(仁旺山), 추모현(追慕峴), 홍재원(弘濟院), 삼각산(三角山), 대남문(大南門), 미륵당(彌勒堂)이라는 지명이 표기되어있다. 이 지역을 나타낸 조선후기 지도와 비교해보면 지형 표현과 지명 표기에 유사성이 있다. 조중묵은 넓은 공간을 포착하기 위해 지도의 지리정보를 숙지하였을 것으로 추정된다. 실경의 현장을 답사한 결과, 조중묵은 각각의 경물을 과장하거나 생략하였고 수평의 화면에 나열식으로 조합하였음을 알 수 있었다. 조중묵은 남종화풍 정형산수에 뛰어났던 화가로, <인왕선영도>의 세부 표현에서 사왕파(四王派) 화풍의 영향을 찾을 수 있다. 19세기 도화서 화원들이 화보를 활용하여 가옥을 그리거나 토파에 호초점을 찍고 당분법(撞粉法)으로 꽃을 나타내는 등 장식적인 화풍을 구사한 경향도 부분적으로 나타난다. <인왕선영도>에는 바위를 짙은 먹으로 쓸어내리듯 붓질한 기법, 산세의 괴량감, 가로로 붓을 대어 단순하게 그린 소나무 등 18세기 정선(鄭敾)(1676~1759)의 개성적 양식도 가미되어있다. 조중묵은 인왕산 실경산수로 유명한 정선의 양식과 권위를 차용한 것으로 추정된다. 그러나 <인왕선영도>는 유기적 공간감과 현장의 인상이 잘 드러나지 않으며, 연폭 화면이라는 매체도 조중묵의 개인 양식과 잘 어울리지 않는다. <인왕선영도>는 발문의 텍스트와 화면의 이미지가 잘 조응하는 작품이다. 발문의 내용을 여섯 단락으로 나누어 보면 ①무덤의 주인공과 이장 경위, ②무덤의 입지와 풍수, ③묘제(墓祭)와 신이(神異)한 응답, ④무덤 관리에 대한 마을 사람들의 협력, ⑤병풍 제작의 동기인 박경빈의 효성과 수묘(守墓), ⑥발문을 쓴 의의로 파악된다. 이 가운데 화면에서 시각적으로 구현하기 용이한 ②의 내용은 화면에 충실하게 재현되었다. <인왕선영도> 제작의 직접적 동기인 ⑤를 보면 주문자 박경빈이 "무덤이 마치 새롭게 단장한 것 같이 눈에 완연하다."라 하여 <인왕선영도>에 만족했음을 알 수 있다. 경물 하나하나를 설명하듯 나열한 구도는 회화미는 떨어지더라도 무덤의 풍수지리를 전달하는 데는 더 적합했을 것으로 추정된다. 현존하는 상당수의 산도(山圖)는 18세기 이후 제작된 목판본 선영도로서, 족보와 문집에 수록된 경우가 많다. 16~17세기의 기록에서는 족자 선영도를 첨배(瞻拜)의 대상으로 삼은 사례를 찾을 수 있다. 선영도 첨배는 현실적으로 수묘(守墓)가 곤란할 때 이를 대신할 수 있는 의례로 인정되었다. 한효원(韓效元)(1468~1534), 조실구(曺實久)(1591~1658) 등이 선영도를 제작한 후 당대의 명사에게 서문을 요청하고 효심을 과시한 사례는 <인왕선영도>의 선구가 된 것으로 추정된다. <석정처사유거도(石亭處士幽居圖)>(개인 소장), <화개현구장도(花開縣舊莊圖)>(국립중앙박물관) 등은 선영도는 아니지만 계회도 형식의 족자이고 풍수를 도해했다는 점에서 17세기 선영도의 모습을 유추할 수 있는 자료가 된다. <인왕선영도>는 첨배라는 측면에서 초상화와도 의미가 비슷했다. 발문의 "부친의 기침소리를 직접 접하는 듯하고, 그 태도와 몸가짐을 눈으로 보는 듯하다."는 표현과 부친의 초상에 조석 문안을 올린 서효숙 고사에서 그 단초를 찾을 수 있다. 박경빈이 일반적인 선영도 형식이었던 족자나 목판화 대신 연폭 병풍의 실경산수화를 주문한 의도는 분명히 알기 어렵다. 19세기에는 민간에서도 사례(四禮) 의식에 다수의 병풍을 배설(排設)하였는데, 의례의 성격에 따라 그림의 주제를 반드시 구분하여 사용한 것은 아니었다. <인왕선영도> 또한 여러 의례에 두루 배설하거나 장식 병풍으로도 사용하기 위해서 선영 그림이라는 주제를 실경산수화 이미지 아래에 가렸을 가능성이 있다. 특히 <인왕선영도>의 핵심 소재인 무덤 봉분이 모호하게 처리된 것은 사산금표(四山禁標)의 금제 위반을 숨기기 위함일 가능성이 있다. <인왕선영도>에 묘사된 인왕산 서쪽 산기슭은 분묘 조성 금지구역이었다. 1832년에 금표 내에 몰래 쓴 묘를 적발하여 즉시 파내고 관련자를 엄히 처벌한 사례로 볼 때, 19세기 중엽까지도 사산금표 내의 분묘 금제는 효력을 발휘하고 있었던 것으로 추정된다. <인왕선영도>의 발문에는 장지를 얻기 위해 쏟은 정성이 상세하게 쓰여 있다. 장지조성에 마을사람들의 협조와 묵인이 필요했던 것은 금표 구역 내에 묘지를 조성하는 것이 부담스러운 일이었기 때문으로 볼 수 있다. <인왕선영도>와 비교 가능한 동시대 연폭 병풍의 실경산수화로 이한철(李漢喆)(1808~1880)이 그린 <석파정도(石坡亭圖)>(미국 로스앤젤레스카운티미술관)를 들 수 있다. <석파정도> 제작시기를 전후한 1861년에 이한철과 조중묵은 철종어진도사에 함께 참여하였으므로 조중묵이 이한철의 <석파정도> 제작 과정을 보았을 가능성은 상당히 높다. 조중묵이 몇 년 후 <인왕선영도>를 주문받았을 때 <석파정도>의 인상적인 연폭 실경산수를 본 경험이 반영되었을 가능성이 있다. 두 작품의 화풍 차이는 주문자의 취향과 제작 목적의 차이에서 비롯된 것으로 추정된다. <인왕선영도>는 실경산수화와 선영도의 중층적인 구조를 가지고 있어서 관람자의 지식수준과 주문자와의 친분, 관람에 들이는 시간에 따라 천차만별의 의미로 수용되었을 것이다. <인왕선영도>의 발문에는 무덤 주인의 이름과 자호, 본관이 일체 작성되지 않은 채 '박공(朴公)'이라고만 표기되어 있다. 주문자인 박경빈의 인적 사항도 파악할 수 없었으나 다만 관직에 나아가지 못한 가계를 미루어 볼 때 재력이 있음에도 지배계층으로 올라설 수 없는 신분적 한계를 지니고 있었음은 짐작할 수 있다. 발문을 쓴 홍선주 또한 사대부로 보기 어려우며, 『승정원일기』 기록에 나타나는 경아전 서리일 가능성이 있다. 박경빈은 상류 계층에 진입하고 싶은 욕망으로 보수적인 가치인 효(孝)를 강조하여 부친의 무덤을 명당으로 이전하고 <인왕선영도>를 제작하였을 것으로 추정된다. 그러나 <인왕선영도>는 금제위반 적발에 대한 우려, 병풍의 다목적성 등의 이유로 본래의 제작의도를 뚜렷하게 드러내지 못하고 모순적인 이미지가 되었다. 병풍이 제작된 지 47년 만에 각 폭이 분리된 채 미술상을 통해 이왕가미술관 소장품이 된 상황을 보더라도, 박경빈이 <인왕선영도>에서 꿈꾸었던 명당 발복과 가문의 신분상승은 이루어지지 못했던 것으로 생각된다.