• 제목/요약/키워드: 텍스트 기반 유사도

검색결과 194건 처리시간 0.027초

학술연구의 동향 및 정책과의 상호관계 분석 : 중소기업 기술혁신정책을 중심으로 (Analysis of the Interrelationship between Academic Research and Policy using Text Mining)

  • 정효정
    • 기술혁신연구
    • /
    • 제26권4호
    • /
    • pp.146-172
    • /
    • 2018
  • 중소기업 분야는 산업사회와 정책 변화에 기인하여 관련 연구들이 증가하는 추세를 보이고 있기 때문에 정책과의 연계성이 비교적 높은 편이라고 할 수 있다. 본 연구에서는 이를 전제로 중소기업 기술혁신정책 관련 학술연구의 연구동향을 분석하고, 중소기업 기술혁신정책과의 상호관계를 살펴보았다. 분석 결과에 따르면 시간이 지남에 따라 학술연구와 정책간의 주제적 유사성이 높아지고 있었다. 이를 통해 해당 시기의 정책을 학술적 관점에서 검증하는 연구가 증가하고 있다는 것과 정부주도정책으로 인해 정책적 이슈가 학술연구에 영향을 미치고 있음을 알 수 있었다. 또한, 학술연구와 정책간의 시간차가 존재하는 연주주제가 나타났으며, 해당 정책이 시행되는 시기에 학술연구가 이전연도에 비해 증가하는 경향이 있다는 것을 확인하였다. 연구 결과는 향후 발표될 '중소기업 기술혁신 5개년 계획(2019~2023)'의 수립에 있어 주요 논의사항을 파악하고 방향성을 설정하는데 기여하고, 증거 기반 정책 설계의 가능성을 보여줄 수 있을 것으로 예상된다.

Analysis of Satisfaction of Pre-service and In-service Elementary Teachers with Artificial Intelligence Education using App Inventor

  • Junghee, Jo
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권3호
    • /
    • pp.189-196
    • /
    • 2023
  • 본 논문에서는 예비 초등교사 13명과 현직 초등교사 9명을 대상으로 앱인벤터를 활용한 인공지능 교육을 실시하고 만족도 조사를 통해서 학생들의 배경 변인과의 관련성이 있는지, 그리고 두 그룹의 학생들 사이에 만족도의 차이가 있는지 분석하였다. 연구 결과, 현직 교사는 교육에 대한 흥미도, 난이도, 참여도를 묻는 문항에서 예비 교사보다 모두 만족도가 높았다. 또한, 교육이 인공지능의 학습 동기 부여에 도움을 주었는지, 향후 초등학교 수업에 적용해 볼 의향이 있는지를 조사하는 문항에서도 예비 교사보다 긍정적으로 나타났다. 예비교사는 대체적으로 현직 교사에 비해서는 부정적인 측면이 있으나 교육이 인공지능의 이해도 향상에 도움이 되었는지, 추가 교육에 참가할 의향이 있는지를 조사하는 문항에서는 현직 교사보다 긍정적으로 나타났다. 두 그룹 학생의 만족도에 의미 있는 차이가 있는지 Mann-Whitney Test로 분석한 결과 통계적인 유의미성은 없었다. 이는, 사전 조사 결과를 기반으로 유추하였을 때 두 그룹의 대다수 학생들이 이미 블록형 또는 텍스트형 프로그래밍 경험이 있었으므로 앱인벤터에 대한 특별한 거부감이나 어려움없이 교육을 따라올 수 있었고 이에 만족도가 두 그룹 사이에 유사한 수치로 높게 나타난 것으로 분석된다. 본 연구의 결과는 향후 예비 및 현직 초등교사의 인공지능 교육을 위한 프로그램 개발 및 운영의 기초 자료로 활용될 수 있을 것이다.

가변 Break를 이용한 코퍼스 기반 일본어 음성 합성기의 성능 향상 방법 (A Performance Improvement Method using Variable Break in Corpus Based Japanese Text-to-Speech System)

  • 나덕수;민소연;이종석;배명진
    • 한국음향학회지
    • /
    • 제28권2호
    • /
    • pp.155-163
    • /
    • 2009
  • Text-to-speech 시스템에서 입력 텍스트로부터 운율 정보를 생성하기 위해서는 운율구 경계, 음소 지속시간, 기본주파수 포락선 설정의 3가지 기본적인 모듈이 필요하다. Break 인덱스 (BI; Break Index)는 합성기에서 운율구의 경계를 나타내고, 자연스러운 합성음을 생성하기 위해서는 BI를 정확히 예측하여야 한다. 그러나 BI는 문장의 의미나 화자의 읽기 습관(reading style)에 따라 임의적으로 결정되는 경우가 많아 정확한 예측이 매우 어렵다. 특히 일본어 합성기에서는 악센트 구 경계 (APB; Accentual Phrase Boundary)와 major phrase 경계 (MPB; Major Phrase Boundary)의 정확한 예측이 어렵다. 따라서 본 논문에서는 APB와 MPB 예측 오류를 보완할 수 있는 방법을 제안한다. BI를 고정 break (FB; Fixed Break)와 가변 break (VB; Variable Break)로 분류하여 합성단위 선택을 수행한다. 일반적으로 BI는 한번 생성되면 변하지 않는다. 따라서 BI가 잘못 생성된 경우 최적의 합성음을 생성할 수 없게 되는데, VB는 생성된 BI와 그것과 유사한 BI를 함께 이용하여 합성단위 선택을 수행함으로써 합성음의 BI가 생성된 BI와 다를 수 있는 것을 의미한다. APB와 MPB에 해당하는 BI에 대하여 VB인지 FB인지 CART(Classification and Regression Tree)를 이용하여 예측하고, VB인 경우 기본 주파수와 음소 지속시간에 대해 다중 운율 모델을 생성하여 합성단위 선택을 수행하였다. MOS 테스트 결과 원음이 4.99, 제안한 방법을 4.25, 기존의 방법은 4.01로 합성음의 자연성을 향상시킬 수 있었다.

대중문화에 재현된 동아시아 자본주의 사회의 담론 : 슈퍼히어로 애니메이션 <타이거 앤 버니>를 중심으로 (The Discourse of Capitalist Society on East Asian Pop Culture: A TV Series of Superhero Animation )

  • 우지운;노광우;권재웅
    • 만화애니메이션 연구
    • /
    • 통권37호
    • /
    • pp.45-82
    • /
    • 2014
  • 서구의 슈퍼히어로 장르는 캐릭터들의 탄생과 성장을 다루는 과정에서 정치, 경제, 사회 환경과 함께 각종 기호체계와 타 예술 장르들을 외적으로 흡수하고, 기존의 작품들을 패러디(parody) 등의 여러 형식으로 받아들였다. 본 논문에서는 슈퍼히어로 장르의 이와 같은 발전과정을 인식의 토대로 하여, 미국적 정신의 구현으로 여겨지던 이 장르가 어떻게 동아시아에서 입체적으로 활용되고 다양하게 재구성되었는지, 일본 선라이즈(Sunrise)사의 TV 애니메이션 시리즈 <타이거 앤 버니>(Tiger & Bunny,2011)를 통해 사례 분석하였다. <타이거 앤 버니>는 상호텍스트성에 기반을 둔 패러디적 유형과 특징들을 보이고 있으며, 내면 정서와 가치관의 동양적 재현에 더해, 자본주의 사회의 회사 중심적인 현대인들의 특징을 차용하여 적극적으로 사회의 외적인 부분을 반영하였다. 서구 히어로물과의 유사성과 차이점 비교를 통해 제시되는 부분은 크게 두 가지로 정리된다. 하나는 서구적 자본주의 사회에 대한 부정적 풍자이고, 다른 하나는 동양적 가족주의 가치관에 대한 긍정적 강조이다. 개인주의와 성과 위주의 평가가 만연한 서구 자본주의 사회에 대한 풍자는 히어로들의 TV 활동 과정에서 이루어진다. 이는 자본과 미디어에 수동적으로 종속된 현대 인간과 공공적 목표조차도 이윤의 도구로 이용하는 자본주의 시스템에 대한 은유적 비판이다. <타이거 앤 버니>의 설정과 내러티브에서 강조되는 덕목은 개인과 사회에 대한 동아시아적 가치관인데, 이는 국가와 사회의 구성원들을 가족적 정서로 연결시켜 공동체의 성공을 위해 노력하는 협조적 관계를 말한다. 타이거는 각자 사적인 목적에 충실하여 대의명분 없이 경쟁만 하던 히어로 집단에 정신적 지주 역할을 수행하고, 버니와 동료들은 타이거의 인간적인 가족주의적 커뮤니케이션 방식에 점차 감화된다. <타이거 앤 버니>는 이 과정을 통해서 현대사회의 사회병리를 해결할 수 있는 방안은 세계시민으로서 이러한 공동체 중심적, 자기희생적 정서를 갖추는 것임을 강조한다.

다계층 이원 네트워크를 활용한 사용자 관점의 이슈 클러스터링 (User-Perspective Issue Clustering Using Multi-Layered Two-Mode Network Analysis)

  • 김지은;김남규;조윤호
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.93-107
    • /
    • 2014
  • 대부분의 인터넷 쇼핑몰은 자사 고객의 관심 분야를 파악하고 이를 상품 추천에 효과적으로 활용하기 위해 많은 노력을 기울이고 있다. 하지만 고객이 회원 가입 시 직접 입력한 개인 정보는 신뢰하기가 어렵고, 고객의 구매 패턴을 통해 파악한 관심 분야 정보는 자사 사이트 내에 진입한 이후에만 보인 한정된 패턴이라는 측면에서 해당 고객의 다양한 관심분야를 제대로 나타낸다고 보기 어렵다. 이러한 한계를 극복하기 위해 본 연구에서는 고객의 평소 인터넷 사용 기록을 통해 최근 방문 사이트들의 주제를 분석함으로써, 고객의 실제 관심 분야를 파악할 수 있는 방안을 제시하였다. 또한 토픽 분석을 통해 각 사이트의 주제를 도출하고 도출된 주제를 다시 동시 방문자 관점에서 군집화 함으로써, 고객 관점에서 의미가 있는 상위 수준의 새로운 테마를 발굴하기 위한 방법론을 제안하였다. 연구의 특징은 유사주제 중심의 군집화라는 기존 연구와는 달리 사용자 관점의 관심주제 중심 군집화라 할 수 있다. 향후 사용자 중심의 카테고리 설계를 비롯한 새로운 관점의 고객군 정의 등 보다 높은 차원의 마케팅 전략 수립에 활용이 가능할 것으로 기대된다. 사용자 관점의 이슈 군집화 과정은 크롤링, 토픽 분석, 액세스 패턴 분석, 네트워크 병합, 네트워크 변환 및 군집화와 같은 여섯 가지 주요단계로 구성되어있다. 이를 위해 텍스트 마이닝과 소셜 네트워크 분석 기법을 활용한 비정형 텍스트를 기반으로한 빅데이터의 활용 방법을 모색하였다. 제안 방법론의 실무 적용 가능성을 평가하기 위해, 국내 최대 포털 뉴스 사이트의 방문자 2,177명의 1년간 방문 기록과 뉴스기사 대한 분석을 수행하고 그 결과를 요약하여 제시하였다.

17세기 이후 동아시아 제와(製瓦)의 기술문화적 인과성 (A Study on the Causality of Technology Culture of East Asian Roof Tile Making Technology Since the 17th Century)

  • 김하진
    • 헤리티지:역사와 과학
    • /
    • 제52권3호
    • /
    • pp.56-73
    • /
    • 2019
  • 본 논문은 동아시아 지역의 기와 제작 기술을 관찰함으로써 기술 양식에 대한 본격적인 논의의 필요성을 제시하려는 목적에서 작성되었다. 연구 방법은 기존의 주된 연구 자료인 발굴 성과와 그에 따른 연구방법론인 제작 흔적 분석뿐만 아니라 문헌과 전승 기술 등을 함께 살피려 노력했다. 공정 단위마다 지역별 유사성으로 기술의 권역을 설정하는 작업을 통해 도구, 공정, 인원 편성 등 기술적 요인을 중심으로 접근했다. 따라서 본고는 선행 연구 성과 토대 위에서 기술양식의 파악이 형태뿐만 아니라 문화 교류에 따른 기술의 인과성을 파악할 텍스트로서 작용 가능한지를 논증하는 실험이며, 이러한 논의를 추동하기 위한 시론(始論)이라 할 수 있다. 한국과 중국, 일본 세 나라의 기술 보유 지역을 네 개로 나누어 기와 제작 도구 및 공정을 분석하였다. 토형제작-기와성형-건정 세 공정을 주된 분석 대상으로 삼았으며 한국을 중심으로 주변 지역을 살펴보는 방식으로 진행하였다. 표면적인 현상으로는 양자강 이남과 오키나와가, 한반도 남방과 혼슈 지방이 유사한 기술의 맥을 공유하고 있었다. 그러나 제작 도구와 그에 따른 세부 공정을 유물, 교류관계와 함께 관찰하였을 때, 기와 제작 기술은 지역마다의 특수성만으로 구분할 수 있는 것이 아니었다. 공정별 세부 기법과 인원 편성 관찰은 공정 단위마다 다양한 권역 설정을 가능하게 했으며, 각 권역의 특색이 나타나는 원인과 그에 따른 결과를 추정할 단서를 제공했다. 이를 통해 각 지역의 기술적 특징을 상호 비교하고 그에 대한 원인 규명을 시도하였다. '편절 기법'은 지역이 보유한 기법에 따라서 권역은 구분되었지만, 규구준승(規矩準繩)에 따른 건축 기술에 기반한 기법이었다. 특히 타 지역들과는 다르게 중국을 중심으로 한 중 일만이 공유하던 특수하고도 고유한 제작 기법이었던 것으로 파악되었다. 또한 '타날 기법'은 기술이 전파되고 토착화되면서 다양한 방식으로 분화되는 양상을 드러냈다. 이러한 변화 양상은 기술의 문화적 다변성과 보수성을 관찰할 수 있는 기회가 되었다.

한국과 캐나다 대학생들의 콩가공식품에 대한 수응도 및 소비실태 비교 연구 (A Comparative Study on the Acceptability and the Consumption Attitude for Soy Foods between Korean and Canadian University Students)

  • 안태현
    • 한국작물학회지
    • /
    • 제51권5호
    • /
    • pp.466-476
    • /
    • 2006
  • 한국과 캐나다의 젊은 소비계층인 대학생들을 중심으로 콩에 대한 일반적 인지도, 콩가공식품에 대한 구매 및 소비행태, 수응도 등을 설문문항을 통하여 비교해 보았고, 콩가공식품의 소비시 지적되는 문제점을 알아보았다. 한국 대학생들이 캐나다 대학생들에 비해 콩식품에 대하여 더욱 긍정적인 생각과 올바른 지식을 가지고 있었고, 콩식품에 대한 정보를 얻는 방법으로는 한국 대학생들의 경우 주로 상업적 매체를 통하는 것으로 나타났던 반면, 캐나다 대학생들의 경우는 주로 가족이나 친구 등 인맥을 통하는 비율이 높게 나타났다. 소비행태에 있어서는, 한국의 경우 조사대상자 전체가 구매경험이 있는 것으로 조사되었으나 캐나다의 경우는 조사대상자의 55.4%만이 콩가공식품 구매경험이 있었으며, 친숙하게 느껴지는 콩가공식품, 구매경험이 있는 콩가공식품 그리고 구매빈도가 높은 콩가공식품 등에 대해서는 한국과 캐나다 모두 매우 유사한 경향을 보였는데 두유에 대한 인지도가 가장 높았으며 소비량도 많은 것으로 나타났고 다음으로 콩음료, 마가린 등의 순서로 나타났다. 본 연구결과, 콩가공식품을 포함한 콩식품은 단순한 동양의 전통식품만이 아니라 동서양의 식생활에 일반적인 식품으로 자리매김하고 있는 것으로 나타났다. 단지 콩 유입의 역사가 짧고 낙농업 위주의 식생활이 주를 이루고있는 캐나다에서는 콩식품에 대한 관심이 한국보다 적어 소비경험이 전혀 없는 대학생들이 많았고(44.6%)우유식품을 선호하는 학생들이 많았다. 반면, 한국의 경우는 다양한 콩 가공식품이 일반화되지 않아 두유나 콩음료 등 특정 콩가공식품에 대한 소비율만 높은 것으로 나타났다. 그러나 앞으로 캐나다의 콩가공식품의 소비는 더욱 늘어날 것으로 전망되며, 우리나라 또한 젊은 소비자들의 콩식품 소비 활성화를 위하여 다양한 기호와 욕구를 충족시킬 수 있는 제품개발이 지속적으로 이루어진다면 전통적인 콩식품 및 콩가공식품 소비는 더욱 늘어날 것으로 전망되어 진다.능력이 있었다. 그러므로 $(PPAR{\gamma})$의 활성에 있어 RXR heterodimer가 사람의 백혈병세포에 대한 조절 경로로서 존재하며, PTEN의 upregulation을 통해 백혈병을 조절하기 때문에 백혈병의 예방 및 치료 접근에 $(PPAR{\gamma})$와 RXR ligands가 중요한 역할을 할 것이다.제안 객체 모델에서는 객체의 상태에 따라 사용 가능한 행위가 결정되는 가상 환경을 위해 새로운 인터페이스로 컨텍스트 메뉴(context menu) 인터페이스와 동작 생성 모델을 제시한다. 정의하였다. 객체 모델에서 객체의 상태 정보와 행위 정보를 분석해 아바타가 할 수 있는 행위를 컨텍스트 메뉴로 제공하기 때문에 사용자는 가상 환경의 상태에 상관 없이 직관적으로 명령을 줄 수 있다. 또한 사용자는 기존의 2D 혹은 텍스트기반 스크립트 작성기법을 벗어나 사용자는 제안된 3D 인터페이스 기법을 통하여 실시간으로 아바타의 행위 스크립트를 작성 및 재생 할 수 있다. 본 논문에서 제시한 시스템은 기존의 아바타 중심적인 제어를 객체에 분산함으로써 효율적이고 직관적인 명령을 내릴 수 있고 또한 손쉬운 시나리오 생성을 가능하게 하였다. 본 연구에서는 제안 기법의 활용을 위해 프리젠테이션 도메인 환경의 시스템을 구축하고 아바타-객체 행위제어 및 스크립트 생성 기법을 적용하였다.S는 스크립트 언어를 사용하는 전문가 시스템[7]으로 선언적 룰(Declarative Rule)을 이용하여 지식을 표현 하고 추론을 수행하는 추론 엔진의 한 종류이다. JESS의 지식 표현 방식은 튜닝 원칙을 쉽게 표현하고 수용할 수 있는 구조를 가지고 있으며 작은 크기와 빠른 추론 성능을 가지기 때문에 실시간으로 처리 되는 어플리케이션 튜닝에 적합하다. 지식 기반 모률의 가장 큰 역할은 주어진 데이터베이스 시스템의 모델을 통하여 필요한 새로운 지식을 생성하고 저장하는 것이다.

텍스트 분석을 활용한 정보의 수요 공급 기반 뉴스 가치 평가 방안 (A Method for Evaluating News Value based on Supply and Demand of Information Using Text Analysis)

  • 이동훈;최호창;김남규
    • 지능정보연구
    • /
    • 제22권4호
    • /
    • pp.45-67
    • /
    • 2016
  • 최근 정보 유통의 주요 매체인 인터넷 뉴스와 SNS의 매체 간 특성 차이를 주목한 많은 연구가 있었음에도 불구하고, 양 매체의 차이를 정보의 수요 및 공급 관점에서 파악한 연구는 상대적으로 매우 부족하다. 일반적으로 새로운 정보는 언론사의 뉴스 기사를 통해 대중에게 노출되고, 대중은 이러한 기사에 대한 의견 또는 추가정보를 SNS를 통해 공유함으로써 해당 정보를 수용함과 동시에 확산시킨다. 이러한 측면에서 언론사가 뉴스를 제공하는 행위를 정보의 공급으로 파악할 수 있으며, 대중은 SNS를 통해 이에 대한 관심을 능동적으로 나타냄으로써 해당 정보에 대한 소비 수요를 표출하는 것으로 이해할 수 있다. 이는 상품 및 서비스의 가격이 수요와 공급의 관계에 의해 결정되는 것과 유사한 원리로, 정보의 가치를 정보 수요와 정보 공급의 관계에 기반을 두어 측정할 수 있음을 시사한다. 본 연구에서는 정보 공급의 대표 매체로 인터넷 뉴스 기사를, 정보 수요를 나타내는 대표 매체로 트위터를 선정하고, 특정 이슈에 대한 뉴스의 정보로서의 가치를 이와 관련된 트위터의 양으로 평가하는 뉴스가치지수(NVI, News Value Index)를 고안하여 제시한다. 구체적으로 제안 방법론은 각 이슈별로 NVI를 도출하고 이를 통해 시간의 흐름에 따른 정보 가치의 변화를 시각화하여 나타낸다. 또한 본 연구에서는 제안 방법론의 실무 적용 가능성을 평가하기 위해 인터넷 뉴스 387,018건과 트윗 31,674,795건에 대한 실험을 수행하였다. 그 결과 대부분의 이슈가 전체 정보 시장의 평균 가치에 수렴하는 형태로 변화함을 알 수 있었으며, 꾸준히 평균 이상의 가치를 가지며 정보 시장을 장악하는 등 특이한 양상을 보이는 흥미로운 이슈도 존재함을 파악할 수 있었다.

일반화 적응 심층 잠재요인 추천모형 (A Generalized Adaptive Deep Latent Factor Recommendation Model)

  • 김정하;이지평;장성현;조윤호
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.249-263
    • /
    • 2023
  • 대표적인 추천 시스템 방법론인 협업 필터링(Collaborative Filtering)에는 이웃기반 방법(Neighbor Methods)과 잠재 요인 모델(Latent Factor model)이라는 두 가지 접근법이 있다. 이중 행렬 분해(Matrix Factorization)를 이용하는 잠재 요인 모델은 사용자-아이템 상호작용 행렬을 두 개의 보다 낮은 차원의 직사각형 행렬로 분해하고 이들의 행렬 곱으로 아이템의 평점(Rating)을 예측한다. 평점 패턴으로부터 추출된 요인 벡터들을 통해 사용자와 아이템 속성을 포착할 수 있기 때문에 확장성, 정확도, 유연성 측면에서 이웃기반 방법보다 우수하다고 알려져 있다. 하지만 평점이 지정되지 않은 아이템에 대해서는 선호도가 다른 개개인의 다양성을 반영하지 못하는 근본적인 한계가 있고 이는 반복적이고 부정확한 추천을 초래하게 된다. 이러한 잠재요인 모델의 한계를 개선하고자 각각의 아이템 별로 사용자의 선호도를 적응적으로 학습하는 적응 심층 잠재요인 모형(Adaptive Deep Latent Factor Model; ADLFM)이 등장하였다. ADLFM은 아이템의 특징을 설명하는 텍스트인 아이템 설명(Item Description)을 입력으로 받아 사용자와 아이템의 잠재 벡터를 구하고 어텐션 스코어(Attention Score)를 활용하여 개인의 다양성을 반영할 수 있는 방법을 제시한다. 하지만 아이템 설명을 포함하는 데이터 셋을 요구하기 때문에 이 방법을 적용할 수 있는 대상이 많지 않은 즉 일반화에 있어 한계가 있다. 본 연구에서는 아이템 설명 대신 추천시스템에서 보편적으로 사용하는 아이템 ID를 입력으로 하고 Self-Attention, Multi-head attention, Multi-Conv1d 등 보다 개선된 딥러닝 모델 구조를 적용함으로써 ADLFM의 한계를 개선할 수 있는 일반화된 적응 심층 잠재요인 추천모형 G-ADLFRM을 제안한다. 다양한 도메인의 데이터셋을 가지고 입력과 모델 구조 변경에 대한 실험을 진행한 결과, 입력만 변경했을 경우 동반되는 정보손실로 인해 ADLFM 대비 MAE(Mean Absolute Error)가 소폭 높아지며 추천성능이 하락했지만, 처리할 정보량이 적어지면서 epoch 당 평균 학습속도는 대폭 향상되었다. 입력 뿐만 아니라 모델 구조까지 바꿨을 경우에는 가장 성능이 우수한 Multi-Conv1d 구조가 ADLFM과 유사한 성능을 나타내며 입력변경으로 인한 정보손실을 충분히 상쇄시킬 수 있음을 보여주었다. 결론적으로 본 논문에서 제시한 모형은 기존 ADLFM의 성능은 최대한 유지하면서 빠른 학습과 추론이 가능하고(경량화) 다양한 도메인에 적용할 수 있는(일반화) 새로운 모형임을 알 수 있다.

텍스트 마이닝을 이용한 2012년 한국대선 관련 트위터 분석 (Analysis of Twitter for 2012 South Korea Presidential Election by Text Mining Techniques)

  • 배정환;손지은;송민
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.141-156
    • /
    • 2013
  • 최근 소셜미디어는 전세계적 커뮤니케이션 도구로서 사용에 전문적인 지식이나 기술이 필요하지 않기 때문에 이용자들로 하여금 콘텐츠의 실시간 생산과 공유를 가능하게 하여 기존의 커뮤니케이션 양식을 새롭게 변화시키고 있다. 특히 새로운 소통매체로서 국내외의 사회적 이슈를 실시간으로 전파하면서 이용자들이 자신의 의견을 지인 및 대중과 소통하게 하여 크게는 사회적 변화의 가능성까지 야기하고 있다. 소셜미디어를 통한 정보주체의 변화로 인해 데이터는 더욱 방대해지고 '빅데이터'라 불리는 정보의 '초(超)범람'을 야기하였으며, 이러한 빅데이터는 사회적 실제를 이해하기 위한 새로운 기회이자 의미 있는 정보를 발굴해 내기 위한 새로운 연구분야로 각광받게 되었다. 빅데이터를 효율적으로 분석하기 위해 다양한 연구가 활발히 이루어지고 있다. 그러나 지금까지 소셜미디어를 대상으로 한 연구는 개괄적인 접근으로 제한된 분석에 국한되고 있다. 이를 적절히 해결하기 위해 본 연구에서는 트위터 상에서 실시간으로 방대하게 생성되는 빅스트림 데이터의 효율적 수집과 수집된 문헌의 다양한 분석을 통한 새로운 정보와 지식의 마이닝을 목표로 사회적 이슈를 포착하기 위한 실시간 트위터 트렌드 마이닝 시스템을 개발 하였다. 본 시스템은 단어의 동시출현 검색, 질의어에 의한 트위터 이용자 시각화, 두 이용자 사이의 유사도 계산, 트렌드 변화에 관한 토픽 모델링 그리고 멘션 기반 이용자 네트워크 분석의 기능들을 제공하고, 이를 통해 2012년 한국 대선을 대상으로 사례연구를 수행하였다. 본 연구를 위한 실험문헌은 2012년 10월 1일부터 2012년 10월 31일까지 약 3주간 1,737,969건의 트윗을 수집하여 구축되었다. 이 사례연구는 최신 기법을 사용하여 트위터에서 생성되는 사회적 트렌드를 마이닝 할 수 있게 했다는 점에서 주요한 의의가 있고, 이를 통해 트위터가 사회적 이슈의 변화를 효율적으로 추적하고 예측하기에 유용한 도구이며, 멘션 기반 네트워크는 트위터에서 발견할 수 있는 고유의 비가시적 네트워크로 이용자 네트워크의 또 다른 양상을 보여준다.