• 제목/요약/키워드: Text Visualization

검색결과 212건 처리시간 0.022초

소셜미디어 콘텐츠의 오피니언 마이닝결과 시각화: N라면 사례 분석 연구 (Visualizing the Results of Opinion Mining from Social Media Contents: Case Study of a Noodle Company)

  • 김유신;권도영;정승렬
    • 지능정보연구
    • /
    • 제20권4호
    • /
    • pp.89-105
    • /
    • 2014
  • Web2.0의 등장과 함께 급속히 발전해온 온라인 포럼, 블로그, 트위터, 페이스북과 같은 소셜 미디어 서비스는 소비자와 소비자간의 의사소통을 넘어 이제 기업과 소비자 사이의 새로운 커뮤니케이션 매체로도 인식되고 있다. 때문에 기업뿐만 아니라 수많은 기관, 조직 등에서도 소셜미디어를 활용하여 소비자와 적극적인 의사소통을 전개하고 있으며, 나아가 소셜 미디어 콘텐츠에 담겨있는 소비자 고객들의 의견, 관심, 불만, 평판 등을 분석하고 이해하며 비즈니스에 적용하기 위해 이를 적극 분석하는 단계로 진화하고 있다. 이러한 연구의 한 분야로서 비정형 텍스트 콘텐츠와 같은 빅 데이터에서 저자의 감성이나 의견 등을 추출하는 오피니언 마이닝과 감성분석 기법이 소셜미디어 콘텐츠 분석에도 활발히 이용되고 있으며, 이미 여러 연구에서 이를 위한 방법론, 테크닉, 툴 등을 제시하고 있다. 그러나 아직 대량의 소셜미디어 데이터를 수집하여 언어처리를 거치고 의미를 해석하여 비즈니스 인사이트를 도출하는 전반의 과정을 제시한 연구가 많지 않으며, 그 결과를 의사결정자들이 쉽게 이해할 수 있는 시각화 기법으로 풀어내는 것 또한 드문 실정이다. 그러므로 본 연구에서는 소셜미디어 콘텐츠의 오피니언 마이닝을 위한 실무적인 분석방법을 제시하고 이를 통해 기업의사결정을 지원할 수 있는 시각화된 결과물을 제시하고자 하였다. 이를 위해 한국 인스턴트 식품 1위 기업의 대표 상품인 N-라면을 사례 연구의 대상으로 실제 블로그 데이터와 뉴스를 수집/분석하고 결과를 도출하였다. 또한 이런 과정에서 프리웨어 오픈 소스 R을 이용함으로써 비용부담 없이 어떤 조직에서도 적용할 수 있는 레퍼런스를 구현하였다. 그러므로 저자들은 본 연구의 분석방법과 결과물들이 식품산업뿐만 아니라 타 산업에서도 바로 적용 가능한 실용적 가이드와 참조자료가 될 것으로 기대한다.

집단지성 기반 학습자료 북마킹 서비스 시스템 (Learning Material Bookmarking Service based on Collective Intelligence)

  • 장진철;정석환;이슬기;정치훈;윤완철;이문용
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.179-192
    • /
    • 2014
  • 최근 IT 환경의 변화에 따라 웹 서비스를 기반으로 대규모 사용자 대상의 상호 참여적인 MOOC(Massive Open Online Courses)과 같은 온라인 교육 환경이 부상하고 있다. 그러나 온라인 교육 시스템은 원거리로 학습이 이루어짐에 따라 학습자의 자발적 동기를 꾸준히 유지하기 어려우며, 또한 학습자 간에 지식을 공유하고 공유한 지식을 활용하는 기능이 부족하다. 이러한 문제를 극복하기 위해 구성주의적 학습이론과 집단지성에 기반하여 학습자가 보유한 학습자료를 공유하고 개인화된 학습자료 추천을 받을 수 있는 학습자료 북마킹 서비스인 WeStudy를 구현하였다. 위키피디아(Wikipedia), 슬라이드쉐어 (SlideShare), 비디오렉쳐스 (VideoLectures) 등 현존하는 집단지성 기반 서비스들의 주요 기능으로부터 필요한 집단지성 기능들을 검토하였으며, 본 서비스의 주요 기능으로 1) 리스트 및 그래프 형태의 학습자료 리스트 시각화, 2) 개인화된 학습자료 추천, 3) 보다 상세한 학습자료 추천을 위한 관심 학습자 지정 등을 도출하여 시스템을 설계하였다. 이후, 웹 기반으로 구현된 세 가지 주요기능 별로 개량된 휴리스틱 사용성 평가 방법을 통해 개발된 시스템의 사용성 평가를 실시하였다. 10명의 HCI 분야 전공자 및 현업 종사자를 대상으로 정량적 및 정성적인 평가 결과, 세 가지의 주요 기능에서 전반적으로 사용성이 우수한 것으로 판정되었다. 주요 기능 별 정성적인 평가에서 도출된 여러 마이너 이슈들을 반영할 필요가 있으며, 향후 대규모 사용자를 대상으로 본 서비스를 보급하고 이용할 수 있도록 제공하여 자발적인 지식 공유 환경을 조성할 수 있을 것으로 전망된다.

국내 휴대폰의 진화패턴 규명을 위한 텍스트 마이닝 방안 제안 및 사례 연구 (A Case Study of a Text Mining Method for Discovering Evolutionary Patterns of Mobile Phone in Korea)

  • 온병원
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권2호
    • /
    • pp.29-45
    • /
    • 2015
  • 생물의 진화패턴과 원리는 지난 200년간 학문적인 영역에서 활발히 연구되어 왔으며 생명의 진화에 대한 체계적인 이론, 개념 및 방법론이 제시되었다. 그리고 진화경제학, 진화심리학, 진화언어학 등 다양한 분야에 적용되어 큰 연구 성과를 거두고 있다. 이와 더불어 진화생물학 논리를 인간이 만든 제품에 적용하려는 시도도 병행되어 왔다. 기존 연구들이 생물진화 논리를 인공물에 그대로 적용하거나 해당 분야 전문가의 직관에 근거하여 진화 모형을 구축하는 것이어서 진화 모형에 대한 일반화를 시키기에는 한계를 가진다. 또한 생물과 달리 인공물은 인간 의지의 상상력이 반영되기 때문에 생물진화 이론을 곧바로 적용할 수 없다고 알려져 왔다. 따라서 본 논문에서는 특정인의 주관에 벗어나 일반 대중들의 생각을 엿보고 이를 바탕으로 진화 모형을 구축하는 것을 목표로 한다. 이를 위해, 인공물을 계통적으로 분류할 수 있는 체계적인 틀을 제시하는 텍스트 마이닝 방안과 그 결과물을 효과적으로 보여줄 수 있는 시각화 방안을 차례로 제안한다. 특히, 제안방안을 바탕으로 최근 혁신의 아이콘으로 떠오르고 있는 휴대폰과 스마트폰에 대한 사례 연구를 집중적으로 수행한다. 지난 10년간 국내에서 출시된 휴대폰과 스마트폰에 대한 리뷰 포스트들을 수집하고 분석하여, 진화패턴을 발견하고 요약해서 보여주며 그 결과에 대해서 자세히 토의한다. 더욱이 이러한 작업은 소수의 전문가들이 방대한 문헌과 자료를 조사 정리하여, 오랜 시간에 걸쳐 진화계통도를 그리게 되는 매우 지난한 작업이다. 하지만 본 논문에서 제안한 방안은 반자동(semi-automatic) 마이닝 알고리즘으로 인간의 노력을 최소화할 수 있어 그 효용 가치가 높다. 이러한 연구를 통해 인간의 창의력과 상상력이 구현되는 방식을 이해하고 휴대폰의 미래 모습을 전망하는데 있어 유관기업들에게 큰 도움을 줄 것이다.

텍스트 마이닝을 활용한 중국공산당 20차 당대회 보고문 분석 (An Analysis of the 20th National Congress Report through Text-mining Methods)

  • 권도경;김정수;박지현
    • 분석과 대안
    • /
    • 제7권1호
    • /
    • pp.115-145
    • /
    • 2023
  • 2022년 10월 16일부터 22일까지, 총 이레 동안 진행된 중국공산당 제20차 전국대표대회(이하 '20차 당대회'로 약칭)는 개최 훨씬 이전부터 '시진핑이 3연임을 할 것인가', '3연임을 함으로써 영구 집권의 기초를 닦을 것인가' 등의 문제를 둘러싸고 세간의 주목을 받았다. 한국 언론의 관심은 주로 20차 당대회가 진시황에 버금가는 '시황제의 대관식'이었다는 점에, 혹은 당대회 진행 중 전 총서기 후진타오(胡锦涛)가 강제퇴장 당하는 장면에 모아졌고, 학계도 20차 당대회에서 시진핑이 정치국 위원과 상무위원에 대한 인사 배치를 어떻게 할 것인지에, 또 시진핑의 후계 구도가 드러날 것인가 등에 집중적인 관심을 기울이면서 오히려 언론의 우려를 강화시켰다. 본 논문은 20차 당대회에서의 시진핑의 정치적 의도에 대한 해석과는 거리를 두면서, 당대회 보고문에 대한 계량적 분석을 시도할 것이다. 중국공산당의 당대회 보고문은 향후 5년 간의 정치, 경제, 사회, 문화, 외교 및 양안관계, 과학기술 등의 분야에 대한 중국공산당의 통치 비전 및 목표, 그리고 전략적 방향을 담고 있으면서 그 자체로 높은 서사성과 논리성을 가지고 있는 문건으로 학술적 가치가 높기 때문이다. 본 논문은 당대회 문건을 대상으로 텍스트 마이닝 방법론을 사용하여 주요 어휘 빈도수 조사 및 분석, 키워드 분석, 주요 표현 조사 및 분석을 진행할 것이다. 이를 통해 18차 당대회에서 20차 당대회까지, 즉 2013년부터 2027년까지 15년의 시진핑 집권기 동안 중국공산당 통치 비전의 거시적인 변화를 계량화, 시각화할 것이다.

소셜 컴퓨팅을 위한 연구·학습 주제의 계층적 지식기반 구축 (Building Hierarchical Knowledge Base of Research Interests and Learning Topics for Social Computing Support)

  • 김선호;김강회;여운동
    • 한국콘텐츠학회논문지
    • /
    • 제12권12호
    • /
    • pp.489-498
    • /
    • 2012
  • 본 논문은 연구 학습 주제 지식베이스를 통한 소셜컴퓨팅 지원에 관한 연구로 두 가지 하부 연구로 구성되었다. 첫 번째 연구는 다양한 학문분야에서 전자 도서관 이용자들의 연구 및 학습 주제를 추출하기 위해 분야별로 분류가 잘 되어 있는 NDLTD Union catalog의 석박사 학위 논문 (Electronic Theses and Dissertations : ETDs)을 분석하여 계층적 지식베이스를 구축하는 연구이다. 석박사 학위 논문 이외에 ACM Transactions 저널의 논문과 컴퓨터 분야 국제 학술대회 웹사이트도 추가로 분석하였는데 이는 컴퓨팅 분야의 보다 세분화된 지식베이스를 얻기 위해서이다. 계층적 지식베이스는 개인화 서비스, 추천시스템, 텍스트 마이닝, 기술기회탐색, 정보 가시화 등의 정보서비스와 소셜컴퓨팅에 유용하게 사용될 수 있다. 본 논문의 두 번째 연구 부분에서는 우리가 만든 계층적 지식기반을 활용하여 4개의 사용자 커뮤니티 마이닝 알고리즘 중에서 우리가 수행중인 소셜 컴퓨팅 연구, 즉 구성원간의 결합도에 기반한 추천시스템에 최상의 성능을 보이는 그룹핑 알고리즘을 찾는 성능 평가 연구 결과를 제시하였다. 우리는 이 논문을 통해서 우리가 제안하는 연구 학습 주제 데이터베이스를 사용하는 방법이 기존에 사용자 커뮤니티 마이닝을 위해 사용되던 비용이 많이 필요하고, 느리며, 개인정보 침해의 위험이 있는 인터뷰나 설문에 기반한 방법을 자동화되고, 비용이 적게 들고, 빠르고, 개인정보 침해 위험이 없으며, 반복 수행시에도 일관된 결과를 보여주는 방법으로 대체할 수 있음을 보이고자 한다.

디지털도서관 구축과정에서 TREC 텍스트 문서의 시각적 표현에 관한 연구 (A Study on the Visual Representation of TREC Text Documents in the Construction of Digital Library)

  • 정기태;박일종
    • 정보관리학회지
    • /
    • 제21권3호
    • /
    • pp.1-14
    • /
    • 2004
  • 이용자들은 유사문서를 검색할 때, 각 가지 문서의 시각적표현을 통하여 도움을 얻게 되며, 모든 정보검색에 관한 연구는 이용자들의 다양한 요구를 충족시키기 위한 여러 가지의 해결책을 제시하고 있다. 제안되어진 해결책은 알파벳 순서로 만들어 진 파피루스 문서로부터 카드목록, 마이크로 필름을 이용한 저장, 컴퓨터 디스크를 이용한 파일 보관 등에 이르기까지 다양한 방법들을 들 수 있을 것이다. 또한 대부분의 정보검색 시스템들은 Document SUITogate( 문헌을 대체할 수 있는 것들 ), 즉 요약문, 목차, 초록, 리뷰한 내용, 기계가독형목록 (MARC) 기록물 등과 같은 서지자료들을 전체논문을 대체하여 이용하게 된다. 본 논문에서는 또 다른 형태의 Document Surrogate 로서 용어 리스트의 집단화 방법을 이용해서 찾아보았다. 이 Document Surrogate 들은 Multidimensional Scaling (MDS) 을 이용해서 2 차원 그래프 위에 좌표로써 표현되어지고 있다. 사용된 2차원의 그래프 위에서 좌표간의 거리는 문헌들의 유사성을 나타낸다고 해석할 수 있으며 거리가 가까우면 가까울수록 두 문서는 더욱 유사한내용을 포함하고 있다고 해석할 수 있는 것으로 밝혀졌다.

기억에 기반한 조경설계의 개념 형상화 유형 (Types of Concept Figuration in Landscape Design based on Memory)

  • 안승홍
    • 한국조경학회지
    • /
    • 제45권6호
    • /
    • pp.171-184
    • /
    • 2017
  • 설계가는 차원 높은 설계철학과 언어를 구사하기 위해 지식 축척과 통찰력 배양을 통해 사고의 폭과 깊이를 추구한다. 본 연구는 조경설계에서 설계가의 '기억'을 기반으로 한 개념 형상화 유형 특성을 구명하고자 하였다. 연구결과는 다음과 같다. 첫째, 설계 아이디어는 설계가의 언어와 이미지 기억을 바탕으로 발상을 시작하여 대표적 의사소통 수단인 언어적 관점과 시각적 관점으로 형상 유형이 구성된다. 둘째, 조경설계의 언어적 개념 형상화는 2가지로 구성된다. '설계주제로서 제목의 상징적 언어'는 하나의 '구(句)'일 수 있으며, 위계를 두어 주(主)와 부(副)의 균형을 갖추어야 한다. '개념적 시나리오의 서술적 형상'은 서술적으로 개념을 표현하여 독자가 설계된 경관을 가상으로 경험하는 글이다. 셋째, 조경설계의 시각적 개념 형상화는 3가지로 구성된다. '다이어그램의 시각적 단순 형상'은 단순한 그래픽으로 상징물, 주석과 이미지, 키워드를 사용하여 쉽게 형상화된다. '개념스케치와 핵심 아이디어의 형상'은 초기 개념단계에서 물리적 요소와 공간에 대한 형태 속성 및 공간관계와 같은 아이디어의 핵심을 파악하는데 유용하다. '이미지 조합으로 새로운 형상을 창조하는 콜라주와 몽타주'는 새로운 시각을 제공하는 재료와 이미지의 모음으로 경관 현상을 기록하여 아이디어를 압축적으로 묘사하는 도구이다.

스트링 B-트리를 이용한 게놈 서열 분석 시스템 (An Analysis System for Whole Genomic Sequence Using String B-Tree)

  • 최정현;조환규
    • 정보처리학회논문지A
    • /
    • 제8A권4호
    • /
    • pp.509-516
    • /
    • 2001
  • 생명 과학의 발전과 많은 게놈(genome) 프로젝트의 결과로 여러 종의 게놈 서열이 밝혀지고 있다. 생물체의 서열을 분석하는 방법은 전역정렬(global alignment), 지역정렬(local alignment) 등 여러 가지 방법이 있는데, 그 중 하나가 k-mer 분석이다. k-mer는 유전자의 염기 서열내의 길이가 k인 연속된 염기 서열로서 k-mer 분석은 염기서열이 가진 k-mer들의 빈도 분포나 대칭성 등을 탐색하는 것이다. 그런데 게놈의 염기 서열은 대용량 텍스트이고 k가 클 때 기존의 온메모리 알고리즘으로는 처리가 불가능하므로 효율적인 자료구조와 알고리즘이 필요하다. 스트링 B-트리는 패턴 일치(pattern matching)에 적합하고 외부 메모리를 지원하는 좋은 자료구조이다. 본 논문에서는 스트링 B-트리(string B-tree)를 k-mer 분석에 효율적인 구조로 개선하여, C. elegans 외의 30개의 게놈 서열에 대해 분석한다. k-mer들의 빈도 분포와 대칭성을 보여주기 위해 CGR(Chaotic Game Representation)을 이용한 가시화 시스템을 제시한다. 게놈 서열과 매우 유사한 서열 상의 어떤 부분을 시그니쳐(signature)라 하고, 높은 유사도를 가지는 최소 길이의 시그니쳐를 찾는 알고리즘을 제시한다.

  • PDF

웹 기반 산불위험지수 표출시스템에서의 UML(Unified Modeling Language) 설계 사례 (Case Study of UML(Unified Modeling Language) Design for Web-based Forest Fire Hazard Index Presentation System)

  • 조윤원;조명희;안승섭
    • 한국지리정보학회지
    • /
    • 제5권1호
    • /
    • pp.58-68
    • /
    • 2002
  • 최근 재해방재 사업에 대한 인식이 고조화 되면서 중앙정부나 지자체에서는 일반 국민들에게 국가에서 시행하는 재해방재 서비스를 웹이라는 공간을 통해 제공함으로서 국민들의 재해방지에 대한 관심을 부각시키려는 노력을 하고 있다. 특히, 사용자 누구든지 접근할 수 있는 웹 환경하에서 대규모의 국가적 재해로 연결될 수 있는 산불의 당일 발생위험지수를 시각화하는 서비스를 제공한다면 산불방지에 대한 국민들의 관심과 인식을 불러 일으켜 산불피해를 조금이나마 최소화하는데 도움을 줄 것이다. 본 연구에서 개발한 산불위험지수 예보시스템은 우리나라의 당일 산불위험지수를 지도상에 시각적으로 표출하고 위험지수산출에 관계되는 자료들을 텍스트 형식으로 서비스하도록 한다. 시스템 개발에 있어서는 컴포넌트를 이용하여 소프트웨어를 생산하는 방식으로 패러다임이 변해 가는 현재의 추세를 반영하기 위하여 UML(Unified Modeling Language)을 이용한 컴포넌트 기반 개발 프로세스를 설계하고 이를 통해 시스템 개발을 체계화하고자 한다. 개발된 시스템은 향후 사용자 요구 사항변경이나 서비스 영역의 확대 시 시스템 유지보수 측면에서 탄력성을 가질 것으로 예상되며 아울러 본 시스템과 유사한 서비스를 제공하는 다른 웹 GIS(Geographic Information System) 애플리케이션 개발에 있어서도 컴포넌트 재사용을 통하여 개발에 소요되는 비용과 시간을 최소화시킬 수 있을 것이라 사료된다.

  • PDF

이커머스에서 정보 탐색을 위한 네비게이션 인터페이스 디자인 유형 연구 (A study on the type of navigation interface design for information search in e-commerce)

  • 정다영;김승인
    • 디지털융복합연구
    • /
    • 제19권10호
    • /
    • pp.411-418
    • /
    • 2021
  • 본 연구에서는 Statista와 National Retail Federation가 선정한 100대 이커머스 서비스들을 대상으로 실제 사용자에게 제공하고 있는 정보 탐색 방식 및 사용자 인터페이스의 유형을 조사하고, 인터페이스를 구성하는 시각화 요소 및 조작에 대한 상호작용 방식을 분석한 후 각 유형이 가지는 특성을 도출하였다. 연구결과, 첫째, 정보의 수와 위계단계가 많을수록 스프레드 형태를, 적을수록 드롭다운과 메가 메뉴 방식을 사용하는 경우가 많았다. 둘째, 정보 위계에 따른 시각적 구분 방식은 배경색상, 서체의 변화, 선을 가장 많이 사용하며 변화에 대한 인지가 가장 빠른 배경 색상과 영역간 구분을 명확하게 할 수 있도록 돕는 선을 사용하는 경우가 많았다. 셋째, 사용자 조작에 대한 상호작용 방식은 배경 컬러, 텍스트 컬러, 선 등 다양한 요소들을 두 가지 이상 동시에 적용하는 경우가 가장 많았다. 본 연구는 이커머스의 정보 탐색을 위한 인터페이스의 유형과 세부 요소들의 선택 기준이 될 수 있는 항목들의 분석을 통해 유형별 특성을 정의하였다는 점에서 의미가 있다.