• 제목/요약/키워드: 의미적 토픽

검색결과 128건 처리시간 0.03초

독후감 텍스트의 토픽모델링 적용에 관한 탐색적 연구 (A Study on the Application of Topic Modeling for the Book Report Text)

  • 이수상
    • 한국도서관정보학회지
    • /
    • 제47권4호
    • /
    • pp.1-18
    • /
    • 2016
  • 이 연구는 독후감 텍스트의 주제분석에 토픽모델링의 활용방안을 탐색하는 것을 목적으로 하고 있다. 텍스트의 주제분석 방안으로서 토픽모델링 분석방법을 이해하고, R에서 제공하는 "topicmodels" 패키지의 LDA 함수를 사용하여 23건의 사례 독후감 텍스트들을 대상으로 실제의 분석작업을 수행하였다 토픽모델링 분석결과 16개의 토픽들을 추출하였고 토픽과 구성 단어들의 관계에서 토픽 네트워크 사례 독후감과 토픽들의 관계에서 독후감 네트워크를 구성하였다. 이후 토픽 네트워크와 독후감 네트워크를 대상으로 중심성 분석을 수행하였으며 분석결과는 다음과 같다. 첫째 16개의 토픽들이 1개의 컴포넌트를 가지는 네트워크로 나타났다. 이것은 16개 토픽들이 상호 연관되어 있다는 것을 의미한다. 둘째, 독후감 네트워크에서는 연결정도 중심성이 높은 독후감들과 낮은 독후감들로 구분이 되었다. 전자의 독후감들은 다른 독후감들과 주제적으로 유사성을 가지며 후자의 독후감들은 다른 독후감들과 주제적으로 상이성을 가지는 것으로 해석하였다. 토픽모델링의 결과를 네트워크 분석과 결합함으로써 독후감의 주제파악에 유용한 결과들을 얻게 되었다.

토픽의 조합으로 이벤트 흐름을 예측하기 위한 시각적 분석 시스템 (Visual Analytics using Topic Composition for Predicting Event Flow)

  • 연한별;김석연;장윤
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권12호
    • /
    • pp.768-773
    • /
    • 2015
  • 사회적 혼란을 야기하는 이벤트는 발생 직후 어떻게 대응하느냐에 따라 소요되는 비용의 편차가 크다. 이에 따라 비정상적인 이벤트를 탐지하고 의미를 파악하는 연구가 많이 진행되고 있다. 또한 예측 분석에 관한 연구도 많이 수행되고 있다. 그러나 대부분의 연구는 이벤트의 전체적인 미래 경향에 대한 수치 결과를 예측할 뿐, 이벤트가 내포하는 의미에 대한 예측 연구는 미비하다. 이에 따라 본 논문에서는 비정상적인 이벤트가 내포하는 토픽의 조합을 통해 미래에 어떠한 일이 발생할 수 있는지에 대한 시각적 예측 분석 방법을 제안한다. 제안하는 방법은 먼저 트윗에서 실시간으로 비정상 이벤트를 탐지한다. 그 다음 과거 유사한 사례를 탐색한 다음 이벤트와 관련된 토픽들을 추출한다. 마지막으로 사용자는 의미 있는 토픽의 조합을 통해 미래에 어떠한 일이 발생할 수 있을지 분석할 수 있다. 실험은 두 가지 상황에 대한 예측 분석을 수행하였으며, 실험 결과 본 논문에서 제안한 방법의 타당성을 입증하였다.

TMDR 기반의 실시간 통합 검색을 위한 분산질의 변환 기법에 대한 연구 (A Study on Distribution Query Conversion Method for Real-time Integrating Retrieval based on TMDR)

  • 황치곤;신효영;정계동;최영근
    • 한국정보통신학회논문지
    • /
    • 제14권7호
    • /
    • pp.1701-1707
    • /
    • 2010
  • 본 연구는 분산된 이종 정보시스템 사이의 의미적 상호운용성을 제공함으로써 다양한 형태의 데이터를 실시간으로 통합하여 검색할 수 있는 시스템 환경을 구현하는데 있다. 의미적 상호운용성은 온톨로지의 집합체인 TMDR(Topicmaps Metadata Registry)을 제공함으로써 가능하다. TMDR은 MDR(MetaData Registry)과 토픽맵을 결합하여 데이터베이스에 저장한 것으로, 분산 쿼리 작성과 효율적으로 지식을 제공할 수 있다. MDR은 분산된 데이터 관리를 위한 메타데이터 관리 기법이며, 토픽맵은 지식 데이터의 접근을 위한 계층성과 연관성을 고려한 온톨로지 표현 기법이다. 우리는 온톨로지의 한 형태인 TMDR을 제안하고, 이는 데이터와 스키마 레벨에서 의미적 충돌을 탐지하고 해결할 수 있다. 본 시스템은 이종의 정보 소스들을 통합 접근하기 위한 쿼리 프로세싱 기법을 제안한다. 이는 기존의 검색과 달리 주제를 중심으로 한 연관관계를 제공함으로써 효율적임 검색과 추론이 가능하다.

공원 이슈에 대한 주요 언론의 담론변화분석 - 1995년부터 2019년까지 신문 기사를 중심으로 - (Analysis of Changes in Discourse of Major Media on Park Issues - Focusing on Newspaper Articles Published from 1995 to 2019 -)

  • 고하정
    • 한국조경학회지
    • /
    • 제49권5호
    • /
    • pp.46-58
    • /
    • 2021
  • 국내에 근대식 공원이 도입된 이후, 공원은 우리에게 필수적인 존재가 되었다. 민선시기 이후, 공원조성 등 공원을 둘러싼 이슈가 생산되고 언론을 통해 확산되어 담론을 형성하는 과정을 거쳤다. 이에 본 연구는 민선시장 체제인 1995년 이후의 '공원' 관련 이슈를 다룬 국내 중앙지의 보도기사를 수집하여 토픽분석과 의미연결망 분석을 통해 공원에 대한 시계열적 담론 변화 추이를 분석하였다. LDA 토픽모델링 분석결과, 5개의 토픽-도시공원확충(토픽1), 역사문화공원(토픽2), 이용프로그램(토픽3), 동물원 사건사고(토픽4), 공원조성과정갈등(토픽5)-으로 분류되었다. 언론에서 다룬 주요 공원담론은 다음과 같다. 첫째, 공원의 양적 확장에 대한 조성과정과 갈등이 주요 담론으로 다뤄지고 있다. 둘째, 신규 공원 조성시마다 공원명이 신규 단어로 출현하고 이후 지속적으로 언급되면서 담론형성에 한 축을 담당하고 있다. 셋째, 민선시대 공원 관련 언론에서 '주민'은 주요 주체로 '도시', '환경'과 함께 언급되며, 공원의 공공성에 대한 담론을 형성하고 있다. 본 연구는 공원이 언론을 통해 어떻게 해석되는지 담론변화를 살펴보았다는 점에서 의의를 가진다. 추후 본 연구에서 다룬 중앙지 외에 지역지, 전문지 등 다른 매체에 대한 연구를 통해 공원에 대한 다양한 관점의 담론이 다뤄지길 기대한다.

토픽모델링과 의미연결망분석을 활용한 한국 예술경영 연구의 동향 변화 - 1988년부터 2017년까지 국내 학술논문 분석을 중심으로 - (An Analysis of Arts Management-Related Studies' Trend in Korea using Topic Modeling and Semantic Network Analysis)

  • 황서이;박양우
    • 예술경영연구
    • /
    • 제50호
    • /
    • pp.5-31
    • /
    • 2019
  • 본 연구는 국내 예술경영분야 학술논문의 연구동향을 파악하고 향후 연구방향을 모색하기 위해 토픽모델링과 의미연결망분석을 적용하여 연구하였다. 연구범위는 예술경영분야와 직·간접적으로 연관된 한국연구재단의 등재학술지인 '문화정책논총', '문화경제연구', '예술경영연구', '문화산업연구', '인문콘텐츠'에 수록된 총 2,110편이고, 학술논문의 서명, 초록, 주제어를 분석대상으로 삼았다. 시간적 범위는 1988년부터 2017년까지로 설정하였고, 연구토픽과 토픽의 추세, 토픽 간의 관계를 분석하였다. 분석 프로그램은 오픈 소프트웨어인 R과 표준 통계 소프트웨어 SPSS를 활용하였다. 분석결과를 요약하면 다음과 같다. 첫째, 최상위 빈도수를 기록한 주요단어는 '한국', '문화', '콘텐츠', '문화콘텐츠', '산업' 이었다. '정책', '지역', '예술', '전략' 의 주요 단어가 그 뒤를 따르고 있었고, '미디어', '경제', '관람객', '마케팅' 등도 상위에 포진되어 있었다. 이는 예술경영분야에서 상위 주요단어들에 대한 논의가 활발하게 시도되고 있다고 볼 수 있다. 둘째, 예술경영분야에서는 총 11개의 연구토픽이 도출되었으며, '문화예술일반', '문화기술', '문화예술정책', '지역문화', '문화콘텐츠산업', '문화교류', '문화예술마케팅', '문화예술교육', '(시각예술)예술경영', '(공연예술)예술 경영', '문화경제: 컬처노믹스' 순으로 나타났다. 셋째, 제4차 산업혁명을 맞은 시대의 흐름에 맞춰 융합교육, 미디어, 기술, 콘텐츠 등과 밀접하게 관련 있는 '문화예술교육'과 '문화교류'에 대한 연구들이 두각을 드러내고 있었다. 넷째, 의미연결망분석에 따르면, 예술경영분야는 문화예술을 중심으로 다양하고 복잡하게 타 영역들과의 연구가 시도되고 있었으며, 관객조사와 관객개발에 관련한 영역이 상대적으로 많이 논의된 것으로 나타났다. 분석결과를 바탕으로 연구의 의의 그리고 한계점 및 향후 연구에 대한 제언을 논의하였고, 문화예술과 인공지능, 문화예술과 빅데이터라는 융합연구에 대한 발전 가능성을 제시하였다.

토픽맵을 이용한 3차원 가상환경 탐색항해 도구의 설계 및 구현 (Design and Implementation of Navigation-Aid for 3D Virtual Environment using Topic Map)

  • 김학근;송특섭;임순범;최윤철
    • 정보처리학회논문지B
    • /
    • 제11B권7호
    • /
    • pp.793-802
    • /
    • 2004
  • 3차원 가상환경은 시각정보 위주의 제한적인 정보를 제공한다 이는 사용자가 환경 안에서 방향을 상실하게 되는 원인이 된다. 이를 보완하기 위해 여러 가지 방법의 탐색항해 도구에 대한 연구가 진행 되었다. 본 연구에서는 시맨틱 웹 구축 기술의 하나인 토픽맵 기법을 3차원 가상환경에 적용하여 탐색항해 도구를 설계했다. 토픽맵은 토픽과 토픽 사이의 연결 관계를 정의함으로 의미적 연결지도를 구축한다. 이를 적용한 탐색항해 도구의 활용성 실험에서 대표성이 높은 목표 보다는 세밀한 목표를 찾을 때 효과적으로 탐색항해에 도움이 되고 있음을 보여주었다. 또한 찾고자 하는 목표가 정확하지 않은 상태에서의 탐색항해에서 주제에 관련된 주변 지식의 제공은 사용자의 목표 선택에 효과적임을 확인할 수 있었다.

토픽맵 기반의 기록정보 검색시스템 구축에 관한 연구 (Construction of Record Retrieval System based on Topic Map)

  • 권창호
    • 기록학연구
    • /
    • 제19호
    • /
    • pp.57-102
    • /
    • 2009
  • 최근, 웹을 이용한 기록정보의 유통과 이용이 증가하고, 정보적 활용 가치가 제고되어 웹사이트를 이용한 기록정보서비스가 기록관의 중요업무로 부각되고 있다. 웹을 이용한 기록정보서 비스의 핵심은 이용자가 원하는 기록정보의 검색을 용이하게 하는데 있다. 검색을 용이하게 하기 위해서는 검색시스템의 기본 메커니즘인 이용자질의와 기록정보표현의 매칭의 정확성이 요구된다. 이를 위해 기록정보 관리자들은 다양한 정보표현 도구를 이용하고 있지만, 이용자들은 여전히 정보검색 과정에서 어려움을 겪고 있다. 이를 개선하기 위해 본 연구에는 기록물의 기술정보 메타데이타를 중심으로 정보자원을 구조화하여 이용자 질의의 접근점을 확장하고, 의미있는 매칭을 통해 지식자원화된 검색결과값을 제공하기 위해 토픽맵 기반의 기록정보 검색시스템을 구축하고자 한다. 구축대상은 웹사이트를 이용하는 불특정 이용자이며, 구축범위는 국가기록포탈의 기록자원 중 대통령 기록물로 선정하였다. 구축단계는 다음과 같다. 1)기록물의 기술정보 메타데이타를 중심으로 토픽맵 기반의 기록정보서비스를 위한 온톨로지 모델을 설계한다. 2)설계한 온톨로지 모델을 바탕으로 국가기록포탈에서 추출한 정보자원목록을 에디터를 이용해 토픽맵으로 반입하여 검색시스템으로 구현한다. 3)구축된 검색시스템의 사용자 인터페이스에서 테스트질의를 통해 토픽맵기반 검색시스템의 특징을 확인하고 그 의미를 평가한다. 최종적으로, 의미적 추론에 의한 연관 네비게이션검색을 확인하고, 분산된 기록정보자원 간의 연계된 결과값을 통해 지식자원화의 가능성도 제시한다.

통계 분석과 뉴스 기사 토픽 모델링을 통한 코로나19가 자살에 미치는 영향 분석 (The Effect of Covid-19 on Suicide through Statistical Analysis and Topic Modeling of News Articles)

  • 권민지;김준철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.518-520
    • /
    • 2021
  • 전 세계적으로 확산된 코로나19의 장기화로 인해 국민들은 경제적, 심리적 어려움을 겪고 있으며, 이에 따른 자살 시도에 대한 우려가 높아지고 있다. 본 연구에서는 자살사망자 통계와 자살 관련 뉴스 기사의 토픽 모델링을 통해 코로나19가 자살에 미친 영향을 분석하였다. 그 결과 수치적으로는 재난 직후 자살률이 일시적으로 감소하는 '허니문 기간'을 보였고, 의미적으로는 자살 예방에 대한 중요성이 지속적으로 부각되었다. 또한 유명인 또는 사회적으로 이슈화된 사건에 대한 수사 및 사실관계가 언론을 통해 드러났으며, 연초를 지나도 꾸준히 유지되는 경제 관련 이슈가 도출되었다.

단어 임베딩(Word Embedding) 기법을 적용한 키워드 중심의 사회적 이슈 도출 연구: 장애인 관련 뉴스 기사를 중심으로 (A Study on the Deduction of Social Issues Applying Word Embedding: With an Empasis on News Articles related to the Disables)

  • 최가람;최성필
    • 정보관리학회지
    • /
    • 제35권1호
    • /
    • pp.231-250
    • /
    • 2018
  • 본 논문에서는 온라인 뉴스 기사에서 자동으로 추출된 키워드 집합을 활용하여 특정 시점에서의 세부 주제별 토픽을 추출하고 정형화하는 새로운 방법론을 제시한다. 이를 위해서, 우선 다량의 텍스트 집합에 존재하는 개별 단어들의 중요도를 측정할 수 있는 복수의 통계적 가중치 모델들에 대한 비교 실험을 통해 TF-IDF 모델을 선정하였고 이를 활용하여 주요 키워드 집합을 추출하였다. 또한 추출된 키워드들 간의 의미적 연관성을 효과적으로 계산하기 위해서 별도로 수집된 약 1,000,000건 규모의 뉴스 기사를 활용하여 단어 임베딩 벡터 집합을 구성하였다. 추출된 개별 키워드들은 임베딩 벡터 형태로 수치화되고 K-평균 알고리즘을 통해 클러스터링 된다. 최종적으로 도출된 각각의 키워드 군집에 대한 정성적인 심층 분석 결과, 대부분의 군집들이 레이블을 쉽게 부여할 수 있을 정도로 충분한 의미적 집중성을 가진 토픽들로 평가되었다.

의미 기반의 지식모델 통합과 탐색에 관한 연구 (A study on integrating and discovery of semantic based knowledge model)

  • 전승수
    • 인터넷정보학회논문지
    • /
    • 제15권6호
    • /
    • pp.99-106
    • /
    • 2014
  • 최근 자연어 및 정형언어 처리, 인공지능 알고리즘 등을 활용한 효율적인 의미 기반 지식모델의 생성과 분석 방법이 제시되고 있다. 이러한 의미 기반 지식모델은 효율적 의사결정트리(Decision Making Tree)와 특정 상황에 대한 체계적인 문제해결(Problem Solving) 경로 분석에 활용된다. 특히 다양한 복잡계 및 사회 연계망 분석에 있어 정적 지표 생성과 회귀 분석, 행위적 모델을 통한 추이분석, 거시예측을 지원하는 모의실험 모형의 기반이 된다. 하지만 대부분의 지식 모델은 특정 지표나 정제된 데이터를 수동적으로 모델링하여 분석에 활용한다. 본 논문에서는 텍스트 마이닝 기술을 통해 방대한 비정형 정보로부터 지식 모델을 구성하는 토픽인자와 관계 노드를 생성하고 이를 통합하는 방법과 정형적 알고리즘을 제시한다. 이를 위해 먼저, 텍스트 마이닝을 통해 도출되는 키워드 맵을 동치적 지식맵으로 변환하고 이를 의미적 지식모델로 통합하는 방법을 설명한다. 또한 키워드 맵으로부터 유의미한 토픽 맵을 투영하는 방법과 의미적 동치 모델을 유도하는 알고리즘을 제안한다.