• 제목/요약/키워드: 연구 토픽

검색결과 690건 처리시간 0.026초

독후감 텍스트의 토픽모델링 적용에 관한 탐색적 연구 (A Study on the Application of Topic Modeling for the Book Report Text)

  • 이수상
    • 한국도서관정보학회지
    • /
    • 제47권4호
    • /
    • pp.1-18
    • /
    • 2016
  • 이 연구는 독후감 텍스트의 주제분석에 토픽모델링의 활용방안을 탐색하는 것을 목적으로 하고 있다. 텍스트의 주제분석 방안으로서 토픽모델링 분석방법을 이해하고, R에서 제공하는 "topicmodels" 패키지의 LDA 함수를 사용하여 23건의 사례 독후감 텍스트들을 대상으로 실제의 분석작업을 수행하였다 토픽모델링 분석결과 16개의 토픽들을 추출하였고 토픽과 구성 단어들의 관계에서 토픽 네트워크 사례 독후감과 토픽들의 관계에서 독후감 네트워크를 구성하였다. 이후 토픽 네트워크와 독후감 네트워크를 대상으로 중심성 분석을 수행하였으며 분석결과는 다음과 같다. 첫째 16개의 토픽들이 1개의 컴포넌트를 가지는 네트워크로 나타났다. 이것은 16개 토픽들이 상호 연관되어 있다는 것을 의미한다. 둘째, 독후감 네트워크에서는 연결정도 중심성이 높은 독후감들과 낮은 독후감들로 구분이 되었다. 전자의 독후감들은 다른 독후감들과 주제적으로 유사성을 가지며 후자의 독후감들은 다른 독후감들과 주제적으로 상이성을 가지는 것으로 해석하였다. 토픽모델링의 결과를 네트워크 분석과 결합함으로써 독후감의 주제파악에 유용한 결과들을 얻게 되었다.

시소러스와 토픽맵의 연관성 연구 (A Study on the Association between Thesaurus and Topic Map)

  • 남영준
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2005년도 제12회 학술대회 논문집
    • /
    • pp.403-408
    • /
    • 2005
  • 현재 정보검색분야에서는 검색도구로써 시소러스가 갖는 장점에도 불구하고 기존에 개발된 시소러스의 유지관리와 활용이 극히 제한적으로 이루어지고 있기 때문이다. 왜냐하면 정보의 급격한 증가로 인하여 전통적인 시소러스의 구조와 유지관리, 활용기법으로는 현대 정보의 홍수 현상에 적극적으로 대처하는데 한계에 직면하였기 때문이다. 이러한 한계점을 극복하기 위해 토픽맵의 구축알고리즘이 절대적으로 필요하였다. 이에 따라 본 연구에서는 토픽맵의 기본요소인 토픽과 대상물, 연관관계, 토픽타입 등을 이용한 시소러스 구조화 알고리즘을 제안하였다. 특히 토픽맵의 기본 요소가운데 대상물(occurrence)은 시소러스의 검색효율가운데 정도율의 확보를 가능하게 하며, 시소러스의 구축에 필요한 지식베이스의 역할을 수행하는 주요한 기법임을 확인하였다.

  • PDF

토픽 분할에 의한 토픽맵 매칭 및 통합 기법 (Topic maps Matching and Merging Techniques based on Partitioning of Topics)

  • 김정민;정현숙
    • 정보처리학회논문지D
    • /
    • 제14D권7호
    • /
    • pp.819-828
    • /
    • 2007
  • 본 논문에서는 토픽맵의 모델 특성을 고려한 토픽맵 매칭 및 통합 기법을 제안한다. 이전까지의 대부분의 스키마 매칭 연구들은 계산 시간의 효율성을 고려하지 않고 매칭 기법의 범용성 및 정확성을 높이기 위한 목적으로 개발되어 왔다. 그러나 현재 표준적인 온톨로지 언어로 RDF/OWL과 토픽맵이 사용되고 있으며 앞으로 많은 온톨로지들이 이들 언어로 구현될 것이다. 따라서 본 논문에서는 토픽맵 데이터 모델의 구조적 특성 및 제약조건을 고려하여 토픽 분할, 토픽명기반 매칭연산, 속성기반 매칭연산, 계층구조기반 매칭연산, 연관관계기반 매칭연산 및 통합 알고리즘을 개발함으로써 효과적이면서 효율적인 토픽맵 매칭 및 통합이 가능함을 보인다.

기업근로자 경력성공 인식의 다차원성과 차이: 토픽모델링의 적용 (Differences and Multi-dimensionality of the Perception of Career Success among Korean Employees: A Topic Modeling Approach)

  • 이재은;채충일
    • 한국콘텐츠학회논문지
    • /
    • 제19권6호
    • /
    • pp.58-71
    • /
    • 2019
  • 이 연구는 우리나라 기업근로자가 인식하는 경력성공의 다차원성과 개인특성에 따른 차이를 토픽모델링 방법을 적용하여 탐색하고자 하는 목적으로 수행되었다. 연구목적을 달성하기 위해 경력성공에 대한 인식을 개방형 설문을 통해 수집하였으며 126명의 기업근로자들의 응답자료를 바탕으로 R 프로그램을 활용하여 분석하였다. 분석결과 한국 근로자의 경력성공 인식에 대한 5가지 토픽이 도출되었다. 구체적으로, 토픽1은 사회적으로 인정받는 직장에 다니는 것(사회적 인정), 토픽 2는 조직 내에서 자신의 업무에 충실하며 견디는 것(조직 내 근속), 토픽 3은 자기 분야에 지식과 노하우를 갖고 전문성을 갖는 것(전문성), 토픽 4는 일한 만큼 경제적 보상과 성과를 얻는 것(경제적 보상), 토픽 5는 일을 통해 보람과 성취감 같은 개인적 의미를 추구하는 것(개인적 의미 추구)으로 나타났다. 또한, 성별, 연령, 학력에 따른 각 토픽별 발현비율 차이가 확인되었다. 이 연구를 통해 경력성공 인식의 다차원성과 개인특성에 따른 경력성공 인식 차이를 확인하였으며, 개방형 설문자료와 같은 비정형 데이터 분석에서 토픽모델링 방법을 활용가능성을 제시하였다.

토픽 모델링을 활용한 한국콘텐츠학회 논문지 연구 동향 탐색 (An Exploratory Research Trends Analysis in Journal of the Korea Contents Association using Topic Modeling)

  • 석혜은;김수영;이연수;조현영;이수경;김경화
    • 한국콘텐츠학회논문지
    • /
    • 제21권12호
    • /
    • pp.95-106
    • /
    • 2021
  • 본 연구의 목적은 한국콘텐츠학회 논문지에 게재된 9,858건의 논문을 대상으로 토픽 모델링을 활용하여 지난 20년간 연구동향을 탐색함으로써 콘텐츠 연구개발에서의 주요 토픽을 도출하고 학술적 발전방향을 제공하는데 있다. 추출된 토픽의 신뢰성과 타당성을 확보하기 위해 양적 평가기법 뿐만 아니라 정성적 기법을 단계적으로 적용하여 연구자들이 합의한 수준의 말뭉치가 생성될 때까지 이를 반복적으로 수행하였으며 이에 따른 구체적인 분석 절차를 제시하였다. 분석 결과 8개의 핵심 토픽이 추출되었다. 이는 한국콘텐츠학회가 특정 학문 분야를 한정하지 않고 다양한 분야의 융·복합 연구 논문을 발간하고 있음을 보여준다. 또한 2012년 이전 상반기에는 공학기술 분야 토픽 비중이 상대적으로 높게 나타난 반면, 2012년 이후 하반기에는 사회과학 분야 토픽 출현 비중이 상대적으로 높게 나타났다. 구체적으로 '사회복지' 토픽은 상반기 대비 하반기에 약 4배수 증가세가 나타났다. 토픽별 추세분석을 통해 추세선의 변곡점이 나타난 특정 시점에 주목하여 해당 토픽의 연구동향에 영향을 미친 외적 변인을 탐색하였고 토픽과 외적 변인 간 관련성을 파악하였다. 본 연구결과가 국내 콘텐츠 관련 연구 개발 및 산업 분야에서 진행되고 있는 활발한 논의를 진행하는데 시사점을 제공할 수 있기를 기대한다.

커뮤니티 기반 Q&A서비스에서의 질의 할당을 위한 이용자의 관심 토픽 분석에 관한 연구 (A Study on Mapping Users' Topic Interest for Question Routing for Community-based Q&A Service)

  • 박종도
    • 정보관리학회지
    • /
    • 제32권3호
    • /
    • pp.397-412
    • /
    • 2015
  • 본 연구에서는 커뮤니티 기반 질의응답 서비스에서의 질의할당을 위하여, 해당 커뮤니티에 축적된 질의응답 데이터 세트를 이용하여 해당 카테고리내의 토픽을 분석하고 이를 바탕으로 해당 토픽에 관심을 가지는 이용자의 관심 토픽을 분석하고자 하였다. 특정 카테고리 내의 토픽을 분석하기 위해서 LDA기법을 사용하였고 이를 이용하여 이용자의 관심 토픽을 모델링하였다. 나아가, 커뮤니티에 새롭게 유입되는 질의에 대한 토픽을 분석한 후, 이를 바탕으로 해당 토픽에 대해 관심을 가지고 있는 이용자를 추천하기 위한 일련의 방법들을 실험하였다.

소상공인 연구 동향 분석 (Investigating the Trends of Research for the Small Business Owners)

  • 방미현;이영민
    • 한국콘텐츠학회논문지
    • /
    • 제22권7호
    • /
    • pp.73-80
    • /
    • 2022
  • 본 연구는 지난 20여 년간의 국내 소상공인 선행연구 280편을 주제어 네트워크와 LDA 토픽 모델링 분석을 통해 종합적으로 분석하고, 학계에서의 전반적인 시각과 동향을 살펴보았다. 핵심 주제어는 서로 상충 되지만 안정적이고 지속적인 성장을 위해서 필수적인 요소인 '영업'과 '보호'를 선정하였고, 7개의 토픽(토픽 1: 창업, 토픽 2: 디지털, 토픽 3: 세제, 토픽 4: 역량, 토픽 5: 상생, 토픽 6: 규제, 토픽 7: 자금)을 도출하였다. 분석 결과를 토대로, 소상공인들의 지속적인 성장과 발전을 위한 디지털 성숙도 향상의 필요성을 제기하였고, 소상공인들의 직면한 경제적 타격 문제 해결을 위해 범부처 차원의 대응과 새로운 정권 이후에도 존속될 수 있는 기능 수행 조직의 안정성을 제시하였다. 또한, 장기적, 신속성, 세밀성, 새로운 방식으로의 정부 지원 방향에 대한 주목과 선 허용 후, 규제를 하는 네거티브 방식으로의 유연한 접근을 제언하였다.

토픽맵 기반 온톨로지 시스템의 통합효과 측정을 위한 프로토타입 시스템 구축 및 평가에 관한 연구 (Developing and Evaluating an prototype system for merging effects of ontology systems : Based on Topic Maps)

  • 도진국;양선화
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2010년도 제17회 학술대회 논문집
    • /
    • pp.41-44
    • /
    • 2010
  • 본 논문은 토픽맵 기반 온톨로지 시스템의 통합효과 측정을 위한 연구에 앞서 통합의 가능성과 통합 성능을 측정하기 위한 프로토타입 시스템 구축에 관한 연구이다. 프로토타입 시스템 구축을 통해 자동 통합 툴의 성능을 측정하고자 한다. 이를 위해 통합 전의 단일 토픽맵에서의 검색 결과와 통합 토픽맵에서의 검색 결과를 비교하여 정답율과 재현율을 평가함으로써 통합 토픽맵이 정보의 손실 없이 단일 토픽맵들을 완전히 통합한 것인지 확인할 수 있다.

  • PDF

잠재 토픽을 이용한 문서 요약문 추출 (Document Summarization Using Latent Topics)

  • 정영섭;최호진
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.240-243
    • /
    • 2011
  • 웹 문서를 비롯한 여러 가지 문서의 양이 급증함에 따라, 문서로부터 주요정보를 얻거나 자동으로 요약하는 연구들이 진행되어왔다. 특히, 문서를 요약하는 연구들은 문서에 존재하는 문장을 추출하는 방법과 요약문을 새롭게 생성하는 방법, 이렇게 크게 두 가지 방법으로 진행되었다. 이 연구에서는, 잠재 토픽 모델을 통하여 얻어낸 각 문장의 토픽 순열을 이용하여 문서를 대표하는 문장, 즉 요약문으로서 적합한 문장들을 추출하는 새로운 기법을 소개한다. 특히, 잠재 토픽 모델이 일반적으로 가지고 있는 속성인 토픽 순열의 교환성(exchangeability)을 배제하고 토픽의 순열을 이용하여 요약문을 추출해내므로 이 기법을 통하여 문서 혹은 문장의 구조를 반영한 요약문을 만들 수 있다.

토픽모델링을 통한 저자명 식별 성능 비교 (A Comparison of Author Name Disambiguation Performance through Topic Modeling)

  • 김하진;정효정;송민
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2014년도 제21회 학술대회 논문집
    • /
    • pp.149-152
    • /
    • 2014
  • 본 연구에서는 저자명 모호성 해소를 위해 토픽모델링 기법을 사용하여 저자명을 식별 하였다. 기존의 토픽모델링은 용어 자질만을 고려하였지만 본 연구에서는 제 3의 메타데이터 자질을 활용하여 ACT(Author-Conference Topic Model) 모델과 DMR(Dirichlet-multinomial Regression) 토픽모델링을 대상으로 저자명 식별 성능을 평가, 비교하였다. 또한 수작업으로 저자 식별 작업을 한 데이터셋을 기반으로 저자 당 논문 수와 토픽 수에 차이를 두고 연구를 진행하였다. 그 결과 저자명 식별에 있어 ACT 모델보다 DMR 토픽모델링의 성능이 더 우수한 것을 알 수 있었다.

  • PDF