• Title/Summary/Keyword: 토픽 추출

검색결과 212건 처리시간 0.025초

태그 기반 토픽맵 생성 시스템의 설계 및 구현 (Design and Implementation of Topic Map Generation System based Tag)

  • 이시화;이만형;황대훈
    • 한국멀티미디어학회논문지
    • /
    • 제13권5호
    • /
    • pp.730-739
    • /
    • 2010
  • 웹2.0환경에서의 핵심적인 기술은 태깅이며, 현재 블로그와 같은 웹 문서에서부터 이미지, 동영상 등과 같은 멀티미디어 데이터에 이르기까지 폭넓게 적용되고 있다. 그러나 태깅에 사용된 태그가 정보 검색에 재사용되어 검색의 효율성을 극대화 시킬 것이라는 기대와는 달리 실제로는 태그가 가지는 근본적인 한계들로 인해 만족스럽지 못한 검색결과가 나타나고 있다. 이에 본 연구에서는 태그 클러스터링을 통한 이미지 검색에 대한 선행연구를 기반으로 의미론적 지식체계인 토픽맵 생성 시스템을 설계 및 구현하였다. 구현 결과 클러스터 내의 태그 정보들은 토픽맵에서의 토픽으로 자동 생성되었으며, 생성된 토픽맵의 토픽들 간에는 WordNet을 적용하여 의미연관관계를 부여하였다. 또한 토픽 쌍에 적합한 어커런스 정보들을 추출하여 토픽들에 부여함으로서 의미론적 지식체계인 토픽맵을 생성하였다. 이와 같이 생성된 토픽맵은 사용자의 정보검색 요구에 대한 시맨틱 내비게이션의 제공을 가능하게 할 뿐만 아니라 풍부한 정보제공이 가능하다.

자율주행자동차 R&D 동향분석과 논리모형 개발에 대한 연구 (A Study on the Analysis of R&D Trends and the Development of Logic Models for Autonomous Vehicles)

  • 김길래
    • 디지털융복합연구
    • /
    • 제19권5호
    • /
    • pp.31-39
    • /
    • 2021
  • 본 연구는 국내외 자율주행자동차 연구개발과정에서 나타나고 있는 다양한 이슈를 파악하기 위해 자율주행자동차 연구개발 관련 영문 뉴스 기사 1,870개를 수집하고 데이터 전처리 과정을 거쳐 토픽 모델링을 수행하였다. 토픽모델링 결과 20개의 토픽을 추출하였으며, 토픽에 대한 명명작업을 수행하고 의미를 해석하였다. 도출된 토픽을 투입, 활동, 산출, 성과의 연구개발과정에 대응시켜 자율주행자동차 연구개발사업 논리모형을 제시하였다. 본 연구의 분석결과는 국내외 자율주행자동차 연구개발사업의 추진 상황을 정확하게 판단하고 빠르게 변화하고 있는 기술개발에 대비할 수 있는 기초자료로 활용할 수 있을 것이다.

LDA 토픽모델링을 활용한 인공지능 관련 국가R&D 연구동향 분석 (A Study on Analysis of national R&D research trends for Artificial Intelligence using LDA topic modeling)

  • 양명석;이성희;박근희;최광남;김태현
    • 인터넷정보학회논문지
    • /
    • 제22권5호
    • /
    • pp.47-55
    • /
    • 2021
  • 특정 주제분야에 대한 연구동향 분석은 대부분 논문, 특허 등 문헌정보를 대상으로 한 키워드 추출을 통해 토픽모델링 기법을 적용하여 주요 연구주제와 연도별 추이 등을 살펴보는 방식을 활용하고 있다. 본 논문에서는 국가과학기술지식정보서비스(NTIS)에서 제공하는 인공지능 관련 국가연구개발사업 과제정보를 대상으로 LDA(Latent Dirichlet Allocation) 토픽모델링 기법을 활용하여 연구주제와 관련된 토픽들을 추출·분석하여 국가연구개발사업에 대한 연구주제와 투자방향에 대하여 분석하고자 한다. NTIS는 국가연구개발사업·과제정보를 비롯하여, 논문, 특허, 보고서 등 연구를 통해 생성된 주요 연구개발성과에 이르기까지 방대한 양의 국가R&D 정보를 제공하고 있다. 본 논문에서는 NTIS 통합검색에서 인공지능 키워드와 관련된 분류 검색을 수행하여 검색결과를 확인하고, 최근 3개년 과제정보를 다운로드 받아 기초데이터를 구축하였다. 파이썬에서 제공하는 LDA 토픽모델링 라이브러리를 활용하여 기초데이터 (연구목표, 연구내용, 기대효과, 키워드 등)를 대상으로 관련 토픽과 주제어를 추출하고 분석하여 연구투자방향에 대한 인사이트를 도출하였다.

단어 임베딩(Word Embedding) 기법을 적용한 키워드 중심의 사회적 이슈 도출 연구: 장애인 관련 뉴스 기사를 중심으로 (A Study on the Deduction of Social Issues Applying Word Embedding: With an Empasis on News Articles related to the Disables)

  • 최가람;최성필
    • 정보관리학회지
    • /
    • 제35권1호
    • /
    • pp.231-250
    • /
    • 2018
  • 본 논문에서는 온라인 뉴스 기사에서 자동으로 추출된 키워드 집합을 활용하여 특정 시점에서의 세부 주제별 토픽을 추출하고 정형화하는 새로운 방법론을 제시한다. 이를 위해서, 우선 다량의 텍스트 집합에 존재하는 개별 단어들의 중요도를 측정할 수 있는 복수의 통계적 가중치 모델들에 대한 비교 실험을 통해 TF-IDF 모델을 선정하였고 이를 활용하여 주요 키워드 집합을 추출하였다. 또한 추출된 키워드들 간의 의미적 연관성을 효과적으로 계산하기 위해서 별도로 수집된 약 1,000,000건 규모의 뉴스 기사를 활용하여 단어 임베딩 벡터 집합을 구성하였다. 추출된 개별 키워드들은 임베딩 벡터 형태로 수치화되고 K-평균 알고리즘을 통해 클러스터링 된다. 최종적으로 도출된 각각의 키워드 군집에 대한 정성적인 심층 분석 결과, 대부분의 군집들이 레이블을 쉽게 부여할 수 있을 정도로 충분한 의미적 집중성을 가진 토픽들로 평가되었다.

'블록체인 활용' 관련 빅데이터를 활용한 토픽 분석: 신문기사를 중심으로 (Topic Analysis Using Big Data Related to 'Blockchain usage': Focused on Newspaper Articles)

  • 김성애;전수진
    • 산업융합연구
    • /
    • 제18권1호
    • /
    • pp.73-78
    • /
    • 2020
  • 이 연구에서는 블록체인 기술의 활용과 관련된 주요 토픽을 분석하기 위해 신문기사에 나타난 '블록체인 기술 활용' 빅데이터를 토픽 모델링기법을 적용하였다. 이를 위해 2013년부터 2019년까지, 21개의 신문사로부터 15,617건을 대상으로 토픽을 추출하고 주요 트렌트를 시기별로 구분하여 분석하였다. 분석결과 블록체인기술 활용과 관련된 기사는 2015년부터 기하급수적으로 증가하였으며 IT_과학 분야와 경제 분야에 집중되었다. 기간에 따라 차이는 있지만 암호화폐, 비트코인, 가상화폐와 관련된 키워드의 가중치가 높았다. 금융거래에 집중되었던 블록체인기술은 빅데이터, 사물인터넷, 인공지능으로 점차 확대되었다. 이에 따라 기업의 토픽 변화도 함께 이루어져 금융거래를 위한 은행에서 다양한 분야로 확대되면서 대기업과 글로벌기업으로 집중되었다. 이 연구를 통해 블록체인기술의 활용과 관련한 신문기사의 주요 토픽과 함께 이러한 토픽들이 어떠한 변화추이를 보이고 있는지에 대해 확인할 수 있었다.

과학기술용어 간 관계 도출을 위한 토픽 분석 연구 (Research of Topic Analysis for Extracting the Relationship between Science Data)

  • 김무철
    • 한국전자거래학회지
    • /
    • 제21권1호
    • /
    • pp.119-129
    • /
    • 2016
  • 웹의 발달과 함께 많은 정보들이 쏟아지기 시작했다. 그에 따라서 사회 이슈들을 소셜 데이터로부터 추출하고, 이에 대한 해결 방법을 모색하는 연구에 대한 관심이 많아지고 있다. 이에 본 연구에서는 과학기술문헌들을 수집하고, 분석해서 이슈 토픽 별로 군집화 하는 연구를 수행한다. 이를 위해서 보건분야의 주요 용어들을 중심으로 수집하고, 효과적인 분석을 위한 데이터 처리 및 토픽들을 중심으로 군집화 연구를 수행한다. 그 결과, 연구 이슈들을 도출하고 사회 현상에 대한 해결 방안을 마련할 수 있는 토대를 구축하고자 한다.

이형 온톨로지 언어의 속성 및 계층구조 매핑 (Mapping of Characteristics and Hierarchy between Heterogeneous Ontology Languages)

  • 홍현술
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (B)
    • /
    • pp.131-136
    • /
    • 2007
  • 토픽맵은 RDF에 기반을 둔 OWL과 많은 유사점을 갖지만, 양자는 역사적, 기술적, 의도하는 목적에서 차이가 있다. 토픽맵은 ISO 표준이지만, OWL은 W3C의 온톨로지 개발 표준언어로서 양자는 각각의 제약언어, 데이터 모델, 그리고 일련의 구문들을 별개로 갖는다. 그러나 토픽맵과 OWL 양자는 지식을 표현하는 온톨로지 언어라는 공통적 특성을 가지며, 술어로직에 기반을 두고 있고, XML포맷이기 때문에 상호간에 매핑이 가능하다. 논문의 목적은 토픽맵과 OWL의 메타모델로부터 온톨로지 정보자원의 공유, 교환, 통합에 접근시킨다. 따라서 각각의 메타모델에서 주요 요소를 추출하고, 이들의 의미적인 측면과 구조적인 측면의 요소들의 손실이 발생되지 않도록 매핑을 수행한다.

  • PDF

국내 간호전문직관 연구 주제 동향: 텍스트네트워크분석과 토픽모델링의 융합 (Trends in the Study of Nursing Professionals in Korea: A Convergence Study of Text Network Analysis and Topic Modeling)

  • 박찬숙
    • 한국융합학회논문지
    • /
    • 제12권9호
    • /
    • pp.295-305
    • /
    • 2021
  • 본 연구의 목적은 국내에서 발표된 간호전문직관 연구 주제 동향을 양적 내용분석을 통해 탐색하는 것이다. 연구방법은 학술논문수집, 단어 정제 및 추출, 자료 분석의 절차를 수행하였다. 351편의 논문을 수집하여 영문초록에서 단어를 추출하여 텍스트네트워크를 개발하였고, 네트워크분석과 토픽모델링을 융합하여 자료를 분석하였다. 연구결과 핵심 주제는 간호사, 간호전문직관, 간호학생, 간호, 전문직자아개념, 보건의료인, 만족, 임상역량, 자기효능감 등이었다. 토픽모델링을 통해 간호사 전문직관, 간호학생 전문직관, 간호전문직 정체성, 간호역량의 토픽그룹을 파악하였다. 시간이 흘러도 핵심 주제는 변화가 없었지만, 1990년대 역할갈등, 윤리적 가치, 2000년대 셀프리더십, 사회화, 2010년대 임상실습스트레스, 지지체계와 같은 주제들이 부상하였다. 결론적으로 본 연구를 통해 국내에서 임상간호사와 간호학생의 간호전문직관과 이에 영향을 미치는 요소들에 대한 연구가 활발하게 발표되고 있었으나, 간호전문직관 형성 및 향상에 효과적인 다차원적인 중재 전략을 모색한 연구는 부족하였음을 알 수 있었다.

토픽모델링을 활용한 물리학 독서감상문 텍스트의 교육과정 연계성 분석 (Curriculum Relevance Analysis of Physics Book Report Text Using Topic Modeling)

  • 임정훈
    • 한국도서관정보학회지
    • /
    • 제53권2호
    • /
    • pp.333-353
    • /
    • 2022
  • 본 연구는 '물리학' 수업에서 교과독서 활동으로 작성된 독후감상문의 교육과정 연계성을 분석하는데 목적이 있다. 연구를 수행하기 위해 교과독서 활동으로 작성한 332편의 물리학 독서감상문을 수집하여 키워드와 키워드들의 연결 관계를 분석하고, STM(Structural Topic Modeling)을 적용하여 토픽을 추출하였다. 분석 결과, 물리학 독서감상문의 주요 키워드는 '생각', '내용', '설명', '이론', '사람', '이해' 등으로 나타났으며, 도출된 키워드의 영향력과 연결 관계를 살펴보기 위해 연결중심성, 매개중심성, 위세중심성을 제시하였다. 토픽모델링 분석 결과, 물리학 교육과정과 관련된 11개 토픽이 추출되었으며, 3과목(물리학I, 물리학II, 과학사), 6개 영역(힘과 운동, 현대물리, 파동, 열과 에너지, 서양과학사, 과학이란 무엇인가)에서 교육과정 연계성을 확인할 수 있었다. 본 연구의 결과는 추후 교과 특성을 반영한 교과독서를 보다 체계적으로 시행할 수 있는 근거자료로 활용할 수 있을 것이다.

토픽모델링을 활용한 간호리더십 관련 국내 연구동향 분석 (Analysis of Research Trends in Korea on Nursing Leadership Research Using Topic Modeling)

  • 윤희장
    • 문화기술의 융합
    • /
    • 제9권2호
    • /
    • pp.451-457
    • /
    • 2023
  • 이 연구의 목적은 간호리더십에 관한 국내 연구 동향을 파악하고, 이를 바탕으로 국내 간호리더십 관련 연구 및 중재 개발에 활용할 수 있는 기초 자료를 제공하기 위함이다. 연구에서는 2012년 1월부터 2021년 12월까지 국내 학술지에서 게재된 335편의 논문에서 간호리더십에 대한 토픽을 추출하기 위해 토픽모델링 기법을 사용하였다. 키워드는 초록에서 추출되었으며, DBpia, KISS, RISS, KM base, Nanet 등 5개의 국내 데이터베이스에서 문헌 검색이 수행되었다. 연구 결과, 간호리더십에 대한 학술 논문은 꾸준히 증가하고 있으며, 셀프리더십, 자기 효능, 교육 등이 주요 토픽으로 확인되었다. 또한, 리더십의 종류 중 셀프리더십이 가장 빈번하게 출현한 키워드로 확인되었기 때문에 다양한 형태의 리더십에 대한 연구가 더욱 활발히 이루어져야 한다는 결론을 얻을 수 있었다. 이러한 연구결과는 국내 간호리더십 분야에 대한 이해를 높이는 데 기여할 것으로 기대한다. 간호리더십에 대한 연구동향을 파악하는데 있어서 이 연구는 새로운 관점을 제공하고, 국내 간호리더십 연구의 지식구조를 분석하였다는데 의의가 있다.