• 제목/요약/키워드: 연구 토픽

검색결과 690건 처리시간 0.024초

토픽모델링을 활용한 학교도서관 연구동향 분석 (A Study on the School Library Research Trends Using Topic Modeling)

  • 정영주;김혜진
    • 한국도서관정보학회지
    • /
    • 제51권3호
    • /
    • pp.103-121
    • /
    • 2020
  • 본 연구는 학교도서관의 연구동향을 살펴보기 위해 토픽모델링을 적용하였다. 분석 대상은 4대 문헌정보학회지 한국도서관·정보학회지, 한국문헌정보학회지, 한국비블리아학회지, 정보관리학회지의 1990년부터 2020년 7월까지 학교도서관 관련 논문 498편이다. 연구 결과 토픽모델링을 통한 주제는 27개의 토픽으로 8개의 영역 일반, 제도·체제, 건물·설비, 운영·경영, 자료조직, 서비스, 교육, 기타로 묶어 정리하였고, 하위단계 주제는 22개로 나누었다. 텍스트 정제와 토픽모델링 분석은 넷마이너(NetMiner) V.4를 사용하여 수행하였고 토픽모델링을 위한 토픽 개수의 결정을 위해 로그우드 추정치를 사용하였다. 연구 결과 27개 토픽의 주제에 제목을 부여하였고 제일 많은 연구가 이루어진 토픽은 도서관 활용수업(T27)이 35편, 정보활용(T2)에 관한 연구가 30편이고, 20편 이상의 연구는 평가지표개발(T13), 학교 사서교사 배치(T24), 학습정보 매체 활용(T3), 지역사회·공공도서관(T7), 도서관 협력(T9), 도서관 이용(T17), 도서관 연구(T11), 독서교육(T4), 장서개발(T5), 교육효과·교육방법(T18)이 있었다.

토픽모델링을 이용한 국내 방사선 학술연구 트렌드 분석 (A Trend Analysis of Radiological Research in Korea using Topic Modeling)

  • 홍동희
    • 한국방사선학회논문지
    • /
    • 제16권3호
    • /
    • pp.343-349
    • /
    • 2022
  • 토픽 모델링을 활용하여 1989년부터 2022년까지 출판된 방사선을 주제로 한 논문을 파악하고 주제들 간의 관련성과 비중을 분석하고자 한다. 본 연구는 방사선 분야의 연구 활성화에 기여하기 위하여 2022년 최근까지 출판된 논문 717편을 대상으로 국문제목에서 도출된 토픽들을 분석하였다. 텍스트마이닝을 통해 연구의 주제 분포에 대한 전반적 연구 동향을 분석하였으며, 토픽모델링을 통해 5가지 주제를 도출해냈다. 첫째, 분석 대상 논문 중 키워드 중심으로 총 논문 717편의 연구에서 핵심어를 전처리 과정을 거쳐 최종적으로 선정된 단어는 총 1675개의 단어를 빈도 분석하였다. 둘째, 5개 토픽에 대하여 구성단어의 연관성을 중심으로 토픽을 분석한 결과 방사선, 영상, CT 임상분야에서 영상의 화질을 떨어뜨리지 않는 범위에서 선량을 최소화 하는데 연구가 주를 이루고 있음을 알 수 있었다. 또한, MRI 분야는 다양한 연구가 주를 이루었고 초음파는 다양한 부위의 질환 분석이 연구가 활발하게 시도되고 있음을 알 수 있었다.

LDA와 BERTopic을 이용한 토픽모델링의 증강과 확장 기법 연구 (Topic Model Augmentation and Extension Method using LDA and BERTopic)

  • 김선욱;양기덕
    • 정보관리학회지
    • /
    • 제39권3호
    • /
    • pp.99-132
    • /
    • 2022
  • 본 연구의 목적은 LDA 토픽모델링 결과와 BERTopic 토픽모델링 결과를 합성하는 방법론인 Augmented and Extended Topics(AET)를 제안하고, 이를 사용해 문헌정보학 분야의 연구주제를 분석하는 데 있다. AET의 실제 적용결과를 확인하기 위해 2001년 1월부터 2021년 10월까지의 Web of Science 내 문헌정보학 학술지 85종에 게재된 학술논문 서지 데이터 55,442건을 분석하였다. AET는 서로 다른 토픽모델링 결과의 관계를 WORD2VEC 기반 코사인 유사도 매트릭스로 구축하고, 매트릭스 내 의미적 관계가 유효한 범위 내에서 매트릭스 재정렬 및 분할 과정을 반복해 증강토픽(Augmented Topics, 이하 AT)을 추출한 뒤, 나머지 영역에서 코사인 유사도 평균값 순위와 BERTopic 토픽 규모 순위에 대한 조화평균을 통해 확장토픽(Extended Topics, 이하 ET)을 결정한다. 최적 표준으로 도출된 LDA 토픽모델링 결과와 AET 결과를 비교한 결과, AT는 LDA 토픽모델링 토픽을 한층 더 구체화하고 세분화하였으며 ET는 유효한 토픽을 발견하였다. AT(Augmented Topics)의 성능은 LDA 이상이었으며 ET(Extended Topics)는 일부 경우를 제외하고 대부분 LDA와 유사한 수준의 성능을 나타내었다.

토픽맵-기반 판소리 검색시스템 구축 및 평가에 관한 연구 (A Study of Developing and Evaluating a Pansoree Retrieval System Using Topic Maps)

  • 오삼균;박옥남
    • 한국도서관정보학회지
    • /
    • 제36권4호
    • /
    • pp.77-98
    • /
    • 2005
  • 이 연구의 목적은 유용한 지식포탈 구축을 위한 대안을 제시하기 위하여 판소리 도메인을 중심으로 토픽맵 시스템을 구축하고 그 유효성을 검증하기 위해서 질의유형별로 기존 사이트와 심층 분석을 수행하는 것이다. 먼저 토픽맵에 대한 간략 설명, 판소리 도메인에 대한 토픽맵 데이터 모델링, 그 모델링을 기반으로 토픽맵 기반 판소리 시스템을 구축하였다. 비교대상 사이트는 다양한 판소리 사이트를 비교한 결과, pansoree.com 사이트를 선정하였다. 보다 체계적인 성능비교를 위해서 질의유형별로 나누어서 두 사이트를 비교 분석하였다. 질의유형은 단순질의, 고급질의, 연계질의 Cross Reference 질의로 나누었고, 분석결과 토픽맵 기반 판소리 사이트가 모든 질의유형에서 기존 사이트보다 검색시간과 단계를 줄일 수 있고, 판소리 도메인을 잘 모르는 이용자의 경우에도 용이한 검색을 제공하는 것으로 판명되었다.

  • PDF

온톨로지 언어의 비교 연구: W3C OWL과 ISO 토픽맵을 중심으로 (A Comparison of Ontology Languages: Focusing on W3C OWL and ISO Topic Maps)

  • 오삼균
    • 한국비블리아학회지
    • /
    • 제15권2호
    • /
    • pp.71-96
    • /
    • 2004
  • 이 연구의 목적은 국제표준 온톨로지 언어로 간주되고 있는 W3C의 웹 온톨로지 언어(OWL)와 ISO 토픽맵(Topic Map)의 핵심개념을 상세히 기술하고, 각 언어의 의미표현력에 대해서 비교분석하는 것이다. 본 논문의 구성은, 첫째 온톨로지의 기반을 이루고 있는 URI와 네임스페이스에 대해서 기술하는 것이고, 둘째 토픽맵의 핵심 개념인 토픽(Topic), 연계(Association), 어커런스(Occurrence) 등에 대한 상세한 설명을 제공하는 것이고, 셋째 토픽맵이 검색결과를 의미 있는 그룹으로 묶어서 보여 주어야 한다는 목록의 제2목적을 효율적으로 성취하는 방법에 대해서 기술하는 것이고, 마지막으로 토픽맵과 OWL의 의미표현력의 차이점에 대해서 상세하게 비교분석한 내용으로 되어 있다.

  • PDF

기업가정신에 대한 연구동향 분석

  • 장성희
    • 한국벤처창업학회:학술대회논문집
    • /
    • 한국벤처창업학회 2022년도 춘계학술대회
    • /
    • pp.73-79
    • /
    • 2022
  • 본 연구는 동시출현단어 분석과 토픽모델링을 통해 기업가정신의 연구주제와 연구 동향을 분석하여 기업가정신 연구에 대한 향후 연구방향을 수립하기 위한 정보를 제공하는 것이 목적이다. 이를 위해 Web of Science 데이터베이스에서 "entrepreneurship"을 기본검색어로 설정하고, 2002년부터 2021년까지 발표한 영어 논문으로 제한하여 기업가정신 논문의 데이터를 다운로드하여 데이터를 확보하였다. 본 연구에서는 VOSviewer 프로그램을 이용하여 동시출현단어 분석을 하였고, R 프로그램을 이용하여 토픽모델링 분석을 하였다. 동시출현단어 분석 결과, 기업가정신과 혁신 클러스터, 기업가정신 교육 클러스터, 사회적 기업가정신과 지속가능성 클러스터, 기업성과 클러스터, 그리고 지식 및 기술이전 클러스터 등 5개의 클러스터로 구분되었다. 토픽모델링 분석 결과, 창업환경 및 경제발전, 국제 기업가정신, 다양한 기업가정신, 벤처기업과 자본조달, 정부정책 및 지원, 사회적 기업가정신, 경영관련 이슈, 지역도시계획 및 개발, 기업가정신 교육, 기업가의 혁신과 성과, 기업가정신 연구, 기업가의 창업의도 등 12개의 토픽으로 분석되었다. 본 연구의 결과는 기업가정신 연구에 대한 전반적인 연구동향을 파악할 뿐만 아니라, 기업가정신과 관련된 어떠한 연구 주제들이 다루어져 왔는지에 대해 분석함으로써 기업가정신에 대한 연구의 이해도를 높이고 기업가정신 연구가 가져올 방향성을 제안하는데 활용할 수 있을 것으로 기대된다.

  • PDF

관리도를 활용한 국민청원 토픽 모니터링 연구 (Topic change monitoring study based on Blue House national petition using a control chart)

  • 이희연;최지은;이성임;손원
    • 응용통계연구
    • /
    • 제34권5호
    • /
    • pp.795-806
    • /
    • 2021
  • 최근 온라인 채널을 통한 텍스트 자료가 방대해 지면서 이를 요약하고 분석하는 연구에 관한 관심이 커지고 있는 추세이다. 먼저 텍스트 자료에 대한 기본적인 분석 중 하나는 어떤 주제나 내용을 포함하고 있는지 잠재된 토픽을 추출하는 것이다. 연구자가 일일이 모든 자료를 읽고 내용을 요약할 수도 있겠지만, 대용량 데이터를 다루는 경우에는 결코 쉽지 않기 때문에, 통계적 모형을 사용하여 토픽을 추출하는 토픽모형 방법들이 제안되어 왔다 (Blei와 Lafferty, 2007; Blei 등, 2003). 시간에 따라 수집된 텍스트 데이터로부터 토픽의 변화를 모니터링하기 위하여, 본 연구에서는 잠재적 디리슈레 할당(latent Dirichlet allocation) 모형을 통해 토픽을 분류하고 그 결과를 바탕으로 한 토픽 지수를 제안하였다. 또한, 이를 통계적 공정관리의 대표적 도구인 관리도에 적용하여 시간 경과에 따른 토픽의 변화를 모니터링하는 데 적용해 보았다. 실제 데이터로 2018년 3월 5일부터 2020년 3월 5일 사이에 청와대 국민청원 온라인 게시판에 접수된 텍스트 데이터를 사용하였으며, 토픽 지수를 모니터링함으로써 토픽에 대한 이상변화를 탐지할 수 있음을 살펴 보았다.

토픽모델링 분석을 활용한 국가연구개발사업과제와 국회 상임위원회 사이의 정책 인식 비교 : ICT 분야를 중심으로 (Comparison of policy perceptions between national R&D projects and standing committees using topic modeling analysis : focusing on the ICT field)

  • 송병기;김상웅
    • 산업융합연구
    • /
    • 제20권7호
    • /
    • pp.1-11
    • /
    • 2022
  • 본 논문에서는 여러 연구기관에서 논의하고 있는 데이터 기반 평가 방법론 중 토픽모델링 기법을 이용하여 계량적인 값을 도출하고 그 과정에서 실제 전문가들이 수행하는 국가연구개발사업과제와 이를 법률과 정책실무에서 다루는 국회 상임위원회 간의 정책적 인식 차이가 있는지 ICT 분야를 중심으로 파악해 보고자 한다. 먼저 HAN 모델로 사업과제 데이터를 학습하여 ICT 문서를 분류하는 모델을 만들고, 해당 모델을 통해 분류된 ICT 문서를 대상으로 LDA 토픽모델링 분석을 수행하여 국가연구개발사업과제 데이터와 국회 상임위원회 회의록에서 도출된 토픽과 분포를 비교한다. 구체적으로 총 26개의 토픽이 도출되었으며, 각 토픽이 포함하는 단어와 문서 분포 비율을 살펴봤을 때, 국가사업과제는 상대적으로 전문적인 주제의 문서가 많았으며, 국회 상임위원회는 상대적으로 사회적이고 대중적인 문제를 다루는 것으로 나타나 인식에 다소 차이가 있는 것으로 보였다. 인식의 차이를 수치적으로 확인할 수 있는 만큼, 향후 정책이나 과제 평가에 사용할 수 있는 지표에 대한 기초연구로 활용 가능할 것이다.

토픽모델을 활용한 택배 서비스 소비자와 종사자의 불만 사항 분석 (Analysis regarding Complaints of Courier Consumers and Workers in the Parcel Delivery Service by using Topic Model)

  • 신진규
    • 융합정보논문지
    • /
    • 제10권2호
    • /
    • pp.39-48
    • /
    • 2020
  • 택배 업계의 서비스 품질 향상과 고객 만족에 영향을 미치는 요인들을 다양한 차원에서 분석한 연구가 많이 이루어져 왔다. 이러한 연구의 대부분은 한정된 응답자를 대상으로 설문조사나 인터뷰 등의 질적 방법이 사용되어 자료의 형식과 내용, 응답자의 범위가 제한적이라는 한계가 있다. 이에 본 연구에서는 장기간에 축적된 불특정 다수의 소비자 상담 사례와 업계 종사자의 불만이 반영된 기사문을 대상으로 삼아 택배 서비스에서 소비자와 공급자가 지적하는 불만에 관한 주요 토픽을 탐색하고 분석하여 선행 연구의 미비점을 보완하고자 하였다. 또한, 이러한 토픽이 시점에 따라 어떻게 변화하는지 흐름을 분석함으로써 최근에 제기된 새로운 토픽을 발굴하고 시사점을 제시하고자 하였다. 이 결과 지연/분실/오배송 토픽과 택배 산업 경쟁 심화 토픽이 중심을 이루는 것으로 나타났다. 토픽 트렌드 분석 결과 최근 국제 택배 상담 내용이 다소 늘었고, 아파트 택배 배송과 관련된 갈등이 많이 다루어져 이를 정부 정책에 반영하거나 연구 주제로 다루어 볼 수 있을 것이다. 연구 결과 나타난 토픽은 선행 연구에서 다루어진 내용이 주를 이루지만 내밀한 상담사례와 학술 문헌 등 다른 자료와 분석 방법을 추가하면 더 새롭고 가치있는 토픽을 도출할 수 있을 것이라고 기대한다.

토픽모델링과 시계열회귀분석을 활용한 정보시스템분야 연구동향 분석 (Investigation of Research Trends in Information Systems Domain Using Topic Modeling and Time Series Regression Analysis)

  • 김창식;최수정;곽기영
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권6호
    • /
    • pp.1143-1150
    • /
    • 2017
  • 본 연구의 목적은 국내에서 2002년부터 2016년까지 출판된, 대표적인 정보시스템분야 저널의 연구동향을 조사하는 것이다. 연구의 목적을 달성하기 위해서 Asia Pacific Journal of Information Systems, Information Systems Review, The Journal of Information Systems에 출판된 논문의 초록 1,245편을 분석 하였다. 본 연구에서는 최근 중요하게 다루어지는 토픽모델링과 시계열회귀분석 기법을 활용하였다. 토픽모델링 분석결과, 20개의 토픽이 도출되었고 "시스템구축", "혁신역량", 및 "고객충성도" 등의 순으로 확인되었다. 둘째, 시계열회귀분석 결과, 상승 추세를 나타내는 토픽으로는 "고객충성도", "소통혁신", "정보보호", 및 "개인정보보호" 가 나타났고, 하락 추세를 나타나는 토픽으로는 "시스템구축" 및 "웹사이트" 가 도출되었다.