• 제목/요약/키워드: 토픽 분석

검색결과 660건 처리시간 0.033초

토픽모델을 활용한 명문대 재학생의 학벌에 관한 인식 분석 (A Prestigious University Students' Perceptions of their Educational Attainment by a Topic model)

  • 정영선;이승연
    • 문화기술의 융합
    • /
    • 제10권3호
    • /
    • pp.503-512
    • /
    • 2024
  • 이 연구는 한국 사회에서 명문대로 분류되는 한 대학의 학생이 작성한 학벌에 대한 글쓰기 과제를 분석하여 이들이 가진 학벌에 대한 인식을 확인하고 내재한 의미를 분류한 연구이다. 분석에서 활용한 방법은 토픽 모델 중 잠재 디리클레 할당 방법으로 총 172편의 문서를 분석한 후 각 토픽에서 빈출한 키워드가 자주 등장하는 문서를 중심으로 학생의 인식을 탐색하였다. 분석 결과 도출한 토픽은 학벌의 순기능(토픽 1), 양날의 검(토픽 2), 권력공동체(토픽 3), 승리의 징표(토픽 4), 학벌의 역기능(토픽 5)의 다섯 가지이다. 각 토픽에서 가장 빈번하게 제시되는 단어를 정리하면 다음과 같다. 토픽 1에서는 '개인', '지위', '수단'이, 토픽 2는 '정의(定義)', '학교', '의미'가, 토픽 3은 '사람', '출신', '권력'이, 토픽 4는 '대학(교)', '능력', '노력'이, 토픽 5는 '학력', '우리나라', '출신'이었다. 이상의 분석을 통해 우리는 명문대 학생이 학벌을 논할 때 계급과 학벌 공동체, 사회와의 관련성을 통하여 계급재생산을 고려하지만 인종 및 민족와 같이 학벌에 영향을 미치는 기타 요인에 대하여는 크게 관심을 두지 않고 있음을 확인하였다. 앞으로의 관련 강의에서 보다 다양한 요인과 학벌의 관련성을 다룰 필요가 있다.

지역신문기사 자료와 토픽모델링을 이용한 해변 관련 계절별 현안분석 (Seasonal analysis of Beach-related Issues using Local Newspaper Articles and Topic Modeling)

  • 유무상;정수연;김건후;손철
    • 지역연구
    • /
    • 제34권4호
    • /
    • pp.19-34
    • /
    • 2018
  • 본 연구의 목적은 2004년부터 2017년까지의 해변과 해수욕장을 키워드로 하는 지역신문기사를 이용하여 계절별 현안을 분석하는 것이다. 분석을 위해 오픈소스 프로그램을 기반으로 한 토픽모델링과 시계열회귀분석을 수행하였다. 토픽모델링 분석 결과 계절별 토픽은 봄 35개, 여름 47개, 가을 36개, 겨울 35개가 도출되었다. 모든 계절에서 공통적으로 도출된 주제는 해수욕장, 축제 행사, 사건사고 및 환경문제, 관광지, 개발 분양, 행정 정책, 날씨로 나타났다. 시계열회귀분석 결과 봄에는 35개의 토픽 중 5개의 상승 토픽과 2개의 하락 토픽이 도출되었다. 여름에는 47개의 토픽 중 6개의 상승 토픽과 3개의 하락 토픽이 도출되었다. 가을에는 36개의 토픽 중 4개의 상승 토픽과 3개의 하락 토픽이 도출되었다. 겨울에는 35개의 토픽 중 3개의 상승 토픽과 3개의 하락 토픽이 도출되었다. 그리고 각 계절별로 상승 토픽과 하락 토픽에 해당하지 않는 토픽은 중립 토픽으로 구분하였다. 본 연구를 통해 해변과 같이 계절별로 용도가 다른 경우에 지역현안에 대한 분석을 위해 계절별 토픽모델링을 진행한다면 더욱 유용한 결과를 도출하고 이에 따른 세부적인 진단이 가능하다고 판단된다.

독후감 텍스트의 토픽모델링 적용에 관한 탐색적 연구 (A Study on the Application of Topic Modeling for the Book Report Text)

  • 이수상
    • 한국도서관정보학회지
    • /
    • 제47권4호
    • /
    • pp.1-18
    • /
    • 2016
  • 이 연구는 독후감 텍스트의 주제분석에 토픽모델링의 활용방안을 탐색하는 것을 목적으로 하고 있다. 텍스트의 주제분석 방안으로서 토픽모델링 분석방법을 이해하고, R에서 제공하는 "topicmodels" 패키지의 LDA 함수를 사용하여 23건의 사례 독후감 텍스트들을 대상으로 실제의 분석작업을 수행하였다 토픽모델링 분석결과 16개의 토픽들을 추출하였고 토픽과 구성 단어들의 관계에서 토픽 네트워크 사례 독후감과 토픽들의 관계에서 독후감 네트워크를 구성하였다. 이후 토픽 네트워크와 독후감 네트워크를 대상으로 중심성 분석을 수행하였으며 분석결과는 다음과 같다. 첫째 16개의 토픽들이 1개의 컴포넌트를 가지는 네트워크로 나타났다. 이것은 16개 토픽들이 상호 연관되어 있다는 것을 의미한다. 둘째, 독후감 네트워크에서는 연결정도 중심성이 높은 독후감들과 낮은 독후감들로 구분이 되었다. 전자의 독후감들은 다른 독후감들과 주제적으로 유사성을 가지며 후자의 독후감들은 다른 독후감들과 주제적으로 상이성을 가지는 것으로 해석하였다. 토픽모델링의 결과를 네트워크 분석과 결합함으로써 독후감의 주제파악에 유용한 결과들을 얻게 되었다.

토픽모델을 이용한 전력반도체 패키징 기술 동향 연구 (A Study on Technology Trend of Power Semiconductor Packaging using Topic model)

  • 박근서;최경현
    • 마이크로전자및패키징학회지
    • /
    • 제27권2호
    • /
    • pp.53-58
    • /
    • 2020
  • 전기자동차용 전력반도체 패키징 기술에 대한 분석을 수행하였다. 비정형 데이터인 특허들을 수집하여 유효특허를 도출하여 LDA 기법을 적용한 토픽모델링을 수행하였다. 20개의 토픽으로 분류하였고 각 토픽별 추출된 단어를 통해 기술에 대한 정의를 내렸다. 각 토픽의 대한 동향분석을 위해 연도별 빈도수에 대한 회귀분석을 통해 토픽별 Hot토픽과 Cold 토픽을 도출하여 전력반도체 패키징 기술의 동향을 분석하였다. Hot 토픽의 기술로는 내전압에 따른 패키지 구조 기술과 입출력 관련 제어 기술, 방열기술을 도출하였고 Cold 토픽 기술로는 인덕턴스 저감기술이 도출되었다.

커뮤니티 기반 Q&A서비스에서의 질의 할당을 위한 이용자의 관심 토픽 분석에 관한 연구 (A Study on Mapping Users' Topic Interest for Question Routing for Community-based Q&A Service)

  • 박종도
    • 정보관리학회지
    • /
    • 제32권3호
    • /
    • pp.397-412
    • /
    • 2015
  • 본 연구에서는 커뮤니티 기반 질의응답 서비스에서의 질의할당을 위하여, 해당 커뮤니티에 축적된 질의응답 데이터 세트를 이용하여 해당 카테고리내의 토픽을 분석하고 이를 바탕으로 해당 토픽에 관심을 가지는 이용자의 관심 토픽을 분석하고자 하였다. 특정 카테고리 내의 토픽을 분석하기 위해서 LDA기법을 사용하였고 이를 이용하여 이용자의 관심 토픽을 모델링하였다. 나아가, 커뮤니티에 새롭게 유입되는 질의에 대한 토픽을 분석한 후, 이를 바탕으로 해당 토픽에 대해 관심을 가지고 있는 이용자를 추천하기 위한 일련의 방법들을 실험하였다.

토론 대화에서의 토픽 분석을 위한 키워드 추출 및 키워드 기반 감성분석 시스템 (A System for Keyword Extraction and Keyword-based Sentiment Analysis for Topic Analysis in Discussion)

  • 정용빈;오유진;박재완;장새미;함영균
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.164-169
    • /
    • 2022
  • 토픽 모델링은 비즈니스 분석이나 기술 동향 파악 등 다방면에서 많이 사용되고 있는 기술이다. 하지만 대표적인 방법인 LDA와 같은 비지도학습의 경우, 그 알고리즘 구조상 문서의 수가 많을 때 토픽 모델링이 가능하다. 본 논문에서는 문서의 수가 적은 경우도, 키워드 및 키프레이즈를 이용한 군집화를 통해 토픽 모델링을 하고 감성분석을 통해 토픽에 대한 분석도 제시하였다. 이에 필요한 데이터 제작 및 키워드 추출, 키워드 기반 감성분석, 키워드 임베딩 및 군집화를 구현하였고, 결과를 정성적으로 보았을 때 유의미한 분석이 되는 것을 확인하였다.

  • PDF

자아 중심 네트워크 분석과 동적 인용 네트워크를 활용한 토픽모델링 기반 연구동향 분석에 관한 연구 (Combining Ego-centric Network Analysis and Dynamic Citation Network Analysis to Topic Modeling for Characterizing Research Trends)

  • 유소영
    • 정보관리학회지
    • /
    • 제32권1호
    • /
    • pp.153-169
    • /
    • 2015
  • 이 연구에서는 토픽 모델링 결과 해석의 용이성을 위하여, 동적 인용 네트워크를 활용하여 LDA 기반 토픽 모델링의 토픽 수를 설정하고 중복 배치된 주요 키워드를 자아 중심 네트워크 분석을 통해 재배치하여 제시하는 방법을 제안하였다. 'White LED' 두 분야의 논문 데이터를 이용하여 분석한 결과, 동적 인용 네트워크 분석을 통해 형성된 분석대상 문헌집단에 혼잡도에 따른 토픽수를 사용하고 중복 분류된 토픽 내 주요 키워드를 자아중심 네트워크 분석 기법을 적용하여 재배치한 결과가 토픽 간의 중복도가 가장 낮은 것으로 나타났다. 따라서 동적 인용 네트워크 및 자아 중심 네트워크 분석을 적용함으로써 토픽모델링에 의한 분석 결과를 보완하는 다면적인 연구 동향 분석이 가능할 것으로 보인다.

토픽모델링과 에고 네트워크 분석을 활용한 스마트 헬스케어 연구동향 분석 (Research Trend Analysis on Smart healthcare by using Topic Modeling and Ego Network Analysis)

  • 윤지은;서창진
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권5호
    • /
    • pp.981-993
    • /
    • 2018
  • 스마트 헬스케어는 ICT 분야와 의료서비스 분야가 융 복합 된 분야로 다양한 분야에서 학제 간 융 복합 연구가 활발히 이루어지고 있다. 본 연구는 토픽모델링(Topic Modeling)과 에고 네트워크 분석(Ego Network Analysis)을 활용하여 스마트 헬스케어 연구동향을 살피는데 그 목적이 있다. 이를 위해 2001년부터 2018년 4월까지 Scopus에 게재된 2,690편을 대상으로 텍스트 분석, 각 기간별 빈도분석, 토픽모델링, 워드 클라우드, 에고 네트워크 분석을 수행하였다. 토픽 모델링 분석 결과 8개의 주요 연구토픽이 도출되었다. 8개 주요 연구토픽은 "AI in healthcare", " Smart hospital", "Healthcare platform", " blockchain in healthcare", "Smart health data", "Mobile healthcare", "Wellness care", "Cognitive healthcare" 순으로 나타났다. 토픽모델링 결과를 보다 심도 있게 살펴보기 위해 연구토픽별 에고 네트워크 분석을 하였다. 이를 통해 스마트 헬스케어 연구동향을 파악하고, 향후 연구의 방향성을 수립하는데 시사점을 제시하고자 한다.

텍스트 분석을 이용한 코로나19 관련 국내논문의 토픽 및 감성연구 (Topic and Sentiment Analysis on COVID19 Research in Korea Using Text Analysis)

  • 허성민;양지연
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.329-331
    • /
    • 2021
  • 본 연구에서는 코로나19 관련 연구논문의 연구주제를 탐색하고 동향을 검토하고 있다. 또한 감성분석을 통해 부정적인 어조가 강한 경고가 되는 주제들을 알아본다. 잠재 디리슐레 할당(LDA)를 이용하여 총 8개의 토픽을 발견하 였고, 이를 구조적 토픽 모델링(STM)과 비교하여 비교적 안정적인 결과임을 확인하였다. 또한 k-means 군집 알고리즘을 통해 각 토픽별로 세부 연구주제를 발견하였고 주성분 분석을 이용하여 이를 시각적으로 표현하였다. 감성분석을 통해 각 토픽별 긍정적, 부정적인 단어들을 살펴보고 감성점수를 계산하여 연구논문의 주된 어조를 파악하였는데, 특히 생물 의학 관련, 국제적 역학관계, 심리적 영향과 관련된 연구에서 부정적인 어조가 강한 것으로 나타나 해당 부문에 대해서 주의와 관심이 요구된다. 향후 연구자들이 연구의 방향성을 탐색하고 정책결정자들이 연구지원 사업을 결정하는데 기초자료로 활용될 수 있을 것이다.

  • PDF

신문기사에 나타난 경주지진 사건의 사회적 이슈분석 (Analysis of Social Issues of the Newspaper Articles on Gyeongju Earthquakes)

  • 이수상
    • 한국도서관정보학회지
    • /
    • 제48권2호
    • /
    • pp.53-72
    • /
    • 2017
  • 이 연구는 토픽모델링을 사용하여 2016년 경주지진에 대한 사회적 이슈의 유형과 특성을 분석하는 것을 목적으로 한다. 구체적인 연구문제는 경주지진 사건과 관련된 토픽의 유형, 사건 발생 이후 시간의 흐름에 따른 토픽의 변화양상, 그리고 신문매체의 유형별 토픽의 차이를 살펴보는 것이다. 토픽모델링 분석결과 55개의 토픽이 추출되었다. 이들 토픽에서 파악한 특성은 다음과 같다. 첫째, 시간의 흐름에 따라 주요 토픽이 변화하는 양상을 보였다. 지진이 발생한 9월에 다양한 토픽들이 나타났다. 특히 지진발생 후 2주간에는 긴급한 이슈들이 다루어졌다. 10월 이후부터는 해당 시기의 사회적 현안과 관련된 이슈들이 부각되었다. 원전관련 안전문제는 시기와 상관없이 꾸준히 제시되었다. 둘째, 전국과 지방으로 구분된 신문매체에서는 주요하게 다루는 토픽에 차이가 나타났다. 그리고 보수와 진보적 성향의 신문매체에서도 주요한 토픽들이 다르게 나타났다.