• 제목/요약/키워드: 색인어추출

검색결과 132건 처리시간 0.021초

텍스트마이닝을 활용한 감정노동 연구 동향 분석 (Research Trends on Emotional Labor in Korea using text mining)

  • 조경원;한나영
    • 한국산업정보학회논문지
    • /
    • 제26권6호
    • /
    • pp.119-133
    • /
    • 2021
  • 텍스트마이닝을 이용하여 연구동향을 파악하는 연구가 많은 분야에서 이루어지고 있으나 감정노동 분야에서는 텍스트마이닝을 사용하여 연구 동향을 파악한 연구는 없는 실정이다. 본 연구는 텍스트마이닝을 이용하여 2004년부터 2019년까지 한국연구재단의 한국학술지인용색인(KCI)에서 '감정 노동'이라는 주제어가 포함된 1,465건의 검색된 논문을 심층적으로 분석하여 감정노동 연구 동향을 파악하고자 한다. LDA분석으로 주제들을 추출하고, 토픽의 비중과 유사도를 확인하기 위해 IDM분석을 실시하였다. 이를 통해 유사도가 높은 토픽들의 의미유용성을 고려하여 토픽의 통합분석을 실시하였다. 연구토픽은 11개로 구분되며, 감정노동의 스트레스(12.2%), 감정노동과 사회적 지지(12.0%), 고객서비스 종사자의 감정노동(10.9%), 감정노동과 회복탄력성(10.2%), 감정노동전략(9.2%), 콜센터상담사의 감정노동(9.1%), 감정노동의 결과(9.0%), 감정노동과 직무소진(7.9%), 감성지능(7.1%), 예비돌봄서비스 종사자의 감정노동(6.6%), 감정노동과 조직문화(5.9%) 순의 비중으로 나타났다. 토픽모델링과 트렌드분석을 통하여 감정노동의 연구동향과 학문적 추이를 분석함으로써 감정노동 연구의 나아갈 방향을 제시하고자 하며 감정노동에 관한 실무적인 전략을 수립할 수 있기를 기대한다.

Word2Vec을 활용한 제품군별 시장규모 추정 방법에 관한 연구 (A Study on Market Size Estimation Method by Product Group Using Word2Vec Algorithm)

  • 정예림;김지희;유형선
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.1-21
    • /
    • 2020
  • 인공지능 기술의 급속한 발전과 함께 빅데이터의 상당 부분을 차지하는 비정형 텍스트 데이터로부터 의미있는 정보를 추출하기 위한 다양한 연구들이 활발히 진행되고 있다. 비즈니스 인텔리전스 분야에서도 새로운 시장기회를 발굴하거나 기술사업화 주체의 합리적 의사결정을 돕기 위한 많은 연구들이 이뤄져 왔다. 본 연구에서는 기업의 성공적인 사업 추진을 위해 핵심적인 정보 중의 하나인 시장규모 정보를 도출함에 있어 기존에 제공되던 범위보다 세부적인 수준의 제품군별 시장규모 추정이 가능하고 자동화된 방법론을 제안하고자 한다. 이를 위해 신경망 기반의 시멘틱 단어 임베딩 모델인 Word2Vec 알고리즘을 적용하여 개별 기업의 생산제품에 대한 텍스트 데이터를 벡터 공간으로 임베딩하고, 제품명 간 코사인 거리(유사도)를 계산함으로써 특정한 제품명과 유사한 제품들을 추출한 뒤, 이들의 매출액 정보를 연산하여 자동으로 해당 제품군의 시장규모를 산출하는 알고리즘을 구현하였다. 실험 데이터로서 통계청의 경제총조사 마이크로데이터(약 34만 5천 건)를 이용하여 제품명 텍스트 데이터를 벡터화 하고, 한국표준산업분류 해설서의 산업분류 색인어를 기준으로 활용하여 코사인 거리 기반으로 유사한 제품명을 추출하였다. 이후 개별 기업의 제품 데이터에 연결된 매출액 정보를 기초로 추출된 제품들의 매출액을 합산함으로써 11,654개의 상세한 제품군별 시장규모를 추정하였다. 성능 검증을 위해 실제 집계된 통계청의 품목별 시장규모 수치와 비교한 결과 피어슨 상관계수가 0.513 수준으로 나타났다. 본 연구에서 제시한 모형은 의미 기반 임베딩 모델의 정확성 향상 및 제품군 추출 방식의 개선이 필요하나, 표본조사 또는 다수의 가정을 기반으로 하는 전통적인 시장규모 추정 방법의 한계를 뛰어넘어 텍스트 마이닝 및 기계학습 기법을 최초로 적용하여 시장규모 추정 방식을 지능화하였다는 점, 시장규모 산출범위를 사용 목적에 따라 쉽고 빠르게 조절할 수 있다는 점, 이를 통해 다양한 분야에서 수요가 높은 세부적인 제품군별 시장정보 도출이 가능하여 실무적인 활용성이 높다는 점에서 의의가 있다.