• 제목/요약/키워드: Text-mining Analysis

검색결과 1,221건 처리시간 0.026초

미 연준 통화정책방향 의결문의 시그널링 효과 분석 (An analysis of the signaling effect of FOMC statements)

  • 우신욱;장영재
    • 응용통계연구
    • /
    • 제33권3호
    • /
    • pp.321-334
    • /
    • 2020
  • 최근 미 연준이 정책금리 인하를 결정하면서 향후 통화정책 운용방향에 관해 관심이 고조되고 있다. 과거 금리동결 시점이나 동결기간 중, 그리고 인상이나 인하 시점이 다가왔을 때 통화정책 의결문의 표현을 살펴보면 단어 선택의 변화 등을 통해 시장과 꾸준하게 커뮤니케이션해 왔었다는 것을 알 수 있다. 하지만 이렇게 의결문의 표현을 문맥을 통해 분석하는 방법이 다소 주관적이고 정성적인 분석에 그칠 수 있다는 비판이 있다. 이런 점을 고려하여 Woo와 Chang (2016)에서는 데이터마이닝 기법 중 하나인 텍스트마이닝 방법을 통해 의결문 분석 과정을 보완할 수 있는 방법을 제안한 바 있다. 본 논문에서는 선행 연구 결과를 토대로 미 연준의 통화정책 의결문의 정책 시그널링 효과를 평가해 보았다. 의결문의 특성을 텍스트마이닝 관점에서 분석하고 의결문 간 표현의 변화를 포착하여 향후 정책 기조 변화를 예측하고자 하였다. 이를 위해 대표적인 데이터마이닝 기법인 의사결정나무모형과 신경망모형을 사용하였다. 분석 결과, 대체로 의결문 간 비유사성의 변화가 향후 정책 변화를 효과적으로 예측할 수 있는 것으로 평가되었으며, 그동안 미 연준이 의결문을 통해 체계적으로 정책 시그널링을 실시해 온 결과로 판단할 수 있다.

빅데이터를 활용한 지역화폐 소비자 이미지 인식에 관한 연구 (A Study on Image Recognition of local Currency Consumers Using Big Data)

  • 김명희;류기환
    • 문화기술의 융합
    • /
    • 제8권4호
    • /
    • pp.11-17
    • /
    • 2022
  • 현재 지역경제의 소득과 자금은 수도권으로 유출되고 있으며, 지역발전의 원동력인 인재들 역시 수도권으로 모여 지역의 경제는 심각한 위기에 직면해 있다. 지역화폐는 지방자치단체가 발행 주체이며, 해당 지역 안에서만 통용이 가능한 보조, 보완기능의 화폐이다. 지역경제 활성화를 위하여 지자체의 지역화폐 도입에 대한 이목 이 집중되면서 지역화폐의 발행 및 활용에 관한 연구가 계속하여 진행되고 있다. 본 연구에서는 현재 포털, SNS 등의 데이터 자료를 빅데이터를 활용하여 지자체 지역에서 발행되고 있는 지역화폐에 대한 소비자 이미지 분석을 통한 인식 파악과 함께 연구 결과를 바탕으로 지역화폐 발행 및 운영에 대한 시사점을 제시하고자 한다. 본 연구 결과는 다음과 같다. 첫째, 지역화폐의 정책적 발행을 통해 지역 소비를 유도하여 지역의 경제적 소득 증대 효과를 보이고 있으며, 둘째, 지자체는 지역화폐 발행과 유통으로 경제 활성화와 지역 경제의 선순환 시스템 구축에 힘을 기울이는 것으로 나타났다. 셋째, 블록체인 기술 도입으로 지역화폐의 안정적인 운영 실태를 보여주고 있다. 학술적 의의로 지역화폐의 정책의 방향성과 빅데이터 분석을 통하여 지역화폐에 대한 변화된 모습과 효과를 파악할 수 있었다.

토픽모델링을 활용한 조세순응 연구 동향 분석 (Analysis of Research Trends in Tax Compliance using Topic Modeling)

  • 강민조;백평구
    • 한국콘텐츠학회논문지
    • /
    • 제22권1호
    • /
    • pp.99-115
    • /
    • 2022
  • 본 연구의 목적은 사회과학 전반에 걸쳐서 수행되고 있는 조세 분야의 대표적인 연구주제로서 조세순응, 납세의식, 성실납세(이하 "조세순응")에 관한 연구의 흐름을 정리함으로써 융합학문으로서 세무학의 지평을 확장하는 것이다. 이에 조세순응에 관한 국내 학술지 논문을 학제적 관점에서 종합적으로 분석하기 위하여 텍스트마이닝의 일환으로 토픽모델링 기법을 적용하였다. 데이터 수집-키워드 전처리-토픽모델 분석의 흐름으로 총 347편의 논문에 연구자가 등록한 조세순응 관련 키워드들로부터 잠재적인 연구주제를 제시하고자 하였다. 본 연구의 분석 결과로 첫째, 키워드 분석에서는 세무조사, 조세회피, 성실신고확인제도 등의 키워드가 단순 빈도 기준으로 상위 5개 키워드에 포함되었고, 키워드의 상대적 중요도를 감안한 TF-IDF 값에서도 상위 5개 키워드에 포함되었다. 한편 탈세라는 키워드는 단순빈도에서 부각되지 않은 것에 비해 TF-IDF 값 기준으로 상위 키워드에 포함되었다. 둘째, 토픽모델링을 통해 잠재적인 8개의 연구주제를 도출하였다. 해당 주제는 (1) 조세공정성과 조세범칙행위의 억제, (2) 조세법의 이념과 조세정책의 타당성, (3) 실질과세원칙과 조세채권의 담보 (4) 납세협력비용과 세무행정 서비스, (5) 신고납세제도와 세무전문가, (6) 조세풍토와 전략적 조세행동, (7) 조세행동의 다면성과 차별적 순응의도, (8) 과세정보시스템과 효율적 세원관리와 같다. 본 연구는 학문 간의 경계를 넘어 조세순응이라는 주제어를 바라보는 다양한 관점을 포괄적으로 조망함으로써 학제간 소통의 기회를 마련하고 합리적인 조세제도를 구축하는데 실천적 시사점을 제시하고자 하였다.

디지털 전환: D.N.A.(Data, Network, AI) 키워드를 활용한 토픽 모델링 (Digital Transformation: Using D.N.A.(Data, Network, AI) Keywords Generalized DMR Analysis)

  • 안세환;고강욱;김영민
    • 지식경영연구
    • /
    • 제23권3호
    • /
    • pp.129-152
    • /
    • 2022
  • 디지털 전환의 핵심 인프라로서 데이터·네트워크·인공지능(D.N.A.) 분야의 확산과 유망 산업의 등장은 경제 전반에 걸쳐 활발한 디지털 혁신의 기반이 되고 있다. 본 연구에서는 텍스트마이닝 방법론을 적용하여 WoS 데이터베이스의 SCIE 급 색인에 해당하는 연구의 초록, 출판연도 및 연구분야를 입력변수로 활용하여 주요 토픽을 도출하였다. 우선, 단어 출현 빈도에 기반한 TF 및 TF-IDF 분석을 통해 주요 키워드를 확인하고, 이어서 g-DMR(Generalized Dirichlet-Multinomial Regression)을 이용하여 토픽 모델링을 수행하였는데, 다양한 형태의 변수를 메타정보로 활용 가능한 해당 토픽 모형의 이점으로 단순하게 토픽을 도출하는 것 이상의 의미를 적절하게 탐색할 수 있었다. 분석 결과에 따르면, 비즈니스 인텔리전스, 제조 생산 시스템, 서비스 가치 창출, 원격 진료, 디지털 교육 등의 토픽들이 디지털 전환에서 주요 연구주제인 것으로 식별되었다. 토픽 모델링의 결과를 요약하자면, 1) COVID-19 이후 비즈니스 인텔리전스를 주제로 하는 연구가 전 영역에서 활발하게 수행되고 있으며, 2) 제조 분야에서 지능형 제조 솔루션 및 메타버스 등의 이슈가 등장함에 따라 제조 생산 시스템에 관한 주제가 다시 한번 주목받고 있음을 확인하였다. 마지막으로, 3) 주제어 자체는 기술과 서비스의 측면에서 분리하여 볼 수 있지만, 다수의 연구에서 해당 기술들을 접목하여 적용된 다양한 서비스를 포괄적으로 다루고 있으므로 이를 별개로 해석하는 것이 바람직하지 못하다는 점을 알 수 있었다.

토픽 모델링을 활용한 코로나19 초기 생활체육 이슈 분석 (Trend Analysis of Sports for All-Related Issues in Early Stage of COVID-19 Using Topic Modeling)

  • 정연길;서수민;강현민
    • 지능정보연구
    • /
    • 제28권3호
    • /
    • pp.57-79
    • /
    • 2022
  • 지난 2019년 12월 시작된 코로나19는 정치, 경제, 사회, 문화 등 우리 삶의 전반에 많은 영향을 끼쳐 왔으며, 스포츠, 공연 예술 등의 분야 역시 이로 인해 큰 폭으로 활동이 위축되었다. 스포츠 분야의 경우 참여스포츠를 대표하는 생활체육 분야에서의 변화가 특히 크게 나타났으며, 헬스장, 탁구장, 배드민턴 동호회 등 국민 삶과 밀접한 장소에서의 확진자 발생은 코로나19의 확산에 대한 사회적 공포감을 증폭시키는 원인이 되기도 하였다. 이에 본 연구에서는 코로나19가 최초 확산한 시기의 생활체육 관련 국내 언론 기사를 분석하여, 코로나19 사태로 인해 생활체육 분야에서 어떤 이슈들이 현장에서 등장하고 있으며 어떠한 논의들이 이루어지고 있는지 살펴본다. 구체적으로 본 연구는 국내 대표적인 포털 뉴스 사이트로부터 생활체육과 관련된 코로나19 이슈를 다루고 있는 뉴스 기사를 수집한 후, 이에 대한 토픽 모델링(Topic Modeling) 분석을 통해 코로나19 환경에서의 주요 생활체육 이슈를 파악하였다. 분석을 통해 체육시설 코로나 발생, 체육활동 지원, 생활체육활동 변화 등의 의미있는 이슈를 발견하였으며, 이들 주요 이슈에 대한 워드 클라우드(Wordcloud) 분석을 통해 이슈를 시각적으로 이해하고 시간의 흐름에 따라 이러한 이슈가 변화하는 양상을 확인하였다.

토픽모델링 기반의 국내외 미래 자동차 연구동향 비교 분석: CASE 키워드 중심으로 (Analysis of domestic and foreign future automobile research trends based on topic modeling)

  • 정호정;김건욱;김나경;장원준;정원웅;박대영
    • 디지털융복합연구
    • /
    • 제20권5호
    • /
    • pp.463-476
    • /
    • 2022
  • 과거 산업화 이후 자동차 산업은 내연기관 중심의 지속적인 성장을 하였으나, 최근 4차 산업혁명으로 큰 변화를 맞이하고 있다. 대다수의 기업들이 전기 자동차, 자율주행으로의 전환을 준비하고 있으며, 현시점에서 국내와 국외의 미래 자동차 연구동향을 비교 분석할 필요가 있다. 이에 본 연구에서는 미래 자동차 트렌드를 대표하는 CASE(Connectivity, Autonomous, Sharing, Electrification)와 관련된 키워드가 포함된 국내 4,002건, 국외 68,372건 논문을 수집하여 LDA 알고리즘 기반의 토픽모델링을 수행하였으며, 국내외 미래 자동차 연구동향을 비교 분석하여 정책적 시사점을 제시하였다. 분석 결과 국내의 경우 교통 인프라, 도시 내 교통효율, 교통정책 등과 같은 거시적인 측면에서의 연구가 주를 이루는 것으로 나타났으며, 국외는 객체인식, 사물인터넷, 전기자동차 소음 등의 차량기술과 관련된 연구가 활성화되고 있음을 확인할 수 있었다. 이를 통해 국내 공유자동차 부문에 있어 MaaS(Mobility-as-a-Service)와 관련한 정부의 기술지원이 필요하고 교통수단별 데이터 개방 필요성 등에 대하여 제시하였고, 이러한 분석결과는 미래 자동차 산업을 위한 기초자료로 활용될 수 있을 것으로 판단된다.

빅데이터를 활용한 요양보호사의 서비스질 인식에 관한 연구 (A Study on the Perception of Quality of Care Services by Care Workers using Big Data)

  • 조한아
    • 대한치위생과학회지
    • /
    • 제6권1호
    • /
    • pp.13-25
    • /
    • 2023
  • 연구배경: 본 연구는 비정형 빅데이터를 활용하여 노인장기요양보험의 직접적 서비스 인력인 요양보호사의 서비스질 관리를 확인하고자 수행되었다. 연구방법: 요양보호사의 서비스질과 관련된 소셜 비정형 데이터를 텍스톰을 사용하여 수집·분석하였다. 데이터를 크롤링하여 수집된 상위 50개 키워드들 간의 빈도분석, TF-IDF, 중심성 분석, 의미연결망분석과 CONCOR 분석을 실시하였다. 연구결과: 빈도분석 결과 상위권에 속한 키워드는 '요양서비스' '요양보호사', '서비스질', '요양보호', '장기요양기관', '향상', '어르신', '처우', '개선', '필요' 였으며, 연결중심성과 위세중심성 분석결과도 거의 동일한 순위로 확인되었다. CONCOR 분석결과 4개의 그룹으로, 요양서비스질 개선, 요양서비스 운영, 요양서비스 제도, 요양보호사의 심리적인 부분에 대한 인식이 높은 것으로 나타났다. 결론: 본 연구는 요양보호사의 서비스질과 관련한 인식을 의미있는 그룹으로 제시하였으며 이는 요양보호사 서비스질 향상을 위한 다각적인 방향성 수립에 기여할 것으로 판단된다.

6G의 기술경쟁력 및 네트워크 분석: GaN 집적회로 특허 데이터 중심 (6G Technology Competitiveness and Network Analysis: Focusing on GaN Integrated Circuit Patent Data)

  • 최우석;김진용;이정환;최상현
    • 산업융합연구
    • /
    • 제21권3호
    • /
    • pp.1-15
    • /
    • 2023
  • 무선통신 기술은 통신서비스 자체에만 활용되는 단계를 넘어 21세기 디지털 전환이라는 패러다임과 맞물려 다양한 산업의 혁신을 촉진하는 기반 기술로써 기대가 높아지고 있다. 본 연구에서는 우리나라와 주요 선도국가의 6G 기술경쟁력을 비교하기 위해 GaN(갈륨나이트라이드) 특허 정보를 기반으로 시장확보 지수(PFS), 피인용도 지수(CPP) 그리고 네트워크 분석을 통해 6G 기술경쟁력을 분석하였다. 우리나라의 6G 기술경쟁력은 PFS가 0.62로, CPP가 3.93으로 나타났으며, 각각 선도국가 대비 32.8%, 19.9% 수준인 것으로 확인되었다. 그다음 네트워크 분석 결과, 6G 분야의 특허 협업 비율은 7.2%로 대부분 국가에서 모두 협업 생태계가 미흡한 것으로 분석되었다. 다만, 우리나라는 선도국가와 달리 산업계와 학계가 연계한 소규모 협업 관계가 구축되어 있음을 확인할 수 있었다. 따라서, 소규모 협업 생태계를 기반으로 통신 기술 고도화를 할 수 있는 국가 차원의 6G 통합 R&D 전략을 마련할 필요가 있겠다.

토픽 모델링을 활용한 대학 강의평가 개방형 응답분석 (Open-Ended Response Analysis for University Course Evaluations using Topic Modeling)

  • 안수현;이상준
    • 실천공학교육논문지
    • /
    • 제15권3호
    • /
    • pp.539-547
    • /
    • 2023
  • 최근 대학교육은 교육 패러다임의 변화와 함께 학습자 중심의 교육 모델을 강조하고 있다. 본 연구는 대학 강의평가의 개방형 응답을 토픽 모델링으로 분석하여 학생들의 다양한 의견을 탐색하고 교육의 질을 향상시키는데 목적이 있다. 이를 위해 비수도권 대학의 2017년부터 2022년까지 강의평가 결과를 바탕으로 총 45,001개의 개방형 응답을 전공과 교양으로 구분하여 단문에 최적화된 BTM(Biterm Topic Modeling) 분석을 진행하였다. 분석 결과 전공 강의는 "비대면 수업경험에 대한 태도", "질문과 토론에 대한 태도", "출석과 성적평가에 대한 태도", "실습활동 및 발표에 대한 태도", "소통과 협업에 대한 태도"로 구분되었고, 교양 강의는 "비대면 수업경험에 대한 태도", "성적 및 평가에 대한 태도", "출석 및 수업계획서에 대한 태도", "학문적 지식과 흥미에 대한 태도", "소통과 질문에 대한 태도"로 구분되었다. 학생들의 다양한 피드백을 분석한 본 연구결과를 토대로 전공과 교양 강의의 특성을 비교하고 강의개선 및 학습경험을 향상시키는데 도움이 될 수 있는 인사이트를 얻을 수 있을 것이다.

SentenceBERT 모델을 활용한 해양안전심판 재결서 분석 방법에 대한 연구 (Maritime Safety Tribunal Ruling Analysis using SentenceBERT)

  • 윤보리;박세길;배혜림;심성현
    • 해양환경안전학회지
    • /
    • 제29권7호
    • /
    • pp.843-856
    • /
    • 2023
  • 전 세계 선박 통행량의 증가에 따른 선박 충돌 사고의 증가는 큰 경제적, 환경적, 물리적 및 인간적 손해를 가져왔다. 선박 사고의 원인은 선원의 판단 오류나 부주의, 항로의 복잡성, 기상 조건, 선박의 기술적 결함 등 다양한 요인이 겹쳐 작용하여 사고를 유발하기 때문에 문장의 깊은 의미와 문맥 정보를 고려할 수 있는 방법론이 필요하다. 따라서, 본 연구는 부산해심 지역에서의 최근 20년 동안의 선박 충돌사고 데이터를 포함하고 있는 해양안전심판 재결서를 SentenceBERT 모델을 활용해 분석하였다. 분석 결과 사고의 주요 원인이 될 수 있는 키워드가 도출되었으며, 특정 키워드 출현 빈도를 바탕으로 군집 분석을 시행하고 시각화하였다. 추후 사고의 원인을 미리 파악함으로써, 이를 통해 선박 충돌 사고의 예방 및 사고 대응 전략 개발의 기초 자료로써 활용하고자 한다.