• 제목/요약/키워드: Text-mining Analysis

검색결과 1,221건 처리시간 0.028초

토핑 모델링을 활용한 동해안 관광의 변화 분석 (The Analysis of Changes in East Coast Tourism using Topic Modeling)

  • 정은희
    • 한국정보전자통신기술학회논문지
    • /
    • 제13권6호
    • /
    • pp.489-495
    • /
    • 2020
  • 4차혁명이 진행되고 있는 초연결사회에선 다양한 IT기기를 통해 데이터량이 증가하고 있고, 이렇게 생산된 데이터를 분석하여 새로운 가치를 창출 할 수 있다. 본 연구에서는 빅카인즈에서 2017년부터 2019년까지 중앙지, 경제지, 지역조합지, 주요방송사 등에서 "(동해안 관광 또는 동해안 여행) 그리고 강원도"라는 키워드로 기사를 총 1,526건을 수집하였다. 수집된 1,526건의 기사를 분석하기 위해 R언어로 구현된 LDA 알고리즘을 이용하여 토픽 모델링을 수행하였다. 2017년부터 2019년까지 각각의 년도별 키워드를 추출하고, 각 년도별로 빈도수가 높은 키워드를 분류하여 비교하였다. Log Likelihood와 Perplexity를 이용하여 최적의 토픽 수를 8로 설정한 후, 깁스 샘플링 방법으로 8가지의 토픽을 추론하였다. 추론된 토픽들은 강릉과 해변, 고성과 금강산, KTX와 동해북부선, 주말바다여행, 속초와 통일전망대, 양양과 서핑, 체험관광, 교통망 인프라이다. 추론된 8개의 토픽의 비중을 이용해 동해안 관광에 대한 기사들의 변화를 분석하였다. 그 결과, 통일전망대와 금강산의 비중은 큰 변화가 없는 것으로 나타났고, KTX와 체험관광의 비중은 증가하였고, 그 외의 토픽들의 비중은 2017년에 비해 2018년에 감소하였다. 2019년에는 KTX와 체험관광의 비중은 감소하였으나, 나머지 토픽들의 비중은 큰 변화가 없는 것으로 나타났다.

AI 윤리와 규제에 관한 표준 프레임워크 설정 방안 연구 (A Study on How to Set up a Standard Framework for AI Ethics and Regulation)

  • 남문희
    • 한국융합학회논문지
    • /
    • 제13권4호
    • /
    • pp.7-15
    • /
    • 2022
  • 정보와 기술의 탈중앙화/분권, 공유/개방, 연결을 통한 개별 맞춤 시대의 지능화 세계 지향으로 그 어느 때 보다도 인공지능에 대한 관심과 기술적 담론 속에 기대와 우려가 교차하는 경향을 자주 보게 된다. 최근에는 2045년 전, 후로 AI의 특이성(Singularity)이 나타날 것이라는 미래학자들의 주장도 쉽게 찾아볼 수 있다. 이제는 다가올 인공지능 시대에서 AI와 함께 상생하고 번영하는 공존 패러다임을 만들기 위한 준비의 일환으로 보다 올바른 AI 윤리와 규제 설정을 위한 표준 프레임워크가 요구되고 있다. 주요지침 설정 누락의 위험성 배제와 타당하고 보다 합리적인 지침 항목과 평가 기준을 가늠 할 수 있는 방안이 점차 큰 연구문제로 나타나고 있기 때문이다. 이런 연구문제 해결과 동시에 AI 윤리와 규제 설정에 대한 지속적인 경험과 학습효과가 연결 발전될 수 있도록 국제기구/국가/기업의 AI 윤리와 규제에 대한 가이드 라인 자료 등을 수집하여 설정 연구모형과 텍스트 마이닝 탐색 분석을 통해 표준 프레임워크(SF: Standard Framework) 설정 방안을 연구 제시한다. 본 연구결과는 향후 보다 발전적인 AI 윤리와 규제지침 항목 설정과 평가 방안연구에 기초 선행연구 자료로 기여될 수 있을 것이다.

스포츠시설에 관한 연구 동향 분석: SCOPUS DB를 중심으로 (Analysis on Research Trends in Sport Facilities: Focusing on SCOPUS DB)

  • 김일광;박성택;박수선;김미숙;박종철
    • 산업융합연구
    • /
    • 제19권6호
    • /
    • pp.11-19
    • /
    • 2021
  • 본 연구의 목적은 "스포츠시설" 관련 국내외 연구의 동향을 탐색적으로 파악하여 향후 연구 방향을 모색하는 데 있다. 이를 위해 2016년부터 2020년까지 SCOPUS DB에서 "스포츠시설"이 포함된 논문의 초록을 수집하였으며, 그 결과 총 1,801편이 자료 분석에 사용되었다. 자료 분석 수행을 위해 LDA 기반 토픽 모델링 기법과 TD-IDF 기법을 활용하였으며, Tagxedo를 활용한 워드클라우드 분석을 수행하였다. 분석 결과, 8가지 토픽이 최적으로 결정되었으며, 각 토픽의 주요 키워드로는 "sports", "facilities", "health", "physical", "data" 및 "using" 등이 도출되었다. 이를 통해 최근에 국내외적으로 스포츠시설과 관련하여 신체활동, 건강 및 시설 이용 등을 주제로 한 연구들이 활발하게 이루어져 왔음을 확인할 수 있었다. 이는 최근 SCOPUS 논문들은 건강 증진과 삶의 질 향상 등과 같은 스포츠시설의 도구적 가치에 주목하고 있음을 의미한다. 따라서, 건강한 삶을 위해 스포츠시설을 이용하는 참여자들에게 도움이 될 수 있는 다양한 연구들이 향후 지속적으로 수행되어야 할 것이다.

스마트도시 구현을 위한 시민참여의 역할과 방향에 관한 연구 (Civic Participation in Smart City : A Role and Direction)

  • 남우민;박건철
    • 인터넷정보학회논문지
    • /
    • 제23권6호
    • /
    • pp.79-86
    • /
    • 2022
  • 본 연구는 스마트도시 구축과정에서 시민참여 활성화를 위한 연구동향을 파악하고자 한다. 이를 바탕으로 스마트도시에서 시민참여의 역할과 방향을 제시하고 시민참여를 유인할 수 있는 정책적·산업적·학술적·방향성을 제시하는데 있다. 전 세계적으로 급격하게 진행되는 도시화와 도시인구 증가로 교통, 환경, 에너지 등 각종사회 문제가 도시를 중심으로 확산 및 심화되고 있다. 세계 각국은 이런 도시문제 해결 및 지속가능한 발전을 이루기 위해 스마트도시를 도입하고 있다. 최근에는 인프라 확대 등 스마트도시 건설을 위한 기존의 하향식(Top-Down) 도시계획 방식에서 벗어나 시민들이 직·간접적으로 도시건설 과정에 참여 및 상호작용할 수 있는 상향식(Bottom-Up) 방식으로의 접근이 경주되고 있다. 한편, 국내에서도 국가전략관점에서 스마트도시 건설이 추진되고 있지만, 스마트도시에 대한 일반 시민의 인식과 참여는 낮은 것으로 나타나고 있다. 이런 상황을 극복하기 위해 스마트도시의 구축과정에서 시민참여를 촉진하기 위한 연구가 시급한 상황이다. 따라서 본 연구에서는 스마트도시의 구축과정에서 시민참여를 촉진하기 위한 전략모색을 위해 Scopus DB에서 'Smart City'와 'Participation(Engagement)'가 동시에 포함된 문헌 995건을 수집 후 토픽모델링 기법을 활용하여 관련 연구주제를 유형화하고, 연구동향을 분석하였다. 이를 통해 스마트도시에서 시민참여에 관한 연구방향을 이해하고, 향후 관련 연구에 대한 방향성을 제시하는 근거자료로 활용될 수 있을 것으로 기대된다.

심층 신경망을 활용한 진료 기록 문헌에서의 종단형 개체명 및 관계 추출 비교 연구 - 파이프라인 모델과 결합 모델을 중심으로 - (A Comparative Research on End-to-End Clinical Entity and Relation Extraction using Deep Neural Networks: Pipeline vs. Joint Models)

  • 최성필
    • 한국문헌정보학회지
    • /
    • 제57권1호
    • /
    • pp.93-114
    • /
    • 2023
  • 정보추출은 문헌 내에 존재하는 개체명을 인식함과 동시에 이들 간의 의미적 관계까지도 식별하여 최종적으로 문헌 내에 포함된 의미적 트리플을 자동으로 추출하여 활용할 수 있으므로 문헌에 대한 심층적인 분석과 이해에 많은 도움을 줄 수 있다. 그러나 지금까지 대부분의 정보추출에 대한 연구는 개체명 인식과 관계추출이 개별 연구로 각각 분리되어 진행되었으며, 그 결과 입력 문헌에 대한 정보추출의 최종 출력인 의미적 트리플 추출 성능에 대한 객관적이고 정확한 평가가 제대로 이루어지지 않았다. 이에 본 논문에서는 진료 기록 문헌에 나타나는 개체명과 그들 간의 관계를 트리플 형태로 직접 추출할 수 있는 종단형 정보추출의 2가지 모델인 파이프라인 및 결합형 모델을 구축하는 구체적인 방법론을 제시하고 성능 비교 실험을 진행하였다. 우선 파이프라인 모델은 양방향 GRU-CRFs를 활용한 개체명 인식 모듈과 다중 인코딩 기반 관계추출 모듈로 구현되었고, 결합형 모델을 위해서는 다중 헤드 레이블링 기반의 양방향 GRU-CRFs이 적용되었다. 두 가지 시스템을 바탕으로 진료기록 문헌 내의 개체명과 관계를 모두 태깅하여 구축된 i2b2/VA 2010 데이터셋을 활용한 비교 실험에서 파이프라인 모델의 성능이 5.5%(F-measure) 더 높게 나타났다. 추가적으로, 대규모 신경망 언어모델과 수작업으로 구축된 자질 정보를 활용한 최고 수준의 기존 시스템과의 비교 실험을 통해, 본 논문에서 구현한 종단형 모델의 객관적인 성능 수준을 파악할 수 있었다.

미래신호 탐지 기법을 활용한 위성산업 시장의 진입 전략 수립 연구 (A Study on Establishing a Market Entry Strategy for the Satellite Industry Using Future Signal Detection Techniques)

  • 김세형;박재형;이한솔;강주영
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.249-265
    • /
    • 2023
  • 우주 산업은 세계적으로 잠재력이 높은 산업 분야로 여겨지지만, 국내에서는 아직 글로벌 시장에 비해 비교적 관심이 저조한 실정이다. 국내에서도 최근 위성산업은 전통적인 정부 주도의 산업에서 벗어난 민간 주도의 '뉴스페이스(New Space)' 패러다임에 관심을 기울이고 있다. 따라서, 본 연구의 목적은 국내 위성산업 관련 민간 기업의 시장 진입 전략을 결정하는 데 도움이 될 수 있는 미래의 신호를 탐색하는 것이다. 이를 위해 본 연구에서는 미래신호 이론과 Keyword Portfolio Map 등의 이론적 배경을 활용하여, 키워드 성장률과 키워드 등장 빈도 등을 바탕으로 특허 문서 데이터 내 키워드 잠재력을 분석한다. 또한, 뉴스 데이터를 추가로 수집하여 미래신호를 각각 first symptom, early information으로 구분하였다. 이는 해당 키워드가 특허문서 이외에 어떻게 실질적인 잠재력을 드러내는지에 대한 해석적 지표로 활용된다. 본 연구는 미래신호 탐색을 위한 데이터 수집과 분석 과정을 수록하였고, 키워드 맵의 시각화 자료를 통해 어떤 형태로 활용될 수 있는지 구체적으로 시각화함으로써 수집된 문서의 각각의 키워드가 약신호에서 강신호로 발전하는 과정을 추적하는 일련의 과정을 수록하였다. 본 연구의 과정은 기존 미래신호에 관한 연구의 방법론적인 기여와 활용 범위의 확장에 기여할 수 있고, 결과물은 위성 산업에서의 신산업 기획 및 연구 방향성 수립에 기여할 수 있다.

지방자치단체의 스마트시티 조례 분석: 토픽모델링을 활용하여 (Analysis of Municipal Ordinances for Smart Cities of Municipal Governments: Using Topic Modeling)

  • 서형준
    • 정보화정책
    • /
    • 제30권1호
    • /
    • pp.41-66
    • /
    • 2023
  • 본 연구는 72개 지자체의 74개 스마트시티 조례를 대상으로, 지자체 스마트시티 조례의 방향성을 확인하고자 토픽모델링을 활용하여 조례의 주요 키워드를 확인하고, 조례의 키워드에 따른 주제분류를 진행하였다. 분석결과 주요 키워드는 스마트도시위원회의 구성 및 운영에 관한 키워드가 조례 내에서 높은 빈도를 보였다. 조례에 대한 토픽모델링 Latent Dirichlet Allocation(LDA) 분석결과 관련 키워드에 따라 총 8개의 주제로 분류할 수 있었다. 구체적으로 주제-1(스마트시티 추진사항 보안), 주제-2(스마트시티 산업진흥), 주제-3(스마트시티 주민협의체 구성), 주제-4(스마트시티 추진체계 지원), 주제-5(개인정보 관리), 주제-6(스마트시티 데이터 활용), 주제-7(지능정보화 행정구현), 주제-8(스마트시티 홍보) 등으로, 주제의 비중은 주제-6, 주제-4, 주제-1 등의 순으로 나타났다. 권역별 주제분류는 수도권은 주제-5, 주제-6, 주제-8 의 비중이 높았고, 지방권은 주제-2, 주제-3, 주제-4의 비중이 높아 수도권은 스마트시티의 실질 운영 관련 주제가 높았고, 지방권은 스마트시티 추진을 위한 준비단계 관련 주제 비중이 높았다.

LDA 토픽모델링을 활용한 국내 치유시설과 치유프로그램 연구 동향 (Research Trends in Korean Healing Facilities and Healing Programs Using LDA Topic Modeling)

  • 이주홍;이경진;성정한
    • 한국조경학회지
    • /
    • 제51권3호
    • /
    • pp.95-106
    • /
    • 2023
  • 국내 치유 연구는 치유에 대한 사회적 관심 증가와 함께 최근 20년 동안 발전해왔다. 치유를 연구하는 분야는 다양하며, 법제화된 자연-기반(natural-based) 치유를 포함한다. 본 연구에서는 KCI와 RISS에 게재된 2,202편의 학술지, 석·박사학위논문 초록을 수집하여 분석하였다. 연구방법은 LDA 토픽모델링을 활용하여 연구의 주제를 분류하였고, 시계열적 논문 발행 추이를 살펴보았다. 연구 결과, 국내 치유 연구의 주제가 5개의 유형과 4개의 매개어로 연결되었음을 규명하였다. 5개의 연구 유형은 "치유관광", "마음·예술치유", "산림치유", "치유공간", "청소년회복치유"였고, 4개의 매개 단어는 "산림", "자연", "문화", "교육"이었다. 또한 국내 치유 연구에서 법제화된 치유 연구만 추출하여 토픽을 분석하였다. 그 결과, 법제화된 치유 연구의 주제 유형이 4개로 분류되었다. 4개의 연구 유형은 "공간환경계획치유", "치유요법실험", "농업교육체험치유", "치유관광요인"이었다. 법제화된 치유에서 연구의 양이 가장 많은 산림치유, 식물을 매개로 유사한 프로그램을 운영하는 치유농업과 정원치유, 해양자원을 활용하는 해양치유의 연구 토픽 또한 분석하였다. 그 결과, 개별 치유 연구만의 독특한 특성을 보여주는 토픽과 모든 치유 연구에서 범용되는 것으로 생각되는 토픽을 도출하였다. 본 연구는 텍스트마이닝의 LDA 토픽모델링을 활용하여 국내 치유시설과 치유프로그램 연구의 전반적 경향을 파악하였다는 데 의의가 있다.

스마트 관광 활성화를 위한 트립어드바이저 애플리케이션 리뷰 분석 : 토픽 모델링을 중심으로 (Analyzing TripAdvisor application reviews to enable smart tourism : focusing on topic modeling)

  • 이유나;한무명초;유선영;소미기;노미진
    • 스마트미디어저널
    • /
    • 제12권8호
    • /
    • pp.9-17
    • /
    • 2023
  • 정보통신의 발달과 스마트 기기의 발전 및 보급 향상은 관광 형태의 변화를 야기하였고, 이후 스마트 관광이라는 개념이 등장하였다. 이에 스마트 관광 정책 및 설문에 관한 연구가 진행되고 있으나 애플리케이션 리뷰에 관한 연구는 미비한 편이다. 본 연구는 구글 플레이 스토어 내 스마트 관광 분야의 대표적인 애플리케이션인 트립어드바이저 애플리케이션 리뷰 데이터를 수집하여 LDA(Latent Dirichlet Allocation) 토픽 모델링을 통해 사용 용도와 사용자 만족을 파악하고자 한다. 분석 결과 4개의 토픽이 도출되었으며 2개의 토픽에서는 긍정적인 평가를 나머지 2개의 토픽에서는 부정적인 평가를 하고 있었다. 사용자들은 해당 애플리케이션의 숙박 및 관광 명소 추천 시스템에 만족하고 있음을 알 수 있었으며 검색 시 설정한 필터가 적용되지 않거나 업데이트 후 리뷰가 게시되지 않음에 불편을 겪고 있음을 알 수 있었다. 이에 다양한 추천 카테고리를 애플리케이션에 추가하여 사용자에게 다양한 경험을 제공하는 것이 만족도 향상에 도움이 될 것으로 기대된다. 또한 필터 기능을 포함한 애플리케이션 문제를 파악하여 애플리케이션 환경 점검과 해당 기능 오류 개선을 한다면 사용자 만족도를 향상시킬 수 있을 것으로 기대된다.

민원 자료를 활용한 반려견 관련 옥외 공공공간 갈등 분석 (Analysis of Dog-Related Outdoor Public Space Conflicts Using Complaint Data)

  • 유예슬;손용훈;조경진
    • 한국조경학회지
    • /
    • 제52권1호
    • /
    • pp.34-45
    • /
    • 2024
  • 반려견이 사회의 일원으로 인식되기 시작하면서 도시의 옥외 공공공간을 함께 이용하는 주체로 부상하고 있다. 그러나 이러한 흐름은 위생, 소음 등의 문제를 발생시키거나 반려인과 비반려인 간 갈등을 야기하는 요인이 되기도 한다. 본 연구는 '반려견', '반려동물', '강아지'와 관련된 공개민원 자료를 텍스트마이닝 기법을 통해 분석하여, 반려견 관련 공간갈등의 원인과 주요 이슈를 밝히기 위해 수행되었다. 연구의 주요 결과는 다음과 같다. 첫째, 반려견과 관련된 민원자료 중 대다수는 옥외 공공공간의 이용과 연관이 있었다. 둘째, 주요 옥외 공공공간 유형별로 공간의 이슈가 다르게 발생하고 있다. 셋째, 반려견 관련 민원자료의 주제는 총 4개로, '반려견 놀이터 조성 요구', '동물 관련 안전 문제 제기', '반려견 전용구역 외 시설에 대한 이용 문제 제기', '펫티켓 관련 공원 관리·단속 강화 요청'이다. 본 연구는 동물이 이용할 수 있는 공공공간의 범위가 확대되는 시점에서, 반려견을 둘러싼 시민들의 인식을 분석했다. 특히, 시민들이 문제점과 요구사항을 명확하게 제시하는 민원자료를 분석 대상으로 채택함으로써, 시민들의 의견을 수렴하는 새로운 방식을 적용한 점에서 의의가 있다.