• 제목/요약/키워드: 워드 클라우드 분석

검색결과 121건 처리시간 0.022초

탐색적 자료 분석(EDA) 기법을 활용한 국내 11개 대표 온라인 쇼핑몰 BEST 100 비교 (Comparison of Online Shopping Mall BEST 100 using Exploratory Data Analysis)

  • 강지천;강주영
    • 한국빅데이터학회지
    • /
    • 제3권1호
    • /
    • pp.1-12
    • /
    • 2018
  • 초기 온라인 쇼핑몰이 등장할 때부터 지금까지 BEST 100은 모든 쇼핑몰 웹사이트의 핵심 기능으로 제공되고 있다. BEST 100은 소비자들이 한눈에 인기 상품들을 확인할 수 있기 때문에 쇼핑몰의 매출 등에 미치는 영향이 높지만 온라인 쇼핑 선행 연구에서 BEST 100과 관련된 연구는 거의 이루어지지 않고 있다. 따라서 본 연구에서는 현 온라인 쇼핑몰 11곳을 대상으로 선정하여 쇼핑몰별 판매 특징을 분석하였다. 연구 방법으로 각 쇼핑몰 웹 사이트의 BEST 100의 구성요소인 판매문구, 가격, 무료배송의 유/무 확인을 크롤링 하여 탐색적 자료 분석 기법(EDA)을 활용하였다. 분석 결과 쇼핑몰 11곳의 종합 평균 가격은 72,891.41원으로 나타났으며 상품 가격이 저렴할수록 무료배송 비율이 낮음을 확인하였다. 가격 이외에 판매문구에서는 텍스트 마이닝을 통해 8개의 카테고리로 구분하였다. 가장 많은 카테고리는 fashion 부분이었으나 카테고리의 설정이 제품 속성이 아닌 마케팅 문구를 분석한 점에 의의가 있다. 본 연구는 EDA를 활용하여 현 온라인 시장 흐름을 파악하고 향후 방향을 제시하는데 시사점이 있다.

An Analysis of Artificial Intelligence Education Research Trends Based on Topic Modeling

  • You-Jung Ko
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권2호
    • /
    • pp.197-209
    • /
    • 2024
  • 본 연구의 목적은 국내 인공지능 교육의 최근 연구 동향을 분석하여 향후 인공지능 교육의 방향성을 모색하는 것이다. 2016년부터 2023년 11월까지 RISS(Research Information Sharing Service)에 게재된 논문 중 인공지능 교육 관련 논문 697편을 대상으로 워드 클라우드(Word Cloud)와 LDA 토픽 모델링(Latent Dirichlet Allocation Topic Modeling) 기법을 활용하여 분석하였다. 분석결과, 주요 토픽으로는 생성형 인공지능 활용 교육, 인공지능 윤리 교육, 인공지능 융합 교육, 인공지능 활용에 대한 교사 인식과 역할, 대학 교육에서 인공지능 리터러시(Literacy) 개발, 인공지능 기반 교육과 연구 방향으로 여섯 가지가 도출되었다. 분석결과를 토대로, (1) 다양한 교과목에 생성형 인공지능 활용 확대, (2) 인공지능 사용을 위한 윤리적 지침, (3) 인공지능 교육의 장기적 영향 평가, (4) 고등교육에서 교사의 인공지능 활용 역량, (5) 대학의 인공지능 교육과정 다양화, (6) 인공지능 연구 추이 분석 및 교육 플랫폼(Platform) 개발 등을 제안하였다.

특허 분석을 통한 해양공간 정책 시뮬레이터 기술개발 동향 연구 (A Study on the Development Trend of Marine Spatial Policy Simulator Technology through Patent Analysis)

  • 이준희;이정은;김대선;정민의
    • 해양환경안전학회지
    • /
    • 제30권1호
    • /
    • pp.32-42
    • /
    • 2024
  • 본 연구에서는 해양공간 통합관리 수단의 지원책으로 활용되는 해양공간 정책 시뮬레이터 기술에 대한 한국, 중국, 일본, 미국, 유럽 등 주요 5개국에 대한 정량분석을 위한 유효특허 1,474건을 도출하고, 연도별, 국가별 특허출원 동향 및 워드 클라우드 분석을 통해 국내 기술 경쟁력 및 국내·외 기술 트렌드를 파악하였다. 분석 결과 해양공간 정책 시뮬레이터 기술의 경우 중국(1,254건, 85.1%) 주도의 특허출원이 활발하게 이루어지고 있으며, 세부 기술별로는 어업환경 변화예측 및 활용 시뮬레이터(AC)가 392건(26.6%)으로 가장 높은 것으로 나타난다. 핵심 키워드 변화를 통해 최근에는 다중 데이터의 수집과 데이터의 탐지, 예측, 평가 등으로 기술 트렌드가 이루어지고 있음을 확인하였으며, 중국 주도의 시장 독과점 및 선점에 대비하기 위해 주변 기술에 대한 특허출원 고려 및 표준화 선점 등의 연계 전략을 통한 대비와 정부 차원의 해양공간 정책 시뮬레이터 기술 연구개발에 대한 적극적인 정책적 지원이 필요함을 진단하였다.

텍스트 마이닝을 적용한 한국교통방송제보 비정형데이터의 분석 (Analysis of the Unstructured Traffic Report from Traffic Broadcasting Network by Adapting the Text Mining Methodology)

  • 노유진;배상훈
    • 한국ITS학회 논문지
    • /
    • 제17권3호
    • /
    • pp.87-97
    • /
    • 2018
  • 교통사고 관련 제보는 비정형 데이터로서 교통사고를 유발한 가해자나 피해자의 관점이 아닌, 교통사고 발생 지점과 구간, 시간대에 있었던 타 운전자의 관점에서 생성된 교통정보의 가치를 가지고 있다. 그러나, 비정형 데이터인 교통제보가 빅 데이터로서 교통사고 통계나 교통관련 연구에 활용되지 못하였으나, 텍스트 마이닝 기법을 활용한 본 연구를 통해 비정형의 빅 데이터를 시각화하고 해석하여, 기존의 정형 데이터에서 분석하지 못한 정보를 도출할 수 있었다. 그리고 교통사고 발생으로 인한 도로상 영향을 파악할 수 있었다. 이러한 분석으로 교통제보의 트랜드를 파악하고, 운전자가 제보하는 "도로명", "지점명", "시간대"를 추출하였으며, 교통사고 발생으로 다른 운전자에게 가장 많은 영향을 미치는 지점과 구간의 파악이 가능하였다. 향후 실제 교통사고 데이터와 결합하여 교통제보와의 상관성 분석 등을 통해 비정형 데이터의 활용방안을 모색할 계획이다.

전자기록관리에 대한 국제 연구 동향 분석 - InterPARES 3와 ITrust 성과물을 중심으로 - (A Study on the International Research Trends in Electronic Records Management: InterPARES 3 and ITrust Achievements)

  • 박옥남;박희진
    • 한국기록관리학회지
    • /
    • 제16권1호
    • /
    • pp.89-120
    • /
    • 2016
  • 본 연구는 InterPARES 3와 ITrust의 배경, 주요 연구분야, 주요 연구성과를 소개하고, IP 3와 ITrust 주요 연구내용의 비교분석을 통하여 InterPARES 프로젝트의 기록관리에 대한 개념 및 변화를 이해하고자 하였다. 이를 위해 IP 3와 ITrust 연구프로젝트에 대한 내용분석을 수행하였으며 이를 통해 주요 키워드를 도출하고, 연구프로젝트 제목을 워드클라우드로 도식화하여 IP 3와 ITrust 비교에 활용하였다. IP 3와 ITrust 연구결과를 환경, 범위, 주제, 키워드, 연구목표, 기록관리 생애주기관점에서 비교분석하였다. 연구결과 InterPARES는 1) 장기보존 뿐만 아니라 생애주기 전반에 적용될 수 있는 분야로, 2) 진본성의 개념에서 신탁의 개념으로, 3) 전자기록에서 인터넷, 디지털 포렌식, 열린정부 또는 공공데이터 등을 포함하는 범위로 연구의 내용과 주제가 광범위하게 확장되고 있음을 파악하였다.

지역화폐 앱 사용자 리뷰 분석을 통한 마케팅 전략 수립 - '동백전'과 '인천e음'을 중심으로 (Establish Marketing Strategy Using Analysis of Local Currency App User Reviews -Focused on 'Dongbackjeon' and 'Incheoneum')

  • 이새미;이태원
    • 한국콘텐츠학회논문지
    • /
    • 제21권4호
    • /
    • pp.111-122
    • /
    • 2021
  • 본 연구는 우리나라 대표적인 지역화폐인 동백전과 인천e음 앱 사용자 리뷰를 분석하여 지역화폐 사용자의 긍정/부정 요인을 파악하고, 이를 바탕으로 마케팅 전략을 수립하였다. 앱 사용자 리뷰를 별점을 기준으로 하여 긍정과 부정으로 분류하고 각각 워드클라우드, 토픽모델링, 소셜 네트워크 분석을 수행하였다. 그 결과, 동백전과 인천e음 부정 리뷰에서는 공통적으로 앱 사용과 카드 발급에 대한 불만이 주로 나타났으며, 긍정 리뷰에서는 '캐시백'에 대한 만족감과 함께 '지역경제'와 '소상공인'과 같은 키워드의 출현으로 지역화폐 사용자들은 자신의 소비가 지역경제 활성화에 도움이 된다고 인식하여 지역화폐를 사용하는 데 있어 만족감을 느끼는 것으로 나타났다. 본 연구의 분석결과로 파악된 만족/불만족 요인을 기반으로 개선해야 할 점과 더욱 강화해야 할 점을 파악하고, 이에 적절한 마케팅 전략을 도출하였다. 본 연구에서 활용한 텍스트 마이닝 방법과 연구 결과는 실질적으로 지역화폐 담당 공무원들과 마케터들에게 지역화폐에 대한 유의미한 정보를 제공해 줄 수 있다.

Keyword Analysis of COVID-19 in News Big Data : Focused on 4 Major Daily Newspapers

  • Kwon, Seong-Wook
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권12호
    • /
    • pp.101-107
    • /
    • 2020
  • 본 논문은 장기전에 접어든 코로나19와 관련한 국내 주요 4개 일간지의 뉴스 빅데이터(빅카인즈)를 활용하여 진보와 보수신문의 정치적 성향 등에 따른 주요 키워드를 비교 분석하는 것을 목적으로 한다. 이를 위해 2020년 1월 20일부터 9월 15일까지 보도된 93,917건의 뉴스를 4단계로 구분하여 4개 신문사의 주요 키워드를 워드클라우드로 구현하여 분석하였다. 분석 결과, 보수신문은 진보신문보다 '정부', '대통령', '사태', '마스크' 키워드를 더 많이 언급함으로써 정부의 대응과 비판, 중국의 책임 등에 주목하였으며, 진보신문은 질병의 심각성과 위험 상황 발생을 강조하는 키워드를 많이 사용하는 것으로 나타났다. 조선일보는 대규모 집단감염 발생(2.18~5.15)기에 다양한 키워드의 사용으로 다양성을 나타내기도 하였으며 특히, 중앙일보가 코로나19와 같은 감염병 보도와 관련해서는 정부 정책을 비판하는 키워드를 사용하기도 하지만 진보신문이 사용하는 질병의 심각성과 위험한 상황 발생을 강조하는 키워드도 함께 사용한다는 점을 밝혀냈다.

A study on the perception of 3D virtual fashion before and after COVID-19 using textmining

  • Cho, Hyun-Jin
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권12호
    • /
    • pp.111-119
    • /
    • 2022
  • 본 연구는 빅데이터 분석을 이용하여 코로나19 전후의 3D가상패션에 대한 인식의 변화를 알아보기 위하여 코로나19 발생 전인 2017년 1월1일부터 발생 이후인 2022년 10월30일까지 소셜미디어 네이버, 다음, 구글, 유튜브에서 추출한 3D 가상패션 관련 주요 단어들을 대상으로 텍스톰을 이용하여 빅데이터 자료를 수집하였다. 수집된 단어는 정제 과정을 거친 후 워드클라우드, 단어의 빈도, 연결중심성, 네트워크 시각화와 CONCOR 분석을 실시하였다. 3D 가상패션을 키워드로 32,461개의 단어를 추출하여 분석한 결과 패션, 가상, 기술의 출현빈도와 중심성이 가장 높게 나타났으며 디지털, 디자인, 의상, 활용, 제조의 출현빈도도 높게 나타났다. 이를 통해 3D 가상패션이 기술의 발달과 더불어 산업 전반에 활용되고 있음을 알 수 있었다. 특히 코로나19 이후 가장 부각되는 주요 단어는 메타버스와 3D 교육으로서 패션산업에서의 요구도가 높게 나타나고 있다.

의료 산업에 있어 현대인의 비대면 의학 상담에 대한 관심도 분석 기법 (Analysis of interest in non-face-to-face medical counseling of modern people in the medical industry)

  • 강유성;박종훈;오하영;이세욱
    • 한국정보통신학회논문지
    • /
    • 제26권11호
    • /
    • pp.1571-1576
    • /
    • 2022
  • 코로나 바이러스의 발병 이후, 의료 산업은 침체기에 들어섰으며, 이에 대한 대응책으로 정부는 일시적으로 비대면 진료를 허용한 상태이다. 본 연구에서는, 이런 시대 흐름에 맞추어 의료 산업에 있어 현대인의 비대면 의학상담에 대한 관심도를 분석하고자 한다. 전문가에게 의학상담을 받을 수 있는 플랫폼인 지식인과, 유튜브 두가지 소셜 플랫폼에서 빅데이터를 수집해 연구를 진행했다. 전화 상담 상위 5개 키워드인 "내과", "일반의", "산경과", "정신건강의학과", "소아청소년과"와 더불어, "전문의", "의학상담", "건강정보" 총 8개의 검색어를 가지고 각 플랫폼으로부터 데이터 세트를 구축했다. 이후 크롤링 된 데이터를 바탕으로 형태소 분류, 질병 추출, 정규화 등 전처리 과정을 거쳤다. 단어 빈도수를 기준으로 한 워드 클라우드, 꺾은선 그래프, 분기별 그래프, 질병 등장 빈도별 막대 그래프 등으로 데이터 시각화를 하였다. 유튜브 데이터에 한해 감성 분류 모델을 구축하였고, GRU와 BERT 기반 모델의 성능을 비교하였다.

마르셀 프루스트에 관한 디지털인문학적 연구 동향분석 (Digital humanities Research Trends on Marcel Proust)

  • 민진영
    • 문화기술의 융합
    • /
    • 제10권3호
    • /
    • pp.181-188
    • /
    • 2024
  • 디지털 전환이라는 시대적 배경에 힘입어 마르셀 프루스트의 탄생 150주년을 맞는 2021년과 서거 100주년을 맞는 2022년에는 프루스트에 대한 다양한 디지털인문학적 연구가 진행되었다. 니콜라 라고노는 문학 웹사이트 '프루스트노믹스'를 운영하여 프루스트와 관련한 온/오프라인의 담론들을 아카이빙하여 분석하고, 『프루스트그래프』를 통해서 프루스트와 관련된 이야기와 『잃어버린 시간을 찾아서』를 둘러싼 다양한 자료들을 수치화하여 효과적으로 시각화하였다. 2021년에 프루스트의 삶과 작품에 관한 다양한 자료를 온라인으로 서비스하는 버팔로 프루스트 프로젝트Buffalo Proust project 2021가 진행되었다. 일리노이 대학의 콜브는 그르노블 대학의 프랑수아즈 르리쉬와 함께 프루스트의 서신을 디지털화하여 온라인으로 서비스하는 작업인 Corr-Proust사업을 진행하였다. 국내의 프루스트에 대한 디지털인문학적 연구는 부재한 상황이라서 지난 60년간 출판된 학술논문의 어휘를 분석하여 2000년 전후 주제면이나 양적인 면에서 많은 발전이 있었음을 어휘빈도와 워드클라우드를 통해 시각화해보았다.