• 제목/요약/키워드: 워드 클라우드 분석

검색결과 121건 처리시간 0.023초

텍스트 마이닝(Text mining) 기법을 활용한 『제1차조선교육령』과 『조선교육요람』(1913, 1920)의영어번역본 분석 (Analysis on the English Translation of The First Chosen Educational Ordinance, Manual of Education of Koreans (1913), and Manual of Education in Chosen 1920 (1920) Using Text Mining Analytics)

  • 탁진영;곽은주;진실로;손민주;김동미
    • 문화기술의 융합
    • /
    • 제9권6호
    • /
    • pp.309-317
    • /
    • 2023
  • 본 논문의 목표는 1911년에 공포된 『제1차 조선교육령』, 1913년에 발행된 『조선교육요람』과 1920년에 발행된 『조선교육요람(1920)』의 영어 텍스트를 비교 분석하고, 이를 통해 조선총독부의 조선 통제 수단으로 활용된 식민지 교육정책을 추적하는 것이다. 본 논문은 조선총독부의 식민지 교육정책의 전체적인 흐름과 그 배경을 파악하기 위해 기존의 단편적이고 질적인 역사서 연구와는 달리 통시적·양적 연구를 시도하였다. 이를 위해 상위 50개 단어 빈도 순위와 워드 클라우드(Word Cloud)와 CONCOR(CONvergence of iteration CORrelation)의 텍스트 마이닝 기법을 활용하여 다음과 같은 결과를 도출하였다. 첫째, 1911년 『제1차 조선교육령』은 '전체적인 규정'이나 '교육과정 및 운영'에 초점을 두었고 둘째, 1913년의 『조선교육요람』은 '교육 방식 및 매체'와 전반적인 '교육 내용'에 대한 지침을 싣고 있었다. 그리고 마지막으로 1920년 『조선교육요람(1920)』은 교육의 구체적인 '교육 실행 및 교육의 주체'에 관한 내용을 담고 있었다.

중앙은행 CBDC에 대한 공공 및 민간 관점의 인식 비교연구- 한국 사례를 중심으로 (Comparison of Public and Private Perspectives on Central Bank CBDC - Focusing on Korean Case)

  • 김봉규;이원부
    • 한국콘텐츠학회논문지
    • /
    • 제21권9호
    • /
    • pp.360-371
    • /
    • 2021
  • 가상화폐의 등장은 최근 발전하고 있는 분산원장기술과 함께 중앙은행에서 발행하는 CBDC(Central Bank Digital Currency)에 대한 관심을 고조시키고 있다. 최근 전자화폐의 등장으로 현금 사용이 지속적으로 감소 추이를 보이고 있으며, 일부 국가들(특히, 인구가 적은 편이며, 현금이용 감소에 따른 부작용이 우려되는 국가와 금융 포용수준이 낮은 일부 국가들의 경우)은 이미 중앙은행이 CBDC에 대한 발행을 결정하거나 시험단계에 있다. CBDC 발행이 도래하고 새로운 금융환경이 조성되는 상황에서 정부 및 공공기관의 이를 바라보는 인식이나 태도에 대한 연구는 많이 부족한 상황이다. 실제 정책 입안자들이나 실행자들이 인식하는 CBDC 제도에 대한 태도와 대안이 그 정책의 영향을 받는 일반 사람들이 생각하는 인식과 어떠한 공통점과 차이점이 있는지에 대해 충분히 연구 혹은 분석된 바가 없다. 따라서 본 연구는 빅데이터 분석 방법을 통하여 중앙은행의 CBDC에 대한 공공의 인식과 민간의 인식에 대해 비교해 보고 향후 CBDC의 도입과 관련한 여러 쟁점들을 미리 점검할 수 있는 기회가 될 것이다.

유튜브에 나타난 슬로우 패션의 빅데이터 분석 (A Study of Slow Fashion on YouTube Through Big Data Analysis)

  • 빈삼;염혜정
    • 패션비즈니스
    • /
    • 제27권4호
    • /
    • pp.50-66
    • /
    • 2023
  • The purpose of this study was to examine the word distribution and topic distribution of slow fashion appearing on YouTube in detail and identify the characteristics and aspects related to fashion design through big data analysis and content analysis methods. The specific research results were as follows. First, in the results of the word distribution analysis, "item" appeared the most, 203 times. Also, "one-piece" was a point to pay attention to, as the item had the highest frequency. Second, a total of 5 topics were defined in the topic distribution analysis: topic 1 was "vintage products," topic 2 was "fashion items," topic 3 was "eco-friendly," topic 4 was "life quality emphasis," and topic 5 was "prudent consumption." Third, looking at the relationship between word distribution and topic distribution above, Korean slow fashion on YouTube was actively selecting related design elements that express vintage images in clothing life regardless of trends. In addition, there was a tendency to pursue various basic and high-quality items. Other than those findings, basic items tended to be reinterpreted in various ways through styling methods matched to the vintage image. Lastly, the tendency of slow and small-volume production appeared to emphasize handicrafts and the cultural values of fashion products.

카카오톡에서의 텍스트 데이터 마이닝 기반의 사용자별 적합 광고 키워드 도출 (Extracting User-Specific Advertising Keywords Based on Textual Data Mining from KakaoTalk)

  • 전예림;소다영 ;이지민 ;조은진;문지훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.368-369
    • /
    • 2023
  • 대화 데이터 기반 광고 추천은 광고 마케팅에서 고객 맞춤형 광고 제공, 마케팅 효과 극대화 등을 위한 중요한 기술로 주목받고 있다. 본 논문에서는 모바일 인스턴스 메신저인 카카오톡 대화창에서 발생한 텍스트 데이터를 기반으로 대화 내용을 분석하여 대화 주제별 적절한 광고 키워드를 제안한다. 이를 위해 주제별 대화 내용을 미용, 식음료, 상거래로 세분하고 KoNLPy 의 Okt 를 이용하여 텍스트 전처리를 수행하고 키워드별로 빈도수를 뽑아 워드 클라우드를 제시한다. 또한, 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA)을 기반으로 대화 주제를 세분화한 뒤 라벨링을 통해 주제별 대화 키워드를 분석한다. 실험 결과, 대화 주제를 온라인 쇼핑, 헤어, 뷰티 관리, 음식으로 나눌 수 있었으며, 토픽별 상위 키워드를 Word2Vec 을 통해 특정 단어와 유사한 키워드를 도출하여 적절한 광고 키워드를 제시할 수 있었다.

텍스트 마이닝으로 OTT 인터랙티브 콘텐츠 다시보기 (Analyzing OTT Interactive Content Using Text Mining Method)

  • 이석창
    • 문화기술의 융합
    • /
    • 제9권5호
    • /
    • pp.859-865
    • /
    • 2023
  • OTT 시장의 과열로 서비스 사업자들이 콘텐츠 개발에 주력하는 상황에서 시청자들의 능동적인 참여를 독려하는 인터랙티브 콘텐츠가 주목받고 있다. 그에 따라 인터랙티브 콘텐츠에 관한 연구 역시 활발히 이루어지고 있다. 본 연구는 온라인상의 비정형 데이터를 중심으로 텍스트 마이닝을 통해 인터랙티브 콘텐츠에 관한 분석을 목적으로 한다. 가중치에 따른 키워드 특징 도출, OTT와 인터랙티브 콘텐츠의 관계, 그리고 인터랙티브 콘텐츠의 트렌드 변화를 객관적인 데이터에 근거하여 '워드클라우드', '관계도 분석', 그리고 '키워드 트렌드'라는 세부 기법을 활용하여 연구 결과 및 함의점을 도출하였다.

국가기록원의 국가지정기록물 웹 기반 기록정보서비스 개선방안 연구 - 패싯 기반 디렉토리 서비스를 중심으로 - (Improving the Access Service of National Designated Records in the National Archives of Korea: Focusing on Facet Directory Service)

  • 정미옥;최상희
    • 한국비블리아학회지
    • /
    • 제30권4호
    • /
    • pp.217-234
    • /
    • 2019
  • 국가지정기록물 지정제도는 국가적으로 보존가치가 큰 민간의 기록물을 관리·보존할 수 있게 하고 기록문화의 발전을 도모하기 위한 중요한 제도이다. 이 연구에서는 기존 국가지정기록물 지정 및 국가기록원의 웹 기반 기록정보서비스 현황을 분석하여 국가지정기록물 웹 페이지의 한계를 다음과 같이 지적했다. 첫째, 현재 국가기록원에서 제공하고 있는 국가지정기록물에 관한 정보는 국가기록원 홈페이지와 국가지정기록물 웹 페이지로 분산되어 있다. 둘째, 국가지정기록물로 지정된 기록물에 관한 정보가 컬렉션 수준으로만 제공되고 있어, 이용자가 국가지정기록물 컬렉션 이하 수준의 정보에 접근하기 어렵다. 이에 대한 해결방안으로 국가지정기록물의 활용성을 높이는 구체적인 웹 기반 기록정보서비스 방안을 다음과 같이 제시하였다. 첫째, 국가기록원 홈페이지와 국가지정기록물 웹 페이지에 흩어져 있는 국가지정기록물에 대한 정보를 국가지정기록물 웹 페이지에서 단일화하여 제공해야 한다. 둘째, 이용자가 국가지정기록물 내용과 주제를 직관적으로 탐색할 수 있고, 다각적인 주제와 내용으로 접근할 수 있도록 지원하기 위해 국가지정기록물의 주제 디렉토리와 워드 클라우드 서비스를 제안했다.

LSTM 기법을 활용한 수위 예측 알고리즘 개발 시 비정형자료의 역할에 관한 연구: 잠수교 사례 (Role of unstructured data on water surface elevation prediction with LSTM: case study on Jamsu Bridge, Korea)

  • 이승연;유형주;이승오
    • 한국수자원학회논문집
    • /
    • 제54권spc1호
    • /
    • pp.1195-1204
    • /
    • 2021
  • 최근 이상기후로 인한 국지성호우가 잦아져 하천변 사회기반시설을 포함한 인적·물적 피해가 급증하고 있다. 본 연구에서는 해당 시설들의 침수 피해를 예측·방지하고자 기계학습 중 시계열자료에 특화된 LSTM(Long Short- term Memory)기법을 활용하여 수위 예측 알고리즘을 개발하였다. 연구대상지는 잠수교로 연구기간은 총 6년(2015년~2020년)의 6, 7, 8월로 3시간 후의 잠수교 수위를 예측하였다. 입력자료(Input data)는 잠수교 수위(EL.m), 팔당댐 방류량(m3/s), 강화대교 조위(cm), 서울시 트윗의 개수로 기존 연구에 주로 사용된 정형자료뿐만 아니라 워드클라우드를 통해 구축된 비정형자료도 함께 사용하여 상호 보완형 자료를 구축하고, 비정형자료 활용 유무의 비교·분석을 통해 비정형자료의 역할도 제시하였다. 잠수교의 수위 예측 시 상호 보완형의 자료가 정형자료만을 사용한 경우에 비해 예측 정확도가 향상하였는 데, 이는 인명 피해를 감소시킬 수 있는 보수적인 예/경보가 가능함을 알 수 있었다. 본 연구에서는 하천변 사회기반시설의 이용자 안전 및 편의 제공에 상호 보완형 자료의 사용이 보다 효과적이라 판단하였다. 향후에는 비정형자료의 종류를 추가하거나 입력자료의 세밀한 전처리를 통하여 더욱 정확한 수위 예측을 기대해본다.

텍스트 분석 기술 및 활용 동향 (Investigations on Techniques and Applications of Text Analytics)

  • 김남규;이동훈;최호창
    • 한국통신학회논문지
    • /
    • 제42권2호
    • /
    • pp.471-492
    • /
    • 2017
  • 최근 데이터의 양 자체가 해결해야 할 문제의 일부분이 되는 빅데이터(Big Data) 분석에 대한 수요와 관심이 급증하고 있다. 빅데이터는 기존의 정형 데이터 뿐 아니라 이미지, 동영상, 로그 등 다양한 형태의 비정형 데이터 또한 포함하는 개념으로 사용되고 있으며, 다양한 유형의 데이터 중 특히 정보의 표현 및 전달을 위한 대표적 수단인 텍스트(Text) 분석에 대한 연구가 활발하게 이루어지고 있다. 텍스트 분석은 일반적으로 문서 수집, 파싱(Parsing) 및 필터링(Filtering), 구조화, 빈도 분석 및 유사도 분석의 순서로 수행되며, 분석의 결과는 워드 클라우드(Word Cloud), 워드 네트워크(Word Network), 토픽 모델링(Topic Modeling), 문서 분류, 감성 분석 등의 형태로 나타나게 된다. 특히 최근 다양한 소셜미디어(Social Media)를 통해 급증하고 있는 텍스트 데이터로부터 주요 토픽을 파악하기 위한 수요가 증가함에 따라, 방대한 양의 비정형 텍스트 문서로부터 주요 토픽을 추출하고 각 토픽별 해당 문서를 묶어서 제공하는 토픽 모델링에 대한 연구 및 적용 사례가 다양한 분야에서 생성되고 있다. 이에 본 논문에서는 텍스트 분석 관련 주요 기술 및 연구 동향을 살펴보고, 토픽 모델링을 활용하여 다양한 분야의 문제를 해결한 연구 사례를 소개한다.

화장품 회사의 빅데이터분석을 통한 브랜드컨셉 개발 사례분석 (A Case Study on the Development of New Brand Concept through Big Data Analysis for A Cosmetics Company)

  • 이주민;방정혜
    • 지식경영연구
    • /
    • 제21권3호
    • /
    • pp.215-228
    • /
    • 2020
  • 본 연구는 경쟁이 심한 화장품 시장에 새롭게 뛰어들어 빅데이터 분석을 활용하여 브랜드 컨셉을 개발한 기업의 사례를 소개하고 있다. 안티에이징 관련 좋은 원재료 기술을 보유한 스킨리버스랩은 기능성화장품 시장에 새롭게 브랜드를 출시하였다. SNS 데이터를 화장품에 대한 소비자 태도, 기능성화장품에 대한 소비자 태도, 기능성화장품의 대표 경쟁사 분석, 소비자의 제품 사용 경험 등의 4가지 측면에서 분석하여 로지컬리스킨이라는 매력적인 브랜드 컨셉을 개발하였다. AI 기반 빅데이터 분석 툴인 루미노소를 이용하여 맥락 기반의 감성분석, 연관어 분석, 워드클라우드 분석 등을 통해 소비자에 대한 인사이트를 도출하였다. 로지컬리스킨은 유명잡지나 앱에서 다수의 상을 수상하며 글로벌 트랜드 기준에 부합한 제품으로 인정을 받았고, 미국, 홍콩을 포함한 6개 국가에 진출하였다. 로지컬리스킨 사례는 외부 데이터 만으로 소비자 인사이트를 도출하여 신생 기업이 신규 브랜드로 시장에 진출한 사례이며, AI 기반 감성 분석을 적용한 사례로서 의의가 있다.

Word Cloud 분석을 이용한 스트리트 패션 연구 (A study on street fashion by word cloud analysis)

  • 이은숙;김새봄
    • 한국의상디자인학회지
    • /
    • 제20권3호
    • /
    • pp.49-62
    • /
    • 2018
  • The purpose of this study is to examine women's street fashion based on Instagram by word cloud analysis. This study is divided into items, silhouettes, colors, materials, patterns, and images that appear in women's street fashion. The results of this study are as follows: First, women's fashion-oriented Instagram accounts have a maximum of 8.6 million followers, with 16 blogs have more than one million users. As for the fashion-oriented Instagram visitors, many were their 10s-20s and photography was the key issue. Second, it was found that the casual image, which is the basis of street fashion, romantic, elegance, active sportive image, and sexy images appeared as unique images, and mixed with each other. Third, we compared the fashion characteristics of the top blogs 'fashionnova', 'fashionclimaxx2', and 'fashion.selection'. The blog 'fashionnova', utilizes sexy images and various dresses, and dresses were the characteristic points. The blog 'fashionclimaxx2' features casual images and modern office looks. The blog 'fashoin.selection' has fashion characteristics of both 'fashionnova' and 'fashionclimaxx2'.