• 제목/요약/키워드: Text frequency analysis

검색결과 458건 처리시간 0.026초

빅데이터 분석을 통한 패키징에 대한 소비자의 주요 인식 조사 -텍스트 마이닝과 의미연결망 분석을 중심으로- (A Study of the Consumer Major Perception of Packaging Using Big Data Analysis -Focusing on Text Mining and Semantic Network Analysis-)

  • 강욱건;고의석;이학래;김재능
    • 한국융합학회논문지
    • /
    • 제9권4호
    • /
    • pp.15-22
    • /
    • 2018
  • 패키징에 대한 소비자들의 주요인식을 조사하기 위해 빅데이터 분석방법인 텍스트 마이닝과 의미연결망 분석을 중심으로 연구를 진행하였다. 데이터 수집은 웹&SNS데이터 분석 프로그램인 텍스톰(Textom)을 사용하여 2년 7개월간의 데이터를 수집하였다. 연구 결과 네트워크 중심도는 패키징의 경우 8.9% 포장은 9.1%로 패키징이 보다 다양한 주제를 다루는 것으로 조사되었다. CONCOR 분석을 통해서 유사한 의미를 가지는 4개의 그룹으로 분류하여 패키징에 관한 소비자들의 주요인식을 연구, 개발, 산업, 소재, 기능 등으로 요약하였다. 본 연구에 따르면 소비자가 가장 많이 인식하는 패키징 소재는 합성수지이며 패키징 기능으로는 보관의 기능을 주로 인식한다. 또한 소비자들이 인식하는 패키징 관련 상품군으로 제약, 의약품인 것으로 조사되었다. 본 연구결과는 패키징에 대한 소비자들의 인식을 예측함으로써 향후 이루어질 연구와 산업발전에 기초자료로써의 활용 가능성을 가지며 빅데이터와 패키징 두 분야의 융합을 통한 패키징 분야의 새로운 연구방향을 제시한 의의가 있다.

텍스트마이닝 기법을 이용한 국내 농식품유통 연구동향 분석 (A Trend Analysis of Agricultural and Food Marketing Studies Using Text-mining Technique)

  • 유리나;황수철
    • 한국산학기술학회논문지
    • /
    • 제18권10호
    • /
    • pp.215-226
    • /
    • 2017
  • 이 연구는 1984~2015년간 국내 농식품 유통분야 연구동향을 파악하기 위해 텍스트마이닝 기법을 이용한 분석 결과이다. 텍스트마이닝은 빅데이터 분석방법의 일환으로, 많은 정보를 객관적으로 처리하여 연구주제 분류와 트렌드 분석에 이용할 수 있다. 실제분석에는 빈도분석, 토픽분석, 연관성분석을 수행하였다. 자료는 농업부문 4개 학술지 수록논문과 연구보고서 중 농식품 유통 관련 연구 제목를 이용하였다. 그 결과, 농식품 유통분야의 논문 1,126건은 6개 주제로 분류되었다. 2000년대를 기점으로 이전에는 도매와 산지연구가 활발했던 반면 이후에는 소비, 식품, 수출입 연구가 활발한 것으로 나타났다. 또한 로컬푸드와 학교급식 영역의 연구가 증가했다. 농산물 수급연구는 정책 연구보고서에서만 주기적으로 이루어졌으며, 학술논문에서는 2000년대 이후 관심주제에서 멀어지는 경향을 보였다. 2010년대 이후로는 특히 소비연구가 주류를 이루었고, 크게 소비트렌드와 소비자 행동에 관한 다양한 연구가 이루어졌다. 이 결과를 바탕으로 더 정확한 연구동향 분석을 하기위해서는, 정밀한 주제 분류기법으로 방법론을 보완하고 이용 자료를 키워드와 논문초록으로 확대함으로써 구체적인 결과를 도출해야 할 것이다.

텍스트 마이닝을 이용한 SNS와 언론의 이슈에 대한 반응 비교 -"한일군사정보보호협정(GSOMIA) 종료"를 중심으로- (Comparison of responses to issues in SNS and Traditional Media using Text Mining -Focusing on the Termination of Korea-Japan General Security of Military Information Agreement(GSOMIA)-)

  • 이수련;최은정
    • 디지털융복합연구
    • /
    • 제18권2호
    • /
    • pp.277-284
    • /
    • 2020
  • 텍스트마이닝은 비정형, 대용량의 텍스트 자료로부터 유의미한 정보를 추출하는 빅데이터 분석의 대표적인 방법이다. 트위터와 같은 SNS는 1초에서 수십만건의 데이터를 생성해내며 대중들의 의견이나 생각 등을 즉각적이며 직접적으로 보여주는 1인 미디어로의 역할을 하고 있다. 기성 미디어인 언론은 정보전달, 사회비판, 여론형성의 기능을 수행하고 있다. 본 논문에서는 미디어로의 SNS와 언론을 비교해 보고자 한다. 이를 위해 2019년 하반기 국내의 이슈 중의 하나인 "한일군사정보보호협정(GSOMIA) 종료"에 대한 SNS의 반응과 언론의 반응을 비교 분석한다. 수집된 데이터는 총 201,728개의 트윗과 20,698개의 신문 기사를 대상으로 감성분석, 연관분석, 군집분석을 수행하였다. 그 결과로 SNS의 경우 이슈에 대해 긍정적 반응이 높았고 언론의 경우는 부정적 반응이 높았다. 연관검색의 경우는 SNS의 경우 "파기, 결정, 우리" 등 국내적 이슈에 대한 지지가 높았고 언론의 경우 "실망, 유감, 우려" 등으로 대외적 이슈에 대한 부정적 견해를 보여주는 차이를 보여주었다. SNS는 정보전달의 기능보다는 사회 비판 및 여론의 추이를 살피거나 형성하는데 언론보다 빠르고 강하게 나타내고 있어 언론이 대중의 인식을 반영해주는 역할을 보완할 수 있다.

Quantitative Study of Soft Masculine Trends in Contemporary Menswear Using Semantic Network Analysis

  • Tin Chun Cheung;Sun Young Choi
    • 한국의류학회지
    • /
    • 제46권6호
    • /
    • pp.1058-1073
    • /
    • 2022
  • Big data analytics and social media have shifted the way fashion trends are dictated. Fashion as a medium for expressing gender has created new concepts of masculinity in popular culture, where men are increasingly depicted in a softer style. In this study, we analyzed 2,879 menswear collections over a 10-year period from Vogue US to uncover key menswear trends. Using Semantic Network Analysis (SNA) on Orange3, we were able to quantitatively analyze how contemporary menswear designers interpreted diversified trends of masculinity on the runway. Frequency and degree centrality were measured to weigh the significance of trend keywords. "Jacket (f = 3056; DC = 0.80), shirt (f = 1912; DC = 0.60) and pant (f = 1618; DC = 0.53)" were among the most prominent keywords. Our results showed that soft masculine keywords, e.g., "lace, floral, and pink" also appeared, but with the majority scoring DC = < 0.10. The findings provide an insight into key menswear trends through frequency, degree centrality measurements, time-series analysis, egocentric, and visual semantic networks. This also demonstrates the feasibility of using text analytics to visualize design trends, concepts, and patterns for application as an ideation tool for academic researchers, designers, and fashion retailers.

대한민국 정권별 아동복지정책 관련 뉴스 기사 분석: K-평균 군집 분석 (Analysis of News Articles on Child Welfare Policies in South Korea: K-Means Clustering)

  • 김은주;김성광;박빛나
    • 동서간호학연구지
    • /
    • 제29권2호
    • /
    • pp.185-195
    • /
    • 2023
  • Purpose: The purpose of this study is to analyze changes of child welfare policies and provide insights based on the collection and classification of newspaper articles. Methods: Articles related to child welfare policies were collected from 1990, during the Kim, Young-sam administration, to May 9, 2022, under the Moon, Jae-in administration. K-Means clustering and keyword Term Frequency-Inverse Document Frequency analysis were utilized to cluster and analyze newspaper articles with similar themes. Results: The administrations of Kim, Young-sam, Kim, Dae-jung, Roh, Moo-hyun, and Park, Geun-hye were classified into two clusters, and the Lee, Myung-bak and Moon, Jae-in administrations were classified into three clusters. Conclusion: South Korea's child welfare policies have focused on ensuring the safety and healthy development of children through diverse policies initiatives over the years. However, challenges related to child protection and child abuse persist. This requires additional resources and budget allocation. It is important to establish a comprehensive support system for children and families, including comprehensive nursing support.

텍스트 마이닝을 활용한 자율운항선박 분야 주요 이슈 분석 : 국내 뉴스 데이터를 중심으로 (Analysis of major issues in the field of Maritime Autonomous Surface Ships using text mining: focusing on S.Korea news data)

  • 이혜영;김진식;구병수;남문주;장국진;한성원;이주연;정명석
    • 시스템엔지니어링학술지
    • /
    • 제20권spc1호
    • /
    • pp.12-29
    • /
    • 2024
  • The purpose of this study is to identify the social issues discussed in Korea regarding Maritime Autonomous Surface Ships (MASS), the most advanced ICT field in the shipbuilding industry, and to suggest policy implications. In recent years, it has become important to reflect social issues of public interest in the policymaking process. For this reason, an increasing number of studies use media data and social media to identify public opinion. In this study, we collected 2,843 domestic media articles related to MASS from 2017 to 2022, when MASS was officially discussed at the International Maritime Organization, and analyzed them using text mining techniques. Through term frequency-inverse document frequency (TF-IDF) analysis, major keywords such as 'shipbuilding,' 'shipping,' 'US,' and 'HD Hyundai' were derived. For LDA topic modeling, we selected eight topics with the highest coherence score (-2.2) and analyzed the main news for each topic. According to the combined analysis of five years, the topics '1. Technology integration of the shipbuilding industry' and '3. Shipping industry in the post-COVID-19 era' received the most media attention, each accounting for 16%. Conversely, the topic '5. MASS pilotage areas' received the least media attention, accounting for 8 percent. Based on the results of the study, the implications for policy, society, and international security are as follows. First, from a policy perspective, the government should consider the current situation of each industry sector and introduce MASS in stages and carefully, as they will affect the shipbuilding, port, and shipping industries, and a radical introduction may cause various adverse effects. Second, from a social perspective, while the positive aspects of MASS are often reported, there are also negative issues such as cybersecurity issues and the loss of seafarer jobs, which require institutional development and strategic commercialization timing. Third, from a security perspective, MASS are expected to change the paradigm of future maritime warfare, and South Korea is promoting the construction of a maritime unmanned system-based power, but it emphasizes the need for a clear plan and military leadership to secure and develop the technology. This study has academic and policy implications by shedding light on the multidimensional political and social issues of MASS through news data analysis, and suggesting implications from national, regional, strategic, and security perspectives beyond legal and institutional discussions.

Analysis of Plant Species in Elementary School Textbooks in South Korea

  • Kwon, Min Hyeong
    • 인간식물환경학회지
    • /
    • 제24권5호
    • /
    • pp.485-498
    • /
    • 2021
  • Background and objective: This study was conducted to find out the status of plant utilization in the current textbooks by analyzing the plants by grade and subject in the national textbooks for all elementary school grades in the 2015 revised curriculum in Korea. Methods: The data collected was analyzed using Microsoft Office Excel to obtain the frequency and ratio of collected plant data and SPSS for Windows 26.0 to determine learning content areas by grade and the R program was used to visualize the learning content areas. Results: A total of 232 species of plants were presented 1,047 times in the national textbooks. Based on an analysis of the plants presented by grade, the species that continued to increase in the lower grades tended to decrease in the fifth and sixth grades, the upper grades of elementary school. As for the number and frequency of plant species by subject, Korean Language had the highest number and frequency of plant species. The types of presentation of plants in textbooks were mainly text, followed by illustrations and photos of plants, which were largely used in first grade textbooks. In addition, as for the area of learning contents in which plants are used, in the lower grades, plants were used in the linguistic domain, and in the upper grades, in the botanical and environmental domains of the natural sciences. Herbaceous plants were presented more than woody plants, and according to an analysis of the plants based on the classification of crops, horticultural crops were presented the most, followed by food crops. Out of horticultural crops, flowering plants were found the most diversity with 63 species, but the plants that appeared most frequently were fruit trees that are commonly encountered in real life. Conclusion: As a result of this study, various plant species were included in elementary school textbooks, but most of them were horticultural crops encountered in real life depending on their use. Nevertheless, plant species with high frequency have continued a similar trend of frequency from the previous curriculums. Therefore, in the next curriculum, plant learning materials should be reflected according to social changes and students' preference for plants.

토픽모델링과 에고 네트워크 분석을 활용한 스마트 헬스케어 연구동향 분석 (Research Trend Analysis on Smart healthcare by using Topic Modeling and Ego Network Analysis)

  • 윤지은;서창진
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권5호
    • /
    • pp.981-993
    • /
    • 2018
  • 스마트 헬스케어는 ICT 분야와 의료서비스 분야가 융 복합 된 분야로 다양한 분야에서 학제 간 융 복합 연구가 활발히 이루어지고 있다. 본 연구는 토픽모델링(Topic Modeling)과 에고 네트워크 분석(Ego Network Analysis)을 활용하여 스마트 헬스케어 연구동향을 살피는데 그 목적이 있다. 이를 위해 2001년부터 2018년 4월까지 Scopus에 게재된 2,690편을 대상으로 텍스트 분석, 각 기간별 빈도분석, 토픽모델링, 워드 클라우드, 에고 네트워크 분석을 수행하였다. 토픽 모델링 분석 결과 8개의 주요 연구토픽이 도출되었다. 8개 주요 연구토픽은 "AI in healthcare", " Smart hospital", "Healthcare platform", " blockchain in healthcare", "Smart health data", "Mobile healthcare", "Wellness care", "Cognitive healthcare" 순으로 나타났다. 토픽모델링 결과를 보다 심도 있게 살펴보기 위해 연구토픽별 에고 네트워크 분석을 하였다. 이를 통해 스마트 헬스케어 연구동향을 파악하고, 향후 연구의 방향성을 수립하는데 시사점을 제시하고자 한다.

웹문서를 이용한 단계별 한국어 미등록어 인식 모델 (Phase-based Model Using Web Documents for Korean Unknown Word Recognition)

  • 박소영
    • 한국정보통신학회논문지
    • /
    • 제13권9호
    • /
    • pp.1898-1904
    • /
    • 2009
  • 신문이나 블로그와 같은 실제 문서에서는 위키백과(Wikipedia)와 같은 기존에 없던 새로운 단어를 포함하고 있다. 그러나, 대부분의 정보 처리 기술은 시스템 개발 당시 확보한 자료를 바탕으로 사전을 구축하므로, 이러한 새로운 단어에 대해 신속하게 대처할 수 없다는 한계가 있다. 따라서 본 논문에서는 사전에 등록되어 있지 않은 한국어 미등록어를 자동으로 인식하는 모델을 제안한다. 제안하는 모델은 전문분석 기반 미등록명사 인식 단계, 웹 출현빈도 기반 미등록용언 인식 단계, 웹 출현빈도 기반 미등록명사 인식 단계로 구성된다. 제안하는 모델은 문서에서 여러 번 나타난 미등록어에 대해 전문분석을 통해 정확하게 인식할 수 있다. 그리고, 제안하는 모델은 문서에 한번 나타난 미등록어에 대해서도 웹문서를 바탕으로 광범위하게 인식할 수 있다. 또한, 제안하는 모델은 기본형이 어절에 그대로 나타나는 미등록명사뿐만 아니라 기본형이 변형하여 나타날 수 있는 미등록용언도 인식할 수 있다. 실험 결과 기존 미등록어 인식방법에 비해 제안하는 접근방법은 정확률 1.01%와 재현을 8.50%를 개선하였다.

기후변화 및 식품 관련 뉴스기사의 텍스트 마이닝 (Text mining on internet-news regarding climate change and food)

  • 현윤진;김정선;정진욱;윤시몬;이문수
    • Journal of the Korean Data and Information Science Society
    • /
    • 제26권2호
    • /
    • pp.419-427
    • /
    • 2015
  • 기후변화와 식품 관련 정보가 유기적인 관련이 있음에도 불구하고, 사실상 현실에서는 사용자들이 직접 그 관련성에 대한 관심을 가지고, 해당 정보에 대한 접근이 용이하다고 말하기는 어렵다.본 연구는 실제 사용자들이 직접적으로 노출되는 인터넷 포털 사이트의 뉴스 기사에 대한 빈도분석 및 연관관계 분석을 통해 기후변화 및 식품 관련 정보가 어느 정도의 연관성을 가지고 얼마나 자주 나타나고 있는지에 대해 파악하였다. 또한 추출된 기후변화 및 식품 관련 뉴스를 대상으로 기후변화 용어 사전과 식품 관련 용어 사전을 활용하여 기후변화 관련 용어와 식품 관련 용어의 총 59개의 연관관계 규칙을 도출함으로써, 특정 기후변화 관련 용어가 어떠한 식품 관련 용어와 연관관계를 갖는지 파악하여, 추후 두 용어를 패키징해 제공할 수 있는 발판을 마련하였다.