• 제목/요약/키워드: Unstructured data analysis

검색결과 422건 처리시간 0.029초

비정형 빅데이터를 활용한 코로나19 발병 전후 경인 아라뱃길 인식 비교 탐색 (Comparative Exploration of Gyeongin Ara Waterway Recognition Before and After COVID-19 Outbreak Using Unstructured Big Data)

  • 한장헌
    • 디지털산업정보학회논문지
    • /
    • 제20권1호
    • /
    • pp.17-29
    • /
    • 2024
  • The Gyeongin Ara Waterway is a regional development project designed to transport cargo by sea and to utilize the surrounding waterfront area to enjoy tourism and leisure. It is being used as a space for demonstration projects for urban air transportation (UAM), which has recently been attracting attention, and various efforts are being made at the local level to strengthen cultural and tourism functions and revitalize local food. This study examined the perception and trends of tourism consumers on the Gyeongin Ara Waterway before and after the outbreak of COVID-19. The research method utilized semantic network analysis based on social network analysis. As a result of the study, first, before the outbreak of COVID-19, key words such as bicycle, Han River, riding, Gimpo, Seoul, hotel, cruise ship, Korea Water Resources Corporation, emotion, West Sea, weekend, and travel showed a high frequency of appearance. After the outbreak of COVID-19, keywords such as cafe, discovery, women, Gimpo, restaurant, bakery, observatory, La Mer, and cruise ship showed a high frequency of appearance. Second, the results of the degree centrality analysis showed that before the outbreak of COVID-19, there was increased interest in accommodations for tourism, such as Marina Bay and hotels. After the outbreak of COVID-19, interest in food such as specific bakeries and cafes such as La Mer was found to be high. Third, due to the CONCOR analysis, five keyword clusters were formed before the outbreak of COVID-19, and the number of keyword clusters increased to eight after the outbreak of COVID-19.

데이터마이닝을 활용한 골프 스윙 최적화 분석 (Quantitative Golf Swing Analysis based on Kinematic Mining Approach)

  • Lee, Kyu Jong;Ryou, Okhyun;Kang, Jihoon
    • 한국운동역학회지
    • /
    • 제31권2호
    • /
    • pp.87-94
    • /
    • 2021
  • Objective: Identification of meaningful patterns and trends in large volumes of unstructured data is an important task in various research areas. In the present study, we gathered golf swing image data and did quantitative analysis of swing image. Method: We collected golf swing images of 30 novice players and 30 professional players in this study. Results: We selected important features of swing posture and employed data mining algorithm to classify whether a player is an expert or a novice. Moreover, our proposed method could offer quantitative advices for golf beginners for correcting their swing. Conclusion: Finally, we found a possibility that our proposed method can be expanded to golf swing correction system

비정형 텍스트 분석을 활용한 이슈의 동적 변이과정 고찰 (Investigating Dynamic Mutation Process of Issues Using Unstructured Text Analysis)

  • 임명수;김남규
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.1-18
    • /
    • 2016
  • 최근 가용한 텍스트 데이터 자원이 증가함에 따라 방대한 텍스트 분석을 통해 새로운 가치를 창출하고자 하는 수요가 증가하고 있다. 특히 뉴스, 민원, 블로그, SNS 등을 통해 유통되는 글로부터 다양한 이슈를 발굴해내고 이들 이슈의 추이를 분석하는 이슈 트래킹에 대한 연구가 활발하게 이루어지고 있다. 전통적인 이슈 트래킹은 토픽 모델링을 통해 오랜 기간에 걸쳐 지속된 주요 이슈를 발굴한 후, 각 이슈를 구성하는 문서 수의 세부 기간별 분포를 분석하는 방식으로 이루어진다. 하지만 전통적 이슈 트래킹은 각 이슈를 구성하는 내용이 전체 기간에 걸쳐 변화 없이 유지된다는 가정 하에 수행되기 때문에, 다양한 세부 이슈가 서로 영향을 주며 생성, 병합, 분화, 소멸하는 이슈의 동적 변이과정을 나타내지 못한다. 또한 전체 기간에 걸쳐 지속적으로 출현한 키워드만이 이슈 키워드로 도출되기 때문에, 핵실험, 이산가족 등 세부 기간의 분석에서는 매우 상이한 맥락으로 파악되는 구체적인 이슈가 오랜 기간의 분석에서는 북한이라는 큰 이슈에 함몰되어 가려지는 현상이 발생할 수 있다. 본 연구에서는 이러한 한계를 극복하기 위해 각 세부 기간의 문서에 대한 독립적인 분석을 통해 세부 기간별 주요 이슈를 도출한 후, 각 이슈의 유사도에 기반하여 이슈 흐름도를 도출하고자 한다. 또한 각 문서의 카테고리 정보를 활용하여 카테고리간의 이슈 전이 패턴을 분석하고자 한다. 본 논문에서는 총 53,739건의 신문 기사에 제안 방법론을 적용한 실험을 수행하였으며, 이를 통해 전통적인 이슈 트래킹을 통해 발굴한 주요 이슈의 세부 기간별 구성 내용을 살펴볼 수 있을 뿐 아니라, 특정 이슈의 선행 이슈와 후행 이슈를 파악할 수 있음을 확인하였다. 또한 카테고리간 분석을 통해 단방향 전이와 양방향 전이의 흥미로운 패턴을 발견하였다.

비정형 금융 데이터에 관한 인공지능 CNN 활용 빅데이터 연구 (Big Data using Artificial Intelligence CNN on Unstructured Financial Data)

  • 고영봉;박대우
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.232-234
    • /
    • 2022
  • 빅데이터는 고객 관계 관리, 관계 마케팅, 금융 업무 개선, 신용정보 및 위험 관리 분야에서 크게 활용되고 있다. 더욱이 최근에 COVID-19 바이러스로 인하여 비대면 금융거래가 보다 활발해지면서 고객과의 관계 측면에서 금융 빅데이터의 활용이 더 요구되고 있다. 고객 관계 측면에서 금융 빅데이터는 기술적인 접근보다 감성적적인 접근이 필요한 시기가 도래하였다. 관계 마케팅 측면에서도 인지적, 이성적, 합리적인 면보다는 감성적인 면을 중요시 할 필요성이 대두되었다. 하지만, 기존의 금융 데이터는 텍스트 형태의 고객 거래 데이터, 기업재무정보, 설문지등을 통하여 수집되고 활용되었다. 본 연구는 SNS를 통하여 고객의 문화 활동, 여가 활동 기반의 고객의 감성적인 이미지 데이터 즉, 비정형 데이터를 획득하여 고객의 활동 이미지를 인공지능 CNN 알고리즘으로 분석한다. 활동 분석은 다시 주석을 달은 인공지능에 적용하고, 주석에 나타난 행동 모델을 분석하는 인공지능 빅데이터 모델을 설계한다.

  • PDF

텍스트 마이닝 기법을 활용한 동남권 신공항 신문기사 분석 (Analysis of News Regarding New Southeastern Airport Using Text Mining Techniques)

  • 한무명초;김양석;이충권
    • 스마트미디어저널
    • /
    • 제6권1호
    • /
    • pp.47-53
    • /
    • 2017
  • 사회적 이슈는 정책의 방향을 결정하는 중요한 요인이며, 신문은 사회적 이슈를 반영하는 중요한 채널이다. 신문기사의 텍스트를 분석하는 것은 사회적 이슈를 이해하는 데 기여할 수 있지만, 대규모의 비정형 데이터인 뉴스를 수작업으로 분석하는 것은 매우 어렵다. 따라서 본 연구는 텍스트 분석기법과 연관분석 기법을 활용해 비정형 신문기사 내용을 정형화하여 사회적 이슈의 이해관계자들 간 관점 차이를 시스템적으로 분석하는 것을 목적으로 한다. 본 연구 수행을 위해 각 지역을 대표하는 신문사(조선일보, 중앙일보, 동아일보, 매일신문, 부산일보)를 선정한 후 기사 115건과 댓글 6,772건을 2주간 수집하여 분석하였다. 연구 결과 전국 일간지들은 해당 지역과 정치적인 관계에 초점을 맞춘 반면에, 지역 일간지들은 속해 있는 지자체를 대변하는 논조로 기사가 작성된 측면이 강하게 나타났다.

Grid Discretization Study for the Efficient Aerodynamic Analysis of the Very Light Aircraft (VLA) Configuration

  • Sitio, Moses;Kim, Sangho;Lee, Jaewoo
    • International Journal of Aeronautical and Space Sciences
    • /
    • 제14권2호
    • /
    • pp.122-132
    • /
    • 2013
  • In this research the development of unstructured grid discretization solution techniques is presented. The purpose is to describe such a conservative discretization scheme applied for experimental validation work. The objective of this paper is to better establish the effects of mesh generation techniques on velocity fields and particle deposition patterns to determine the optimal aerodynamic characteristics. In order to achieve the objective, the mesh surface discretization approaches used the VLA prototype manufacturing tolerance zone of the outer surface. There were 3 schemes for this discretization study implementation. They are solver validation, grid convergence study and surface tolerance study. A solver validation work was implemented for the simple 2D and 3D model to get the optimum solver for the VLA model. A grid convergence study was also conducted with a different growth factor and cell spacing, the amount of mesh can be controlled. With several amount of mesh we can get the converged amount of mesh compared to experimental data. The density around surface model can be calculated by controlling the number of element in every important and sensitive surface area of the model. The solver validation work result provided the optimum solver to employ in the VLA model analysis calculation. The convergence study approach result indicated that the aerodynamic trend characteristic was captured smooth enough compared with the experimental data. During the surface tolerance scheme, it could catch the aerodynamics data of the experiment data. The discretization studies made the validation work more efficient way to achieve the purpose of this paper.

Multimodal Sentiment Analysis for Investigating User Satisfaction

  • 황교엽;송쯔한;박병권
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제32권3호
    • /
    • pp.1-17
    • /
    • 2023
  • Purpose The proliferation of data on the internet has created a need for innovative methods to analyze user satisfaction data. Traditional survey methods are becoming inadequate in dealing with the increasing volume and diversity of data, and new methods using unstructured internet data are being explored. While numerous comment-based user satisfaction studies have been conducted, only a few have explored user satisfaction through video and audio data. Multimodal sentiment analysis, which integrates multiple modalities, has gained attention due to its high accuracy and broad applicability. Design/methodology/approach This study uses multimodal sentiment analysis to analyze user satisfaction of iPhone and Samsung products through online videos. The research reveals that the combination model integrating multiple data sources showed the most superior performance. Findings The findings also indicate that price is a crucial factor influencing user satisfaction, and users tend to exhibit more positive emotions when content with a product's price. The study highlights the importance of considering multiple factors when evaluating user satisfaction and provides valuable insights into the effectiveness of different data sources for sentiment analysis of product reviews.

중고의류와 중고명품 구매 관련 언론 보도 빅데이터 분석: 텍스트마이닝을 활용한 사회적 인식과 현황 파악 (Big Data Analysis of News on Purchasing Second-hand Clothing and Second-hand Luxury Goods: Identification of Social Perception and Current Situation Using Text Mining)

  • 유화숙
    • Human Ecology Research
    • /
    • 제61권4호
    • /
    • pp.687-707
    • /
    • 2023
  • This study was conducted to obtain useful information on the development of the future second-hand fashion market by obtaining information on the current situation through unstructured text data distributed as news articles related to 'purchase of second-hand clothing' and 'purchase of second-hand luxury goods'. Text-based unstructured data was collected on a daily basis from Naver news from January 1st to December 31st, 2022, using 'purchase of second-hand clothing' and 'purchase of second-hand luxury goods' as collection keywords. This was analyzed using text mining, and the results are as follows. First, looking at the frequency, the collection data related to the purchase of second-hand luxury goods almost quadrupled compared to the data related to the purchase of second-hand clothing, indicating that the purchase of second-hand luxury goods is receiving more social attention. Second, there were common words between the data obtained by the two collection keywords, but they had different words. Regarding second-hand clothing, words related to donations, sharing, and compensation sales were mainly mentioned, indicating that the purchase of second-hand clothing tends to be recognized as an eco-friendly transaction. In second-hand luxury goods, resale and genuine controversy related to the transaction of second-hand luxury goods, second-hand trading platforms, and luxury brands were frequently mentioned. Third, as a result of clustering, data related to the purchase of second-hand clothing were divided into five groups, and data related to the purchase of second-hand luxury goods were divided into six groups.

시민 니즈와 참여 기반의 스마트시티 문제해결을 위한 빅 데이터 활용 절차에 관한 연구 (A Study on the Procedure of Using Big Data to Solve Smart City Problems Based on Citizens' Needs and Participation)

  • 장혜정
    • 한국정보전자통신기술학회논문지
    • /
    • 제13권2호
    • /
    • pp.102-112
    • /
    • 2020
  • 스마트시티의 목표는 스마트시티의 요소기술을 통해 도시문제를 해결하여 친환경적이고 지속가능한 경제발전 및 시민의 삶의 질을 향상하는 것이라 할 수 있다. 지금까지 스마트시티는 요소기술 중심으로 발전해왔지만 이제는 스마트시티에서 생활을 하는 시민들의 니즈나 참여에 대해 관심을 두어야 할 때이다. 본 논문에서는 시민 니즈와 참여를 기반으로 스마트시티의 문제해결을 위한 빅 데이터 절차를 제시한다. 이를 위하여 지역별 주요산업별 스마트시트 프로젝트 시장과 분야별 스마트시티 시장 영역 발전단계를 살펴본다. 또한 시민 참여에 대한 분야별 정의와 필요성을 이해하고 빅 데이터를 통한 문제해결 방법으로 7단계 빅 데이터 문제해결 프로세스에 접목 방안을 제시한다. 문제해결을 위한 7단계 빅데이터 프로세스는 스마트시티의 각 부문별 정형·비정형 데이터 수집 분석 후 과제를 도출하고 이에 따른 정책 프로그램을 도출하는 방법이다. 이러한 절차에 시민 참여를 이끌어 내기 위하여 비정형 데이터 수집과정에서 디자인싱킹 방법론의 공감단계를 활용한다. 또한 스마트시티 도시문제 해결을 위한 시민 니즈를 찾는 방법으로 비정형 데이터 분석과정에 디자인싱킹 방법론의 문제정의 단계를 접목시켰다.

Hierarchical Attention Network를 활용한 주제에 따른 온라인 고객 리뷰 분석 모델 (Analysis of the Online Review Based on the Theme Using the Hierarchical Attention Network)

  • 장인호;박기연;이준기
    • 한국IT서비스학회지
    • /
    • 제17권2호
    • /
    • pp.165-177
    • /
    • 2018
  • Recently, online commerces are becoming more common due to factors such as mobile technology development and smart device dissemination, and online review has a big influence on potential buyer's purchase decision. This study presents a set of analytical methodologies for understanding the meaning of customer reviews of products in online transaction. Using techniques currently developed in deep learning are implemented Hierarchical Attention Network for analyze meaning in online reviews. By using these techniques, we could solve time consuming pre-data analysis time problem and multiple topic problems. To this end, this study analyzes customer reviews of laptops sold in domestic online shopping malls. Our result successfully demonstrates over 90% classification accuracy. Therefore, this study classified the unstructured text data in the semantic analysis and confirmed the practical application possibility of the review analysis process.