• 제목/요약/키워드: Big data collection

검색결과 347건 처리시간 0.022초

A Study on Intelligent Skin Image Identification From Social media big data

  • Kim, Hyung-Hoon;Cho, Jeong-Ran
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권9호
    • /
    • pp.191-203
    • /
    • 2022
  • 화장품 및 뷰티산업에서 고객 맞춤형 제품과 서비스를 제공하는 것은 주요 기술 트렌드이고, 피부상태 진단과 관리는 중요한 필수기능이다. 고객의 요구 수준은 더욱더 높아지고 있으며 이에 대한 다양하고 섬세한 고민과 요구 사항이 소셜미디어 커뮤니티에서 활발하게 다루어지고 있다. 소셜미디어 상의 이미지는 매우 다양하고 비정형적이므로 피부상태 진단 및 관리에 필요한 체계적인 피부 이미지 식별을 위한 시스템이 필요하다. 본 논문에서는 소셜미디어 인스타그램에서 수집한 빅데이터로부터 피부 이미지 데이터를 지능적으로 식별하고, 피부상태 진단 및 관리를 위한 정형화된 피부 샘플 데이터를 추출하는 시스템을 개발하였다. 본 논문에서 제안한 시스템은 빅데이터수집분석단계, 피부이미지분석단계, 훈련데이터준비단계, 인공신경망훈련단계, 피부이미지식별단계로 구성된다. 빅데이터수집분석단계에서는 인스타그램으로부터 빅데이터를 수집하고 피부 상태 진단 및 관리를 위한 이미지 정보를 분석결과로 저장한다. 피부이미지분석단계에서는 전통적인 이미지 처리 기법을 사용하여 피부 이미지의 평가 및 분석 결과를 획득한다. 훈련데이터준비단계에서는 피부이미지 분석결과로부터 피부 샘플데이터를 추출하여 훈련데이터를 준비하였다. 그리고 인공신경망훈련단계에서는 이 훈련데이터를 사용하여 지능적으로 피부 이미지 유형을 예측하는 인공신경망 AnnSampleSkin을 단계별 고도화와 훈련을 통해 모델을 완성하였다. 피부이미지식별단계에서는 소셜미디어로부터 수집된 이미지에 대해 피부샘플을 추출하고, 훈련된 인공신경망 AnnSampleSkin의 이미지 유형 예측 결과들을 통합하여 최종 피부 이미지 유형을 지능적으로 식별한다. 본 논문에서 제안된 피부이미지식별 방법은 약 92% 이상의 높은 피부 이미지 식별 정확도를 나타내고 있고, 정형화된 피부 샘플 이미지 빅데이터를 제공할 수 있게 되었다. 추출된 피부샘플 세트는 피부 상태를 진단하고 관리하는데 매우 효율적이고 유용한 정형화된 피부 이미지 데이터로 사용될 것으로 기대된다.

A Study on the Trend Change of Restaurant Entrepreneurship through Big Data Analysis

  • Jong-Hyun Park;Yang-Ja Bae;Jun-Ho Park;Gi-Hwan Ryu
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제15권4호
    • /
    • pp.332-341
    • /
    • 2023
  • Notable trends in the restaurant start-up market after the lifting of social distancing include increasing interest in start-ups, emphasizing the importance of food quality and diversity, decreasing the relative importance of delivery services, and increasing interest in certain industries. The data collection period is three years from April 2021 to May 2023, including before and after social distancing, and texts extracted from blogs, news, cafes, web documents, and intellectuals provided by Naver, Daum, and Google were collected. For the collected data, the top 30 words were derived through a refining process. In addition, based on April 2021, the application period of social distancing, data from April 2021 to April 2022, and data from May 2022 to May 2023, Through these changes in trends, founders can capture new opportunities in the market and develop start-up strategies. In conclusion, this paper provides important insights for founders in accurately understanding the changes in food service start-up trends and in developing strategies appropriate to the current market situation.

가축의 행동 분석을 위한 농장 수준의 데이터 수집 시스템 설계와 구현 (Design and Implementation of the Farm-level Data Acquisition System for the Behavior Analysis of Livestocks)

  • 박기철;한수영
    • 한국소프트웨어감정평가학회 논문지
    • /
    • 제17권2호
    • /
    • pp.117-124
    • /
    • 2021
  • 가축의 행동 분석은 가축 건강관리와 농업 생산성 증대에 큰 영향을 미치는 요소이다. 그러나 가축의 행동 분석을 위해 도입되는 대부분의 디지털 기기들은 원시 데이터를 제공하지 않으며 분석 결과 또한 제한적으로 제공한다. 이러한 폐쇄적인 시스템은 첨단 IT 기술의 도입에 필수불가결한 데이터 통합과 빅데이터 구축을 더욱 어렵게 한다. 이에 저비용으로 손쉽게 사용할 수 있는 농장 규모의 데이터 수집 장치 보급이 필요하다. 본 연구는 가축의 행동 분석을 위한 데이터 수집 시스템을 제시한다. 이 시스템은 무선으로 동작하는 다수의 초소형 컴퓨팅 유닛으로 구성되어 있으며 이를 통해 가축의 체온과 가속도 데이터, 위치 정보, 축사 환경 데이터를 수집한다. 또한 본 연구에서는 수집된 가속도 데이터를 바탕으로 가축의 행동을 추정하는 알고리즘을 제시한다. 실험을 위해 경기도 이천의 한우 농가에 시스템을 구축하고 20두의 한우에 대해 데이터를 수집하였으며 이를 토대로 실증 및 분석 결과를 제시하였다.

Analysis of the supportive care needs of the parents of preterm children in South Korea using big data text-mining: Topic modeling

  • Park, Ji Hyeon;Lee, Hanna;Cho, Haeryun
    • Child Health Nursing Research
    • /
    • 제27권1호
    • /
    • pp.34-42
    • /
    • 2021
  • Purpose: The purpose of this study was to identify the supportive care needs of parents of preterm children in South Korea using text data from a portal site. Methods: In total, 628 online newspaper articles and 1,966 social network service posts published between January 1 and December 31, 2019 were analyzed. The procedures in this study were conducted in the following order: keyword selection, data collection, morpheme analysis, keyword analysis, and topic modeling. Results: The term "yirundung-yi", which is a native Korean word referring to premature infants, was confirmed to be a useful term for parents. The following four topics were identified as the supportive care needs of parents of preterm children: 1) a vague fear of caring for a baby upon imminent neonatal intensive care unit discharge, 2) real-world difficulties encountered while caring for preterm children, 3) concerns about growth and development problems, and 4) anxiety about possible complications. Conclusion: Supportive care interventions for parents of preterm children should include general parenting methods for babies. A team composed of multidisciplinary experts must support the individual growth and development of preterm children and manage the complications of prematurity using highly accessible media.

Panic Disorder Intelligent Health System based on IoT and Context-aware

  • Huan, Meng;Kang, Yun-Jeong;Lee, Sang-won;Choi, Dong-Oun
    • International journal of advanced smart convergence
    • /
    • 제10권2호
    • /
    • pp.21-30
    • /
    • 2021
  • With the rapid development of artificial intelligence and big data, a lot of medical data is effectively used, and the diagnosis and analysis of diseases has entered the era of intelligence. With the increasing public health awareness, ordinary citizens have also put forward new demands for panic disorder health services. Specifically, people hope to predict the risk of panic disorder as soon as possible and grasp their own condition without leaving home. Against this backdrop, the smart health industry comes into being. In the Internet age, a lot of panic disorder health data has been accumulated, such as diagnostic records, medical record information and electronic files. At the same time, various health monitoring devices emerge one after another, enabling the collection and storage of personal daily health information at any time. How to use the above data to provide people with convenient panic disorder self-assessment services and reduce the incidence of panic disorder in China has become an urgent problem to be solved. In order to solve this problem, this research applies the context awareness to the automatic diagnosis of human diseases. While helping patients find diseases early and get treatment timely, it can effectively assist doctors in making correct diagnosis of diseases and reduce the probability of misdiagnosis and missed diagnosis.

시계열 프레임워크를 이용한 효율적인 클라우드서비스 품질·성능 관리 방법 (An Efficient Cloud Service Quality Performance Management Method Using a Time Series Framework)

  • 정현철;서광규
    • 반도체디스플레이기술학회지
    • /
    • 제20권2호
    • /
    • pp.121-125
    • /
    • 2021
  • Cloud service has the characteristic that it must be always available and that it must be able to respond immediately to user requests. This study suggests a method for constructing a proactive and autonomous quality and performance management system to meet these characteristics of cloud services. To this end, we identify quantitative measurement factors for cloud service quality and performance management, define a structure for applying a time series framework to cloud service application quality and performance management for proactive management, and then use big data and artificial intelligence for autonomous management. The flow of data processing and the configuration and flow of big data and artificial intelligence platforms were defined to combine intelligent technologies. In addition, the effectiveness was confirmed by applying it to the cloud service quality and performance management system through a case study. Using the methodology presented in this study, it is possible to improve the service management system that has been managed artificially and retrospectively through various convergence. However, since it requires the collection, processing, and processing of various types of data, it also has limitations in that data standardization must be prioritized in each technology and industry.

확장형 실시간 데이터 파이프라인 시스템 아키텍처 설계 (Design of Extended Real-time Data Pipeline System Architecture)

  • 신호승;강성원;이지현
    • 정보과학회 논문지
    • /
    • 제42권8호
    • /
    • pp.1010-1021
    • /
    • 2015
  • 빅데이터 시스템은 대규모 로그 데이터를 수집하는 용도로 광범위하게 사용되고 있기 때문에 높은 성능을 갖는 것이 매우 중요하지만, 현재의 Hadoop 기반의 빅데이터 시스템은 중복 처리로 인하여 낮은 성능을 갖는 아키텍처적인 문제를 가지고 있다. 본 논문은 아키텍처 설계 개선을 통하여 Hadoop 기반 시스템의 낮은 성능 문제를 해결한다. 새로운 제안 아키텍처는 기존 아키텍처의 배치(Batch) 기반의 데이터 수집 방식을 개별처리 방식과 혼합한 수집 방법을 사용하고, 수집하는 데이터를 In-Memory 상에서 직접 분석하여 중복 처리를 배제하여 높은 성능을 제공하게 한다. 또한 제안 아키텍처는 기존 Hadoop 기반 아키텍처의 장점인 시스템 확장성을 가진다. 본 논문은 제안 아키텍처가 테스트 베드 환경에서 기존 아키텍처보다 데이터의 분석 처리 속도가 30%~35% 빠르고 확장성도 가진다는 것을 확인하였다.

초등학교 저학년을 위한 데이터 수집 교육 프로그램 개발 (Development of data collection education programs for lower grades in elementary school students)

  • 이슬;마대성
    • 한국정보교육학회:학술대회논문집
    • /
    • 한국정보교육학회 2021년도 학술논문집
    • /
    • pp.275-281
    • /
    • 2021
  • 우리 생활의 많은 부분이 인공지능과 밀접하게 관련되고 있고, 사회는 더욱 빠르게 변화하고 있다. 이러한 시대적 상황을 반영하며 인공지능 교육에 대한 필요성이 대두되고 다양한 학습 방안들이 제시되고 있지만, 초등학교 저학년 학생들을 위한 인공지능 교수·학습 활동에 대한 안내는 부족한 실정이다. 따라서 본 연구에서는 초등학교 저학년을 위한 데이터 수집 교육 프로그램을 한국과학창의재단의 내용기준에 근거하여 개발하였다. 인공지능의 원리와 활용 영역의 데이터 세부 영역을 중심으로 숫자와 문자를 색, 그림 등 다양한 방법으로 표현하고 생활 속에서 다양한 유형의 데이터를 찾아보며 인공지능의 원리를 학습할 수 있도록 하는 것에 중점을 두었다. 이 프로그램을 통해서 초등학교 저학년 학생들이 데이터에 대해 알고 소리, 그림, 문자 데이터를 수집해보는 과정을 통해서 인공지능에서 데이터 수집의 중요성을 이해할 수 있을 것으로 기대한다.

  • PDF

시민 니즈와 참여 기반의 스마트시티 문제해결을 위한 빅 데이터 활용 절차에 관한 연구 (A Study on the Procedure of Using Big Data to Solve Smart City Problems Based on Citizens' Needs and Participation)

  • 장혜정
    • 한국정보전자통신기술학회논문지
    • /
    • 제13권2호
    • /
    • pp.102-112
    • /
    • 2020
  • 스마트시티의 목표는 스마트시티의 요소기술을 통해 도시문제를 해결하여 친환경적이고 지속가능한 경제발전 및 시민의 삶의 질을 향상하는 것이라 할 수 있다. 지금까지 스마트시티는 요소기술 중심으로 발전해왔지만 이제는 스마트시티에서 생활을 하는 시민들의 니즈나 참여에 대해 관심을 두어야 할 때이다. 본 논문에서는 시민 니즈와 참여를 기반으로 스마트시티의 문제해결을 위한 빅 데이터 절차를 제시한다. 이를 위하여 지역별 주요산업별 스마트시트 프로젝트 시장과 분야별 스마트시티 시장 영역 발전단계를 살펴본다. 또한 시민 참여에 대한 분야별 정의와 필요성을 이해하고 빅 데이터를 통한 문제해결 방법으로 7단계 빅 데이터 문제해결 프로세스에 접목 방안을 제시한다. 문제해결을 위한 7단계 빅데이터 프로세스는 스마트시티의 각 부문별 정형·비정형 데이터 수집 분석 후 과제를 도출하고 이에 따른 정책 프로그램을 도출하는 방법이다. 이러한 절차에 시민 참여를 이끌어 내기 위하여 비정형 데이터 수집과정에서 디자인싱킹 방법론의 공감단계를 활용한다. 또한 스마트시티 도시문제 해결을 위한 시민 니즈를 찾는 방법으로 비정형 데이터 분석과정에 디자인싱킹 방법론의 문제정의 단계를 접목시켰다.

PPNC: Privacy Preserving Scheme for Random Linear Network Coding in Smart Grid

  • He, Shiming;Zeng, Weini;Xie, Kun;Yang, Hongming;Lai, Mingyong;Su, Xin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권3호
    • /
    • pp.1510-1532
    • /
    • 2017
  • In smart grid, privacy implications to individuals and their families are an important issue because of the fine-grained usage data collection. Wireless communications are utilized by many utility companies to obtain information. Network coding is exploited in smart grids, to enhance network performance in terms of throughput, delay, robustness, and energy consumption. However, random linear network coding introduces a new challenge for privacy preserving due to the encoding of data and updating of coefficients in forwarder nodes. We propose a distributed privacy preserving scheme for random linear network coding in smart grid that considers the converged flows character of the smart grid and exploits a homomorphic encryption function to decrease the complexities in the forwarder node. It offers a data confidentiality privacy preserving feature, which can efficiently thwart traffic analysis. The data of the packet is encrypted and the tag of the packet is encrypted by a homomorphic encryption function. The forwarder node random linearly codes the encrypted data and directly processes the cryptotext tags based on the homomorphism feature. Extensive security analysis and performance evaluations demonstrate the validity and efficiency of the proposed scheme.