• Title/Summary/Keyword: 빅데이터 기반 모델링

Search Result 103, Processing Time 0.024 seconds

Adaptive User and Topic Modeling based Automatic TV Recommender System for Big Data Processing (빅 데이터 처리를 위한 적응적 사용자 및 토픽 모델링 기반 자동 TV 프로그램 추천시스템)

  • Kim, EunHui;Kim, Munchurl
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2015.07a
    • /
    • pp.195-198
    • /
    • 2015
  • 최근 TV 서비스의 가입자 및 TV 프로그램 콘텐츠의 급격한 증가에 따라 빅데이터 처리에 적합한 추천 시스템의 필요성이 증가하고 있다. 본 논문은 사용자들의 간접 평가 데이터 기반의 추천 시스템 디자인 시, 누적된 사용자의 과거 이용내역 데이터를 저장하지 않고 새로 생성된 사용자 이용내역 데이터를 학습하는 효율적인 알고리즘이면서, 시간 흐름에 따라 사용자들의 선호도 변화 및 TV 프로그램 스케줄 변화의 추적이 가능한 토픽 모델링 기반의 알고리즘을 제안한다. 빅데이터 처리를 위해서는 분산처리 형태의 알고리즘을 피할 수 없는데, 기존의 연구들 중 토픽 모델링 기반의 추론 알고리즘의 병렬분산처리 과정 중에 핵심이 되는 부분은 많은 데이터를 여러 대의 기계에 나누어 병렬분산 학습하면서 전역변수 데이터를 동기화하는 부분이다. 그런데, 이러한 전역데이터 동기화 기술에 있어, 여러 대의 컴퓨터를 병렬분산처리하기위한 하둡 기반의 시스템 및 서버-클라이언트간의 중재, 고장 감내 시스템 등을 모두 고려한 알고리즘들이 제안되어 왔으나, 네트워크 대역폭 한계로 인해 데이터 증가에 따른 동기화 시간 지연은 피할 수 없는 부분이다. 이에, 본 논문에서는 빅데이터 처리를 위해 사용자들을 클러스터링하고, 클러스터별 제안 알고리즘으로 전역데이터 동기화를 수행한 것과 지역 데이터를 활용하여 추론 연산한 결과, 클러스터별 지역별 TV프로그램 시청 토큰 별 은닉토픽 할당 테이블을 유지할 때 추천 성능이 더욱 향상되어 나오는 결과를 확인하여, 제안된 구조의 추천 시스템 디자인의 효율성과 합리성을 확인할 수 있었다.

  • PDF

사물인터넷기반 라이프케어 빅데이터 센싱기술

  • Jo, Wi-Deok;Choe, Seon-Tak;Baek, Jae-Sun;Min, Myeong-Gi;Lee, Yeong-Gwon;Lee, Gyu-Pil;Park, Gyeong-Chan;Lee, Jong-Ik
    • Information and Communications Magazine
    • /
    • v.32 no.11
    • /
    • pp.21-31
    • /
    • 2015
  • 현대 사회에서의 삶의 모습이 다양해짐에 따라 생활습관이 다양해지고 잘못된 생활습관으로 인한 생활습관병에 대한 관심이 높아지고 있다. 본 논문에서는 사물인터넷 및 빅데이터와 같은 IT기술을 통해 사용자의 다양한 생활습관을 추적할 수 있는 방법과 그 응용 기술에 대해서 소개하고자 한다. 이러한 생활습관 추적 및 분석 기술은 다양한 사용자의 요구에 능동적으로 대처할 수 있으며 노약자나 장애인, 생활습관병 환자 등 특수계층의 건강 예측, 질병 관리 분야에서 실효성을 가질 수 있다. 특히 본 논문에서는 라이프케어 서비스를 위한 사용자 센싱 기술에 초점을 두고, 낮 시간의 활동과, 밤 시간의 수면 및 위치 기반 기술, 빅데이터 플랫폼, 스마트 홈 패턴 모델링 기술에 대해서 소개한다.

Construction of Hierarchical LOD Development Environment and Its Application of Medical Information (계층적 LOD 개발 환경 구축 및 의료 정보 적용)

  • Moon, Hee-Kyung
    • Annual Conference of KIPS
    • /
    • 2017.11a
    • /
    • pp.432-433
    • /
    • 2017
  • 최근 ICT 기술과 의료 빅데이터를 활용한 다양한 연구가 활발하게 진행되고 있다. 이질적인 의료데이터의 공유와 확산을 위해 표준화 데이터 모델로 온톨로지 기반의 Linked Open Data가 대안으로 급부상하고 있다. 특히 의료 빅데이터의 분석을 위한 데이터 셋은 프로토콜화하기 어려운 문제점을 갖고 있다. 본 논문에서는 이러한 문제점을 해결하기 개발된 계층적 LOD 개발 환경 시스템을 기반으로 의료정보를 적용하기 위한 모델링에 중점을 두고자 한다. 본 연구는 의료 빅데이터의 검색과 분석연구 분야에 큰 영향을 줄 것으로 기대하고 있다.

A Study on the Application Modeling of SNS Big-data for a Micro-Targeting using K-Means Clustering (K-평균 군집을 이용한 마이크로타겟팅을 위한 SNS 빅데이터 활용 모델링에 관한 연구)

  • Song, Jeo;Lee, Sang Moon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2015.01a
    • /
    • pp.321-324
    • /
    • 2015
  • 본 논문에서는 SNS에 존재하는 특정 제품과 브랜드 또는 기업에 대한 평가, 의견, 느낌, 사용 후기 등의 소비자 생각을 수집하여 기업에서 향후 신제품 개발이나 시장 진출 및 확대 등의 경영활동에 활용할 수 있도록 SNS 빅데이터를 문석하고, 이를 활용하여 보다 소집단화 되고 개인화 되어가는 Micro-Trend 중심의 마케팅 활동을 할 수 있는 Micro-Targeting 관련 분석 정보를 제공 모델링하는 것을 제안한다. 본 연구에서는 SNS 데이터의 수집, 저장, 분석에 대한 내용을 다루고 있으며, 특히 마이크로타겟팅을 위한 정보를 머하웃(Mahout)의 유클리드 거리 기반의 유사도와 K-평균 군집 알고리즘을 활용하여 구현하고자 하였다.

  • PDF

Traffic Volume Dependent Displacement Estimation Model for Gwangan Bridge Using Monitoring Big Data (교량 모니터링 빅데이터를 이용한 광안대교의 교통량 의존 변위 추정 모델)

  • Park, Ji Hyun;Shin, Sung Woo;Kim, Soo Yong
    • KSCE Journal of Civil and Environmental Engineering Research
    • /
    • v.38 no.2
    • /
    • pp.183-191
    • /
    • 2018
  • In this study a traffic volume dependent displacement estimation model for Gwangan Bridge was developed using bridge monitoring big data. Traffic volume data for four different vehicle types and the vertical displacement data in the central position of the Gwangan Bridge were used to develop and validate the estimation model. Two statistical estimation models were developed using multiple regression analysis (MRA) and principal component analysis (PCA). Estimation performance of those two models were compared with actual values. The results show that both the MRA and the PCA based models are successfully estimating the vertical displacement of Gwangan Bridge. Based on the results, it is concluded that the developed model can effectively be used to predict the traffic volume dependent displacement behavior of Gwangan Bridge.

Federated Learning-based Route Choice Modeling for Preserving Driver's Privacy in Transportation Big Data Application (교통 빅데이터 활용 시 개인 정보 보호를 위한 연합학습 기반의 경로 선택 모델링)

  • Jisup Shim
    • The Journal of The Korea Institute of Intelligent Transport Systems
    • /
    • v.22 no.6
    • /
    • pp.157-167
    • /
    • 2023
  • The use of big data for transportation often involves using data that includes personal information, such as the driver's driving routes and coordinates. This study explores the creation of a route choice prediction model using a large dataset from mobile navigation apps using federated learning. This privacy-focused method used distributed computing and individual device usage. This study established preprocessing and analysis methods for driver data that can be used in route choice modeling and compared the performance and characteristics of widely used learning methods with federated learning methods. The performance of the model through federated learning did not show significantly superior results compared to previous models, but there was no substantial difference in the prediction accuracy. In conclusion, federated learning-based prediction models can be utilized appropriately in areas sensitive to privacy without requiring relatively high predictive accuracy, such as a driver's preferred route choice.

Development of a Prediction Model for Advertising Effects of Celebrity Models using Big data Analysis (빅데이터 분석을 통한 유명인 모델의 광고효과 예측 모형 개발)

  • Kim, Yuna;Han, Sangpil
    • Journal of the Korea Convergence Society
    • /
    • v.11 no.8
    • /
    • pp.99-106
    • /
    • 2020
  • The purpose of this study is to find out whether image similarity between celebrities and brands on social network service be a determinant to predict advertising effectiveness. To this end, an advertising effect prediction model for celebrity endorsed advertising was created and its validity was verified through a machine learning method which is a big data analysis technique. Firstly, the celebrity-brand image similarity, which was used as an independent variable, was quantified by the association network theory with social big data, and secondly a multiple regression model which used data representing advertising effects as a dependent variable was repeatedly conducted to generate an advertising effect prediction model. The accuracy of the prediction model was decided by comparing the prediction results with the survey outcomes. As for a result, it was proved that the validity of the predictive modeling of advertising effects was secured since the classification accuracy of 75%, which is a criterion for judging validity, was shown. This study suggested a new methodological alternative and direction for big data-based modeling research through celebrity-brand image similarity structure based on social network theory, and effect prediction modeling by machine learning.

Data-Driven Technology Portfolio Analysis for Commercialization of Public R&D Outcomes: Case Study of Big Data and Artificial Intelligence Fields (공공연구성과 실용화를 위한 데이터 기반의 기술 포트폴리오 분석: 빅데이터 및 인공지능 분야를 중심으로)

  • Eunji Jeon;Chae Won Lee;Jea-Tek Ryu
    • The Journal of Bigdata
    • /
    • v.6 no.2
    • /
    • pp.71-84
    • /
    • 2021
  • Since small and medium-sized enterprises fell short of the securement of technological competitiveness in the field of big data and artificial intelligence (AI) field-core technologies of the Fourth Industrial Revolution, it is important to strengthen the competitiveness of the overall industry through technology commercialization. In this study, we aimed to propose a priority related to technology transfer and commercialization for practical use of public research results. We utilized public research performance information, improving missing values of 6T classification by deep learning model with an ensemble method. Then, we conducted topic modeling to derive the converging fields of big data and AI. We classified the technology fields into four different segments in the technology portfolio based on technology activity and technology efficiency, estimating the potential of technology commercialization for those fields. We proposed a priority of technology commercialization for 10 detailed technology fields that require long-term investment. Through systematic analysis, active utilization of technology, and efficient technology transfer and commercialization can be promoted.

Exploration of User Experience Research Method with Big Data Analysis : Focusing on the Online Review Analysis of Echo (빅데이터 분석을 활용한 사용자 경험 평가 방법론 탐색 : 아마존 에코에 대한 온라인 리뷰 분석을 중심으로)

  • Hwang, Hae Jeong;Shim, Hye Rin;Choi, Junho
    • The Journal of the Korea Contents Association
    • /
    • v.16 no.8
    • /
    • pp.517-528
    • /
    • 2016
  • This study attempted to explore and examine a new user experience (UX) research method for IoT products which are becoming widely used but lack practical user research. While user experience research has been traditionally opted for survey or observation methods, this paper utilized big data analysis method for user online reviews on an intelligent agent IoT product, Amazon's Echo. The results of topic modelling analysis extracted user experience elements such as features, conversational interaction, and updates. In addition, regression analysis showed that the topic of updates was the most influential determinant of user satisfaction. The main implication of this study is the new introduction of big data analysis method into the user experience research for the intelligent agent IoT products.

입출항 지원 서비스를 위한 AIS 빅데이터 기반 해상교통혼잡도 예측

  • 이서호;김세원;손준배;엄정온;이주향;김동함;윤상웅;김혜진
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2022.11a
    • /
    • pp.344-346
    • /
    • 2022
  • 최근 자율운항기술개발이 활발하게 이루어짐에 따라 자율운항선 실증이 증가하고 있으며, 또한 자율운항선의 효율적 운용 특히 운항의 안전성을 위해 입출항 시기의 적절성 또한 중요해지고 있다. 이에 해상교통혼잡도를 예측하고자 하였고, AIS 빅데이터를 통해 선박별항적을 분석 및 분류하고자 하였다. 장기적 관점에서 PORT-MIS 선박입출항현황 데이터(호출번호, 입항일시, 출항일시, 전출항지, 차항지, 계선지)를 과거 AIS 빅데이터와 연결시켜 과거 항적 중 가장 가까운 항적을 찾고자 하였다. 그리고 당시 소요 시간을 반영하여 12개의 시간대별로 어느 시점에 어느 위치 구간에 선박들이 놓이게 될지 예측하였고, 특히 입출항 시기의 적절성에 핵심이 되는 13개로 모델링된 영역에 몇 개의 선박들이 항로를 지나는지에 따라 혼잡도(원활, 혼잡, 정체)를 구분하였다. 또한, 본 연구에서는 단기적 관점에서 실제 AIS가 수신된 후에도 유사한 항적을 검사해가며 혼잡도를 예측하고자 하였고, 이러한 장단기적 혼잡도 예측을 통해 미래 자율운항선입출항 지원 서비스의 안전과 그 적절성을 제공하고자 하였다.

  • PDF