• 제목/요약/키워드: 빅데이터 기반 모델링

검색결과 103건 처리시간 0.026초

빅 데이터 처리를 위한 적응적 사용자 및 토픽 모델링 기반 자동 TV 프로그램 추천시스템 (Adaptive User and Topic Modeling based Automatic TV Recommender System for Big Data Processing)

  • 김은희;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.195-198
    • /
    • 2015
  • 최근 TV 서비스의 가입자 및 TV 프로그램 콘텐츠의 급격한 증가에 따라 빅데이터 처리에 적합한 추천 시스템의 필요성이 증가하고 있다. 본 논문은 사용자들의 간접 평가 데이터 기반의 추천 시스템 디자인 시, 누적된 사용자의 과거 이용내역 데이터를 저장하지 않고 새로 생성된 사용자 이용내역 데이터를 학습하는 효율적인 알고리즘이면서, 시간 흐름에 따라 사용자들의 선호도 변화 및 TV 프로그램 스케줄 변화의 추적이 가능한 토픽 모델링 기반의 알고리즘을 제안한다. 빅데이터 처리를 위해서는 분산처리 형태의 알고리즘을 피할 수 없는데, 기존의 연구들 중 토픽 모델링 기반의 추론 알고리즘의 병렬분산처리 과정 중에 핵심이 되는 부분은 많은 데이터를 여러 대의 기계에 나누어 병렬분산 학습하면서 전역변수 데이터를 동기화하는 부분이다. 그런데, 이러한 전역데이터 동기화 기술에 있어, 여러 대의 컴퓨터를 병렬분산처리하기위한 하둡 기반의 시스템 및 서버-클라이언트간의 중재, 고장 감내 시스템 등을 모두 고려한 알고리즘들이 제안되어 왔으나, 네트워크 대역폭 한계로 인해 데이터 증가에 따른 동기화 시간 지연은 피할 수 없는 부분이다. 이에, 본 논문에서는 빅데이터 처리를 위해 사용자들을 클러스터링하고, 클러스터별 제안 알고리즘으로 전역데이터 동기화를 수행한 것과 지역 데이터를 활용하여 추론 연산한 결과, 클러스터별 지역별 TV프로그램 시청 토큰 별 은닉토픽 할당 테이블을 유지할 때 추천 성능이 더욱 향상되어 나오는 결과를 확인하여, 제안된 구조의 추천 시스템 디자인의 효율성과 합리성을 확인할 수 있었다.

  • PDF

사물인터넷기반 라이프케어 빅데이터 센싱기술

  • 조위덕;최선탁;백재순;민명기;이영권;이규필;박경찬;이종익
    • 정보와 통신
    • /
    • 제32권11호
    • /
    • pp.21-31
    • /
    • 2015
  • 현대 사회에서의 삶의 모습이 다양해짐에 따라 생활습관이 다양해지고 잘못된 생활습관으로 인한 생활습관병에 대한 관심이 높아지고 있다. 본 논문에서는 사물인터넷 및 빅데이터와 같은 IT기술을 통해 사용자의 다양한 생활습관을 추적할 수 있는 방법과 그 응용 기술에 대해서 소개하고자 한다. 이러한 생활습관 추적 및 분석 기술은 다양한 사용자의 요구에 능동적으로 대처할 수 있으며 노약자나 장애인, 생활습관병 환자 등 특수계층의 건강 예측, 질병 관리 분야에서 실효성을 가질 수 있다. 특히 본 논문에서는 라이프케어 서비스를 위한 사용자 센싱 기술에 초점을 두고, 낮 시간의 활동과, 밤 시간의 수면 및 위치 기반 기술, 빅데이터 플랫폼, 스마트 홈 패턴 모델링 기술에 대해서 소개한다.

계층적 LOD 개발 환경 구축 및 의료 정보 적용 (Construction of Hierarchical LOD Development Environment and Its Application of Medical Information)

  • 문희경
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.432-433
    • /
    • 2017
  • 최근 ICT 기술과 의료 빅데이터를 활용한 다양한 연구가 활발하게 진행되고 있다. 이질적인 의료데이터의 공유와 확산을 위해 표준화 데이터 모델로 온톨로지 기반의 Linked Open Data가 대안으로 급부상하고 있다. 특히 의료 빅데이터의 분석을 위한 데이터 셋은 프로토콜화하기 어려운 문제점을 갖고 있다. 본 논문에서는 이러한 문제점을 해결하기 개발된 계층적 LOD 개발 환경 시스템을 기반으로 의료정보를 적용하기 위한 모델링에 중점을 두고자 한다. 본 연구는 의료 빅데이터의 검색과 분석연구 분야에 큰 영향을 줄 것으로 기대하고 있다.

K-평균 군집을 이용한 마이크로타겟팅을 위한 SNS 빅데이터 활용 모델링에 관한 연구 (A Study on the Application Modeling of SNS Big-data for a Micro-Targeting using K-Means Clustering)

  • 송재오;이상문
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2015년도 제51차 동계학술대회논문집 23권1호
    • /
    • pp.321-324
    • /
    • 2015
  • 본 논문에서는 SNS에 존재하는 특정 제품과 브랜드 또는 기업에 대한 평가, 의견, 느낌, 사용 후기 등의 소비자 생각을 수집하여 기업에서 향후 신제품 개발이나 시장 진출 및 확대 등의 경영활동에 활용할 수 있도록 SNS 빅데이터를 문석하고, 이를 활용하여 보다 소집단화 되고 개인화 되어가는 Micro-Trend 중심의 마케팅 활동을 할 수 있는 Micro-Targeting 관련 분석 정보를 제공 모델링하는 것을 제안한다. 본 연구에서는 SNS 데이터의 수집, 저장, 분석에 대한 내용을 다루고 있으며, 특히 마이크로타겟팅을 위한 정보를 머하웃(Mahout)의 유클리드 거리 기반의 유사도와 K-평균 군집 알고리즘을 활용하여 구현하고자 하였다.

  • PDF

교량 모니터링 빅데이터를 이용한 광안대교의 교통량 의존 변위 추정 모델 (Traffic Volume Dependent Displacement Estimation Model for Gwangan Bridge Using Monitoring Big Data)

  • 박지현;신성우;김수용
    • 대한토목학회논문집
    • /
    • 제38권2호
    • /
    • pp.183-191
    • /
    • 2018
  • 본 연구에서는 차종별 교통량 데이터와 연직 변위 데이터의 상관관계를 바탕으로 광안대교의 차종별 교통량 데이터를 이용한 연직 변위 추정 모델을 개발하였다. 추정 모델의 개발 과정에서 구조화 회귀 분석에 기반한 모델링 방법과 주성분 분석법에 기반한 모델링 방법이 적용되었으며, 각각의 방법으로 개발된 모델의 변위 추정 성능을 비교 분석하였다. 개발된 모델을 이용하여 추정된 변위는 실측 변위와 유사한 것으로 분석되었으며, 이로부터 차종별 교통량 데이터를 광안대교의 교통량 의존 변위 추정에 적용 가능한 것을 알 수 있었다. 또한, 구조화 회귀 분석에 기반한 모델과 주성분 분석에 기반한 모델의 변위 추정 성능은 상호간에 큰 차이가 없다는 것을 알 수 있었다. 결론적으로 본 연구에서 개발한 차종별 교통량 데이터를 이용한 연직 변위 추정 모델은, 광안대교의 교통하중에 따른 거동 분석 등에 유효하게 활용될 수 있을 것으로 사료된다.

교통 빅데이터 활용 시 개인 정보 보호를 위한 연합학습 기반의 경로 선택 모델링 (Federated Learning-based Route Choice Modeling for Preserving Driver's Privacy in Transportation Big Data Application)

  • 심지섭
    • 한국ITS학회 논문지
    • /
    • 제22권6호
    • /
    • pp.157-167
    • /
    • 2023
  • 본 연구에서는 분산 컴퓨팅 및 개별 디바이스 활용을 통해 개인 정보 보호에 특화된 학습방법인 연합학습 방법론을 기반으로, 모바일 내비게이션 애플리케이션에서 수집된 대규모의 운전자 데이터를 이용하여 경로 선택 예측 모델을 수립하는 방법에 대해 고찰한다. 경로 선택 모델링에서 활용될 수 있는 운전자 데이터의 전처리 및 분석 방법을 수립하고, 서포트벡터머신(SVM) 및 다층 퍼셉트론(MLP)과 같이 기존에 널리 활용되는 학습 방법과 연합학습 방법의 성능과 특성을 비교한다. 분석 결과 연합학습을 통한 모델 성능은 중앙 서버 기반의 모델과의 비교에서 예측 정확도 측면의 차이가 거의 없는 것으로 나타났으나, 개별 데이터가 충분히 확보되는 경우 연합학습 모델과 같은 개인화 모델의 성능이 개선될 수 있다는 점을 확인하였다. 연합학습 모델은 본 연구의 경로 선택 모델링 사례와 같이 모빌리티 부문의 데이터 프라이버시 문제가 중요한 분야에서 대규모 데이터 처리를 필요로 하는 경우에 그 활용 가치가 매우 높을 것으로 기대된다.

빅데이터 분석을 통한 유명인 모델의 광고효과 예측 모형 개발 (Development of a Prediction Model for Advertising Effects of Celebrity Models using Big data Analysis)

  • 김유나;한상필
    • 한국융합학회논문지
    • /
    • 제11권8호
    • /
    • pp.99-106
    • /
    • 2020
  • 본 연구는 소셜 빅데이터에 기반을 둔 유명인과 브랜드의 이미지 유사도가 광고효과를 예측할 수 있는 결정변수가 될 수 있는지를 파악하기 위해, 광고효과 예측모형을 생성하고 빅데이터 분석기법인 기계학습 방법을 통해 그 타당도를 검증하는 것을 목적으로 하였다. 이를 위해 SNS상의 키워드 네트워크 구조에 기반하여 유명인-브랜드 이미지 유사도를 정량화하고, 학습 데이터를 통해 이미지 유사도를 독립변수로, 광고효과 데이터를 종속변수로 하는 다중회귀모형을 반복 실시하여 광고효과 예측모형을 생성하였다. 이렇게 생성된 예측모형의 정확도를 판단하기 위해 예측 데이터에서 얻은 광고효과 예측값과 비교 기준으로서의 서베이값을 비교한 결과, 타당도를 판단하는 기준치인 75%의 분류 정확도를 보였으므로 본 광고효과 예측 모델링의 타당성은 확보된 것으로 입증되었다. 본 연구는 유명인-브랜드 이미지 유사성 구조를 소셜 네트워크 구조로 설명하고 그 효과를 기계학습을 통한 예측 모델링으로 검증하여 빅데이터 기반 모델링 연구에 새로운 방법론적 대안과 방향을 제시하였다.

공공연구성과 실용화를 위한 데이터 기반의 기술 포트폴리오 분석: 빅데이터 및 인공지능 분야를 중심으로 (Data-Driven Technology Portfolio Analysis for Commercialization of Public R&D Outcomes: Case Study of Big Data and Artificial Intelligence Fields)

  • 전은지;이채원;류제택
    • 한국빅데이터학회지
    • /
    • 제6권2호
    • /
    • pp.71-84
    • /
    • 2021
  • 빅데이터 및 인공지능 기술은 4차 산업혁명에 핵심적인 기술이나, 국내 중소·중견 기업의 빅데이터 분석 활용과 복합 인공지능 분야의 기술경쟁력 확보가 미흡한 상황이다. 따라서 빅데이터 및 인공지능 분야의 기술사업화를 통해 산업군 전반의 경쟁력을 강화하는 것이 중요하다. 본 연구에서는 기술 포트폴리오 분석을 통해 공공연구성과 실용화 우선순위를 평가하고자 한다. 우선 공공연구성과 정보에 대해 앙상블 기법을 적용한 딥러닝 모델을 사용하여 과제의 6T 분류 결측값을 개선하였다. 이후 6T 분야별 빅데이터 및 인공지능융합 분야를 대상으로 토픽 모델링을 진행하여 10개의 세부기술분야를 도출하였다. 세부기술분야별 기술사업화 가능성을 판단하기 위해 기술활동성과 기술효율성을 새롭게 정의하고 측정하였다. 두 축을 기반으로 포트폴리오를 4가지의 유형으로 구분하여 기술사업화 최우선 고려 대상, 장기 투자가 필요한 기술분야 등을 제안하였다. '영상 및 이미지 기반의 진단 기술'은 기술활동성 및 기술효율성이 높아 시장의 수요와 사업화 역량 모두 이상적인 수준으로 나타났다. 이처럼 체계적인 산업·기술시장 분석을 통해 공공연구성과 창출 기술의 활용을 활성화할 수 있으며 중소·중견으로의 효율적인 기술 이전 및 사업화 추진이 가능하다.

빅데이터 분석을 활용한 사용자 경험 평가 방법론 탐색 : 아마존 에코에 대한 온라인 리뷰 분석을 중심으로 (Exploration of User Experience Research Method with Big Data Analysis : Focusing on the Online Review Analysis of Echo)

  • 황해정;심혜린;최준호
    • 한국콘텐츠학회논문지
    • /
    • 제16권8호
    • /
    • pp.517-528
    • /
    • 2016
  • 이 연구는 이미 실생활에서 사용되고 있으나 이에 대한 실증적 사용자 경험 조사가 부족한 사물인터넷 기반 제품에 대한 새로운 사용자 경험 방법론을 탐색해보고자 진행되었다. 지금까지의 사용자 경험에 대한 연구가 주로 설문이나 관찰 방법 등을 통해 이루어져 온 것과 달리 본 연구에서는 사물인터넷 기반 제품 중 지능형 에이전트인 아마존 에코(Echo)를 대상으로 사용자들의 온라인 리뷰를 분석하는 빅데이터 분석 기법을 활용하여 사용자 경험을 살펴보았다. 토픽 모델링 분석 결과, 에코의 기능, 음성 인터랙션, 지속적인 기능 개선과 관련된 사용 경험 요인들이 도출되었다. 또한 회귀분석결과 지속적인 기능 개선이 만족도에 가장 큰 영향을 미치는 것으로 나타났다. 연구의 의의는 사용자 경험을 제고할 수 있는 지능형 사물인터넷 제품 연구방법으로서 빅데이터 분석방법론 활용 가능성을 제시한 점이다.

입출항 지원 서비스를 위한 AIS 빅데이터 기반 해상교통혼잡도 예측

  • 이서호;김세원;손준배;엄정온;이주향;김동함;윤상웅;김혜진
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2022년도 추계학술대회
    • /
    • pp.344-346
    • /
    • 2022
  • 최근 자율운항기술개발이 활발하게 이루어짐에 따라 자율운항선 실증이 증가하고 있으며, 또한 자율운항선의 효율적 운용 특히 운항의 안전성을 위해 입출항 시기의 적절성 또한 중요해지고 있다. 이에 해상교통혼잡도를 예측하고자 하였고, AIS 빅데이터를 통해 선박별항적을 분석 및 분류하고자 하였다. 장기적 관점에서 PORT-MIS 선박입출항현황 데이터(호출번호, 입항일시, 출항일시, 전출항지, 차항지, 계선지)를 과거 AIS 빅데이터와 연결시켜 과거 항적 중 가장 가까운 항적을 찾고자 하였다. 그리고 당시 소요 시간을 반영하여 12개의 시간대별로 어느 시점에 어느 위치 구간에 선박들이 놓이게 될지 예측하였고, 특히 입출항 시기의 적절성에 핵심이 되는 13개로 모델링된 영역에 몇 개의 선박들이 항로를 지나는지에 따라 혼잡도(원활, 혼잡, 정체)를 구분하였다. 또한, 본 연구에서는 단기적 관점에서 실제 AIS가 수신된 후에도 유사한 항적을 검사해가며 혼잡도를 예측하고자 하였고, 이러한 장단기적 혼잡도 예측을 통해 미래 자율운항선입출항 지원 서비스의 안전과 그 적절성을 제공하고자 하였다.

  • PDF