• 제목/요약/키워드: 모델링결과데이터

검색결과 1,370건 처리시간 0.033초

빅 데이터 처리를 위한 적응적 사용자 및 토픽 모델링 기반 자동 TV 프로그램 추천시스템 (Adaptive User and Topic Modeling based Automatic TV Recommender System for Big Data Processing)

  • 김은희;김문철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.195-198
    • /
    • 2015
  • 최근 TV 서비스의 가입자 및 TV 프로그램 콘텐츠의 급격한 증가에 따라 빅데이터 처리에 적합한 추천 시스템의 필요성이 증가하고 있다. 본 논문은 사용자들의 간접 평가 데이터 기반의 추천 시스템 디자인 시, 누적된 사용자의 과거 이용내역 데이터를 저장하지 않고 새로 생성된 사용자 이용내역 데이터를 학습하는 효율적인 알고리즘이면서, 시간 흐름에 따라 사용자들의 선호도 변화 및 TV 프로그램 스케줄 변화의 추적이 가능한 토픽 모델링 기반의 알고리즘을 제안한다. 빅데이터 처리를 위해서는 분산처리 형태의 알고리즘을 피할 수 없는데, 기존의 연구들 중 토픽 모델링 기반의 추론 알고리즘의 병렬분산처리 과정 중에 핵심이 되는 부분은 많은 데이터를 여러 대의 기계에 나누어 병렬분산 학습하면서 전역변수 데이터를 동기화하는 부분이다. 그런데, 이러한 전역데이터 동기화 기술에 있어, 여러 대의 컴퓨터를 병렬분산처리하기위한 하둡 기반의 시스템 및 서버-클라이언트간의 중재, 고장 감내 시스템 등을 모두 고려한 알고리즘들이 제안되어 왔으나, 네트워크 대역폭 한계로 인해 데이터 증가에 따른 동기화 시간 지연은 피할 수 없는 부분이다. 이에, 본 논문에서는 빅데이터 처리를 위해 사용자들을 클러스터링하고, 클러스터별 제안 알고리즘으로 전역데이터 동기화를 수행한 것과 지역 데이터를 활용하여 추론 연산한 결과, 클러스터별 지역별 TV프로그램 시청 토큰 별 은닉토픽 할당 테이블을 유지할 때 추천 성능이 더욱 향상되어 나오는 결과를 확인하여, 제안된 구조의 추천 시스템 디자인의 효율성과 합리성을 확인할 수 있었다.

  • PDF

해양 모델 결과에 대한 GIS 데이터 변환 및 가시화 연구 (GIS data conversion and visualization for Ocean model)

  • 장원석;박한산;오세웅;박종민;서상현
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2007년도 추계학술대회 및 제23회 정기총회
    • /
    • pp.129-130
    • /
    • 2007
  • 해양 분야에서는 현재 해양 생태계 모델이나 수질모델 그리고 해수 유동모델과 같은 다양한 모델들이 사용되어 지고 있으며 이러한 해양 모델들의 결과 값은 사용자가 한눈에 알아보기 어려운 수치 데이터의 나열로서 출력되어 지고 있다. 본 논문에서는 현재의 분석하기 어려운 모델링결과 데이터를 보다 효과적으로 분석하기 위해 GIS 의 기법을 적용하여 이 데이터를 보다 직관적이고 가시적인 형태로 변환하고 표현하는 기술을 개발, 적용하였다.

  • PDF

실감 모델링을 위한 반짝이는 특성을 지닌 물체에서 색상선 추출 방법 연구 (Estimation of Color Lines from the Specular Object for Immersive Modeling)

  • 박정욱;유현진;이관행
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.1283-1288
    • /
    • 2006
  • 실감모델링(Immersive modeling)이란 모델링하는 사람이 물체의 특성을 고려하여 오감을 활용하여 모델링하는 것을 의미한다. 실감모델링을 위한 오감 중에서 시각은 모델링하는 사람에게 가장 영향을 많이 주기 때문에 실제와 같은 색상과 형상을 생성하는 것이 중요하다. 그러나 가상현실을 위한 데이터를 실시간으로 다루기 위해 많은 데이터를 사용할 수 없고 처리 과정이 단순해야 하기 때문에 시각데이터를 획득하는 과정에도 이를 고려해야 한다. 그 중에서 반짝이는 특성을 가진 물체의 색을 정확히 표현하기 위한 방법으로 색상선(color line)을 사용한다. 색상선은 반짝이는 특성의 표면의 색을 이색성반사 모델(dichromatic reflection model)로 간주하면 색 특성을 표현하는 선이 생성되게 된다. 본 연구는 반짝이는 물체로부터 색상선을 추출하기 위한 방법으로 노출 시간이 다른 여러 장의 이미지로부터 색상을 추출하는 방법을 제안한다. 노출 시간이 다른 이미지를 사용함으로써 한 장에 의해 분류하기 어려운 색상도 분류 가능하고 하이라이트가 발생하여 색상이 왜곡된 경우도 본래 색이 어떤 색상인지 추정되기 때문에 정확한 색상 추출이 된다. 본 연구에서는 3차원 측정 장비를 이용하여 3차원 형상과 색상이 동시 추출된 모델을 이용하여 렌더링된 결과와 제안된 방법으로 추출된 색상을 적용하여 렌더링된 결과를 비교할 것이다.

  • PDF

데이터 모델링을 위한 업무 분석 방법의 개선에 관한 연구 (A Study on the Improvement of Business analysis method for Data Modeling)

  • 박선이;무맹;여정모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 춘계학술발표대회
    • /
    • pp.508-511
    • /
    • 2016
  • IT 프로젝트 수행하는 과정 중 가장 많은 시간을 투자해야 하는 부분은 요구사항 분석이다. 소프트웨어 공학에서 요구사항 분석 방법이 체계화되어 실무에서 많이 활용하고 있으며, 분석 결과로 프로그램 개발뿐만 아니라 정보시스템 관련 모든 분야에서 활용할 수 있다. 하지만 소프트웨어 중심의 요구사항 분석방법은 데이터베이스 설계에 적용하기에는 불필요한 정보가 포함 되어 잘못된 데이터 모델로 설계될 수 있다. 또한, 데이터 중심으로 필요한 요구사항을 분석하는 방법론이 없는 실정이기에 선행 연구에서 데이터 모델링을 위한 업무 요구사항 방법을 제시하였다. 선행 연구 방법은 실제로 적용할 때 절차가 복잡하고 분석에 어려움이 있어, 본 연구는 선행 연구방법의 절차를 개선하고 적용하기 쉬운 방법으로 연구하여 제시하였다. 제안한 방법을 검증하기 위해 선행 연구방법과 동일한 업무요구사항명세서를 적용하여 단계별로 업무 분석 결과를 비교하였다. 그 결과 선행 연구방법보다 절차가 간소화되어 향상된 결과를 얻을 수 있었다. 분석한 결과를 바탕으로 향후 데이터 모델링 단계에 대해 계속 연구할 예정이다.

멀티센서 데이터를 이용한 건물의 3차원 모델링 기법 개발 및 평가 (Developing and Valuating 3D Building Models Based on Multi Sensor Data (LiDAR, Digital Image and Digital Map))

  • 위광재;김은영;윤홍식;강인구
    • 한국측량학회지
    • /
    • 제25권1호
    • /
    • pp.19-30
    • /
    • 2007
  • 현실세계를 컴퓨터에 재현하기 위해서는 건물에 대한 3D 모델링 작업이 가장 필수적인 작업이다. 건물에 대한 3차원 모델링의 방법으로는 항공레이저측량을 통하여 획득된 고밀도 3차원 점 데이터를 기반으로 하여 1:1,000 수치지형도의 건물 레이어를 이용하는 방법과 LiDAR 데이터와 함께 취득되는 디지털 영상을 이용하는 방법으로 구분할 수 있는데 본 연구에서는 각각의 방법에 대하여 1:1,000 수치지형도 1도엽을 대상으로 건물에 대한 3차원 모델링 작업을 실시하여 작업방법을 개발하였으며, 효율성, 정확도 및 재현성를 정량적으로 평가 분석하였다. 연구 결과, 단순 건물의 경우에는 수치지형도와 LiDAR 데이터를 이용하는 것이 효율적인 것으로 나타났으며, 모양이 다양하고 복잡한 형태의 건물의 경우는 LiDAR 데이터와 디지털 영상을 이용하여 모델링 하는 것이 효과적임을 알 수 있었다. 또한 모델링된 정확도 평가 결과, LiDAR 데이터와 디지털 영상을 이용하여 건물에 대하여 3차원 모델링후, 수치지형도와 비교하였을 때, 수평위치가 ${\pm}50cm$ 이내인 것으로 나타났다. 따라서 건물에 대한 3차원 모델링 작업은 LiDAR 데이터와 수치지형도의 건물 레이어을 이용하여 효과적으로 수행 할 수 있을 것으로 판단이 되며 구축된 3차원 건물 모델링 데이터는 3D GIS. U-City, Telematics, Navigation, 가상현실 및 게임 등 다양한 분야의 디지털 콘텐츠로 활용할 수 있을 것이다.

분산 기반의 Gradient Based Fuzzy c-means 에 의한 MPEG VBR 비디오 데이터의 모델링과 분류 (Modeling and Classification of MPEG VBR Video Data using Gradient-based Fuzzy c_means with Divergence Measure)

  • 박동철;김봉주
    • 한국통신학회논문지
    • /
    • 제29권7C호
    • /
    • pp.931-936
    • /
    • 2004
  • GPDF(Gaussian Probability Density Function)을 효율적으로 군집화할 수 있는 GBFCM(DM)(Gradient Based Fuzzy c_means with Divergence Measure) 알고리즘이 본 논문에서 제안되었다. 제안된 GBFCM(DM)은 데이터 사이의 거리 척도로 발산거리(Divergence measure)를 적용한 새로운 형태의 FCM으로, 기존의 GBFCM에 기반을 두는 알고리즘이다. 본 논문에서는 MPEG VBR 비디오 데이터를 GPDF형태의 다차원 데이터로 변형시켜 모델링 하고, 모델링 한 MPEG VBR 비디오 데이터를 영화 또는 스포츠 형태로 분류하는데 응용되었다. 본 논문의 실험에서 기존의 FCM, GBFCM과 새롭게 제안된 GBFCM(DM)을 사용하여 모델링 및 분류결과를 상호 비교하였다. 비교결과 GBFCM(DM)이 오분류율의 기준에서 기존의 다른 알고리즘들에 비해 약 5∼l5%의 향상된 성능을 보였다.

HyGIS와 수문모형의 연계 시스템 개발을 위한 데이터 모델링에 관한 연구 (Data Modeling to Connect HyGIS with Hydrologic Model)

  • 김경탁;최윤석
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2006년도 학술발표회 논문집
    • /
    • pp.874-878
    • /
    • 2006
  • 수자원 분야에서 이용하고 있는 모형을 구동하기 위해서는 대상 지역의 지형특성과 시계열 자료 및 비공간적 매개변수 등의 많은 정보가 필요하다. 이러한 자료들은 다양한 과정을 거쳐서 모형에 입력되며, 모의대상이 복잡한 구조를 가지고 있거나 모형의 구동조건이 변할 경우, 모형의 구동과 결과의 관리를 위해서는 더욱 많은 노력이 필요하게 된다. 따라서 이러한 자료들을 효과적으로 관리하고 운용하는 것은 모형구동의 효율성과 객관성을 유지하는데 매우 중요한 요소가 될 수 있다. 이를 위하여 국내 기술로 개발된 GIS 기반의 수자원시스템인 HyGIS(Hydro Geographic Information System)와 수자원 모형을 연계하여 운영할 수 있는 시스템을 개발하고자 하며, 이를 HyGIS-Model이라고 한다. 본 연구에서는 HyGIS의 시공간 데이터 모델을 소개하고, HyGIS-Model 중 HyGIS와 SWAT2000 모형이 연계된 시스템(HyGIS-SWAT)을 개발하기 위한 데이터 모델링에 대해서 기술하고자 한다. 연구결과 HyGIS 데이터 모델과 HyGIS-Model 통합시스템 운영 표준은 HyGIS-SWAT 데이터 모델링과 시스템 설계에 효과적으로 적용될 수 있었다. 이를 통하여 GIS와 수자원 모형의 연계 시스템을 개발하기 위한 시스템 설계에 대한 기술을 확보할 수 있었으며, GIS를 이용한 수자원 모형의 입력자료의 생성, 운영 및 모형 구동 결과의 관리에 대한 표준적 절차를 수립할 수 있었다.

  • PDF

k-NN 기법을 이용한 학습자 데이터의 노이즈 선별 방법 (Noise-Reduction of Student's Learning Data using k-NN Method)

  • 윤태복;이지형;정영모;차현진;박선희;김용세
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 추계학술대회 학술발표 논문집 제16권 제2호
    • /
    • pp.135-138
    • /
    • 2006
  • 사용자 모델링을 위해서는 사용자의 성향 및 행위 등의 다양한 정보를 수집하여 분석에 이용한다. 하지만 사용자(인간)로 부터 얻은 데이터는 기계나 환경에서 수집된 데이터 보다 패턴을 찾기 힘들어 모델링하기 어렵다. 그 이유는 사용자는 사용자의 현재 상태와 상황에 따라 다양한 결과를 보이며, 일관성을 유지 하지 않는 경우가 있기 때문이다. 사용자 모델링을 위해서는 분산되어 있는 데이터에서 노이즈를 선별하고 연관성 있는 데이터를 분류할 수 있는 기술이 필요하다. 본 논문은 사용자로 부터 수집된 데이터를 k-NN(Nearest Neighbor) 기법을 이용하여 노이즈를 선별한다. 노이즈가 제거된 데이터는 의사결정나무(Decision Tree)방법을 이용하여 학습하였고, 노이즈가 분류되기 전과 비교 분석 하였다. 실험에서는 홈 인테리어 학습 컨텐츠인 DOLLS-HI를 이용하여 수집된 학습자의 데이터를 이용하였고, 생성된 학습자 모델링의 신뢰도가 높아지는 것을 확인하였다.

  • PDF

성능 향상을 위한 데이터 모델링 방법 (Data Modeling Methods for Performance Enhancement)

  • 김수연;이상호;서의호
    • 지능정보연구
    • /
    • 제4권2호
    • /
    • pp.85-102
    • /
    • 1998
  • 현재의 시스템 개발 프로젝트에서 대부분의 기업은 관계형 데이터베이스를 목표 환경으로 채택하고 있지만 설계자들은 기존의 파일 시스템이나 계층형 데이터베이스의 설계 방식을 관계형 데이터베이스 설계 시에도 그대로 적용하려는 경향이 있다. 또한 모델링 시 시스템 특성과는 무관한 업무 중심의 엔티티 관계도를 작성함으로써 구현 시에 모델을 상당 부분 변경하거나 추가해야 하는 오버헤드가 발생하기도 한다. 관계형 데이터베이스의 경우 구조를 어떻게 설계하느냐에 따라 효율의 차이가 크게 나타나므로 성능 향상을 위한 데이터 모델링 기법이 중요한 이슈로 등장하게 되었다. 본 논문에서는 관계형 데이터베이스 성능과 관련하여 이미 연구되고 실험된 내용을 여러 문헌과 자료를 참고하여 조사하였다. 성능 항상을 위한 모델링 기법들을 테이블, 릴레이션쉽, 인덱스 등의 객체별로 분류하여 정리하였고, 조사된 내용 중에서 몇 가지를 선택하여 Oracle DBMS 환경에서 실제로 실험을 실시하였다. 대용량 테이블에 대한 질의를 수행하여 소요되는 시간을 측정하고 그 결과를 분석하였다. 실험을 통해 검증된 결과를 토대로 제안되는 모델링 방법을 제시한다.

  • PDF

클러스터 생성을 이용한 자기구성 퍼지 모델링 (Self-Organizing Fuzzy Modeling using Creation of Clusters)

  • 고택범
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 춘계학술대회 및 임시총회
    • /
    • pp.245-251
    • /
    • 2002
  • 본 논문에서는 상대적으로 큰 퍼지 엔트로피를 갖는 입력-출력 데이터 집단에 다중 회귀 분석을 적용하여 다차원 평면 클러스터를 생성하고, 이 클러스터를 새로운 퍼지 모델의 규칙으로 추가한 후 퍼지 모델 파라미터의 개략 동조와 정밀 동조를 수행하는 자기구성 퍼지 모델링을 제안한다. Weighted recursive least squared 알고리즘과 fuzzy C-regression model 클러스터링에 의해 퍼지 모델의 파라미터를 개략적으로 동조한 후 gradient descent 알고리즘에 의해 파라미터를 정밀 동조하면서 감수분열 유전 알고리즘을 이용하여 최적의 학습률을 탐색한다. 그리고 자기 구성 퍼지 모델링 기법을 이용하여 Box-Jenkins의 가스로 데이터, 다변수비선형 정적 함수의 데이터와 하수 처리 활성오니 공정의 모델링을 수행하고, 기존의 방법에 의한 모델링 결과와 비교하여 그 성능을 입증한다.

  • PDF