• 제목/요약/키워드: 데이터 군집화

검색결과 566건 처리시간 0.026초

시각적 특징을 기반한 샷 클러스터링을 통한 비디오 씬 탐지 기법 (Video Scene Detection using Shot Clustering based on Visual Features)

  • 신동욱;김태환;최중민
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.47-60
    • /
    • 2012
  • 비디오 데이터는 구조화되지 않은 복합 데이터의 형태를 지닌다. 이러한 비디오 데이터의 효율적인 관리 및 검색을 위한 비디오 데이터 구조화의 중요성이 대두되면서 콘텐츠 내 시각적 특징을 기반으로 비디오 씬(scene)을 탐지하고자 하는 연구가 활발히 진행되었다. 기존의 연구들은 주로 색상 정보만을 이용하여 샷(shot) 간의 유사도 평가를 기반한 클러스터링(clustering)을 통해 비디오 씬을 탐지하고자 하였다. 하지만 비디오 데이터의 색상 정보는 노이즈(noise)를 포함하고, 특정 사물의 개입 등으로 인해 급격하게 변화하기 때문에 색상만을 특징으로 고려할 경우, 비디오 샷 혹은 씬에 대한 올바른 식별과 디졸브(dissolve), 페이드(fade), 와이프(wipe)와 같은 화면의 점진적인 전환(gradual transitions) 탐지는 어렵다. 이러한 문제점을 해결하기 위해, 본 논문에서는 프레임(frame)의 컬러 히스토그램과 코너 에지, 그리고 객체 컬러 히스토그램에 해당하는 시각적 특징을 기반으로 동일한 이벤트를 구성하는 의미적으로 유사한 샷의 클러스터링을 통해 비디오 씬을 탐지하는 방법(Scene Detector by using Color histogram, corner Edge and Object color histogram, SDCEO)을 제안한다. SDCEO는 샷 바운더리 식별을 위해 컬러 히스토그램 분석 단계에서 각 프레임의 컬러 히스토그램 정보를 이용하여 1차적으로 연관성 있는 연속된 프레임을 샷 바운더리로 병합한 후, 코너 에지 분석 단계에서 병합된 샷 내 처음과 마지막 프레임의 코너 에지 특징 비교를 통하여 샷 바운더리를 정제하여 최종 샷을 식별한다. 키프레임 추출 단계에서는 샷 내 프레임간 유사도 비교를 통해 모든 프레임과 가장 유사한 프레임을 각 샷을 대표하는 키프레임으로 추출한다. 그 후, 비디오 씬 탐지를 위해, 컬러 히스토그램과 객체 컬러 히스토 그램에 해당하는 프레임의 시각적 특징을 기반으로 상향식 계층 클러스터링 방법을 이용하여 의미적인 연관성을 지니는 샷의 군집화를 통해 비디오 씬을 탐지하는 방법이다. 본 논문에서는 SDCEO의 프로토 타입을 구축하고 3개의 비디오 데이터를 이용한 실험을 통하여 SDCEO의 효율성을 평가하였고 샷 바운더리 식별의 성능의 정확도는 평균 93.3%, 비디오 씬 탐지 성능의 정확도는 평균 83.3%로 만족할만한 성능을 보였다.

시맨틱 웹에서 개인화된 선호도를 이용한 의상 코디 시스템 개발 (Development of Apparel Coordination System Using Personalized Preference on Semantic Web)

  • 은채수;조동주;이정현;정경용
    • 한국콘텐츠학회논문지
    • /
    • 제7권4호
    • /
    • pp.66-73
    • /
    • 2007
  • 인터넷과 웹이 일상생활의 일부가 되면서 온라인상에는 방대한 양의 정보가 쌓이게 되었다. 이러한 흐름 속에서 정보의 양은 급속도로 늘어나는 현상을 보이며, 개인화를 통해 수많은 데이터들 사이에서 원하는 정보를 자동으로 찾아내는 기술의 중요성이 부각되고 있다. 현재 사용하는 필터링 중에서 콘텐츠를 중심으로 분석하여 사용자에게 추천하는 기법인 내용기반 필터링과 사용자와 유사한 선호도를 가진 사용자 군집의 선호도에 따라 새로운 사용자가 관심을 가질 것으로 생각되는 콘텐츠를 추천해 주는 기법인 협력적 필터링 기법이 있다. 그러나 협력적 필터링 방법으로 추천 받기 위해서는 특정 수 이상의 아이템에 대한 평가가 필요하며, 또한 비슷한 성향을 가지는 일부 사용자 정보에 근거하여 추천함으로써 나머지 사용자 정보를 무시하는 경향이 있다. 따라서 특정 수 이상의 선호정보가 준비되지 않은 사용자들에 대해서도 적절한 추천방법이 필요하다. 본 논문에서는 기존의 필터링들을 조합하고 좀 더 편리하게 정보를 공유하고 학습할 수 있는 시맨틱 웹에서 개인화된 선호도를 이용한 의상코디 시스템을 개발하였다. 이 시스템을 웹에서 제공한 결과 불필요한 검색시간이 줄어들고 사용자의 피드백을 통해 점차 만족도가 향상됨을 알 수 있었다.

RFM기법과 k-means 기법을 이용한 개인화 추천시스템의 개발 (Development of Personalized Recommendation System using RFM method and k-means Clustering)

  • 조영성;구미숙;류근호
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권6호
    • /
    • pp.163-172
    • /
    • 2012
  • 기존 추천시스템의 명시적((Explicit) 협력 필터링 방법은 실용화 되었으나 정확한 아이템의 속성이 반영되지 않는 문제와 희박성과 확장성 문제가 여전히 남아 있다. 본 논문에서는 실시간성과 민첩성이 요구되는 유비쿼터스 상거래에서 고객에게 번거로운 질의 응답 과정이 없이 묵시적인(Implicit) 방법을 이용하여 RFM(Recency, Frequency, Monetary)기법과 k-means 기법을 이용한 개인화 추천시스템을 제안한다. 구매 가능성이 높은 아이템을 추출하기 위해서 고객데이터와 구매이력 데이터를 기반으로 아이템의 속성 반영이 가능한 RFM기법과 k-means 클러스터링을 이용한다. 제안 방법으로 추천의 효율성이 높은 아이템 추천이 가능하도록 고객정보의 속성 변수의 특징 벡터가 적용된 클러스터링 작업과 군집내의 아이템 카테고리 선호도 계산 작업의 전처리를 수행한다. 성능평가를 위해 현업에서 사용하는 인터넷 화장품 아이템 쇼핑몰의 데이터를 기반으로 데이터 셋을 구성하여 기존 시스템과 비교 실험을 통해 성능을 평가하여 효용성과 타당성을 입증하였다.

세균성 이질의 탐색적 공간분석 (An Explorator Spatial Analysis of Shigellosis)

  • 박기호
    • 대한지리학회지
    • /
    • 제34권5호
    • /
    • pp.473-491
    • /
    • 1999
  • 세균성 이질은 국내 제1종 법정 전염병으로 분류되어 관리되고 있는 질환으로서 1998년 이후 그 발병 사례가 급속히 증가하고 있다. 본 연구는 1999년 3월 부산시 사상구에서 집단 발병한 세균성 이질을 대상으로 하여, 각 환자들의 발병 시점과 장소의 분포패턴에 대한 지리학적 고찰을 목적으로 한다. 환자분포의 특징적 공간패턴과 그들의 시계열적 확산 양상 등을 탐색하기 위한 방법론은 보건지리학과 지도학 및 공간통계학에 기반을 둔 공간분석기법을 중심으로 설정하였다. 분석자료는 해당 지역의 수치지형도, 지적도, 인구 센서스 자료를 포함한 GIS 데이터베이스로 구축되었다. 인구분포를 감안한 밀도구분도를 바탕으로 개별환자의 위치자료와 동 단위로 집계된 자료를 자료의 형태에 따라 분석기법을 달리하였으며, 환자 발생 밀도, 상대적 위험지수 등을 지도화하여 역학자료의 시각적 통계적 분석을 수행하였다. 환자분포의 공간적 중심위치와 분산의 변화 등 기술적 통계분석과 함께 제1차 공간속성을 커널추정법으로 찾아보았다. 이와 더불어 ‘공간적 의존성’과 관련된 제2차 공간속성은 K-함수와 시뮬레이션을 통해 분석하여 군집성 등이 통계적으로 확인되었다. 본 연구를 통해 역학조사시 GIS의 활용사례가 제시되었으며, 모집단 인구를 고려한 확률지도 작성 기법과 다양한 데이터 가시화 방법, 그리고 시계열별 발생 환자들의 지리적 변이를 분석 하는데 따르는 문제들이 논의되었다.

  • PDF

TYPE-2 퍼지 추론 구동형 RBF 신경 회로망 설계 및 최적화 (Design of Radial Basis Function Neural Network Driven to TYPE-2 Fuzzy Inference and Its Optimization)

  • 백진열;김웅기;오성권;김현기
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 학술대회 논문집 정보 및 제어부문
    • /
    • pp.247-248
    • /
    • 2008
  • 본 논문에서는 TYPE-2 퍼지 추론 기반의 RBF 뉴럴 네트워크(TYPE-2 Radial Basis Function Neural Network, T2RBFNN)를 설계하고 PSO(Particle Swarm Optimization) 알고리즘을 이용하여 모델의 파라미터를 동정한다. 제안된 모델의 은닉층은 TYPE-2 가우시안 활성 함수로 구성되며, 출력층은 Interval set 형태의 연결가중치를 갖는다. 여기에서 규칙 전반부 활성함수의 중심 선택은 C-means 클러스터링 알고리즘을 이용하고, 규칙 후반부 Interval set 형태의 연결가중치 결정에는 경사 하강법(Gradient descent method)을 이용한 오류 역전파 알고리즘을 사용하여 학습한다. 또한, 최적의 모델을 설계하기 위한 학습율 및 활성함수의 활성화 영역 결정에는 입자 군집 최적화(PSO; Particle Swarm Optimization) 알고리즘으로 동조한다. 마지막으로, 제안된 모델의 평가를 위하여 모의 데이터 집합(Synthetic dadaset)을 적용하고 근사화 및 일반화 능력에 대하여 토의한다.

  • PDF

한국프로야구에서 타자능력의 측정 (Measurements for hitting ability in the Korean pro-baseball)

  • 이장택
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권2호
    • /
    • pp.349-356
    • /
    • 2014
  • 타자들의 평가에 대한 불완전한 부분을 보완하기 위하여 세이버메트리션들이 세워놓은 기준들이 선수 평가에 중요한 잣대가 되고 있다. 하지만 평가지표들은 개수가 많고 형태가 일정하지 않아서 팬들을 혼동에 빠지게 한다. 본 연구에서는 대표적인 타자평가지표를 이용하여 지표들의 특성을 골고루 반영하는 주성분을 찾아보고 한국프로야구에 적합한 타자지표를 제안한다. 제안된 지표는 타자들의 능력을 그룹화하여 객관적으로 설명할 수 있기 때문에 선수들의 연봉을 합리적으로 결정할 수 있다.

인터넷 쇼핑몰을 위한 데이터마이닝 기반 개인별 상품추천방법론의 개발 (Development of a Personalized Recommendation Procedure Based on Data Mining Techniques for Internet Shopping Malls)

  • Kim, Jae-Kyeong;Ahn, Do-Hyun;Cho, Yoon-Ho
    • 지능정보연구
    • /
    • 제9권3호
    • /
    • pp.177-191
    • /
    • 2003
  • 상품추천시스템은 고객들에게 추천 상품 리스트를 만들어 고객들이 구매 가능성이 있는 상품을 쉽게 찾도록 도와주는 개인화 된 정보필터링 기술이다 협업 필터링(collaborative filtering)이 가장 성공적인 상품추천 기법으로 알려져 있으며 많이 이용되고 있다. 그러나, 인터넷 쇼핑몰에서 관리하는 상품과 고객의 수가 급속히 증가하면서 협업필터링에 기반 한 상품추천 시스템은 입력데이터의 희박성(Sparsity) 문제와 시스템 확장성(Scalability) 문제가 노출되고 있다. 따라서 본 연구에서는 협업필터링 기반 상품추천시스템의 상품추천 효과 및 성능을 개선하기 위해 웹 마이닝과 군집분석 기법에 기반을 둔 개인별 상품추천 방법론을 개발한다. 또한 실제 인터넷 쇼핑몰에서 개인별로 상품을 추천할 때 개발된 상품추천 방법론을 적용하여 다른 기존 상품추천 방법론과 실험적으로 비교함으로써 개발 방법론의 효과 및 성능을 검증한다.

  • PDF

병리특이적 형태분석 기법을 이용한 HRCT 영상에서의 새로운 봉와양폐 자동 분할 방법 (A Novel Method for Automated Honeycomb Segmentation in HRCT Using Pathology-specific Morphological Analysis)

  • 김영재;김태윤;이승현;김광기;김종효
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제1권2호
    • /
    • pp.109-114
    • /
    • 2012
  • 봉와양폐(Honeycomb)는 직경 2~10mm 정도의 크기가 같지 않은 낭포(Cyst)가 경계가 명확한 섬유질(Fibrosis)로 이루어진 벽에 둘러싸여 밀집된 형태로 이루어져 있다. 봉와양폐가 발견될 경우 급성악화의 발생 빈도가 높으며 따라서 봉와양폐의 관찰 여부와 측정은 임상에서 중요한 지표가 된다. 따라서 본 논문에서는 봉와양폐 영역의 정량적 측정을 위하여 봉와양폐의 특징을 이용한 형태학적 기법과 군집성 평가 기법을 통해 자동 구획 방법을 제안하였다. 첫 번째로 영상의 잡음을 제거하기 위하여 가우시안 필터링을 적용하고, 모폴로지 기법 중 팽창 기법을 이용하여 폐 영역을 구획하였다. 두번째로, 주변 8방향 검사를 통해 봉와양폐를 구성하는 낭포의 후보군을 찾고, 영역 확장과 외곽선 검사를 통해 비 낭포들을 제거하였다. 마지막으로 군집화 검사를 통해 최종적으로 봉와양폐를 구획하였다. 제안한 방법은 80장의 고해상도 컴퓨터 단층촬영 영상에서 실험한 결과, 89.4%의 민감도와, 72.2%의 양성 예측도를 보였다.

현장 및 원격 초분광 정보 계측을 통한 하천 수변공간 재료 구분 (Field and remote acquisition of hyperspectral information for classification of riverside area materials)

  • 신재현;성호제;이동섭
    • 한국수자원학회논문집
    • /
    • 제54권12호
    • /
    • pp.1265-1274
    • /
    • 2021
  • 본 연구에서는 남한강에서 드론에 탑재된 초분광 센서를 활용하여 수변공간을 측정한 후, 초분광 분석을 통하여 재료를 구분하였다. 식생, 콘크리트, 흙 등의 재료를 대상으로 구분하였으며, 각각 재료의 고유한 분광반사 곡선의 특성을 비교 및 분석하였다. 드론으로 측정한 초분광 자료를 검증하기 위하여 지상분광측정기를 사용하여 현장조사를 실시하고 각 재료를 비교하였다. 분석 비교 결과 각 재료별로 고유한 유형의 파장대가 발생하는 것을 확인하였고 드론으로 수행한 원격 탐사 결과가 지상분광측정 결과와 유사하다는 결론을 내릴 수 있었다. 수변 공간의 분류를 위하여 K-means 군집화 기법과 SVM 분류 기법을 활용하여 측정 구역의 공간 분류를 수행할 수 있었다. 비교 결과, 지도학습인 SVM 분류 기법의 수변공간 분류가 비지도학습인 K-means 기법과 비교하여 상세한 구분이 수행되었음을 확인할 수 있었다. 이와 같이 분류 및 군집 분석 기법을 활용하여 각 수변공간 재료의 고유 분광 특성을 활용하여 측정되는 드론탑재 초분광 이미지의 각 데이터를 분류할 수 있게 되었다.

[논문철회]지표변위계를 활용한 비탈면 안정성 예측 ([Retracted]Analysis of Slope Safety by Tension Wire Data)

  • 이석영;장서용;김태수;한희수
    • 한국지반환경공학회 논문집
    • /
    • 제16권4호
    • /
    • pp.5-12
    • /
    • 2015
  • 사면붕괴의 위험성이 있는 다양한 실계측 데이터들이 토목기술자들에게 주어졌지만 이를 해석, 가공 후 실시간 사면거동양상을 분석하고 사면안정에 대한 결론을 유도하는 일은 결코 쉬운 일이 아니다. 최근 많은 연구기관들이 실시간 계측시스템을 위험 사면 현장에 설치하고 이를 계측하고 있으나, 대부분이 하드웨어 시스템의 설치에 초점을 맞추고 있어 이들 계측시스템에서 구한 실시간 계측자료를 해석하는 소프트웨어는 상대적으로 약하다고 할 수 있다. 그러므로 이 연구는 시간에 따라 변위가 지속적으로 증가하는 사면거동에 대한 계측자료들이 서로 어떤 상호관련성이 있고 군집화되는지를 보여주고자 하는 데 목적이 있다. 실시간 계측자료들을 분류함에 있어 저자들은 세 가지의 수학적 개념을 사용하고자 한다. 즉 평균변위차지수($AD_{i,j}$), 평균상대변위차($\overline{RD}_{i,j}$) 및 평균상대좌표시스템($\overline{RD}$, AD)을 사용하고자 한다. 이 세 가지 개념은 통계학적 방법 및 사면파괴거동에 토대를 두고 있다. 그러므로 이 방법들은 파괴거동을 일으키는 같은 대상 사면영역의 군집특성을 보여준다.