• 제목/요약/키워드: 패턴벡터추출

검색결과 185건 처리시간 0.028초

유사어 벡터 확장을 통한 XML태그의 유사성 검사 (Similarity checking between XML tags through expanding synonym vector)

  • 이정원;이혜수;이기호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권9호
    • /
    • pp.676-683
    • /
    • 2002
  • XML(extensible Markup Language)문서가 웹 문서의 표준으로 자리 매김 할 수 있는 가장 큰 성공요인은 사용자가 문서 타입을 기술할 수 있는 유연성(flexibility)이다. 그러나 XML의 유연성으로 야기되는 문제점은 동일한 의미를 표현하기 위해 XML문서 작성자마다 서로 다른 태그명과 구조를 사용한다는 점이다. 즉 서로 다른 태그 집합, 요소(element), 속성(attribute)에 대한 서로 다른 이름 또는 다른 문서 구조로 인해 다른 태그로 표현된 문서는 서로 다른 부류의 문서로 간주되기 쉽다. 따라서 본 논문은 XML태그에 내재된 의미 정보(semantic information)와 구조 정보(structured information)를 추출하여 의미적으로 최대한 유사한 동의어로 확장하고, XML문서의 확장된 태그간의 의미적 유사도를 비교 분석할 수 있는 개념 기반의 태그 패턴 매처(Tag Pattern Matcher)를 설계 구현하였다. 두 XML문서의 태그간의 의미적 유사도에 가중치를 부여하여 기존의 비구조적인(semi-structured) 문서를 위한 벡터 스페이스 모델(vector space model)을 확장함으로써 두 XML문서가 유사한지를 파악할 수 있다.

시퀀스 데이타베이스에서 타임 워핑을 지원하는 효과적인 유살 검색 기법 (An Effective Similarity Search Technique supporting Time Warping in Sequence Databases)

  • 김상욱;박상현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제28권4호
    • /
    • pp.643-654
    • /
    • 2001
  • 본 논문에서는 대형 시퀀스 데이타베이스에서 타임 워핑을 지원하는 유사 검색을 효과적으로 처리하는 방안에 관하여 논의한다 타임 워핑은 시퀀스의 길이가 서로 다른 경우에도 유사한 패턴을 갖는 시퀀스들을 찾을 수 있도록 해 준다. 타임 워핑 거리는 삼각형 부등식 성질을 만족하지 못하므로 기존의 기법들은 착오 기각(false dismissal) 없이 다차원인덱스를 사용할 수 없었다. 이러한 기법들은 전체 데이타베이스를 스캔해야 하므로 대형 데이타베이스에서는 심각한 성능 저하의 문제를 가진다. 서픽스 트리를 사용하는 또 다른 기법은 큰 트리로 인한 성능상의 문제를 갖는다 본 논문에서는 타임 워핑을 지원하는 효과적인 유사 검색 기법을 제안한다. 제안된 기법의 주요 목표는 착오 기각 없이 대형 데이타베이스에서도 좋은 검색 성능을 보장하는 것이다. 이러한 목표를 위하여 본 연구에서는 삼각형 부등식을 만족하는 타임 워핑 거리의 새로운 하한 거리 함수 $D_{tw-Ib}를 고안한다. D_{tw-Ib}$는 각 시퀀스로부터 타임 워핑과 무관한 4-터플 특성 벡터를 추출한 다. 제안된 기법에서는 이러한 4-터플 특성 벡터를 인덱싱 애트리뷰트로 사용하는 다차원 인덱스를 기반으로 유사 검색을 효율적으로 처리한다. 본 논문에서는 제안된 기법에서 착오 기각이 발생하지 않음을 증명한다. 또한, 제안된 기법의 우수성을 규명하기 위하여 다양한 실험을 수행한다. 실험 결과에 의하면 제안된 기법은 기존의 기법들과 비교하여 실제 S&P 500 주식 데이타에 대하여 43배, 대형 생성 데이타에 대하여 720배가지 의 성능 개선 효과를 가지는 것으로 나타났다.

  • PDF

미디어 레퍼토리를 이용한 스마트폰 애플리케이션 이용 패턴 유형 분석 (Mobile App Analytics using Media Repertoire Approach)

  • 권성은;장서인;황보현우
    • 한국전자거래학회지
    • /
    • 제26권4호
    • /
    • pp.133-154
    • /
    • 2021
  • 현대인에게 가장 보편적이고 융합적인 미디어인 스마트 폰은 애플리케이션이라는 비히클을 갖는 뉴미디어이다. 이 연구는 미디어 사용자들은 어떻게 레퍼토리를 구성하여 미디어를 이용하고 있는지를 파악하고자 2019년 11월, 4주 동안의 개인별 모바일 이용행동 로그 데이터를 이용하여 모바일 애플리케이션 카테고리별 미디어 이용량을 중심으로 군집 분석을 실시하고, 최종적으로 8개의 모바일 미디어 레퍼토리 유형별 집단을 분류하였다. 8개의 각 미디어 레퍼토리 그룹은 애플리케이션 카테고리별 절대적 이용량과 타 그룹 대비 상대적 이용량에서 차이를 보였으며, 데모그라픽적 분포에서도 집단간 차이를 보였다. 이 연구는 모바일 미디어 레퍼토리를 규명해 냈다는 학문적 기여뿐만 아니라 기존의 k-means clustering에 의존적이었던 군집 분석을 SOM(Sefl-Organized Map)을 이용하여 프로토벡터를 추출하고 이 프로토벡터를 이용하여 k-means clustering을 실시하는 이단계 접근법(two-step approach)을 시도함으로써, 기존 k-means clustering이 갖고 있는 '이상치(outlier)'나 '결측치'에 민감했던 한계점을 극복하고 더 나은 성능의 분석 결과를 도출하고 있음을 보여준다는 점에서 방법론적으로도 의미를 갖는다. 또한 모바일 미디어 이용 행동의 유형 분류 연구는 전자거래 서비스를 이용하는 고객을 유형분류하고, 각 고객 유형에 맞는 고객 관리 서비스를 집행해야 하는 실무진이 고객 행동 로그 데이터를 기반으로 고객의 구조를 파악하고 각 고객 집단에 적합한 서비스 또는 마케팅 의사결정을 차별적으로 집행해야 하는 전자거래 커뮤니티에 실무적 가이드를 제공한다는 점에서도 의미를 갖고 있다.

움직임과 영상 패턴 서술자를 이용한 중복 동영상 검출 (Detecting near-duplication Video Using Motion and Image Pattern Descriptor)

  • 진주경;나상일;정동석
    • 대한전자공학회논문지SP
    • /
    • 제48권4호
    • /
    • pp.107-115
    • /
    • 2011
  • 본 논문은 대용량 동영상을 관리하기 위한 빠르고 효율적인 내용기반 중복 동영상 검출 알고리즘을 제안한다. 효율적인 중복 동영상 검출을 위해 대용량의 동영상을 처리하기 쉬운 작은 단위로 나누는 동영상 장면 전환 기반 분할 기술을 적용하였다. 동영상 서비스 및 저작권 보호 관련 사업모델의 경우, 필요한 기술은 아주 작은 구간의 동영상이나 한 장의 영상 을 검색하기보다는 상당한 길이 이상 일치하는 동영상을 파악하는 기술이 필요하다. 이러한 중복 동영상 검출을 위해 본 논문에서 동영상을 장면 전환을 기준으로 분할하여, 나누어진 장면 내에서 움직임 분포 서술자와 대표 프레임을 선택하여 프레임 서술자를 추출한다. 움직임 분포 서술자는 동영상 디코딩 과정에서 얻어지는 매크로 블록의 움직임 벡터를 이용한 장면 내 움직임 분포 히스토그램을 구성하였다. 움직임 분포 서술자는 정합시 고속 정합이 가능하도록 필터링 역할을 한다. 반면 움직임 정보만는 낮은 변별력을 가진다. 이를 높이기 위해 움직임 분포 서술자를 이용하여 정합된 장면간에 선택된 대표 프레임의 패턴 서술자를 이용하여 동영상의 중복 여부를 최종 판단한다. 제안된 방법은 실제 동영상 서비스 환경에서 우수한 인식률과 낮은 오인식률을 가질 뿐만아니라 실제 적용이 가능할 정도의 빠른 정합 속도를 얻을 수 있었다.

가속도 센서기반의 인체활동 및 낙상 분류를 위한 알고리즘 구현 (Implementation of Acceleration Sensor-based Human activity and Fall Classification Algorithm)

  • 박현;박준모;하연철
    • 융합신호처리학회논문지
    • /
    • 제23권2호
    • /
    • pp.76-83
    • /
    • 2022
  • 최근 IT기술이 발달함에 따라 다양한 생체신호 측정 기기에 대한 연구 및 관심이 높아지고 있는 이유 중 하나로 고령사회가 본격화됨에 따라 IT 관련 기술을 이용한 고령 인구에 대한 연구가 지속해서 발전되고 있다. 본 논문은 초고령사회에 접어들면서 빠르게 발전하고 있는 노인층을 대상으로 한 의료서비스 영역 중 하나인 생활 패턴 감지와 낙상 감지 알고리즘 개발에 관한 것이다. 3축 가속도 센서와 심전도 센서를 이용한 시스템을 구성하여 데이터를 수집한 뒤 데이터를 분석하는 과정으로 진행하였고 실제 연구 결과로부터 행동 패턴의 분류가 가능함을 제안한다. 본 논문에 의해 구현된 인체 활동 모니터링 시스템의 유용성을 평가하기 위하여 자세 변화, 보행속도의 변화 등 다양한 조건에서 실험을 수행하여 인체의 중력 가속도와 인체 활동 정도를 반영하는 신호크기 범위 및 신호 벡터크기 파라미터를 추출하였다. 그리고 이들 파라미터값에 의해 피검자의 상태에 따라 판별이 가능하였다.

탄성변형에너지 측도를 이용한 부분적으로 가려진 이진 객체의 인식 (Recognition of Partially Occluded Binary Objects using Elastic Deformation Energy Measure)

  • 문영인;구자영
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권10호
    • /
    • pp.63-70
    • /
    • 2014
  • 주어진 이진영상 안에 존재하는 객체를 인식하기 위해서는 영상분할과 패턴정합 과정을 거친다. 영상 내의 이진 객체들이 서로 분리되었다는 조건 하에서는 면적, 경계선의 길이, 또는 그들 사이의 비례 등과 같은 대상 전체의 특징을 기술하는 전역적 특징을 이용해서 객체를 인식할 수 있지만 객체들이 서로에 의해 부분적으로 가리어져 있으면 전역적 특징은 사용될 수 없고 점, 선분 등 객체의 부분을 기술하는 국지적 특징들을 이용해서 인식해야 한다. 본 논문에서는 모델의 경계선상의 곡률이 큰 점들을 추출하여 특징점으로 삼고, 그 가운데 두 점을 택하여 하나의 국지적 특징으로 사용한다. 또한 모델과 입력영상에서 각기 추출된 국지적 특징들을 비교하여 정합함으로써 부분적으로 가려진 객체를 인식하는 방법을 제안하고 있다. 특징점의 쌍으로 표현되는 국지적 특징을 서로 비교함에 있어서 두 점간의 거리와 양 특징점에서의 그래디언트 벡터의 사이 각을 일치시키는데 필요한 탄성변형 에너지를 이용하여 국지적 특징 사이의 유사도를 정의한다. 인식대상 객체 상의 한 특징점의 레이블을 다른 특징점의 레이블들이 얼마나 지지하는 지를 계산함으로써 부분적으로 가려진 객체를 안정적으로 인식하는 방법을 제안한다. Kimia-25 데이터에 대한 실험 결과 최대 클리크 알고리즘의 4.5배의 속도로 동일한 인식률을 얻음을 보였다.

고유 얼굴과 퍼지 신경망을 이용한 얼굴 인식 기법 (Face Recognition using Eigenfaces and Fuzzy Neural Networks)

  • 김재협;문영식
    • 전자공학회논문지CI
    • /
    • 제41권3호
    • /
    • pp.27-36
    • /
    • 2004
  • 일반적으로 영상에서 얼굴 영상을 검출하고 인식하는 알고리즘은 패턴 인식 연구에 있어서 인간과 컴퓨터의 상호작용의 연구라는 면에서 아주 중요한 문제로 연구되어 왔다. 본 논문에서는 고유얼굴과 퍼지 신경망을 이용한 얼굴인식 기법을 제안한다. PCA(Principal Component Analysis) 방식은 우수한 인식 결과를 보장하는 얼굴인식 기법중의 하나이며, 얼굴 영상을 이용하여 공분산 행렬을 계산하고, 공분산 행렬을 통해 생성된 저차원의 벡터, 즉 고유얼굴(Eigenface)을 이용하여 가중치를 계산하고, 이 가중치를 기준으로 인식을 수행하는 기법이다. 이를 기반으로 하여, 본 논문에서는 전처리 과정, 고유얼굴 과정, 퍼지 소속도 함수 설계 과정, 신경망 학습 과정, 인식과정으로 구성된 5단계의 얼굴 인식 알고리즘을 제안한다. 먼저 각 얼굴 영상들은 전처리과정을 거치며 이 영상들을 이용하여 고유얼굴을 추출한다. 추출된 고유얼굴을 이용한 가숭치 135개에 대하여 비대칭 가우시안 함수를 응용한 퍼지 소속도 함수를 이용하여 퍼지 소속도가 부여되며 이 소속도들이 신경망의 입력으로 사용되어 학습과정을 거친다. 학습과정을 거친 후, 신경망의 출력은 현재의 얼굴 이미지가 데이터베이스의 얼굴 이미지와 유사한 정도를 나타내게 되어 인식을 수행한다. 제안하는 알고리즘으로 가중치의 개수와 퍼지 레벨의 개수에 대하여 기존의 얼굴 데이터 베이스를 이용하여 실험하였으며, 실험 결과 특정 조건하에서 약 95% 이상의 인식 성능을 확인할 수 있었다.

GSIS를 이용한 입지선정에 있어 퍼지공간중첩기법의 적용에 관한 연구 (The application of fuzzy spatial overlay method to the site selection using GSIS)

  • 임승현;조기성
    • 한국측량학회지
    • /
    • 제17권2호
    • /
    • pp.177-187
    • /
    • 1999
  • 현재까지 GSIS를 이용하는 많은 응용분야에서 각종 공간자료의 추출 및 분석을 위해 벡터형 공간중첩(spatial overay)이나 격자형 공간연산(spatial algebra)기능이 주로 사용되었다. 하지만 이런 방법에 내재하고 있는 개념은 전통적인 보통집합이론에 근거하고 있기 때문에 많은 종류의 공간자료들이 구간설정에 있어서 예리한 경계로 분할되는 것으로 다루어지고 있다. 이것은 현실 세계에 존재하는 실제 자료들의 공간분포패턴과 일치하지 않는다. 즉, 공간상에 일정영역이나 실체들이 오직 한가지 속성으로 한정되는(one-entity-one-value)오류를 그대로 포함하고 있다. 본 연구는 이러한 보통집합의 개념하에서 공간자료를 다루어 왔던 종래의 방식을 개선하기 위해서 공간자료가 지니는 모호함 내지 경계의 애매성을 잘 표현할 수 있는 퍼지집합의 개념을 두 가지 방법을 통해 공간중첩과정에 도입하였다. 첫 번째 방법은 공간적으로 연속성을 갖는 자료에 대해서 퍼지부분집합에 의한 퍼지구간분할법이며, 두 번째 방법은 범주형 자료에 대해서 적용한 퍼지경계집합법이다. 사례연구로서 신시가지 개발입지선정을 위한 적지분석을 수행을 함으로서 기존의 부울분석방법과 퍼지 공간 중첩법의 결과를 비교하였으며 그 결과, 퍼지공간중첩법에 의한 적합도면이 신시가지 개발입지에 대한 보다 타당성 있는 정보를 제공하며, 더불어 정보표현측면에서도 더욱 적절한 형태임을 알 수 있었다.

  • PDF

개인화된 건강 데이터의 대량 처리 모니터링을 위한 메시지 모델 및 동적 버퍼 할당 설계 (Design of Dynamic Buffer Assignment and Message model for Large-scale Process Monitoring of Personalized Health Data)

  • 전영준;황희정
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권6호
    • /
    • pp.187-193
    • /
    • 2015
  • ICT 힐링플랫폼은 만성질환 예방을 목적으로 하며 개인의 생체신호 및 생황습관 등의 정보에 기반을 둔 질환 조기 경보를 목표로 한다. 이를 위한 2-step 개방형 시스템(TOS)에는 힐링플랫폼과 개인건강데이터 저장소간의 중계가 설계되었으며 데이터 처리과정을 실시간으로 전송(모니터링)하기 위한 대량 커넥션 기반의 publish/subscribe(pub/sub) 서비스가 고려되었다. 그러나 TOS pub/sub의 초기 설계에서는 커넥션 메시지를 deflate 알고리즘으로 인코딩하기 위해, 커넥션의 유휴(idle) 여부 및 메시지의 종류에 상관없이 동일한 버퍼를 할당한다. 본 논문의 동적 버퍼 할당은 다음과 수행된다. 우선 각 커넥션의 메시지 전송 유형을 큐잉하고, 각 큐는 tf-idf를 통해 특징(feature)추출 연산 후 벡터로 변환하여 k-means 클러스터에 입력하여 군집을 생성한다. 특정 군집으로 분류된 커넥션은 해당 군집의 자원 테이블에 따라 자원을 재할당 한다. 이때 각 군집의 센트로이드(centroid)는 해당 군집을 대표하는 큐잉 패턴을 사전에 선택하여 자원참조 테이블(버퍼 크기별 인코딩 효율)로 도출한다. 제안된 설계는 TOS의 인코딩 버퍼 자원을 네트워크 커넥션에 효율적으로 배분하기 위해, 군집 및 특징 연산을 위한 연산 자원과 네트워크 대역폭 간의 trade-off를 수행함으로써 TOS의 tps(단위 시간당 실시간 데이터 처리 모니터링 연결수)를 높이는데 활용할 수 있다.

시공간 순차 정보를 이용한 내용기반 복사 동영상 검출 (Content based Video Copy Detection Using Spatio-Temporal Ordinal Measure)

  • 정재협;김태왕;양훈준;진주경;정동석
    • 대한전자공학회논문지SP
    • /
    • 제49권2호
    • /
    • pp.113-121
    • /
    • 2012
  • 본 논문은 대용량 동영상을 관리하기 위한 빠르고 효율적인 내용기반 중복 동영상 검출 알고리즘을 제안한다. 효율적인 중복 동영상 검출을 위해 대용량의 동영상을 처리하기 쉬운 작은 단위로 나누는 동영상 장면 전환 기반 분할 기술을 적용하였다. 동영상 서비스 및 저작권 보호 관련 사업모델의 경우, 필요한 기술은 아주 작은 구간의 동영상이나 한 장의 영상 을 검색하기보다는 상당한 길이 이상 일치하는 동영상을 파악하는 기술이 필요하다. 이러한 중복 동영상 검출을 위해 본 논문에서 동영상을 장면 전환을 기준으로 분할하여, 나누어진 장면 내에서 움직임 분포 서술자와 대표 프레임을 선택하여 프레임 서술자를 추출한다. 움직임 분포 서술자는 동영상 디코딩 과정에서 얻어지는 매크로 블록의 움직임 벡터를 이용한 장면 내 움직임 분포 히스토그램을 구성하였다. 움직임 분포 서술자는 정합시 고속 정합이 가능하도록 필터링 역할을 한다. 반면 움직임 정보만는 낮은 변별력을 가진다. 이를 높이기 위해 움직임 분포 서술자를 이용하여 정합된 장면 간에 선택된 대표 프레임의 패턴 서술자를 이용하여 동영상의 중복 여부를 최종 판단한다. 제안된 방법은 실제 동영상 서비스 환경에서 우수한 인식률과 낮은 오인식률을 가질 뿐만아니라 실제 적용이 가능할 정도의 빠른 정합 속도를 얻을 수 있었다.