• 제목/요약/키워드: 리듬 특징

검색결과 305건 처리시간 0.029초

잡음 민감성이 향상된 주성분 분석 기법의 비선형 변형 (A Non-linear Variant of Improved Robust Fuzzy PCA)

  • 허경용;서진석;이임건
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권4호
    • /
    • pp.15-22
    • /
    • 2011
  • 주성분 분석(PCA)은 데이터의 차원을 줄이면서 최대의 데이터 변이를 보존하는 기법으로 차원 축소나 특징 추출을 위해 널리 사용되고 있다. 하지만 PCA는 잡음에 민감하며 가우스 분포에 대하여만 유효하다는 단점이 있다. 잡음 민감성의 개선을 위해 다양한 방법이 제시되었고 그 중 퍼지 소속도를 이용한 반복적 최적화 기법인 RF-PCA2가 다른 방법에 비해 우수한 성능을 보였다. 하지만 RF-PCA2는 가우스 분포에만 사용할 수 있는 선형 알고리듬이라는 한계가 있다. 이 논문에서는 RF-PCA2와 커널 주성분 분석(kernel PCA, K-PCA)을 결합하여 가우스 분포 이외의 분포들도 다룰 수 있는 비선형 알고리듬인 improved robust kernel fuzzy PCA (RKF-PCA2)를 제안한다. RKF-PCA2는 RF-PCA2 알고리듬의 잡음 강건성과K-PCA의비선형성을 통해 기존알고리듬에 비해 잡음민감성이 적으며 가우스분포 한계를 효과적으로 극복할 수 있다. 이러한 사실은 실험 결과를 통해 확인할 수 있다.

문자출력 무선호출기를 위한 음성인식 시스템 (Speech Recognition in the Pager System displaying Defined Sentences)

  • 박규붕;박전규;서상원;황두성;김현빈;한문성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.158-162
    • /
    • 1996
  • 본 논문에서는 문자출력이 가능한 무선호출기에 음성인식 기술을 접목한, 특성화된 한 음성인식 시스템에 대하여 설명하고자 한다. 시스템 동작 과정은, 일단 호출자가 음성인식 서버와 접속하게 되면 서버는 호출자의 자연스런 입력음성을 인식, 그 결과를 문장 형태로 피호출자의 호출기 단말기에 출력시키는 방식으로 되어 있다. 본 시스템에서는 통계적 음성인식 기법을 도입하여, 각 단어를 연속 HMM으로 모델링하였다. 가우시안 혼합 확률밀도함수를 사용하는 각 모델은 전통적인 HMM 학습법들 중의 하나인 Baum-Welch 알고리듬에 의해 학습되고 인식시에는 이들에 비터비 빔 탐색을 적용하여 최선의 결과를 얻도록 한다. MFCC와 파워를 혼용한 26 차원 특징벡터를 각 프레임으로부터 추출하여, 최종적으로, 83 개의 도메인 어휘들 및 무음과 같은 특수어휘들에 대한 모델링을 완성하게 된다. 여기에 구문론적 기능과 의미론적 기능을 함께 수행하는 FSN을 결합시켜 자연발화음성에 대한 연속음성인식 시스템을 구성한다. 본문에서는 이상의 사항들 외에도 음성 데이터베이스, 레이블링 등과 갈이 시스템 성능과 직결되는 시스템의 외적 요소들에 대해 고찰하고, 시스템에 구현되어 있는 다양한 특성들에 대해 밝히며, 실험 결과 및 앞으로의 개선 방향 등에 대해 논의하기로 한다.

  • PDF

차세대 실감 내비게이션을 위한 실시간 신호등 및 표지판 객체 인식 (Real-time Identification of Traffic Light and Road Sign for the Next Generation Video-Based Navigation System)

  • 김용권;이기성;조성익;박정호;최경호
    • 한국공간정보시스템학회 논문지
    • /
    • 제10권2호
    • /
    • pp.13-24
    • /
    • 2008
  • 차세대 실감 내비게이션 시스템은 2D 기반 내비게이션 시스템의 단점을 보완하고 보다 안전한 운전을 할 수 있도록 다양한 서비스를 제공하기 위해 연구되고 있다. 실감 내비게이션 시스템 차선인식과 도로시설물 객체 DB, 교차로 인식 모듈등의 기능 블록들로 구성된다. 본 논문에서는 실감내비게이션의 중요 요소 중 하나인 교차로 인식을 위한 신호등과 표지판 인식 시스템을 개발하였다. 개발된 알고리듬은 색상 정보를 이용해 인식 대상을 검출하고 객체의 특징을 이용하여 신호등과 표지판을 객체별로 인식할 수 있도록 하였으며 실험을 통해 검증하였다. 실험결과 신호등의 경우 60-30m의 거리에서 평균90%의 인식률을 보였으며, 표지판의 경우 90-40m의 거리에서 평균 97%의 인식률을 보였고, 프레임 당 평균 처리시간이 46msec로서 실시간 처리가 가능함을 보였다.

  • PDF

<한국어 립씽크를 위한 3D 디자인 시스템 연구> ()

  • 신동선;정진오
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 2부
    • /
    • pp.362-369
    • /
    • 2006
  • 3 차원 그래픽스에 적용하는 한국어 립씽크 합성 체계를 연구하여, 말소리에 대응하는 자연스러운 립씽크를 자동적으로 생성하도록 하는 디자인 시스템을 연구 개발하였다. 페이셜애니메이션은 크게 나누어 감정 표현, 즉 표정의 애니메이션과 대화 시 입술 모양의 변화를 중심으로 하는 대화 애니메이션 부분으로 구분할 수 있다. 표정 애니메이션의 경우 약간의 문화적 차이를 제외한다면 거의 세계 공통의 보편적인 요소들로 이루어지는 반면 대화 애니메이션의 경우는 언어에 따른 차이를 고려해야 한다. 이와 같은 문제로 인해 영어권 및 일본어 권에서 제안되는 음성에 따른 립싱크 합성방법을 한국어에 그대로 적용하면 청각 정보와 시각 정보의 부조화로 인해 지각의 왜곡을 일으킬 수 있다. 본 연구에서는 이와 같은 문제점을 해결하기 위해 표기된 텍스트를 한국어 발음열로 변환, HMM 알고리듬을 이용한 입력 음성의 시분할, 한국어 음소에 따른 얼굴특징점의 3 차원 움직임을 정의하는 과정을 거쳐 텍스트와 음성를 통해 3 차원 대화 애니메이션을 생성하는 한국어 립싱크합성 시스템을 개발 실제 캐릭터 디자인과정에 적용하도록 하였다. 또한 본 연구는 즉시 적용이 가능한 3 차원 캐릭터 애니메이션뿐만 아니라 아바타를 활용한 동적 인터페이스의 요소기술로서 사용될 수 있는 선행연구이기도 하다. 즉 3 차원 그래픽스 기술을 활용하는 영상디자인 분야와 HCI 에 적용할 수 있는 양면적 특성을 지니고 있다. 휴먼 커뮤니케이션은 언어적 대화 커뮤니케이션과 시각적 표정 커뮤니케이션으로 이루어진다. 즉 페이셜애니메이션의 적용은 보다 인간적인 휴먼 커뮤니케이션의 양상을 지니고 있다. 결국 인간적인 상호작용성이 강조되고, 보다 편한 인간적 대화 방식의 휴먼 인터페이스로 그 미래적 양상이 변화할 것으로 예측되는 아바타를 활용한 인터페이스 디자인과 가상현실 분야에 보다 폭넓게 활용될 수 있다.

  • PDF

트로피컬 하우스에서 나타나는 켈틱 음악의 특징 연구 (A Study on the Characteristics of Celtic Music Elements in Tropical House)

  • 이신애
    • 한국산학기술학회논문지
    • /
    • 제21권9호
    • /
    • pp.575-583
    • /
    • 2020
  • 본 논문은 기존의 트로피컬 하우스의 정의와 다르게 접근한다. 일렉트로닉 음악 장르인 딥 하우스, 칠 아웃, 댄스 홀로부터 파생되었다는 것이 기존의 정의이다. 이와 달리 본 연구에서는 트로피컬 하우스가 일렉트로닉 음악뿐만 아니라 다른 예술 양식의 요소를 포함하고 있음을 이야기한다. 바로 아일랜드의 전통 음악인 켈틱 음악의 요소들이다. 어떤 이유에서 트로피컬 하우스 장르와 켈틱 음악 장르의 융합이 용이했는지에 관하여 설명한다. 그리고 트로피컬 하우스가 켈틱 음악의 요소를 가지고 있다는 것을 8곡의 파퓰러 음악을 통하여 분석한다. 트로피컬 하우스의 선율, 화성, 리듬, 보컬 창법, 악기, 곡의 구조가 켈틱 음악의 요소와 교집합이 있다는 것을 확인할 수 있다. 본 논문의 요지는 켈틱 음악의 요소가 트로피컬 하우스라는 장르에서 발견되었음을 주장하는 것이다. 더불어 창작자들은 세계 전통음악을 비롯한 다양한 음악들에 관심을 갖을 필요가 있다. 독창적인 음악을 만들기 위해 오늘날의 음악과 다양한 장르의 음악을 어떻게 접목시킬 수 있을지에 대해 고민해볼 필요가 있음을 시사한다.

다중스펙트럼 위성영상 압축을 위한 복합부호화 기법 (Hybrid Coding for Multi-spectral Satellite Image Compression)

  • 정경훈
    • 한국지리정보학회지
    • /
    • 제3권1호
    • /
    • pp.1-11
    • /
    • 2000
  • 본 논문에서는 인공위성으로부터 얻어진 다중스펙트럼영상의 부호화 방법을 다룬다. 위성영상의 공간 및 스펙트럼 해상도가 급속도로 향상되면서 처리해야 할 다중스펙트럼 영상의 데이터량은 엄청나게 증가하였다. 이에 따라 위성영상을 활용하기 위해서는 효율적으로 부호화하는 기술이 필요하다. 본 논문에서는 벡터양자화에 근거한 예측부호화, 영상의 quadtree 분할, 그리고 예측오차의 압축을 위한 DCT를 복합적으로 적용한 부호화 기법을 제시한다. 벡터양자화를 통해 대역영상간의 공간적인 특징이 동일하다는 점을 이용한 예측을 하고, 영상분할을 통해 영상의 공간적인 정보량에 따라 적응적으로 비트를 할당하며, DCT를 통해 예측오차의 공간적응적인 부호화를 수행한다. Landsat TM 영상을 대상으로 수행한 실험을 통해 제안 알고리듬의 위성영상 압축기법으로서의 타당성을 보였다.

  • PDF

비등속 이동물체의 표면 검사를 위한 3D 모델링 기술에 관한 연구 (A Study on a 3D Modeling for surface Inspection of a Moving Object)

  • 예수영;이영열;남기곤
    • 융합신호처리학회논문지
    • /
    • 제8권1호
    • /
    • pp.15-21
    • /
    • 2007
  • 본 논문에서는 비등속 이동물체의 표면 검사를 위한 3차원 표면 모델링(modeling) 기법을 제안하였다. 레이저 라인을 물체에 조사하면 표면의 굴곡에 따라 라인에 휨 현상이 나타난다. 이를 분석하여 물체 표면에 대한 3차원 정보를 획득 할 수 있다. 기존의 단일 라인(single stripe) 기법의 정확성과 단일 프레임(single frame) 기법의 빠른 복원 속도의 장점을 모두 활용하기 위하여 멀티 레이저 라인 투사기법을 이용하였다. 정확한 레이저 라인의 추출을 위하여 이진화 및 채널별 에지 검출 기법을 소개하였고, 효과적인 레이저 각 라인의 라벨링 기법을 새로 제안하였다. 개별 3차원 복원 표면을 전체영상으로 합성하기 위해 영상간 특징점 매칭(matching)을 활용하여 동기화 정보를 획득하고 영상을 정합하였다. 본 알고리듬을 컨테이너 표면 데미지 검사에 활용하여 제안한 3차원 모델링 기술의 우수성을 확인하였다.

  • PDF

석탑 문화재의 실루엣 추출을 위한 노이즈 제거 (Silhouette Denoising for the Stone Cultural Heritages)

  • 김학란;황보택근
    • 디지털콘텐츠학회 논문지
    • /
    • 제10권3호
    • /
    • pp.381-388
    • /
    • 2009
  • 논문에서는 3D 스캔 자료에서 추출한 실루엣(silhouette)의 윤곽선(contour edge)이나 주름변(crease edge)의 정보에 나타난 불필요한 노이즈를 제거하는 방법을 제안한다. 석탑 문화재는 석조물 재질의 특징상 울퉁불퉁한 표면 정보를 가지며, 또한 오랜 세월의 풍화작용에 의한 훼손과 데이터 수집 시 나타날 수 있는 기술적 오류에 의해 실루엣에 단발성 선분 형태의 많은 잡음이 나타난다. 따라서 실루엣의 정보에서 노이즈처럼 보이는 단발성 변들을 제거하면 또렷한 석탑 자체의 실루엣을 얻을 수 있다. 선분의 연속성을 세는 알고리듬을 고안하여 길이가 3개 이하인 윤곽선이나 주름변을 제거하였다. 임계값(threshold)을 사용하는 기존의 실루엣 추출방법과 비교하여, 새로이 제안한 방법은 더욱 효과적이고 정확한 실루엣을 얻을 수 있었다. 제안한 노이즈 제거 방법은 석탑 문화재의 경우뿐 아니라 정보의 변형이나 오류에 의해 잘못된 단발성 주름변을 가지는 다른 경우에 대해서도 응용될 수 있다.

  • PDF

G.729 코덱의 패킷 손실 영향 모델을 이용한 비 침입적 음질 예측 기법 (Non-Intrusive Speech Quality Estimation of G.729 Codec using a Packet Loss Effect Model)

  • 이민기;강홍구
    • 한국음향학회지
    • /
    • 제32권2호
    • /
    • pp.157-166
    • /
    • 2013
  • 본 논문은 패킷 손실의 영향을 이용한 비 침입적 음질 평가 방법을 제안한다. 패킷 손실은 패킷 기반의 통신 시스템에서 음질을 저하시키는 주된 요소이며 그 영향은 코덱에 내장된 패킷 손실 은닉 알고리듬에 의해 결정된다. 패킷 손실 영향을 반영한 음질평가 시스템을 위해 VoIP 에서 협대역 코덱으로 사용되는 코덱 중 하나인 G.729를 선택하였으며, 음성 특징에 따른 패킷 손실 영향을 구분하기 위해서 G.729 코덱의 음성 파라미터를 이용한 한 음성 특성 분류기를 설계하였다. 이후, 각각의 패킷 특성에 따른 음질 저하의 정도를 수치화하기 위해 원 PESQ-LQ점수와 상관계수를 최대화하는 음질 저하 가중치를 반복적으로 구하였으며, 최종 음질 저하는 가중합으로 구하였다. 그 결과 제안한 모델과 PESQ-LQ의 상관계수는 칩입 모델 에서는 0.8950를, 비 침입 모델 에서는 0.8911의 결과를 나타내었다.

얼굴과 발걸음을 결합한 인식 (Fusion algorithm for Integrated Face and Gait Identification)

  • ;안성제;홍성준;이희성;김은태;박민용
    • 한국지능시스템학회논문지
    • /
    • 제18권1호
    • /
    • pp.72-77
    • /
    • 2008
  • 개인 식별 연구는 보안, 감시 시스템에서 중요한 부분이다. 최선의 성능을 가진 시스템을 설계하기 위하여 감지기들로부터 최대 정보를 이용할 수 있도록 설계한다. 다양한 생체 인식 시스템은 등록, 확인, 또는 개인 식별을 위하여 생리 특성이나 행동 특성을 하나이상 활용한다. 발걸음 인식만을 가지고는 아직 개인별 변별적 특징을 안정적으로 나타내지 못하므로, 본 논문에서는 얼굴과 발걸음을 결합한 개인 식별 시스템을 제안한다. 본 논문에서 우리는 한 개의 카메라를 이용한다. 즉, 얼굴과 발걸음 인식 모두 하나의 카메라를 이용하여 획득된 같은 이미지 셋을 사용한다. 본 논문의 중점은 이미지들에서 이용할 수 있는 최대 정보량을 활용하는 것으로 시스템의 성능을 향상시키는 것이다. 결합은 결정 단계에서 고려된다. 제안된 알고리듬은 NLPR 데이터베이스를 사용한다.