• 제목/요약/키워드: rotation-invariant

검색결과 256건 처리시간 0.026초

Smith-Waterman 정렬 알고리즘을 이용한 온라인 필기체 숫자인식 (Online Handwritten Digit Recognition by Smith-Waterman Alignment)

  • 문원호;최연석;이상걸;차의영
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권9호
    • /
    • pp.27-33
    • /
    • 2011
  • 본 논문에서는 필기체 문자의 Convex-Concave한 곡선 특징을 문자로 변환하고 추출된 문자를 Smith-Waterman 정렬 알고리즘을 이용하여 온라인 필기체 숫자 인식 방법을 제안한다. 필기체 숫자 인식을 위한 입력 데이터는 시간에 순서적인 좌표로 순서화하고 전처리의 입력데이터로 적용된다. 필기자의 개성이 표현된 필기체 문자는 크기, 회전, 곡선 비율이 다양한 형태로 나타난다. 따라서 본 논문에서는 곡선의 Convex-Concave 특징을 이용하여 크기, 회전에 강인한 특징을 추출한다. 추출된 특징은 문자로 변환하고 Smith-Waterman 정렬 알고리즘의 입력데이터로 적용한다. 본 논문에서는 실시간 필기체 숫자를 대상으로 실험한 결과, 오류역전파 신경 회로망을 적용한 것과 비교하여 제안된 방법이 좋은 성능을 보였다.

카메라 이동환경에서 mean shift와 깊이 지도를 결합한 다수 인체 추적 (Multiple Human Tracking using Mean Shift and Depth Map with a Moving Stereo Camera)

  • 김광수;홍수연;곽수영;안정호;변혜란
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권10호
    • /
    • pp.937-944
    • /
    • 2007
  • 본 논문은 스테레오 카메라를 이용한 이동 카메라 환경에서Mean Shift와 깊이지도를 결합하여 다수의 사람을 다양한 자세, 크기, 조명변화에 강인한 추적을 하는 방법을 제안한다. Mean Shift 추적 알고리즘은 빠르고 안정적인 성능으로 실시간 추적에 적합하다. 그러나 객체의 칼라 정보만으로는 배경과 칼라 분포가 유사한 객체의 경우 추적에 실패할 수 있는 단점을 보완하기 위하여 깊이 정보를 결합하는 방법을 제안한다. 또한 객체가 이동하면서 발생하는 가려짐 문제를 해결하기 위하여 검출된 사람 영역을 머리, 몸통, 다리로 나누어 신체 부위별 모델링을 하였고 박스 크기가 객체의 크기변화에 따라 적응적으로 변하도록 하였다. 본 논문에서 제안하는 알고리즘은 다양한 데이타에 대해서 실험한 결과 정확한 검출과 추적에 우수한 성능을 확인 할 수 있었다.

윤곽선 이미지 피라미드와 관심영역 검출을 이용한 SIFT 기반 이미지 유사성 검색 (SIFT based Image Similarity Search using an Edge Image Pyramid and an Interesting Region Detection)

  • 유승훈;김덕환;이석룡;정진완;김상희
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제35권4호
    • /
    • pp.345-355
    • /
    • 2008
  • 다양한 형태 특징 추출 방법 중의 하나인 SIFT는 물체 인식, 모션 추적, 3차원 이미지 재구성과 같은 컴퓨터 비전 응용 분야에서 많이 사용된다. 하지만 SIFT 방법은 많은 특징점들과 고차원의 특징 벡터를 사용하기 때문에 이미지 유사성 검색에 그대로 적용하기에는 많은 어려움이 있다. 본 논문에서는 윤곽선 이미지 피라미드와 관심영역 검출을 이용한 SIFT 기반 이미지 유사성 검색 기법을 제안한다. 제안한 방법은 윤곽선 이미지 피라미드를 이용하여 이미지의 밝기 변화, 크기, 회전등에 불변한 특징을 추출하고, 타원 형태의 허프변환을 이용한 관심영역 검출을 통해 불필요한 많은 특징점들을 제거하여 검색성능을 높인다. 실험 결과에서 제안한 방법의 이미지 검색 성능이 기존의 SIFT의 방법에 비해 평균 재현율이 약 20%정도 좋은 성능을 보이고 있다.

컬러와 모양 정보를 이용한 캐릭터 이미지 검색 (Charactor Image Retrieval Using Color and Shape Information)

  • 이동호;유광석;김회율
    • 방송공학회논문지
    • /
    • 제5권1호
    • /
    • pp.50-60
    • /
    • 2000
  • 본 논문에서는 캐릭터 이미지 검색에 가장 적합한 컬러와 모양 정보를 표현하는 새로운 복합 특징량을 제안한다. 제안된 방법은 YCbCr 컬러 모델에서 얻어진 Y이미지에 대해서는 회전, 이동, 크기 변화에 불변한 Zernike 모멘트를 사용하여 모양 정보를 추출하고, Cb 및 Cr 이미지로부터 DCT계수를 사용하여 색상 정보를 추출하여 캐릭터 이미지를 검색한다. 이 방법은 인간의 시각적인 특성을 잘 표현하는 방법으로서 36개의 적은 특징량으로 높은 검색효율을 나타내기 때문에 대용량 데이터베이스와 같은 웹 검색과 애니메이션 검색에 적합한 방법이다. 캐릭터 이미지 3,834개를 대상으로 실험하였으며 MPEG-7 컬러/질감, 기술자들의 성능 평가에 사용된 ANMRR(Average of Normalized Modified Retrieval Rank)과 모션/모양 기술자들의 성능 평가에 사용된 BEP(Bull's Eye Performance)를 사용하여 캐릭터 이미지 검색에서 우수한 성능을 타나냄을 실험으로 확인하였다.

  • PDF

기하학 정보를 이용한 3차원 모델 검색 (3D Model Retrieval Using Geometric Information)

  • 이기호;김낙우;김태용;최종수
    • 한국통신학회논문지
    • /
    • 제30권10C호
    • /
    • pp.1007-1016
    • /
    • 2005
  • 본 논문은 3차원 모델의 모양 기반 검색을 하기 위한 모델의 특징을 추출하는 방법을 제시한다. 3차원 모델의 특징 기술자는 모델에 대한 위치, 회전, 크기 변환에서 그 특징이 불변해야 하기 때문에, 모델을 정규 좌표계로 표시하기 위한 선(先)처리 작업이 필요하다. 우리는 선처리 작업을 위해서 주성분 분석 방법을 사용하였으며, 이 방법은 최소 경계 상자와 외접구의 생성을 위해서도 이용되었다. 제안한 알고리즘은 다음과 같다. 반지름 1인 외접구를 만들고, 구의 중심에 3차원 모델을 위치시킨 후, 반지름이 다른 동심구($r_i=i/n,\;i=1,2,{\ldots},n$)를 생성하고, 이 동심구들과 모델이 접하는 면을 구한 다음 그 면에 대한 곡률을 계산한다. 여기서 구한 곡률을 3차원 모델의 특징 기술자로 사용하게 된다. 실험 결과는 타 알고리즘에 비해 제안하는 방법이 상대적으로 적은 빈(bin) 수를 가졌음에도 불구하고 ANMRR 평가 함수에 의해 최소 0.1에서 0.6 이상의 성능 개선 효과가 나타나고 있음을 보여 준다. 본 논문은 색인 기법으로 $R{^*}-tree$를 사용하였다.

특징기반 계층적 영상 검색 시스템의 구현 (A Implementation of the Feature-based Hierarchical Image Retrieval System)

  • 김봉기;김홍준;김창근
    • 한국컴퓨터정보학회논문지
    • /
    • 제5권2호
    • /
    • pp.60-70
    • /
    • 2000
  • 최근 컴퓨터 기술의 발전으로 인해 영상을 효율적으로 검색할 수 있는 영상 검색 시스템이 정보화 사회의 중요한 핵심 기술로 대두되고 있다. 본 논문에서는 내용기반 영상 데이터 검색을 위한 계층적 영상검색 시스템을 구현하였다. 1단계에서는 색상 정보를 위해서 Striker 등이 제시한 색상 분포 특성을 이용한 색인 방법의 문제점을 보완하여 지역 색상 분포 특성을 고려한 색인 방법을 사용하여 1차로 영상을 대 분류한다. 2단계에서는 1단계에서 대 분류된 집단 영상들에 대하여 2차로 모양 정보를 이용하여 사용자가 질의한 영상과 유사한 영상을 최종적으로 검색한다 모양 정보를 위해서는 기존 불변 모멘트의 문제점인 많은 연산량과. Jain 등이 제시한 방향 히스토그램 인터섹션 방법에서 제기된 회전에 민감하다는 문제점을 해결하기 위해 물체의 윤곽선에 해당하는 화소들만을 대상으로 연산을 수행하는 향상된 불변 모멘트(Improved Moment Invariants : IMI)를 이용한다. 실험 영상으로 300개의 자동차 영상을 사용하여 기존 방법들과의 비교 실험을 통해 향상된 검색 결과를 얻을 수 있었다.

  • PDF

드 브루인 수열을 이용한 효과적인 위치 인식 마커 구성 (Effective Marker Placement Method By De Bruijn Sequence for Corresponding Points Matching)

  • 박경미;김성환;조환규
    • 한국콘텐츠학회논문지
    • /
    • 제12권6호
    • /
    • pp.9-20
    • /
    • 2012
  • 컴퓨터비전에서 안정적으로 대응점을 획득하는 것은 매우 중요한 일이다. 그러나 이들은 스케일, 조명, 시점 등이 변하는 환경에서 정확한 대응점을 찾는 과정은 쉽지 않다. SIFT 알고리즘은 객체의 모서리나 꼭지점으로부터 추출한 특징벡터를 사용하므로 스케일링, 회전, 조명변화를 가지는 영상에서도 뛰어난 매칭을 수행한다. 그러나 SIFT는 엣지에 의해 특징점을 추출하므로 엣지가 존재하지 않는 영역에서는 원하는 대응점을 찾을 수 없다. 본 연구는 SIFT에 의한 대응 특징점 추출과 매칭 성능을 향상시키기 위한 마커 모양 및 배치 방법을 제안한다. 제안 방법에서 사용한 마커의 모양은 부착 방향에 따라 SIFT 알고리즘에 의해 한 방향으로 우세한 벡터를 검출할 수 있는 반원형(SemiCircle)으로 구성한다. 그리고 대응점 매칭의 성능을 향상시키기 위하여 마커의 방향 배치는 드 브루인 수열(De Bruijn Sequence)을 이용한다. 실험을 통해 제안한 방법이 기존의 방법보다 더 정확한 특징점 검출과 매칭에 효과적임을 증명하였다.

대용량 DB를 사용한 지문인식 시스템 (A Fingerprint Identification System using Large Database)

  • 차정희;서정만
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.203-211
    • /
    • 2005
  • 본 논문에서는 대용량 DB에서 개인을 인식하는 새로운 자동 지문인식 시스템을 제안한다. 시스템은 전처리, 분류, 매칭의 3단계로 구성되는데, 분류단계에서는 방향성 이미지 분포의 통계적인 접근 방법에 기반한 새로운 분류기법을 제안하였고, 정합단계에서는 기존 알고리즘보다 더 빠르고 정확한, 개선된 특징점 후보쌍 추출 알고리즘을 제안하였다. 정확성을 위해 정합 단계에서 세선화된 이미지로부터 지문의 특징점을 추출하고 특징점의 연결정보를 사용한 정합과정을 소개한다. 특징점 정합과정에서 연결정보를 사용하는 것은 간단하지만 정확한 방법이며, 두 지문의 비교단계에서 빠르게 기준 특징점 쌍을 선택하는 문제를 해결해 준다. 알고리즘은 지문의 회전과 이동에 무관하다. 제안한 시스템은 반도체 칩방식 입력장치로부터 획득한 1000개의 지문영상으로 실험하였으며, 실험결과는 제안한 방법이 기존방법보다 오인식율은 줄어들고 정확도는 증가하였음을 보여준다.

  • PDF

원형 패턴 벡터를 이용한 인쇄체 한글 인식 (Recognition of Printed Hangul Text Using Circular Pattern Vectors)

  • 정지호;최태영
    • 대한전자공학회논문지SP
    • /
    • 제38권3호
    • /
    • pp.269-281
    • /
    • 2001
  • 본 논문에서는 단일 글꼴에 의존하는 원형 패턴 벡터(circular pattern vectors)를 이용하여 위치 이동, 크기 변화 그리고 회전에 무관한 새로운 인쇄체 한글 인식 알고리즘을 제안한다. 제안한 알고리즘은 2진 형태론(binary morphology)을 이용하여 입력 문자에 존재하는 잡음(noise)을 제거한 후, 원형 패턴벡터를 추출한다. 추출된 원형 패턴 벡터는 주어진 문자의 무게 중심을 원의 중심으로 하여 그린 여러 원주 상에 위치한 공간적인 분포 값을 나타내는 것이다. 마지막으로, 실험 문자는 기준 원형 패턴 벡터와 실험 원형 패턴 벡터간의 거리가 최소가 되는 기준 문자로 인식하게 된다. 제안한 알고리즘의 성능을 평가하기 위해, 크기 변화와 회전 변형이 있는 완성형 바탕체 한글 2,350자를 대상으로 모의 실험을 수행하였다. 제안한 알고리즘은 기존의 고리 투영 알고리즘보다 크기 변화와 회전 변형이 있는 한글 인식에 있어서 우수함을 보였다.

  • PDF

다중 스케일 영상을 이용한 GAN 기반 영상 간 변환 기법 (GAN-based Image-to-image Translation using Multi-scale Images)

  • 정소영;정민교
    • 문화기술의 융합
    • /
    • 제6권4호
    • /
    • pp.767-776
    • /
    • 2020
  • GcGAN은 기하학적 일관성을 유지하며 영상 간 스타일을 변환하는 딥러닝 모델이다. 그러나 GcGAN은 회전이나 반전(flip) 등의 한정적인 기하 변환으로 영상의 형태를 보존하기 때문에 영상의 세밀한 형태 정보를 제대로 유지하지 못하는 단점을 가지고 있다. 그래서 본 연구에서는 이런 단점을 개선한 새로운 영상 간 변환 기법인 MSGcGAN(Multi-Scale GcGAN)을 제안한다. MSGcGAN은 GcGAN을 확장한 모델로서, 다중 스케일의 영상을 동시에 학습하여 스케일 불변 특징을 추출함으로써, 영상의 의미적 왜곡을 줄이고 세밀한 정보를 유지하는 방향으로 영상 간 스타일 변환을 수행한다. 실험 결과에 의하면 MSGcGAN은 GcGAN보다 정량적 정성적 측면에서 모두 우수하였고, 영상의 전체적인 형태 정보를 잘 유지하면서 스타일을 자연스럽게 변환함을 확인할 수 있었다.