• 제목/요약/키워드: 영상방법론

검색결과 762건 처리시간 0.028초

영역 기반 영상 검색을 위한 다중클래스 피드백 알고리즘 (Multi-class Feedback Algorithm for Region-based Image Retrieval)

  • 고병철;남재열
    • 정보처리학회논문지B
    • /
    • 제13B권4호
    • /
    • pp.383-392
    • /
    • 2006
  • 본 논문에서는 영역기반 영상검색의 성능 향상을 위한 피드백 알고리즘으로 다중 클래스를 갖는 확률적 신경망(Probabilistic Neural Networks)을 이용한 방법론을 제안하고 이를 영역기반 영상 검색 시스템인 FRIP(Finding Regions In the Pictures) 시스템에 적용하였다. 본 논문에서 제안하는 피드백 알고리즘은 특정 벡터가 독립적이라는 가정을 할 필요가 없으며 보다 상세한 분류를 위해 추가적인 클래스들을 추가할 수 있도록 허용하고 있다. 또한 단지 4개 층(layer)만을 가지고 있음으로 학습을 위한 계산시간이 적게 든다는 장점이 있다. 추가적으로 다음단계에서의 성능 향상을 위해 분류 단계에서 사용자의 이전 피드백 행동을 모두 히스토리(history)로 모두 기억시켜 놓고 다음 단계를 위한 가중치 학습을 위해 사용하도록 한다. 히스토리를 사용함으로써 제안하는 알고리즘은 사용자의 주관적 의도를 보다 정확하게 파악 할 수 있을 뿐만 아니라 학습을 위해 이전 단계만을 사용 했을 때 발생할 수 있는 성능 감소를 막을 수 있다. 본 논문에서는 Corel-photo CD에서 3000장의 자연 영상을 무작위로 추출하여 기존의 방법론들과 제안하는 방법론의 성능을 측정하여 본 논문에서 제안하는 방법론이 성능이 우수함을 증명하였다.

새로운 커널 기반 정상 상태 복구 기법과 응용 (New Kernel-Based Normality Recovery Method and Applications)

  • 강대성;박주영
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2006년도 춘계학술대회 학술발표 논문집 제16권 제1호
    • /
    • pp.306-309
    • /
    • 2006
  • SVDD(support vector data description)는 one-class 서포트 벡터 학습 방법론 중 하나로 비정상 물체에서 정상 데이터를 구분하기 위해서 특징 공간에서 정의된 구를 이용하는 전략을 쓰는 방법론이다. 본 논문에서는 SVDD를 이용해서 노이즈가 섞인 비정상 데이터를 노이즈가 제거된 정상 데이터로 복원하는 방법에 대해서 논한다. 그리고 저해상도의 이미지를 고해상도의 이미지로 복원함으로써 본 논문의 방법론이 어떻게 실용적으로 적용되는지에 대해서 다룬다.

  • PDF

합성 대표영상에 기반 한 조명 변화무관 얼굴 인식 (Illumination Invariant Face Recognition based on the Synthesized Exemplars)

  • 문송향;이상웅;이성환
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.685-687
    • /
    • 2004
  • 최근 생체 인식에 대한 관심이 고조됨에 따라. 다양한 환경 변화에 강인한 얼굴 인식 방법들이 연구되고 있다. 특히, 조명 변화를 처리하기 위한 연구들이 세계적으로 발표되고 있다. 그러나 기존 방법들은 다수의 등록영상이나 조명에 대한 사전 지식이 필요하다는 제약조건을 가지고 있다. 본 논문에서는 기존 방법의 한계점을 해결하기 위해 조명 대표영상의 선형 분석을 이용한 새로운 방법론을 제안하였다. 또한 제안 방법의 효율성을 입증하기 위하여 공인된 얼굴 데이터베이스를 이용하여 다양한 실험을 시도하였으며, 이를 통해 제안된 방법 이 기존의 다른 방법에 비하여 안정적인 인식 성능을 보이는 것을 확인할 수 있었다.

  • PDF

방향코사인을 이용한 드론영상의 에피폴라 영상제작 (Generation of Epipolar Image from Drone Image Using Direction Cosine)

  • 김의명;최한승;홍송표
    • 한국측량학회지
    • /
    • 제36권4호
    • /
    • pp.271-277
    • /
    • 2018
  • 에피폴라 영상은 원 영상에서 y-시차를 제거한 영상으로 3차원 입체 모델을 생성하거나 지도를 제작하기 위해서 필수적인 기술이다. 에피폴라 영상 제작에는 두 영상에서 특징점을 정합한 후 상호표정요소를 추정하여 생성하는 방법과 외부표정요소를 결정한 후 두 영상의 기선과 회전각을 이용하는 방법이 있다. 본 연구에서는 입력 영상의 외부표정요소에서 방향코사인을 이용하여 에피폴라 영상을 제작하는 방법과 원 영상에서 에피폴라 영상으로 변환할 때 용이한 계산을 위하여 변환관계를 행렬을 이용하는 방법론을 제안하였다. 제안한 방법론의 적용성은 고정익과 회전익 드론에서 촬영한 영상을 이용하여 평가하였으며 그 결과 드론의 형태에 관계없이 에피폴라 영상이 적합하게 제작됨을 알 수 있었다.

청각장애인을 위한 동영상 이미지캡션 생성 소프트웨어 개발 (The Development of Image Caption Generating Software for Auditory Disabled)

  • 임경호;윤준성
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.1069-1074
    • /
    • 2007
  • 청각장애인이 PC환경에서 영화, 방송, 애니메이션 등의 동영상 콘텐츠를 이용할 때 장애의 정도에 따라 콘텐츠의 접근성에 있어서 시각적 수용 이외의 부분적 장애가 발생한다. 이러한 장애의 극복을 위해 수화 애니메이션이나 독화 교육과 같은 청각장애인의 정보 접근성 향상을 위한 콘텐츠와 기술이 개발된 사례가 있었으나 다소 한계점을 가지고 있다. 따라서 본 논문에서는 현대 뉴미디어 예술 작품의 예술적 표현 방법을 구성요소로서 추출하여, 기술과 감성의 조화가 어우러진 독창적인 콘텐츠를 생산할 수 있는 기술을 개발함으로써 PC환경에서 청각장애인의 동영상 콘텐츠에 대한 접근성 향상 방법을 추출하고, 실질적으로 청각적 효과의 시각적 변환 인터페이스 개발 및 이미지 캡션 생성 소프트웨어 개발을 통해 청각장애인의 동영상 콘텐츠 사용성을 극대화시킬 수 있는 방법론을 제시하고자 한다. 본 논문에서는 첫째, 청각장애인의 동영상 콘텐츠 접근성 분석, 둘째, 미디어아트 작품의 선별적 분석 및 유동요소 추출, 셋째, 인터페이스 및 콘텐츠 제작의 순서로 단계별 방법론을 제시하고 있다. 이 세번 째 단계에서 이미지 캡션 생성 소프트웨어가 개발되고, 비트맵 아이콘 형태의 이미지 캡션 콘텐츠가 생성된다. 개발한 이미지 캡션 생성 소프트웨어는 사용성에 입각한 일상의 언어적 요소와 예술 작품으로부터 추출한 청각 요소의 시각적요소로의 전환을 위한 인터페이스인 것이다. 이러한 기술의 개발은 기술적 측면으로는 청각장애인의 다양한 웹콘텐츠 접근 장애를 개선하는 독창적인 인터페이스 추출 환경을 확립하여 응용영역을 확대하고, 공학적으로 단언된 기술 영역을 콘텐츠 개발 기술이라는 새로운 영역으로 확장함으로써 간학제적 시도를 통한 기술영역을 유기적으로 확대하며, 문자와 오디오를 이미지와 시각적 효과로 전환하여 다각적인 미디어의 교차 활용 방안을 제시하여 콘텐츠를 형상화시키는 기술을 활성화 시키는 효과를 거둘 수 있다. 또한 청각장애인의 접근성 개선이라는 한정된 영역을 뛰어넘어 국가간 언어적인 장벽을 초월할 수 있는 다각적인 부가 동영상 콘텐츠에 대한 시도, 접근, 생산을 통해 글로벌 시대에 부응하는 새로운 방법론으로 발전 할 수 있다.

  • PDF

로버스트 그룹 독립성분분석 (Robust group independent component analysis)

  • 김현성;이웅주;임예지
    • 응용통계연구
    • /
    • 제34권2호
    • /
    • pp.127-139
    • /
    • 2021
  • 독립성분분석은 혼합 데이터로부터 독립된 신호들을 분리해내는 대표적인 통계적 방법론이며, 그룹 독립성분분석은 독립성분분석을 여러 개체에 적용할 수 있도록 확장한 방법론이다. 그룹 독립성분분석은 기능적 자기 공명 영상 데이터에 활용되어 의학적으로 유의미한 결과를 줌이 알려져있다. 그러나 자기 공명 영상 스캔에서 흔히 일어나는 이상치가 포함되어 있는 경우, 기존의 그룹 독립성분분석은 그 효과가 떨어짐이 알려져있다. 본 연구에서는 ROBPCA 기반의 로버스트한 그룹 독립성분분석 방법론을 제안하였다. 시뮬레이션과 실제 자료 분석을 통해 제안한 방법과 기존 방법을 비교하였고, 그 결과 제안한 방법론의 로버스트성을 입증했다.

특징 정보를 이용한 다단계 내용기반 영상 검색 기법 (Multi-Level Content-Based Image Retrieval Technique Using Feature Information)

  • 김봉기;오해석
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1998년도 국제 컨퍼런스: 국가경쟁력 향상을 위한 디지틀도서관 구축방안
    • /
    • pp.395-405
    • /
    • 1998
  • 최근 멀티미디어 기술의 발전으로 인해 영상을 효율적으로 검색할 수 있는 영상 데이터베이스 시스템이 정보화 사회의 중요한 핵심 기술로 대두되고 있다. 본 논문에서는 내용기반 영상 데이터 검색을 위한 영상 특징 추출 방법으로 색상 정보와 모양 정보를 고려하는 다단계 영상 검색 시스템을 제안하였다. 1단계에서는 색상 정보론 얻기 위해서는 Striker 등이 제시한 색상 분포 특성을 이용한 색인 방법의 문제점을 보완하고 확장해서 지역 색상 분포 특성을 고려한 색인 방법을 사용하여 1차로 영상을 대분류한다. 2단계에서는 1단계에서 대분류된 집단 영상들에 대하여 2차로 모양 정보를 이용하여 사용자가 질의한 영상과 유사한 영상을 최종적으로 검색한다. 모양 정보를 얻기 위해서는 기존 불변 모멘트의 문제점인 많은 연산량과, Jain 등이 제시한 방향 히스토그램 인터섹션 방법에서 제기된 회전에 민감하다는 문제점을 해결하기 위해 물체의 윤곽선에 해당하는 화소들만을 대상으로 연산을 수행하는 향상된 불변 모멘트(Improved Moment Invariants : IMI)를 이용한다. 실험 영상으로 300개의 자동차 영상을 사용하여 기존 방법들과의 비교 실험을 통해 향상된 검색 결과를 얻을 수 있었다.

  • PDF

영상검색을 통한 초해상도 기법 (Super-Resolution using Image retrieval)

  • 한유덕;이준영;권인소
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.348-351
    • /
    • 2012
  • 본 논문에서는 많은 양의 외부 데이터를 활용할 수 있는 예제기반 초해상도(example-based super-resolution) 방법을 보다 효율적으로 할 수 있는 예제선정과 그를 위한 최적화기반의 방법론을 제안한다. 외부 데이터베이스 전체에 의존하는 것이 아니라, 예제선정을 위해 영상검색 (image retrieval) 방법을 도입하여 입력 영상과 관련 있는 영상을 외부 데이터베이스로부터 찾고 영상들로부터 초해상도 영상을 얻는다. 기존의 방법은 외부 데이터베이스를 모두 사용하기 때문에 입력영상에 불필요한 정보들이 복원되어 초해상도 결과의 질을 저하시킨다. 하지만 제안하는 방법에서는 영상검색을 통해 불필요한 정보들을 미리 제거하여 좋은 결과를 얻을 수 있다. 또한 외부 데이터베이스를 크기에 상관없이 검색된 몇 장의 영상을 사용하기 때문에 기존의 방법에 비해서 속도가 향상되었다.

Level Set 방법을 이용한 영상분할 알고리즘 (Video Segmentation using the Level Set Method)

  • 김대희;호요성
    • 대한전자공학회논문지SP
    • /
    • 제40권5호
    • /
    • pp.303-311
    • /
    • 2003
  • MPEG-4 표준에서는 객체 단위의 부호화를 수행하기 위해 우선 자연영상으로부터 비디오 객체론 분리하는 영상분할(Segmentation) 기술이 필요하다. 영상분할 방법은 크게 자동 영상분할(Automatic Segment값ion)과 반자동 영상분할(Semi-automatic Segmentation)의 두 부류로 나눌 수 있다. 대부분의 자동 영상분할 방법은 비디오 객체의 명확한 모델을 수학적으로 제시하기 어려우므로 한 화면에서 개별 객체를 추출하기 어렵기 때문에 그 성능에 한계가 있다. 본 논문에서는 이러한 문제점을 극복하기 위해 기하학적인 Active Contour를 이용한 반자동 영상분할 알고리즘을 제안한다. 매개변수 방식의 Active Contour와 달리, 기하학적인 Active Contour는 곡선의 변화론 Level Set 방법을 이용하여 기술하기 때문에 초기 곡선의 모양을 객체의 모양과 무관하게 그릴 수 있다. 평탄화된 영상으로부터 경계함수를 생성하기 위해 이진화된 3차원 확산 모델을 사용하여 LUV 벡터 공간에서 비등방형 확산을 수행한다. 본 논문에서는 흐름 벡터장(Advection Vector Field)에서 곡선을 수축하고, 움직임 정보를 이용하여 곡선 확장하는 방법을 이용하여 동영상에서 객체를 분리하는 방법을 제안한다.

딥러닝과 의미론적 영상분할을 이용한 자동차 번호판의 숫자 및 문자영역 검출 (Detection of Number and Character Area of License Plate Using Deep Learning and Semantic Image Segmentation)

  • 이정환
    • 한국융합학회논문지
    • /
    • 제12권1호
    • /
    • pp.29-35
    • /
    • 2021
  • 자동차 번호판 인식은 지능형 교통시스템에서 핵심적인 역할을 담당한다. 따라서 효율적으로 자동차 번호판의 숫자 및 문자영역을 검출하는 것은 매우 중요한 과정이다. 본 연구에서는 딥러닝과 의미론적 영상분할 알고리즘을 적용하여 효과적으로 자동차 번호판의 번호영역을 검출하는 방법을 제안한다. 제안된 방법은 화소 투영과 같은 전처리과정 없이 번호판 영상에서 바로 숫자 및 문자영역을 검출하는 알고리즘이다. 번호판 영상은 도로 위에 설치된 고정 카메라로 부터 획득한 영상으로 날씨 및 조명변화 등을 모두 포함한 다양한 실제 상황에서 촬영된 것을 사용하였다. 입력 영상은 색상변화를 줄이기 위해 정규화하고 실험에 사용된 딥러닝 신경망 모델은 Vgg16, Vgg19, ResNet18 및 ResNet50이다. 제안방법의 성능을 검토하기 위해 번호판 영상 500장으로 실험하였다. 학습을 위해 300장을 할당하였으며 테스트용으로 200장을 사용하였다. 컴퓨터모의 실험결과 ResNet50을 사용할 때 가장 우수하였으며 95.77% 정확도를 얻었다.