• 제목/요약/키워드: 실험 영상

검색결과 10,233건 처리시간 0.043초

SIFT와 SURF의 성능 비교 (A Comparison of performance between SIFT and SURF)

  • 이용환;박성현;신인경;안효창;조한진;이준환;이상범
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1560-1562
    • /
    • 2013
  • 정확하고 강인한 영상 등록(Registration)은 영상 검색과 컴퓨터 비전과 같은 여러 응용 분야에서 성능을 좌우하는 매우 중요한 역할을 담당하며, 특징 추출 및 매칭 단계를 통해 수행된다. 영상의 특징을 관심 점으로 지정하여 추출하는 대표적인 알고리즘으로, SIFT (Scale Invariant Feature Transform)와 SURF (Speeded Up Robust Feature)가 있다. 본 논문에서는 2 개의 특징점 추출 알고리즘을 구현하고 예제 데이터를 기반으로 실험을 통해 성능적 비교 분석을 수행한다. 실험 결과, SURF 알고리즘이 특징 추출 및 매칭, 처리시간 측면에서 SIFT 보다 효율적인 성능을 보였다.

MobileNet을 이용한 한국어 입모양 인식 시스템 (Korean Lip Reading System Using MobileNet)

  • 이원종;김주아;손서원;김동호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.211-213
    • /
    • 2022
  • Lip Reading(독순술(讀脣術)) 이란 입술의 움직임을 보고 상대방이 무슨 말을 하는지 알아내는 기술이다. 본 논문에서는 MBC, SBS 뉴스 클로징 영상에서 쓰이는 문장 10개를 데이터로 사용하고 CNN(Convolutional Neural Network) 아키텍처 중 모바일 기기에서 동작을 목표로 한 MobileNet을 모델로 이용하여 발화자의 입모양을 통해 문장 인식 연구를 진행한 결과를 제시한다. 본 연구는 MobileNet과 LSTM을 활용하여 한국어 입모양을 인식하는데 목적이 있다. 본 연구에서는 뉴스 클로징 영상을 프레임 단위로 잘라 실험 문장 10개를 수집하여 데이터셋(Dataset)을 만들고 발화한 입력 영상으로부터 입술 인식과 검출을 한 후, 전처리 과정을 수행한다. 이후 MobileNet과 LSTM을 이용하여 뉴스 클로징 문장을 발화하는 입모양을 학습 시킨 후 정확도를 알아보는 실험을 진행하였다.

  • PDF

자율 주행을 위한 실시간 차선 인식 (Real-Time Road Lane Recognition for Autonomous Driving)

  • 황인찬;이봉환;이규원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.94-97
    • /
    • 2009
  • 본 논문에서는 실제 도로 환경에서의 실시간 차선 인식 방법을 제안한다. 전방주시카메라를 활용하여 촬영한 입력영상으로부터 도로영역에 해당하는 관심영역을 추출하고 반복적인 평균 명도를 측정하여 이진화함으로써 차선 특징을 검출하고 YCbCr 변환한 영상에 대한 실험 임계값을 적용하여 중앙선의 특징을 검출하였다. 이에 Canny 알고리즘을 이용한 에지 추출로 허프 변환시의 작업량을 최소화하였으며 허프 변환하여 얻은 차선 후보군으로부터 각도를 기반으로 필터링하여 통계적으로 우선순위가 높은 선분을 차선으로 인식하였다. 또한 실제 도로 환경에서 수집한 동영상으로 실험한 결과 강건한 차선 인식률을 보였다.

렌더링 비교 뉴럴넷 기반 가구 조립 설명서 부품의 6D 자세 추정

  • 박재우;강이삭;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.100-105
    • /
    • 2021
  • 본 논문에서는 뉴럴넷 기반 렌더링 비교 방식을 사용하여 가구 조립 설명서에 표기된 부품의 자세를 추정하는 방법을 제안한다. 제안하는 방법은 부품의 자세를 임의로 가정한 후, 가정한 자세로 투사한 부품의 영상과 설명서의 부품 영상을 비교하여 두 영상의 부품을 일치시키는 자세 변화를 추정하는 방식으로 진행된다. 또한, 설명서에 반복적으로 모델을 적용하여 부품의 자세를 점차적으로 정확하게 보정하는 방식을 사용하였으며, 네트워크의 구성 및 자세 추정에 사용되는 목표 함수를 다양하게 실험하여 성능을 비교하였다. 본 연구에선 IKEA 의 Stefan 의자 조립 설명서의 부품 데이터셋으로 실험을 진행하였으며, 해당 데이터셋에 대하여 제안하는 방법이 정확하게 자세를 보정함을 확인하였다.

  • PDF

충주댐 수몰지구의 3차원 영상복원 기법에 관한 실험적 연구 (A Experimental Study on the 3-D Image Restoration Technique of Submerged Area by Chung-ju Dam)

  • 연상호
    • 한국측량학회지
    • /
    • 제22권1호
    • /
    • pp.21-27
    • /
    • 2004
  • 다목적 대형 댐의 건설로 수몰된 과거의 삶의 공간을 20년이 지나서 다시 복원한다는 것은 그곳에 살던 실향민에게는 참으로 반가운 소식이다. 본 연구에서는 1980년대 초에 완공된 충주댐으로 인하여 물 속에 잠긴 청풍지구를 수몰이전의 입체 지형 공간적으로 원형복원하기 위한 원격탐사 기법을 적용한 것이다. 비교적 해상도가 좋은 인공위성 사진자료와 원격탐지된 디지털 영상자료를 수집하고, 수몰 직전에 제작된 지형도를 이용하여 위성영상자료의 통합 적용하여 수몰이전의 지형공간정보를 현재시간으로 영상 복원하는 실험을 한 것이다. 이를 위하여 지형도에서 추출한 등고선과 현재의 등고선과의 접목을 통하여 청풍 주변지역을 중심으로 당시의 수치표고모형을 생성하였다. 또한 이를 입체적으로 보여주기 위한 투시조감도를 각 방향에서 생성함으로서 수몰이전의 아름다운 모습을 3차원적으로 영상복원 하였다. 좀 더 가깝게 수몰마을을 보기 위한 근접 비행 시뮬레이션 동영상을 제작하여 과거 기억 속의 고향을 찾아볼 수 있도록 한 것이다. 이러한 실험적인 연구 결과로 새로운 퓨젼 영상의 생성에 의한 3차원 투시조감도의 생성과 근접방문이 가능한 비행시뮬레이션에 의한 과거 수몰된 댐 유역의 지형에 대한 영상복원이 가능하도록 하였다.

X-색도 공간에서 ROI의 전방향 프로젝션과 백색패치의 평행이동에 의한 본질 영상 획득 (Acquisition of Intrinsic Image by Omnidirectional Projection of ROI and Translation of White Patch on the X-chromaticity Space)

  • 김달현;황동국;이우람;전병민
    • 정보처리학회논문지B
    • /
    • 제18B권2호
    • /
    • pp.51-56
    • /
    • 2011
  • 흑체의 온도 변화에 대한 영상의 색차를 줄이는 본질 영상은 단일 불변 방향을 검출하고 백색 장면 조명체를 기반으로 하기 때문에 실영상에 존재하는 다수의 불변 방향과 유색 장면 조명체에 취약하다. 이러한 문제를 해결하기 위해 본 논문에서는 ${\chi}$-색도 공간에서 ROI의 전방향프로젝션과 백색패치의 평행이동을 통해 불변 방향을 검출하는 본질 영상 획득 기법을 제안한다. 3차원 RGB 공간 분석의 어려움으로 인하여, 본 논문 또한 밝기가 고려되지 않은 ${\chi}$-색도 공간을 사용한다. 이 공간에서 유색 조명체의 효과는 백색패치의 평행이동을 통해 감소시키고, 색차에 따라 가상의 선분으로 나타나는 불변 방향은 ROI의 전방향 프로젝션을 통해 검출한다. 다수의 불변 방향을 고려하여 ROI 선택은 3D 히스토그램에서 빈도수에 의해 결정한다. 검출 후, 본질 영상은 불변 방향의 직교 방향으로의 프로젝션과 RGB영상으로의 역변환 과정을 통해 획득된다. 실험에서 Ebner가 제안한 데이터집합을 실험 영상으로 이용하였고, 불변 방향의 표준편차와 색항등성 측도를 평가 측도로 사용하였다. 제안한 기법의 실험 결과는 엔트로피 기법보다 불변 방향의 표준 편차가 낮았으며, 기존의 기법에 비해 색항등성이 2배 이상 높았다.

신경회로망에 의한 의료영상 질환인식 (Disease Recognition on Medical Images Using Neural Network)

  • 이준행;이흥만;김태식;이상복
    • 한국방사선학회논문지
    • /
    • 제3권1호
    • /
    • pp.29-39
    • /
    • 2009
  • 본 논문에서는 신경회로망을 이용한 의료영상의 질환부위 인식방법을 제안하였다. 질환부위 인식을 위한 신경회로망은 입력층, 은닉층, 출력층으로 구성하여 적응 오차 역전파 알고리즘으로 학습하였다. 신경회로망에 입력된 의료영상의 특징 파라미터는 웨이브릿 변환에 의하여 분해된 저주파 영역을 행렬식으로 표현하여 특성 다항식의 계수값(n+1)개로 하였다. 추출된 특징 파라미터는 탄젠트시그모이드 전달함수의 범위로 정규화하여 신경회로망의 입력 벡터로 이용하였다. 제안된 방법의 타당성을 입증하기 위해서 실험에 사용된 입력 의료영상을 가지고 모사실험을 통해 질환부위의 인식률을 평가하였다. 실험 결과 4레벨 DWT로 변환된 저주파영역 행렬의 특성 다항식 계수를 탄젠트시그모이드 전달함수의 범위로 정규화하여 신경회로망의 입력 벡터로 이용했을 때 최적의 학습 횟수를 보였다. 신경회로망의 학습은 적응 오차 역전파 알고리즘을 사용하였고, 학습계수를 0.01, 모우멘텀을 0.95로 하였을 때, 위영상에 대해서는 55회, 가슴영상은 55회, CT영상은 46회, 초음파영상은 55회 그리고 혈관영상에 대해서는 157회 등의 최적의 학습 횟수를 보이며 100%의 인식률을 보였다.

  • PDF

아리랑위성 2호 입체영상을 이용한 지도제작 가능성 연구 (A Feasibility Study for Mapping Using The KOMPSAT-2 Stereo Imagery)

  • 이광재;김윤수;서현덕
    • 한국지리정보학회지
    • /
    • 제15권1호
    • /
    • pp.197-210
    • /
    • 2012
  • 아리랑위성 2호는 다양한 공간정보 생성 및 활용을 위해서 서로 다른 두 궤도를 이용하여 입체영상을 촬영하여 제공할 수 있다. 그러나 이와 같은 입체영상을 지도제작 등에 활용 가능한지 확인하기 위해서는 다양한 실험이 요구된다. 본 연구의 목적은 아리랑위성 2호 입체영상을 이용한 지도제작 가능성을 확인하는데 있으며, 이를 위하여 입체영상 기반의 수치도화를 수행하고 그 성과를 바탕으로 수치고도모델 및 정사영상을 제작한 후 정확도 평가를 수행하였다. RPC 기반의 모델링 결과를 GPS 측량점과 비교한 결과 수평, 수직 모두 ${\pm}1.5m$ 이내의 정확도를 나타냈으며, 이를 바탕으로 실제 도화한 성과를 기존 축척 1/5,000 수치지형도와 비교한 결과 수직방향으로는 지형특성에 따라 최대 5m 이상의 차이도 존재하는 것으로 확인되었다. 한편 비록 실험에 사용된 영상자료 내에 일부 불규칙한 시차가 존재하는 것을 확인하였지만 축척 1/5,000 수치지형도에서 요구되는 레이어에 대해서 최소 70% 이상은 판독 및 도화가 가능한 것으로 확인되었다. 또한 실험을 통해 제작된 도화 DEM을 기존 라이다 DEM 등과 비교함과 동시에 이를 통해 제작된 정사영상의 위치정확도가 축척 1/5,000 정사영상지도에서 요구하는 정확도를 만족하는 것을 확인하였다.

역시간 구조보정을 활용한 해저 기포플룸 영상화 연구 (Study of Imaging of Submarine Bubble Plume with Reverse Time Migration)

  • 이다운;정우근;김원기;배호석
    • 지구물리와물리탐사
    • /
    • 제26권1호
    • /
    • pp.8-17
    • /
    • 2023
  • 해양 환경에서의 기포는 바람, 파도, 선박 및 해저 가스 누출을 포함한 여러 요인에 의해 생성된다. 수중에서의 기포는 강력한 산란 신호를 생성하여 음향 신호를 측정하는데 영향을 미친다. 이러한 기포의 특성은 음파 신호의 세기를 감쇠시켜 소음 차단 목적으로 주로 이용되고 있으며, 최근에는 해저에서 대규모로 누출되는 메탄가스 탐지를 위한 연구가 진행되고 있다. 이러한 가스 누출은 기포플룸의 형태를 취하며, 기포의 물리적 특성과 분포 구조를 이해하는 것은 누출된 가스를 기후 변화와 연관성을 파악하는데 중요한 요소 중 하나이다. 본 연구에서는 탄성파 영상화 기법을 이용하여 기포플룸의 분포를 추정하고자 수조환경에서 실험을 수행하였으며, 별도로 제작된 인공기포 발생기, 자료 취득 시스템을 이용하여 기포에 의한 음향 신호를 취득하였다. 기포플룸을 영상화하기 위해 지진파 영상기법 중 역시간 구조보정을 이용하였으며, 획득한 음향 신호의 포락선 신호를 이용하여 기포 분포 패턴을 효과적으로 추정하였다. 영상화 결과의 검증을 위해 추정된 기포플룸의 분포와 광학카메라 영상을 비교하였다. 실험결과 탄성파 영상화 기법 통해 인공 기포플룸의 산란신호를 이용한 영상화가 가능함을 확인하였다.

흰쥐 광 혈전 뇌경색 모델에서 줄기세포 추적을 위한 자화강조영상 (Susceptibility Weighted Image for Stem Cell Tracking in Rat Photothrombotic Infarction)

  • 하본철;임청환
    • 한국콘텐츠학회논문지
    • /
    • 제10권8호
    • /
    • pp.249-256
    • /
    • 2010
  • 사람 중간엽 줄기세포(hMSCs)를 초상자성산화철(SPIO)로 표지하여, 체외에서 세포 농도에 따른 신호의 변화를 알아보고, 흰쥐 광 혈전 뇌경색 모델에 이식하여 자기공명영상 기법 중, T2강조영상과 $T2^*$강조영상 그리고 자화강조영상의 줄기세포 검출능을 분석하고, 병리 소견과 비교하고자 하였다. 체외실험은 SPIO(Feridex I.V.$^{(R)}$)로 표지한 줄기세포 $1.56{\times}10^4$, $3.13{\times}10^4$, $6.25{\times}10^4$, $1.25{\times}10^5$, $2.5{\times}10^5$, $5{\times}10^5$ 개/$m{\ell}$, SPIO로 표지 하지 않은 $5{\times}10^5$ 개/$m{\ell}$의 세포를 Control로 준비하여 $0.5m{\ell}$튜브에 담아 T2WI, $T2^*WI$, SWI sequence로 자기공명영상을 얻었다. 체내실험은 8마리의 흰쥐를 대상으로 정수리점(bregma)에서 우측으로 2.5mm, 뒤쪽으로 2.5mm 부위에 광 혈전 뇌경색을 만들고, SPIO-hMSC $2.5{\times}10^5$ 개/$m{\ell}$, $1m{\ell}$을 꼬리 정맥에 주입하여 실험하였다. 자기공명영상은 주입 전과 주입 후 1, 3, 7 그리고, 14일째 T2WI, $T2^*$WI, SWI 영상을 얻고 정량적으로 평가하였다. 자기공명영상검사 후 흰쥐는 조직검사를 위해 희생시켰다. 체외실험 결과 CNR은 SWI, $T2^*WI$, T2WI 순으로의 높게 나왔고, 세포 농도에 따라서는 $2.5{\times}10^5$ 개/$m{\ell}$의 농도에서 가장 높게 나왔다. 체내실험에서 normal, infarction, SPIO 상호간의 CNR을 분석해본 결과 normal-infarction의 CNR은 T2WI가 가장 높게 나왔고, normal-SPIO 그리고 infarction-SPIO에서 CNR은 SWI, $T2^*WI$, T2WI순으로 나왔다. 따라서 흰쥐를 이용한 실험에서 T2WI sequence는 infarction을 잘 표현해 주고, SWI는 SPIO로 표지한 줄기세포를 normal과 infarction으로 부터 잘 구별해 주었다. 현재 임상에서 SWI는 출혈, 석회화 병변등을 쉽게 찾아내는 sequence로 사용 되고 있지만 향후에 줄기세포 치료가 인간의 질병을 치료하는 주요방안으로 자리 잡을 때에도 이식된 줄기 세포를 관찰 할 수 있는 좋은 도구가 될 것으로 기대 된다.