• 제목/요약/키워드: 시각 변환

검색결과 698건 처리시간 0.032초

운전자 안정성 향상을 위한 Generative Adversarial Network 기반의 야간 도로 영상 변환 시스템 (Night-to-Day Road Image Translation with Generative Adversarial Network for Driver Safety Enhancement)

  • 안남현;강석주
    • 방송공학회논문지
    • /
    • 제23권6호
    • /
    • pp.760-767
    • /
    • 2018
  • 첨단 운전자 지원 시스템(ADAS)은 차량 기술 분야에서 활발한 연구가 이루어지고 있는 기술이다. ADAS 기술은 직접적으로 차량을 제어하는 기술과 간접적으로 운전자에게 편의를 제공하는 기술로 나뉜다. 본 논문에서는 야간 도로 영상을 보정하여 운전자에게 시각적 편의를 제공하는 시스템을 제안한다. 제안하는 시스템은 전방 블랙박스 카메라로부터 촬영된 도로 영상을 입력받는다. 입력된 영상은 가로 축을 따라 세 부분으로 분할된 뒤 일괄적으로 이미지 변환 모듈을 통해 각각 낮 영상으로 변환된다. 변환된 영상은 다시 결합된 뒤 운전자에게 제공되어 시각적 편의를 제공한다. 본 논문의 실험 결과를 통해 제안한 시스템이 기존의 밝기 변환 알고리즘과 비교하여 우수한 성능을 보임을 입증한다.

시각특성과 DCT를 이용한 영상부호화에 관한 연구 (A Study on Image Coding using the Human Visual System and DCT)

  • 남승진;최성남;전중남;박규태
    • 한국통신학회논문지
    • /
    • 제17권4호
    • /
    • pp.323-335
    • /
    • 1992
  • 본 논문에서는 인간의 시각특성을 반영한 적응 DCT 영상 부호화에 관하여 연구하였다. 인간의 시각은 특정한 중간 주파수 대역에 가장 민감하며, 저주파 대역과 고주파 대역에 대하여 상대적으로 덜 민감하다. 이러한 특성은 많은 심리시각적 실험을 통하여 MTF(Modulation transfer function)라는 수식으로 모델링되었다. DCT는 공간영역의 에너지를 주파수 영역으로 변환하므로 MTF를 효율적으로 이용할 수 있다. 또한 시각의 공간 마스킹 특성에 의하여 변화가 많은 영역의 잡음은 변화가 적은 영역의 잡음에 비하여 인간의 시각에 덜 민감하다. 제안된 부호화 방법은 시각의 공간주파수 반응 특성을 양자화 행렬로 채택하였으며, 영상의 변화도에 따라 변환 블럭을 차등양자화 함으로써 주관적 화질의 향상을 꾀하였다. 각 블럭의 변화도를 측정하기 위한 방법으로 공간 영역에서 간단한 연산을 행하였으며, 이에 따라 변화가 적은 블럭을 상대적으로 정확하게 양자화하였다. 실험결과 낮은 비트율에서 시각특성을 반영한 제안된 부호화 방법이 주관적으로 우수한 성능을 보임을 확인하였다.

  • PDF

건설도면의 GIS 데이터 변환을 위한 건물외곽선 단순화기법 비교 연구 (Comparative Study on the Building Outline Simplification Algorithms for the Conversion of Construction Drawings to GIS data)

  • 박우진;박승용;유기윤
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2008년도 공동춘계학술대회
    • /
    • pp.437-444
    • /
    • 2008
  • 최근 유비쿼터스 시대를 맞아 건설 분야에서 이용되는 CAD 자료에서 GIS 자료로의 변환 및 융복합에 대한 요구가 증대되면서 상호변환을 위한 연구가 활발하게 진행되고 있다. 본 연구에서는 건설도면 CAD 데이터를 활용하여 수치지도의 건물데이터를 수정, 갱신하기 위한 방법론의 일환으로 건설도면의 건물외곽선을 추출하여 수치지도의 건물데이터 수준으로 일반화하는 선형 단순화 알고리즘을 비교 분석하였다. 선형 단순화 알고리즘은 Douglas-Peucker 알고리즘, Lang 알고리즘, Reumann-Witkam, Opheim 알고리즘을 적용하였으며 분석방법으로는 시각적 분석, 절점 수, 총길이, 면적 변화율 분석 그리고 각 절점이 수치지도 작성내규를 만족하는 비율을 이용하였다. 분석 결과 Douglas-Peycker 알고리즘이 시각적 측면과 절점 수 감소율 측면에서 상대적으로 우수한 단순화 결과를 보여주었으나 수치지도 작성내규 만족도 측면에서는 공통적으로 $50{\sim}60%$ 수준의 만족도를 보이고 있어 국내의 수치지도의 건물데이터를 작성하기 위한 단순화 기법으로는 한계가 있는 것으로 나타났으며 이를 만족시키기 위한 일반화 알고리즘의 개발이 필요하다고 판단된다.

  • PDF

비트플레인과 Key를 이용한 비디오 워터마킹 (Video Watermarking Using Bit plane and Key)

  • 최용수;김정엽;현기호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2004년도 추계학술발표논문집(상)
    • /
    • pp.867-870
    • /
    • 2004
  • 본 논문은 비디오 워터마킹에 관한 연구로서 기존의 DCT변환을 한 후 동영상에 워터마크를 삽입하는 방법과는 달리, 압축과정이나 다른 다양한 공격에 대한 강인성에 초점을 두었다. 이 기법은 DWT 기반의 블라인드 비디오 워터마킹으로서 인간 시각적 특성에서 비지각성을 유지하기 위한 방법이다. 칼라영상을 LUV 좌표계로 변환하여 인간 시각에 둔감한 U영역에 서로 다른 장면의 I-프레임에 대해서 웨이블릿 영역 안에 8bit-plane을 한 후, 1단계 웨일블릿 변환을 거친 부호화된 워터마크에 랜덤한 키를 이용하여 삽입한다. 이 기법은 독립적인 워터마크를 HH1를 제외한 나머지 고주파 부대역 영역에 워터마크를 삽입하고 추출 시에는 삽입된 키를 이용하여 추출하였다. 그리고, 제안한 비디오 워터마킹 알고리즘은 효과적으로 풀리지 않았던 프레임 드로핑과 같은 공격들에 대한 강인함을 기존의 방법과 비교 실험하였다. 이는 최초의 영상 없이 삽입된 워터마크 정보를 실시간으로 검색하여 추출할 수 있다.

  • PDF

시각장애인을 위한 온각 기반 감정 전달 시스템 (Thermal Display-Based Emotional Communication System for Blindness)

  • 노효주;김강태;이성길
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1659-1660
    • /
    • 2013
  • 사람 간 의사소통에서 표정, 몸짓과 같은 비언어적 시각 요소들은 감정 표현의 중요한 요소이나, 시각장애인들은 이러한 감정 정보들을 받아들이는데 제한적이다. 본 논문은 시각장애인에게 이러한 비언어적 시각 요소 기반의 감정 정보를 인식하여 온각으로 전달하기 위한 방법론을 제안한다. 상대방의 표정은 안경 착용형 카메라로 인식되어 감정으로 분류된다. 인식된 표정이 웃는 얼굴과 같이 호감인 경우, 이 상태는 온각으로 변환되어 안경에 착용된 온도전달 장치에서 시각장애인에게 호감을 전달한다. 이러한 온각기반 감정전달 장치는 시각장애인의 의사소통 향상을 위한 장치의 개발에 응용될 수 있다.

시각정보처리과정을 이용한 인공시각시스템 (Artificial Vision System using Human Visual Information Processing)

  • 서창진
    • 디지털융복합연구
    • /
    • 제12권11호
    • /
    • pp.349-355
    • /
    • 2014
  • 본 논문은 인간의 생물학적 시각정보처리과정 특성과 웨이블릿을 이용한 인공시각시스템을 제안한다. 인공시각시스템은 인간의 생물학적 시각정보 처리과정을 이용하며 맹인의 인공시각시스템 제작 및 일반적인 인식시스템에 적용할 수 있다. 본 논문에서는 인간의 망막에서 신경절 세포까지 정보 처리과정을 모델링하여 구성하였고 신경절 세포에서 후두엽 초기시각피질까지 전달되는 정보 복원과정을 모델링하여 초기시각피질에 표현되는 영상정보를 구성하였다. 실험과정은 인간의 시각정보 처리과정 특성인 저주파, 고주파 분해를 웨이블릿 변환으로 시각 정보를 구현하였고 이를 이용하여 인식 시스템에 적용하였다. 실험에 사용한 데이터는 AT&T 얼굴데이터베이스를 사용하였다. 그리고 제안하는 인간의 시각정보처리 과정 특성을 이용한 방법이 영상인식 시스템의 정확성을 향상시킬 수 있음을 실험을 통하여 증명하고자 한다.

DCT블록을 이용한 인간 시각시스템 기반의 영상 리사이징 알고리즘 개발 (Development of Image resizing algorithm based Human Visual System using DCT block)

  • 양대규;정상현;서태석
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2008년도 추계학술대회
    • /
    • pp.199-202
    • /
    • 2008
  • 고객의 통신 니즈가 다양해지고 통신 인프라가 대용량, 고속화 되고 단말이 지능화됨에 따라 이를 기반으로 IPTV의 셋탑, 컴퓨터 모니터, 이동통신 핸드폰이 이르기 까지 다양한 화면 사이즈의 단말을 통하여 서비스를 제공하고 있다. 이를 위해 원영상을 화면의 크기에 적합하게 크기를 변환하는 영상 리사이징 기술을 이용하게 되며, 그 방식은 DCT 방식과 공간 방식으로 나눌 수 있다. DCT방식은 원영상의 고주파 영역의 조정하여 크기를 변화하는 방식으로 열화는 최소화되나 DCT 변환을 위한 계산량이 많고 고정 크기 블록을 사용하므로 유연성이 떨어진다. 공간영역은 객관적인 평가에서 품질이 열화되더라도 시각적으로 눈에 민감한 영역의 변화를 최소화하는 것이다. 본 논문은 인간시각시스템을 기반으로 눈의 민간도가 높은 망막 이심율이 작은 영역에서는 DCT블록의 크기를 변화를 최소화시키고 망막이심율이 큰 영역에서는 블록의 변화를 크게 하는 가변 블록방식을 제안한다. 이를 통해 우수한 영상 품질을 확보하면서도 시각적으로 뛰어난 리사이징 영상을 얻을 수 있다.

  • PDF

봉차트의 실시간 시각정보를 보완적 음향정보로 변환하는 방법에 관한 연구 (A Study on the transformation of real-time visual information of bar charts into complementary sound information)

  • 구본철
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.717-722
    • /
    • 2006
  • 경제지표, 주식시세, 전자상거래 등 시각적으로 제공되는 정보 중에 정확한 숫자가 중요한 정보인 경우도 있지만 2 차 정보로서 변화의 추세나 패턴이 중요한 경우도 있다. 주식을 포함한 유가증권이나 선물거래의 경우 주로 미국식 봉차트를 사용하는데 개인투자자가 늘고 있는 우리나라 실정으로 볼때 식음을 전폐하고 전광판에 매달리는 문제점이 지적되고 있고, 전문투자자들도 시각정보를 놓치지 않기 위해 일상 업무에 소홀해지는 경우가 많다. 이러한 경우 음향정보도 함께 제공한다면 인간은 다양한 감각기관을 가지고 있기 때문에 시각정보를 주로 이용하다가도 잠시 휴식을 취하거나 다른 용무가 있을 때 청각정보를 보완적으로 사용하여 스트레스를 줄일 수 있고 명철한 판단력을 유지할 수 있으며, 경우에 따라서는 음향정보가 상황판단을 위해 더욱 효과적일 수도 있을 것으로 본다. 음향정보가 시각정보를 대체하기 보다는 2 차 정보로서 상호보완성이 목적이라면 정확한 숫자의 표현보다는 거래패턴 등을 음악적으로 표현하여 음악 감상의 기능까지 갖춘다면 시각정보와는 차별화된 음향정보의 독자성을 찾을 수 있다. 간혹 종목별 등락을 읽어주거나 중요한 매매시점에 신호음을 내는 청각적인 방법이 사용되기도 하지만 상당히 제한적이고 단순한 상태이다. 그러므로 본 연구의 진정한 개발목적은 정보성 이외에 예술적 표현을 융합하는 것이며, 시각장애인이나 네트워크 환경이 열악한 사람들도 주식투자에 있어서 평등성을 보장하여 건전한 투자문화를 형성하기 위함이다. 실시간 거래정보를 음악적으로 표현하여 업무를 보면서도 들려오는 음악을 통해 거래상황을 파악할 수 있는 연구방법으로 거래빈도는 음의 빠르기로, 거래가는 음의 높낮이, 거래량은 음의 세기, 종목은 악기의 음색으로 표현하였으며, 컴퓨터에 내장된 사운드카드를 통해 소리를 들을 수 있도록 MIDI 데이터로 변환하였다. 통계정보는 주로 한국증권선물거래소(KRX: The Korea Exchange)에서 발췌하였으며, 시뮬레이션을 위한 프로그래밍 언어로는 Cycling74 의 Max/MSP 를 사용하였다.

  • PDF

다해상도 웨이브렛 영역에서 인간 시각 특성을 이용한 컬러 영상의 디지털 워터마킹 기법 (Digital Watermarking Techniques of color image using human visual system in multi-resolution wavelet transform)

  • 연현숙;지인호
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.751-754
    • /
    • 2001
  • 일반적으로 디지털 컬러 영상의 워터마킹 구현방법은 기존의 워터마킹 방법을 RGB 컬러 성분에 대해 각각 적용하였기 때문에 컬러 영상의 특성을 충분히 고려하지 못했다. 그러나 인간의 시각 체계(HVS : Human Visual System)의 특성을 이용하면 컬러 영상에 더욱 효과적으로 워터마크를 삽입할 수 있다. 본 논문에서는 다해상도 이산 웨이브렛 변환 영역에서의 인간의 시각 체계의 특성을 이용한 컬러 영상 워터마킹 방법을 제안하였다.

  • PDF

Wavelet 에 의한 주파수 영역내에서의 디지털 워터마크의 삽입 및 검출 기법 (Digital Watermarking based on Frequency Domaon using Wavelet Transform)

  • 김철기
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 춘계학술발표논문집
    • /
    • pp.161-164
    • /
    • 2000
  • 본 논문에서는 웨이블릿에 의한 원 영상의 주파수 성분들을 스케일링에 의한 해상도 변화를 이용하여, 여러개의 서브밴드들로 나누어질 수있다는 성질을 이용하여 각각의 서브밴드들을 이용하여 워터마크를 삽입·검출하는 기법을 제안하고 있다. 보통 디지털 워터마크는 크게 주파수 영역 워터마크와 공간 영역 워터마크의 두 가지 분야로 분류될 수 있다. 주파수 영역 워터마크는 영상 데이터를 주파수 공간으로 변환하고 그 주파수 영역들 중에서 인간의 시각에 덜 민감한 성분에 워터마크를 삽입하게 되고, 이는 인간 시각 시스템을 더 효과적으로 활용한 것으로 인간시각으로 감지할 수 없는 영역인 고주파수 성분에 워터마크를 삽입하게된다.

  • PDF