• 제목/요약/키워드: 인간시각 시스템

검색결과 315건 처리시간 0.026초

인간시각시스템을 이용한 하드카피 복사방지기법에 관한 연구 (A Study on the Anti-copying method for hard copy documents using Human Visual System)

  • 이강호
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권4호
    • /
    • pp.291-297
    • /
    • 2006
  • 본 논문에서는 하드카피 문서에 대한 새로운 재생산 방지 기법을 제안한다. 일반 프린터로 일반 용지에 출력한 원본 하드카피를 칼라 복사기로 복사하거나 스캐너로 스캔하여 다시 출력할 경우 원본 하드카피에 포함된 복사방지 패턴에 특별한 문구 패턴이 나타나 복사본임을 육안으로 구분할 수 있는 기술이다. 이를 위하여 본 논문에서는 제안하는 기법은 인간시각시스템(HVS: Human Visual System)의 칼라 인지특성을 이용 우선 배경과 칼라 복사기로 복사하거나 스캐너로 스캔하여 다시 출력할 경우 보일 이진 패턴 맵을 구현하고 원본을 출력하려는 프린너의 도트 게인과 하프토닝 특성을 테스트하는 단계, 하프톤 셀과 스폿을 생성하여 만들어진 하프톤 셀과 스폿을 사용하여 병치 감법혼합으로 농도가 잘 조절된 칼라패턴을 생성한다. 본 논문에서 제안한 하드카피 복사 방지 기법은 기존의 방법에 비해 고해상도 복사 방지 기법으로 유용한 방법이다.

  • PDF

<한국어 립씽크를 위한 3D 디자인 시스템 연구> ()

  • 신동선;정진오
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 2부
    • /
    • pp.362-369
    • /
    • 2006
  • 3 차원 그래픽스에 적용하는 한국어 립씽크 합성 체계를 연구하여, 말소리에 대응하는 자연스러운 립씽크를 자동적으로 생성하도록 하는 디자인 시스템을 연구 개발하였다. 페이셜애니메이션은 크게 나누어 감정 표현, 즉 표정의 애니메이션과 대화 시 입술 모양의 변화를 중심으로 하는 대화 애니메이션 부분으로 구분할 수 있다. 표정 애니메이션의 경우 약간의 문화적 차이를 제외한다면 거의 세계 공통의 보편적인 요소들로 이루어지는 반면 대화 애니메이션의 경우는 언어에 따른 차이를 고려해야 한다. 이와 같은 문제로 인해 영어권 및 일본어 권에서 제안되는 음성에 따른 립싱크 합성방법을 한국어에 그대로 적용하면 청각 정보와 시각 정보의 부조화로 인해 지각의 왜곡을 일으킬 수 있다. 본 연구에서는 이와 같은 문제점을 해결하기 위해 표기된 텍스트를 한국어 발음열로 변환, HMM 알고리듬을 이용한 입력 음성의 시분할, 한국어 음소에 따른 얼굴특징점의 3 차원 움직임을 정의하는 과정을 거쳐 텍스트와 음성를 통해 3 차원 대화 애니메이션을 생성하는 한국어 립싱크합성 시스템을 개발 실제 캐릭터 디자인과정에 적용하도록 하였다. 또한 본 연구는 즉시 적용이 가능한 3 차원 캐릭터 애니메이션뿐만 아니라 아바타를 활용한 동적 인터페이스의 요소기술로서 사용될 수 있는 선행연구이기도 하다. 즉 3 차원 그래픽스 기술을 활용하는 영상디자인 분야와 HCI 에 적용할 수 있는 양면적 특성을 지니고 있다. 휴먼 커뮤니케이션은 언어적 대화 커뮤니케이션과 시각적 표정 커뮤니케이션으로 이루어진다. 즉 페이셜애니메이션의 적용은 보다 인간적인 휴먼 커뮤니케이션의 양상을 지니고 있다. 결국 인간적인 상호작용성이 강조되고, 보다 편한 인간적 대화 방식의 휴먼 인터페이스로 그 미래적 양상이 변화할 것으로 예측되는 아바타를 활용한 인터페이스 디자인과 가상현실 분야에 보다 폭넓게 활용될 수 있다.

  • PDF

지능형 로봇 시스템에서 신경 회로망을 이용한 인간 몸의 제스처 추출 (Extraction of Human Body Using Neural Network in Intelligent Robot System)

  • 소제윤;김종선;주영훈
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2006년도 제37회 하계학술대회 논문집 D
    • /
    • pp.2081-2082
    • /
    • 2006
  • 본 논문에서는 지능형 로봇 시스템에서 신경 회로망을 이용한 인간 몸의 제스처 추출 기법을 제안 하였다. 지능형 로봇 시스템에서 사용된 컴퓨터 시각 기반에서는 시간상의 변화에 따른 특징 벡터 추출을 필요로 한다. 이를 위해 본 논문에서는 신경 회로망을 이용한 제스처 추출 기법을 제안 하였다. 신경 회로망을 이용한 제스처 추출은 오류 역 전파 학습방법을 사용하여 시간상에서 변화하는 영상 시퀀스에 정보를 생성하고 움직임 모델을 통해 두 정보간의 따른 제스처 추출에 가중치를 준다. 마지막으로 본 연구에서 제안한 기법은 실험을 통해 그 우수성을 확인하였다.

  • PDF

과학적 창의성과 시각예술적 창의성: 창의적 성취 사례의 영역보편성 및 영역특정성 (Scientific Creativity and Visual Artistic Creativity: The Domain-universality and Domain-specificity on Creative Accomplishment)

  • 강정하;최인수
    • 영재교육연구
    • /
    • 제18권2호
    • /
    • pp.201-237
    • /
    • 2008
  • 본 연구는 과학 및 시각예술 영역의 창의적 성취사례를 통해 두 영역의 영역보편성과 영역특정성에 대해 살펴보는 데 그 목적을 두었다. 연구를 위해 각각의 영역에서 세계적인 성취를 이룬 한국의 창의적 인물들(과학자: 10인, 시각예술가: 9인)에 대한 인터뷰를 실시하였고, 이로부터 수집한 질적 자료를 토대로 창의적 성취에서 영역보편적으로 드러나는 특성과 영역특정적으로 드러나는 특성을 요약, 기술하였다. 자료분석에는 본 연구의 근간이 되는 총괄적이고 체계적인 개념틀 '지식진화시스템(Knowledge-Evolving Systems: KES)'을 사용하였다. 분석 결과를 보면, 실재시스템에서 두 영역의 성취는 공통적으로 요동, 탐색, 산물을 통해 드러났다. 반면, 과학은 전문지식, 어려운 과제, 세계 최초의 객관적인 지식이 주요한 요인으로, 예술에서는 일상적인 지식, 다양한 주제, 새로운 변화에 대한 인간의 감성 전달이 주된 요인으로 드러났다. 개인시스템에서 두 영역은 모두 분명한 목표를 향한 집중과 독자적인 노력을 보편적으로 요구하였다. 반면 과학은 창조의지, 확산적 및 분석적 사고, 직관 및 통찰, 그리고 도전이 대표적인 요인으로, 시각예술은 즐거움, 민감성, 통합적 사고, 완벽성, 그리고 자유로움이 주요한 요인으로 산출되었다. 마지막으로 사회시스템에서 두 영역의 성취는 전문가의 승인에 의해 결정되었다. 그리고 과학자들의 성취에는 인간네트워크, 기관의 지원, 생존경쟁과 운이 큰 영향을 미쳤고, 시대적 요구와 민족성이 발전의 토대가 되었다. 반면, 시각예술가들은 주변의 반대와 부적인 예술문화 풍토로 인해 고독한 삶을 살아왔다.

근육모델 기반의 3차원 얼굴표정 생성시스템 (3D Facial Expression Creation System Based on Muscle Model)

  • 이현철;윤재홍;허기택
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 춘계학술발표논문집(상)
    • /
    • pp.465-468
    • /
    • 2002
  • 최근 컴퓨터를 이용한 시각 분야가 발전하면서 인간과 관계된 연구가 중요시 되어, 사람과 컴퓨터의 인터페이스에 대한 새로운 시도들이 다양하게 이루어지고 있다. 특히 얼굴 형상 모델링과 얼굴 표정변화를 애니메이션 화하는 방법에 대한 연구가 활발히 수행되고 있으며, 그 용도가 매우 다양하고, 적용 범위도 증가하고 있다. 본 논문에서는 한국인의 얼굴특성에 맞는 표준적인 일반모델을 생성하고, 실제 사진과 같이 개개인의 특성에 따라 정확한 형상을 유지할 수 있는 3차원 형상 모델을 제작한다. 그리고 자연스러운 얼굴 표정 생성을 위하여, 근육모델 기반의 얼굴표정 생성 시스템을 개발하여, 자연스럽고 실제감 있는 얼굴애니메이션이 이루어질 수 있도록 하였다.

  • PDF

퍼지 추론과 시각특성 기반의 적응적 워터마킹 (Adaptive Watermarking based on Fuzzy Inference and Human Visual System)

  • 신희종;박기홍;김윤호
    • 디지털콘텐츠학회 논문지
    • /
    • 제5권4호
    • /
    • pp.311-315
    • /
    • 2004
  • 본 논문에서는 이산 웨이블릿 변환(DWT)영역에 인간의 시각시스템(HVS)용소를 적용한 압축에 강인한 디지털 워터마킹 알고리즘을 제안하였다 전처리과정으로 3-Levl DWT를 수행한 후, 주파수 계수의 공간적인 특성을 고려하여 워터마크를 삽입하였다. 최적의 워터마크삽입영역 선택을 위하여 영상의 명암대비도와 텍스처 특징을 파라미터로 실정하여 퍼지추론기를 설계하였다. 삽입되는 워터마크는 시각적으로 인지가 가능한 특정 로고 형태의 이진 영상을 사용하였고, 실험결과 JPEC 압축비율 $70\%$까지 $90\%$이상의 상관관계를 보였다.

  • PDF

이미지-텍스트 자질을 이용한 행동 포착 비디오 기반 대화시스템 (Audio-Visual Scene Aware Dialogue System Utilizing Action From Vision and Language Features)

  • 임정우;장윤나;손준영;이승윤;박기남;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.253-257
    • /
    • 2023
  • 최근 다양한 대화 시스템이 스마트폰 어시스턴트, 자동 차 내비게이션, 음성 제어 스피커, 인간 중심 로봇 등의 실세계 인간-기계 인터페이스에 적용되고 있다. 하지만 대부분의 대화 시스템은 텍스트 기반으로 작동해 다중 모달리티 입력을 처리할 수 없다. 이 문제를 해결하기 위해서는 비디오와 같은 다중 모달리티 장면 인식을 통합한 대화 시스템이 필요하다. 기존의 비디오 기반 대화 시스템은 주로 시각, 이미지, 오디오 등의 다양한 자질을 합성하거나 사전 학습을 통해 이미지와 텍스트를 잘 정렬하는 데에만 집중하여 중요한 행동 단서와 소리 단서를 놓치고 있다는 한계가 존재한다. 본 논문은 이미지-텍스트 정렬의 사전학습 임베딩과 행동 단서, 소리 단서를 활용해 비디오 기반 대화 시스템을 개선한다. 제안한 모델은 텍스트와 이미지, 그리고 오디오 임베딩을 인코딩하고, 이를 바탕으로 관련 프레임과 행동 단서를 추출하여 발화를 생성하는 과정을 거친다. AVSD 데이터셋에서의 실험 결과, 제안한 모델이 기존의 모델보다 높은 성능을 보였으며, 대표적인 이미지-텍스트 자질들을 비디오 기반 대화시스템에서 비교 분석하였다.

  • PDF

PC 모니터에서의 sRGB 매칭 알고리즘 (sRGB Matching Algorithm in PC Monitor)

  • 곽종섭;송규익
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2001년도 합동 추계학술대회 논문집 정보 및 제어부문
    • /
    • pp.402-405
    • /
    • 2001
  • 인터넷 환경의 발달로 인해 컴퓨터 산업분야에서는 각 컴퓨터 시스템과 멀티미디어 기기들 상호간의 색 정보 처리의 호환성을 필요로 하게 되었다. 이에 따라 제안된 standard RGB (SRGB) color space는 각 컴퓨터 시스템 및 기기들 간에 명백하고 효율적인 하나의 단일 color space로 색 정보가 표현될 수 있게 하였다. 한편 칼라 디스플레이 모니터에서의 색재현에 있어 궁극적인 목적은 원 화상의 색과 동일한 색으로 화상을 재현하는 것으로 인간 시각 특성을 고려한 색 재현이 바람직하다. 따라서 본 연구에서는 인터넷 환경의 비표준 모니터 상에 화상을 재현함에 있어 sRGB 표준과의 차이에 의해 발생되는 좌표적 색도 오차를 정정 매트릭스를 사용하여 색도 오차가 저감되는 보정 방법을 제안하였다. 또한 모니터 주변 밝기에 따른 시각 특성 변화에 따라 인지되는 콘트라스트의 변화에 대한 상관관계를 유도함으로써 그 변화를 보정할 수 있는 방안도 함께 제안하였다.

  • PDF

칼만 필터를 이용한 시청각 음원 정위 및 추적 (Audio-Visual Localization and Tracking of Sound Sources Using Kalman Filter)

  • 송민규;김진영;나승유
    • 한국지능시스템학회논문지
    • /
    • 제17권4호
    • /
    • pp.519-525
    • /
    • 2007
  • 최근 로봇 기술 및 응용에 대한 관심이 고조됨에 따라, 로봇의 청각기술에 대한 연구가 활발하다. 본 기술에서는 로봇 탑재용으로 인간 청각기능중 하나인 음원정위 및 추적기술에 대하여 논한다. 음원 정위 및 추적을 위하여 시청각 정보를 이용하였는데, 시각정보로는 얼굴색 기반 얼굴 탐지 정보를 이용하였으며, 양이(binaural) 기반의 음원 추정 정보가 청각 정보로서 활용되었다. 시각과 청각 정보는 Kalman 필터를 이용하여 통합하였다. 실험결과 시청각 음원 추적 기술은 일부 정보의 유실이 있을 때, 효과적으로 활용될 수 있음을 보였다.

영상 워터마킹을 위한 엔트로피 마스킹 모델 (An Entropy Masking Model for Image and Video Watermarking)

  • Kim, Seong-Whan;Shan Suthaharan
    • 정보처리학회논문지B
    • /
    • 제10B권5호
    • /
    • pp.491-496
    • /
    • 2003
  • 본 논문에서는 정지 영상과 동영상 컨텐츠에 적용하기 위한 새로운 워터마크 설계 가이드라인을 제공한다. 본 논문에서 제안하는 워터마크 설계 방법은 인간 시각 시스템 내의 시각 세포들의 기본적인 동작 특성인 상호간섭 및 배제 작용을 이용하여, 각각의 영상 컨텐츠의 특성을 반영하여 최대한의 워터마크 강도를 구하는데 있다. 영상 컨텐츠의 최대 워터마크를 결정할 수 있다면, 자연스럽게 워터마크의 강인성이 증가되어 일반적인 영상처리 공격이나 MPEG 공격에도 강인하게 동작한 수 있다. 정지영상에서는 여러 단계의 에지 성분이 나타나게 됨에 따라 인간 시각 시스템의 민감도가 급감하게 되고, 동영상에서는 움직임이 세밀해지고 또는 많아질수록 민감도가 급감한다는 점을 모델링하기 위해, 본 논문에서는 정지 영상에서의 엔트로피 마스킹과 동영상에서의 움직임 엔트로피 마스킹을 이용하여 민감도 저하 현상을 모델링하였다. 또한, (움직임) 엔트로피 마스킹 모델을 기존의 워터마크 기법에 적용한 결과를 통해, 일반적인 워터마크 기법에 엔트로피 마스킹을 더함으로써, 워터마크의 투명성을 늘리고, 자연스럽게 워터마크의 강건성을 늘릴 수 있음을 보였다.