통합 검색 | Korea Science

Artificial Neural Network Method Based on Convolution to Efficiently Extract the DoF Embodied in Images

Kim, Jong-Hyun
- 한국컴퓨터정보학회논문지
- /
- 제26권3호
- /
- pp.51-57
- /
- 2021
본 논문에서는 카메라의 포커싱과 아웃포커싱에 의해 이미지에서 뿌옇게 표현되는 피사계 심도(Depth of field, DoF) 영역을 효율적인 합성곱 신경망을 통해 찾는 방법을 제안한다. 우리의 접근 방식은 RGB채널기반의 상호-상관 필터를 이용하여 DoF영역을 이미지로부터 효율적으로 분류하고, 합성곱 신경망 네트워크에 학습하기 위한 데이터를 구축하며, 이렇게 얻어진 데이터를 이용하여 이미지-DoF가중치 맵 데이터 쌍을 설정한다. 학습할 때 사용되는 데이터는 이미지와 상호-상관 필터 기반으로 추출된 DoF 가중치 맵을 이용하며, 네트워크 학습 단계에서 수렴률을 높이기 위해 스무딩을 과정을 한번 더 적용한 결과를 사용한다. 테스트 결과로 얻은 DoF 가중치 이미지는 입력 이미지에서 DoF영역을 안정적으로 찾아내며, 제안하는 방법은 DoF영역을 사용자의 ROI(Region of interest)로 활용하여 NPR렌더링, 객체 검출 등 다양한 곳에 활용이 가능하다.
https://doi.org/10.9708/jksci.2021.26.03.051 인용 PDF KSCI

실감모형 제작을 위한 고해상도 유물 이미지 매팅 (High Resolution Photo Matting for Construction of Photo-realistic Model)

최석근;이승기;최도연;김광호
- 한국측량학회지
- /
- 제40권1호
- /
- pp.23-30
- /
- 2022
최근 딥러닝을 이용한 이미지 매팅 방법에 관한 다양한 연구가 진행되고 있다. 특히, 사진측량 분야에서도 고품질의 실감모형을 제작하기 위해서는 촬영된 이미지에서 유물 정보를 추출하는 과정이 필요하며, 이와 같은 과정은 많은 시간과 인력이 들어 기존에는 크로마키를 이용하여 추출하는 방법이 많이 활용되고 있다. 그러나, 기존의 방법은 세부 분류에 대한 정확도가 떨어져 고품질 실감모형에 적용하기에는 어려움이 있었다. 본 연구에서는 사전배경정보와 훈련된 학습데이터를 이용하여 고해상도 유물 이미지에서 배경정보를 제거하고 추출된 유물 이미지에 대하여 정성적, 정량적 결과를 평가하였다. 그 결과 제안된 방법과 FBA(매뉴얼 트라이맵)이 정량적으로 높은 결과를 나타냈으며, 정성적 평가에서도 유물 주변부의 분류도가 높은 정확도를 보였다. 따라서 제안된 방법은 고해상도 유물 이미지 분류에 있어 사전배경정보 취득을 통하여 높은 정확도와 빠른 처리 속도를 나타냈으며, 실내 유물 촬영에서 그 활용 가능성을 확인하였다.
https://doi.org/10.7848/ksgpc.2022.40.1.23 인용 PDF KSCI

혼합 영상의 3D 변환을 위한 이미지 영역 검출 (Detecting Image Regions in Mixed Images for 3D Conversion)

이준석;위진영;길종인;김만배
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2013년도 하계학술대회
- /
- pp.363-365
- /
- 2013
최근 3D산업의 급성장으로 인해 3D콘텐츠 제작에 대한 관심이 확산되고 있다. 지금까지는 3D콘텐츠 제작을 영화나 애니메이션 같은 자연영상을 3D변환하는 것에 초점이 맞추어져 있었다. 자동 3D변환에서는 window 영상처럼 텍스트, 이미지, 로고 등의 혼합되어 있는 영상을 처리하는데 어려움이 있다. 특히 텍스트는 동일한 깊이맵을 얻지 못하면, 깨짐, 흔들림 등의 문제점이 발생한다. 해결방법으로 혼합 영상을 구분하고 영상 영역만을 탐색해서, 3D변환을 하고, 다른 영역은 2D로 처리함으로써 상기 문제점을 극복할 수 있다.
PDF

웹페이지 이미지 영역의 3D 변환 (3D Conversion of Image Regions in Webpages)

임창민;김만배
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2013년도 하계학술대회
- /
- pp.366-367
- /
- 2013
3D Conversion은 3DTV 및 3D Display에 장착되어 제공되고 있다. 이외에도 다양한 변환 방법이 제안되어 왔다 기존 방법들은 영화나 애니메이션 같은 자연영상을 3D로 변환하는 것에 초점이 맞추어져 있었다. 따라서 자동 3D변환에서는 webpage영상처럼 텍스트, 이미지, 로고 등의 혼재되어 있는 영상을 처리하는데 어려움이 있다. 특히 텍스트는 동일한 깊이맵을 얻지 못하면, 깨짐, 흔들림 등의 문제점이 발생한다. 해결방법으로 webpage에서 image region만을 탐색해서, 3D변환을 하고, 다른 영역은 2D로 처리함으로써 상기 문제점을 극복할 수 있다. 이를 위해 본 논문에서는 변환하려는 영상 영역을 탐색하고 이 탐색된 영상들을 단순하게 픽셀의 수평이동이 아닌, 양선형 보간으로 변환하여 홀채움 문제를 극복할 수 있는 변환방법을 제안한다.
PDF

학교시설(學校施設)의 공간인지(空間認知)에 관한 연구(硏究) - 주거환경(住居環境)이 학교시설(學校施設)의 인지(認知)에 미치는 영향(影響)을 중심(中心)으로 - (A Study of Spacial Cognition in School Buildings - Focused on the Relationship between School Building and House -)

김승제;김경록
- 교육시설
- /
- 제7권2호
- /
- pp.37-45
- /
- 2000
It has been practiced that past school buildings were planned focused spacial composition of functional and aesthetic. Therefore there is little consideration of psychological consciousness for the very user-students and teachers. To be premised that residential environment has an effect on cognizing of school buildings, The purpose of this study is like that. 1. How to recognize space for Children. 2. What kinds of type on Spacial Cognition. 3. To break any agreement of Relationship Structure for Spacial Cognition between School buildings and Residential Environment, and Mechanism of its essential element of composition.
PDF

자연영상에서 코너 에지 특징 분석방법을 이용한 한글 텍스트 검출기법에 관한 연구 (Hangul Text Detection using Text Corner Edge Feature Analysis in Natural Scene Images)

박종천;권교현;전병민
- 한국콘텐츠학회:학술대회논문집
- /
- 한국콘텐츠학회 2005년도 추계 종합학술대회 논문집
- /
- pp.379-383
- /
- 2005
본 연구에서는 자연 이미지에서 한글 텍스트가 갖고 있는 에지 코너 특징을 이용한 한글 텍스트 검출방법을 제안한다. 자연영상으로부터 에지를 검출하고, 검출된 에지를 20종류의 에지 구조 성분을 갖는 에지 맵을 생성한다. 생성된 에지 맵에서 한글 텍스트 특징 갖는 특징들을 조합하여 모두 8가지의 텍스트 영역 후보 특징을 추출한다. 추출된 텍스트 영역의 특징을 수평 및 수직방향으로 검사하여 텍스트의 시작 라인과 끝라인을 검출하여 텍스트 영역의 수평좌표를 구한다. 추출된 텍스트 후보 영역에서 최종적으로 텍스트 영역을 결정한다. 제안한 방법은 다양한 종류의 자연 이미지에서 텍스트 영역을 검출에서 좋은 성능을 나타냈다.
PDF

홉필드 신경망을 이용한 부분패턴의 복원에 관한 연구 (A Study on Partial Pattern Restoration using Hopfield Neural Network)

김지훈;이주영;남궁재찬
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
- /
- pp.591-594
- /
- 2003
본 논문에서는 hopfield 신경망을 사용한 다양한 부분적인 패턴 복원에 관하여 연구하였다. 여섯 개의 $32{\times}32$ 비트맵 훈련패턴들은 한글자음 ㄱ, ㅁ, ㅂ, ㅇ, ㅊ, ㅍ, 그리고 남자와 여자 이미지로 구성되어 있다. 그리고 부분패턴들의 크기, 범위, 방향의 효과를 알아보기 위해서 훈련패턴에서 여덟 가지 형태의 테스트 패턴을 만든다. 한글 자음의 경우 유사 패턴이 많기 때문에 완전히 복원되지 못하였으나, 400회 정도 수렵된 후에는 테스트패턴들이 견본패턴과 비슷한 모양으로 복원되었다. 이 유사도를 측정하기 위해 해밍거리 (Hamming distance)를 이용하였다. 유사도를 측정하여 해밍거리가 가장 적은 것으로 본래의 이미지들 복원하였다.
PDF

하이퍼볼릭 패턴 생성을 위한 백워드 매핑 (Backward Mapping Method for Hyperbolic Patterns)

조청운
- 한국정보과학회논문지:시스템및이론
- /
- 제30권5_6호
- /
- pp.213-222
- /
- 2003
일반적으로 하이퍼볼릭 공간상에서 대칭 패턴을 생성하는 알고리즘은 벡터표현 방식에 기반한 포워드 매핑 알고리즘을 사용한다. 기존의 알고리즘에서는 복사한 대칭 패턴을 표현하는 레이어의 증가에 따라 메모리의 사용이 기하급수적으로 증가한다 이러한 문제점으로 인해 전체 패턴의 정밀한 표현이 불가능하다. 또한 기본 패턴으로 비트맵 이미지를 사용하기 어렵고 벡터형태의 결과를 이미지로 변환하는 추가의 처리를 필요로 한다. 본 논문에서는 하이퍼볼릭 공간에서 대칭 패턴을 생성하는데 있어 정밀하고도 효율적인 계산 방법인 백워드 매핑 알고리즘을 제안한다.
PDF KSCI

UAV 및 모바일 기기를 위한 얼굴 표정 인식 네트워크 (Face Expression Recognition Network for UAV and Mobile Device)

최은지;박병준;윤경로
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2021년도 하계학술대회
- /
- pp.348-351
- /
- 2021
최근 자동화의 필요성이 증가함에 따라 얼굴 표정 인식 분야(face expression recognition)가 인공지능과 이미지 처리 분야에서 활발히 연구되고 있다. 본 논문에서는 기존 인공신경망에서 요구되었던 고성능 GPU 환경과 높은 연산량을 극복하고자 모델 경량화(Light weighted Model) 기법을 적용하여 드론 및 모바일 기기에서 적용될 수 있는 얼굴 표정 인식 신경망을 제안한다. 제안하는 방법은 미세한 얼굴의 표정 인식을 위한 방법으로, 입력 이미지의 receptive field 를 늘려 특징 맵의 표현력을 높이는 방법을 제안한다. 또한 효과적인 신경망의 경량화를 위하여, 파라미터의 연산량을 줄일 때 발생하는 문제점을 극복하기 위한 방법을 제시한다. 따라서 제안하는 네트워크를 적용하면 많은 연산량과 느린 연산속도로 인해 제한되었던 네트워크 환경을 극복할 수 있을 뿐만 아니라, UAV(Unmanned Aerial Vehicle, 무인항공기) 및 모바일 기기에서 신경망을 이용한 실시간 얼굴 표정 인식을 할 수 있다.
PDF

청각장애인을 위한 동영상 이미지캡션 생성 소프트웨어 개발 (The Development of Image Caption Generating Software for Auditory Disabled)

임경호;윤준성
- 한국HCI학회:학술대회논문집
- /
- 한국HCI학회 2007년도 학술대회 1부
- /
- pp.1069-1074
- /
- 2007
청각장애인이 PC환경에서 영화, 방송, 애니메이션 등의 동영상 콘텐츠를 이용할 때 장애의 정도에 따라 콘텐츠의 접근성에 있어서 시각적 수용 이외의 부분적 장애가 발생한다. 이러한 장애의 극복을 위해 수화 애니메이션이나 독화 교육과 같은 청각장애인의 정보 접근성 향상을 위한 콘텐츠와 기술이 개발된 사례가 있었으나 다소 한계점을 가지고 있다. 따라서 본 논문에서는 현대 뉴미디어 예술 작품의 예술적 표현 방법을 구성요소로서 추출하여, 기술과 감성의 조화가 어우러진 독창적인 콘텐츠를 생산할 수 있는 기술을 개발함으로써 PC환경에서 청각장애인의 동영상 콘텐츠에 대한 접근성 향상 방법을 추출하고, 실질적으로 청각적 효과의 시각적 변환 인터페이스 개발 및 이미지 캡션 생성 소프트웨어 개발을 통해 청각장애인의 동영상 콘텐츠 사용성을 극대화시킬 수 있는 방법론을 제시하고자 한다. 본 논문에서는 첫째, 청각장애인의 동영상 콘텐츠 접근성 분석, 둘째, 미디어아트 작품의 선별적 분석 및 유동요소 추출, 셋째, 인터페이스 및 콘텐츠 제작의 순서로 단계별 방법론을 제시하고 있다. 이 세번 째 단계에서 이미지 캡션 생성 소프트웨어가 개발되고, 비트맵 아이콘 형태의 이미지 캡션 콘텐츠가 생성된다. 개발한 이미지 캡션 생성 소프트웨어는 사용성에 입각한 일상의 언어적 요소와 예술 작품으로부터 추출한 청각 요소의 시각적요소로의 전환을 위한 인터페이스인 것이다. 이러한 기술의 개발은 기술적 측면으로는 청각장애인의 다양한 웹콘텐츠 접근 장애를 개선하는 독창적인 인터페이스 추출 환경을 확립하여 응용영역을 확대하고, 공학적으로 단언된 기술 영역을 콘텐츠 개발 기술이라는 새로운 영역으로 확장함으로써 간학제적 시도를 통한 기술영역을 유기적으로 확대하며, 문자와 오디오를 이미지와 시각적 효과로 전환하여 다각적인 미디어의 교차 활용 방안을 제시하여 콘텐츠를 형상화시키는 기술을 활성화 시키는 효과를 거둘 수 있다. 또한 청각장애인의 접근성 개선이라는 한정된 영역을 뛰어넘어 국가간 언어적인 장벽을 초월할 수 있는 다각적인 부가 동영상 콘텐츠에 대한 시도, 접근, 생산을 통해 글로벌 시대에 부응하는 새로운 방법론으로 발전 할 수 있다.
PDF

검색결과 204건 처리시간 0.024초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)