Search | Korea Science

Comparison of Machine Learning Models for Image Classification on Composite Images (합성 이미지에 대한 기존 머신 러닝 이미지 분류 모델의 성능 비교)

Jeong, YoonJin;Han, Ji-Hyeong
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2021.06a
- /
- pp.324-326
- /
- 2021
증강현실은 현실 공간에 가상의 객체를 합성한 영상을 생성하는 기술이다. 증강현실 기술에 대한 지속적인 수요 증가와 기술 발전이 이루어져 왔으며, 앞으로 사용자에게 현실을 기반으로 생성된 이질감이 느껴지지 않는 정교한 영상을 제공할 수 있으리라 기대할 수 있다. 본 논문에서는 증강현실 기술로 생성된 합성 영상이 정교한 영상임을 판단할 수 있는 객관적인 기준을 마련하기 위해 기존의 머신 러닝 기반의 이미지 분류 모델들로 합성 이미지 예측에 대한 실험을 진행하고 그 결과를 비교한다.
PDF

Pose Estimation through 3D modeling based on NeRF (NeRF 기반 3차원 모델링을 통한 자세 추정)

Park, Chan;Kim, Hyungju;Moon, Nammee
- Proceedings of the Korea Information Processing Society Conference
- /
- 2022.11a
- /
- pp.600-602
- /
- 2022
2차원 이미지 또는 영상을 통한 자세 추정의 경우, 영상 내에서 발생할 수 있는 탐지 오류, 피사체 잘림, 폐색(Occlusion) 등으로 인해 자세 추정 정확도가 감소할 수 있다. 본 논문에서는 4장 이상의 다양한 각도로 촬영한 이미지를 NeRF(Neural Radiance Fields)를 통해 이미지 합성(Image synthesis)을 진행하여 3차원 모델을 생성한다. 이후 DeepLabCut을 사용하여 관절 좌표와 골격(Skeleton)을 구축한다. 구축한 골격을 인공지능에 학습시킨 뒤 2차원 영상에서의 관절 좌표 인식, 골격 구축, 자세 추정을 진행한다. 2차원 영상 테스트 데이터를 통해, 3차원 모델을 사전 학습한 인공지능 모델과 기존 2차원 이미지를 사용하여 학습한 인공지능 모델의 자세 추정 정확도를 비교한다.
https://doi.org/10.3745/PKIPS.y2022m11a.600 인용 PDF

Decorative PhotoMosaics (장식적인 포토모자이크)

김정은;나현철;윤경현
- Proceedings of the Korea Multimedia Society Conference
- /
- 2004.05a
- /
- pp.667-670
- /
- 2004
지금까지 발표된 포토 모자이크 제작 방법은 입력영상을 일정한 크기의 사각형 격자로 나눈 후, 데이터베이스로 구축해 놓았던 이미지들을 입력영상의 색상이 비슷한 격자에 매핑시키는 방법이었다. 본 논문에서는 사각형 타일을 이용하여 입력영상을 표현하는 방법은 같지만, 타일들 사이에 틈을 주어 이미지 에지 주변의 타일들을 회전하거나 이동시킬 수 있게 하여 에지의 방향성을 최대한 표현해낼 수 있는 방법을 제안한다.
PDF

An Image Management System of Frame Unit on a Hand-held Device Environments (휴대장치 환경을 위한 프레임 단위의 영상 데이터 관리 시스템)

Choi, Jun-Hyeog;Yoon, Kyung-Bae;Han, Seung-Jin
- Journal of the Korea Society of Computer and Information
- /
- v.13 no.7
- /
- pp.29-36
- /
- 2008
This paper proposes algorithm for the system that can search for an image of a frame unit, and we implement it. A system already inserts in images after generating the cord that mechanical decoding and identification are possible. We are independent of an external noise in a frame unit, and a system to propose at these papers can search for an image recorded by search condition to include recording date, recording time, a recording place or filming course etc. This system is composed by image insertion wealth to insert data to an image to data image code generation wealth, a frame generating data image code you apply a code generation rule to be fixed in order to express to a price to have continued like data entry wealth, GPS locator values and direction price receiving an image signal, image decoding signals and an image search signal to include search condition, and to have continuity from users each of an image. Also, image decoding we decipher about the noise that was already added from the outsides in a telerecording process, a copy process or storage processes inserted in images by real time, and searching image information by search condition. Consequently we implement decoder, and provide the early system that you use, and we easily insert data code among images. and we can search. and maximization can get precision regarding an image search and use satisfaction as we use algorithm to propose at these papers.
PDF

Enhanced Image Mapping Method for Computer-Generated Integral Imaging System (집적 영상 시스템을 위한 향상된 이미지 매핑 방법)

Lee Bin-Na-Ra;Cho Yong-Joo;Park Kyoung-Shin;Min Sung-Wook
- The KIPS Transactions:PartB
- /
- v.13B no.3 s.106
- /
- pp.295-300
- /
- 2006
The integral imaging system is an auto-stereoscopic display that allows users to see 3D images without wearing special glasses. In the integral imaging system, the 3D object information is taken from several view points and stored as elemental images. Then, users can see a 3D reconstructed image by the elemental images displayed through a lens array. The elemental images can be created by computer graphics, which is referred to the computer-generated integral imaging. The process of creating the elemental images is called image mapping. There are some image mapping methods proposed in the past, such as PRR(Point Retracing Rendering), MVR(Multi-Viewpoint Rendering) and PGR(Parallel Group Rendering). However, they have problems with heavy rendering computations or performance barrier as the number of elemental lenses in the lens array increases. Thus, it is difficult to use them in real-time graphics applications, such as virtual reality or real-time, interactive games. In this paper, we propose a new image mapping method named VVR(Viewpoint Vector Rendering) that improves real-time rendering performance. This paper describes the concept of VVR first and the performance comparison of image mapping process with previous methods. Then, it discusses possible directions for the future improvements.
https://doi.org/10.3745/KIPSTB.2006.13B.3.295 인용 PDF KSCI

Implementation of an Efficient Interpolation for CMOS Image Sensor (CMOS 이미지 센서용 효과적인 인터폴레이션 구현)

Lee, Dong-Hun;Sonh, Seung-Il
- Proceedings of the Korean Institute of Information and Commucation Sciences Conference
- /
- v.9 no.1
- /
- pp.353-357
- /
- 2005
본 논문에서는 영상 입력 장치 또는 카메라 이미지 센서로부터 얻은 Bayer Data입력 포맷을 우리가 디스플레이 장치로 보는 영상으로 출력하기 위해 전처리 작업을 수행한다. 먼저 들어오는 Bayer Data Format은 인터폴레이션을 수행하여 컬러영상을 표현하기위한 한 픽셀 표현 R, G, B값을 구한다. 본 논문에서는 연산량과 필요한 레지스터의 수를 줄이고 칩의 성능을 향상시키기 위해 기존 3${\times}$3라인 쓰지 않고 2${\times}$2라인을 이용한 인터폴레이션을 수행한다. 또한 Bayer Data입력에 대한 이미지 스케일링 작업과 인터폴레이션 수행 작업을 동시에 수행한다. 이를 구현하기위해 원본 이미지 사이즈를 640${\times}$480으로 입력 데이터를 사용하고, 소프트웨어로 전처리하여 이미지 결과를 확인한 후, 최적화된 알고리즘를 적용하여 VHDL설계언어를 이용한 하드웨어 설계후, ModelSim 6.0a를 이용하여 데이터를 검증한다.
PDF

A Frism Mirror Based Stereo Vision : Geometry (프리즘 거울을 이용한 단안렌즈 스테레오비전)

구창운;김충원
- Proceedings of the Korean Institute of Information and Commucation Sciences Conference
- /
- 1999.11a
- /
- pp.424-427
- /
- 1999
적은 연산으로 정확한 정합점을 추출한다는 것은 고전적인 스테레오비전의 가장 큰 단점이다. 이러한 문제점을 해결하기 위해 효과적인 정합점 검출 알고리듬이 많이 연구되고 있으나, 뚜렷한 해결 방법은 없다. 따라서 본 논문에서는 위와 같은 문제점들을 해결 할 수 있는 거울을 이용한 스테레오 비전 시스템을 제안한다. 제안된 시스템은 보다 저렴한 가격으로 스테레오 시스템을 구추할 수 있으며, 한 대의 카메라만을 사용하기 때문에 칼리브레이션 과정을 간략화 할 수 있다. 거울에 반사된 오른쪽과 왼쪽 영상은 거울의 각도에 의해서 동일 이미지 평면의 좌우에 촬상이 된다. 같은 이미지 평면에 촬상된 두 영상의 epipolar line은 x축과 평행한 scan line을 갖는다. 따라서 본 논문에서 제안한 시스템은 정합점을 추출하기 위한 epipolar 검출 알고리듬이 필요하지 않고 한 대의 카메라만을 사용하기 때문에 칼리브레이션 과정을 간략화 할 수 있다. 또한 동일한 이미지 평면에 오른쪽 이미지와 왼쪽 이미지가 촬상되기 때문에 두 영상의 명암도 차이를 보정하기 위한 정규화 작업도 필요하지 않다. 위와 같은 장점은 고전적인 스테레오 비전에서 발생되는 문제점들을 효과적으로 보완한다. 본 논문에서 제안된 시스템에 대한 프로토타입을 제작하여 실험하였으며, 그 결과를 제시하였다.
PDF

Localization of Mobile Robot Using Color Indexing (Color Indexing을 이용한 이동 로봇의 위치 추정)

Kim, Tae-Kyun;Park, Hyun-Keon;Chung, Myung-Jin
- Proceedings of the KIEE Conference
- /
- 1999.07g
- /
- pp.3001-3003
- /
- 1999
Color 이미지 데이터 베이스로부터 원하는 이미지를 찾아내는 방법으로 image indexing에 대한 많은 연구가 이루어지고 있다. 본 논문에서는 image indexing의 한 방법인 color indexing을 이용하여 이동 로봇의 위치 추정 문제를 해결하고자 한다. Color indexing은 영상의 color 분포를 분석하여 원하는 이미지를 찾아내는 기법으로 로봇은 사전에 저장되어 있는 주변 환경에 대한 모델 이미지들로부터 현재 입력되는 영상과 가장 가까운 이미지를 찾아낸다. 또한 로봇은 찾아진 영상을 이용하여 사전에 저장되어 있는 지도상에서의 자신의 위치를 추정할 수 있다. 본 논문에서는 일반적으로 로봇이 작업하는 환경의 조명 상황이 일정하지 않음을 고려하여 다양한 조명 상태에 대하여 여러 가지 color indexing 알고리즘을 적용하여 실험하였으며 matching된 이미지를 이용하여 지도상에서의 로봇의 위치를 추정하는 구체적인 방법을 제시하고 실험을 통하여 타당성을 검증하였다.
PDF

An Enhancement of the Encoding Speed and a Compensation of Decoded Video Quality for H.263 Codec (H.263 압축 속도 향상과 영상 복원용 화질 보상 연구)

Yun, Seong-Gyu;Gang, Ui-Seon;Yu, Hwan-Jong;Im, Yeong-Hwan
- Journal of KIISE:Software and Applications
- /
- v.28 no.5
- /
- pp.402-411
- /
- 2001
H.263 압축 방식은 실현하는데 여러 가지 문제가 있지만 그 중에서 그 대표적인 것은 인코딩 과정에서의 압축 시간이 오래 걸린다는 것이고 다른 한 가지는 과도한 압축률에 의한 복원된 이미지 화질 저하이다. 이 논문에서는 H.263에서의 압축 속도 향상과 복원 이미지의 화질 이미지의 화질 보상에 대한 두 가지 새로운 방법을 제안하였다. 압축 속도를 향상시키기 위해서 움직임 벡터를 찾는 알고리즘을 개선하여 새로운 4단계 탐색 알고리즘을 제안하였다. 또한 화질을 보상하기 위해 디코더에서 블록 아티팩을 제거하고 복원 이미지를 선명하게 하는 알고리즘을 제안하였다. 여기서 화질 보상은 원본 이미지와 동일하게 만드는 것이 아니라 인간이 더 좋은 영상으로 인식하도록 하는 걸 목적으로 한다. 우리가 제한한 알고리즘에 의해서 압축 속도는 초당 2.5에서 17 프레임으로 증가하였고 블록 아티팩을 제거하고 명암 대비를 높임으로써 보기 좋은 영상을 제공하였다.
PDF

Understanding Documents With Chemical Structures Using Image Segmentation (영상 분할을 활용한 화학 구조 문서 이해)

Yang, Haeyoon;Cho, Nam Ik
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2022.06a
- /
- pp.1297-1300
- /
- 2022
Document layout analysis는 문서 이미지의 구조와 구성요소를 파악하는 기술이다. 기존 딥러닝을 사용한 학습 기반 방법에는 각 구성 요소를 검출하는 detection 기반 방식이 많으나 이는 다양한 형식의 문서 이미지에 확장될 수 있는 가능성이 낮다는 한계가 존재한다. 특히, 다양한 모양과 크기의 화학 구조를 포함하는 화학 문서 이미지에 적용하기 어렵다. 본 논문에서는 영상분할을 활용하여 화학 구조 문서를 이해하는 연구를 진행하였다. 기존의 블록 단위로 레이블링된 벤치마크와 다르게 객체 단위로 레이블링한 학습 데이터를 가지고 DeepLabv3 구조의 네트워크를 학습하여 화학 문서 이미지를 효과적으로 분할하였다. 객체 단위 레이블링과 영상 분할을 사용한 방식이 문서 이해 및 화학 구조 검출에 준수한 성능을 보이는 것을 확인하였고 이 방식이 다양한 형식의 문서 이미지에 확장될 수 있음을 보였다.
PDF

Search Result 3,018, Processing Time 0.035 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)