• 제목/요약/키워드: Image Transformation

검색결과 1,071건 처리시간 0.034초

Face Recognition Research Based on Multi-Layers Residual Unit CNN Model

  • Zhang, Ruyang;Lee, Eung-Joo
    • 한국멀티미디어학회논문지
    • /
    • 제25권11호
    • /
    • pp.1582-1590
    • /
    • 2022
  • Due to the situation of the widespread of the coronavirus, which causes the problem of lack of face image data occluded by masks at recent time, in order to solve the related problems, this paper proposes a method to generate face images with masks using a combination of generative adversarial networks and spatial transformation networks based on CNN model. The system we proposed in this paper is based on the GAN, combined with multi-scale convolution kernels to extract features at different details of the human face images, and used Wasserstein divergence as the measure of the distance between real samples and synthetic samples in order to optimize Generator performance. Experiments show that the proposed method can effectively put masks on face images with high efficiency and fast reaction time and the synthesized human face images are pretty natural and real.

Human Face Recognition Based on improved CNN Model with Multi-layers

  • Zhang, Ruyang;Lee, Eung-Joo
    • 한국멀티미디어학회논문지
    • /
    • 제24권5호
    • /
    • pp.701-708
    • /
    • 2021
  • As one of the most widely used technology in the world right now, Face recognition has already received widespread attention by all the researcher and institutes. It has been used in many fields such as safety protection, surveillance system, crime control and even in our ordinary life such as home security and so on. This technology with today's technology has advantages such as high connectivity and real time transformation. But we still need to improve its recognition rate, reaction time and also reduce impact of different environmental status to the whole system. So in this paper we proposed a face recognition system model with improved CNN which combining the characteristics of flat network and residual network, integrated learning, simplify network structure and enhance portability and also improve the recognition accuracy. We also used AR and ORL database to do the experiment and result shows higher recognition rate, efficiency and robustness for different image conditions.

Development of Standard Hill Technology for Image Encryption over a 256-element Body

  • JarJar, Abdellatif
    • Journal of Multimedia Information System
    • /
    • 제8권1호
    • /
    • pp.45-56
    • /
    • 2021
  • This document traces the new technologies development based on a deep classical Hill method improvement. Based on the chaos, this improvement begins with the 256 element body construction, which is to replace the classic ring used by all encryption systems. In order to facilitate the application of algebraic operators on the pixels, two substitution tables will be created, the first represents the discrete logarithm, while the second represents the discrete exponential. At the same time, a large invertible matrix whose structure will be explained in detail will be the subject of the advanced classical Hill technique improvement. To eliminate any linearity, this matrix will be accompanied by dynamic vectors to install an affine transformation. The simulation of a large number of images of different sizes and formats checked by our algorithm ensures the robustness of our method.

Remote Reading of Surgical Monitor's Physiological Readings: An Image Processing Approach

  • Weerathunga, Haritha;Vidanage, Kaneeka
    • International Journal of Computer Science & Network Security
    • /
    • 제22권7호
    • /
    • pp.308-314
    • /
    • 2022
  • As a result of the global effect of infectious diseases like COVID-19, remote patient monitoring has become a vital need. Surgical ICU monitors are attached around the clock for patients in critical care. Most ICU monitor systems, on the other hand, lack an output port for transferring data to an auxiliary device for post-processing. Similarly, strapping a slew of wearables to a patient for remote monitoring creates a great deal of discomfort and limits the patient's mobility. Hence, an unique remote monitoring technique for the ICU monitor's physiologically vital readings has been presented, recognizing this need as a research gap. This mechanism has been put to the test in a variety of modes, yielding an overall accuracy of close to 90%.

감시 카메라 영상의 객체 인식을 위한 회전 변화에 강인한 질감 분류 (Rotation Transformation Invariant Texture Classification for Object Recognition of Surveillance Camera Image)

  • 김원희;박성모;김종남
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 춘계학술발표대회
    • /
    • pp.171-172
    • /
    • 2009
  • 질감 분류 기술은 패턴인식과 컴퓨터 비전 분야에서 널리 사용되는 기술로서, 최근 들어서는 감시 카메라 시스템에서의 정확한 객체 인식을 위한 회전 변화에 강인한 질감 분류 연구가 진행되고 있다. 본 논문에서는 순환 가보 웨이블렛 필터를 이용한 회전 변환에 강인한 질감 분류 방법을 제안한다. 제안하는 방법은 순환 가보 웨이블렛 필터링된 영상에서 전역 및 지역 특징 벡터를 계산하고 특징 벡터의 차이를 이용한 유사도 측정 판별식으로 질감 분류를 수행한다. Brodatz 질감 앨범을 이용한 실험에서 기존의 방법들보다 2~6% 향상된 질감 분류 비율을 확인할 수 있었다. 제안하는 방법은 질감 기반 객체 인식에 관련된 응용 분야에서 유용하게 사용될 수 있다.

피아노 학습을 위한 IoT 훈련시스템 구현 (Implementation of IoT training system for piano practicing)

  • 유성룡;유강은;김다영;박형근
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.526-528
    • /
    • 2022
  • 본 연구에서는 피아노 학습에 있어서 문제점을 도출하고 캡스톤디자인 프로젝트를 통해 피아노를 혼자 학습할 수 있도록 지원하는 IoT기술 기반의 훈련시스템을 개발하였다. 피아노 훈련 매체는 악보를 영상처리기술을 통해 인식하고 훈련시 피아노 음으로부터 FFT 변환을 통해 정확한 건반을 쳤는지를 확인하게 된다. 리듬게임의 요소를 이용하여 시각적 효과 및 점수 표시 기능을 제공함으로써 입문단계에서 지루한 피아노 교육에 대한 흥미를 유발하고 피아노 학습의 효과를 높일 수 있었다.

  • PDF

MBTI 성격유형과 외모의 연관성 탐색 : StyleCLIP 기반 이미지 변환 및 전이학습 활용 연구 (Exploring the Association between MBTI Personality Types and Physical Appearance: A Study using StyleCLIP Image Transformation and Transfer Learning)

  • 정미영;류연호;이호정;홍민기;송미화
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.293-294
    • /
    • 2023
  • 이 연구는 사람의 외적인 요소와 마이어스-브릭스가 제안한 16 가지 성격유형을 결부한 연구이다. 기존의 성격유형에 대한 기준을 기반으로 하여, 일반적인 MBTI 판독기와는 다르게 StyleCLIP 을 활용해서 추상적인 단어로 이미지를 변환하고 전이학습 AI 를 이용하여 비교 테스트를 진행한다. 최종적으로 이 연구를 통해 외모와 성격은 연관이 있다는 가설을 증명한다.

X-색도 공간에서 ROI의 전방향 프로젝션과 백색패치의 평행이동에 의한 본질 영상 획득 (Acquisition of Intrinsic Image by Omnidirectional Projection of ROI and Translation of White Patch on the X-chromaticity Space)

  • 김달현;황동국;이우람;전병민
    • 정보처리학회논문지B
    • /
    • 제18B권2호
    • /
    • pp.51-56
    • /
    • 2011
  • 흑체의 온도 변화에 대한 영상의 색차를 줄이는 본질 영상은 단일 불변 방향을 검출하고 백색 장면 조명체를 기반으로 하기 때문에 실영상에 존재하는 다수의 불변 방향과 유색 장면 조명체에 취약하다. 이러한 문제를 해결하기 위해 본 논문에서는 ${\chi}$-색도 공간에서 ROI의 전방향프로젝션과 백색패치의 평행이동을 통해 불변 방향을 검출하는 본질 영상 획득 기법을 제안한다. 3차원 RGB 공간 분석의 어려움으로 인하여, 본 논문 또한 밝기가 고려되지 않은 ${\chi}$-색도 공간을 사용한다. 이 공간에서 유색 조명체의 효과는 백색패치의 평행이동을 통해 감소시키고, 색차에 따라 가상의 선분으로 나타나는 불변 방향은 ROI의 전방향 프로젝션을 통해 검출한다. 다수의 불변 방향을 고려하여 ROI 선택은 3D 히스토그램에서 빈도수에 의해 결정한다. 검출 후, 본질 영상은 불변 방향의 직교 방향으로의 프로젝션과 RGB영상으로의 역변환 과정을 통해 획득된다. 실험에서 Ebner가 제안한 데이터집합을 실험 영상으로 이용하였고, 불변 방향의 표준편차와 색항등성 측도를 평가 측도로 사용하였다. 제안한 기법의 실험 결과는 엔트로피 기법보다 불변 방향의 표준 편차가 낮았으며, 기존의 기법에 비해 색항등성이 2배 이상 높았다.

스크린 이미지 부호화를 위한 에지 정보 기반의 효과적인 형태학적 레이어 분할 (Effective Morphological Layer Segmentation Based on Edge Information for Screen Image Coding)

  • 박상효;이시웅
    • 한국콘텐츠학회논문지
    • /
    • 제13권12호
    • /
    • pp.38-47
    • /
    • 2013
  • 다중 레이어 영상 모델인 Mixed Raster Content 모델 (MRC) 기반의 영상 부호화는 스크린 이미지와 같은 혼합 영상을 전경 레이어, 이진 마스크 레이어, 배경 레이어로 재구성한 뒤, 각 레이어마다 그 레이어의 신호 특성에 적합한 부호화기를 이용하여 영상을 압축하는 기법이다. 문자와 같은 계단 형태의 강한 에지를 갖는 영역의 위치 정보를 마스크 레이어에 저장하고, 그 위치의 색상 신호는 전경 레이어에 저장한다. 그리고 나머지 영역인 배경 영역의 색상 신호는 배경 레이어에 저장한다. 따라서 마스크 레이어가 전경과 배경의 분할 정보를 담게 되며, 이 분할 정보의 정확도에 따라 전체 부호화기의 압축 효율이 직접적인 영향을 받는다. 본 논문은 MRC 기반의 영상 부호화를 위한 새로운 레이어 분할 알고리즘을 제안한다. 제안 방법은 형태학적 필터인 top hat 변환을 이용하여 문자를 배경신호로부터 분할한다. 이때 문자의 경계를 에지 맵으로부터 추정하여 문자 색상과 배경과의 상대적 밝기를 결정하고 이를 통해 형태학적 필터링에 필요한 top hat 변환의 종류를 정확히 선택하도록 하였다. 실험을 통해 제안 방법이 비교 대상 알고리즘에 비해 우수한 분할 성능을 가짐을 보인다.

LSPIV 적용시 Tracers에 따른 바람의 영향 (Effects of Wind Depending on Tracers in an Application of LSPIV)

  • 김영성;양재린
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2007년도 학술발표회 논문집
    • /
    • pp.836-840
    • /
    • 2007
  • Large-Scale Particle Image Velocimetry (LSPIV)는 Particle Image Velocimetry (PIV)를 자연하천이나 실험실에서 넓은 영역($4m^2{\sim}45,000m^2$)에 적용할 수 있도록 확장시킨 것으로 지난 10여년 이상 세계적으로 널리 이에 대한 연구가 진행되고 있다. PIV는 seeding, illumination, recording 그리고 image processing으로 구성된다. LSPIV(Large Scale PIV)는 PIV의 기본원리를 근거로 하여 기존의 PIV에 비하여 실험실 내에서의 수리모형실험이나 일반 하천에서의 유속측정과 같은 큰 규모의 흐름해석을 할 수 있도록 seeding, illumination에 대한 조정이 필요하고, 촬영된 image에 대한 왜곡을 없애는 작업이 필요하다. LSPIV는 PIV의 네가지 단계를 포함하여 seeding, illumination, recording, image transformation, image processing 및 post-processing의 여섯 단계로 구성되어진다 (Li, 2002). LSPIV를 일반 하천에 적용시, 자연발생적인 tracers - 난류로 인한 표면 교란, 부유물, 수공구조물로 인해서 발생하는 자연 발생되는 거품 - 가 풍부해서 seeding이 불필요한 경우를 제외하고는 정확한 유속장의 해석을 위하여 인공적인 seeding을 필요로 한다. 일반적으로 Seeding 재료로 많이 이용되는 것은 wood mulch, Ecofoam, grain-straw 등이다. 하천에서 자연발생적 혹은 인위적 seeding을 하였을 때 이들 tracers의 물리적인 속성으로 바람에 쉽게 영향을 받고 이로 인하여 실제의 물표면유속을 대표하지 못하는 경우가 있다. 이에 실험실의 개수로에서 여러 가지 이용 가능한 tracers에 대하여 바람에 의한 오차 발생의 정도를 조사하였다. 실험에 사용된 seeding 재료로는 black polypropylene, Ecofoam, white polystyrene의 세가지를 이용하였다. black polypropylene (SG=0.92)과 white polystyrene (SG=0.0125)은 폭 1 m 이내의 개수로 실험 장치에서 유속장의 해석에 많이 이용되고 Ecofoam (SG=0.0065)은 수리 모형실험에서 많이 이용된다. seeding 물질에 따른 바람의 영향을 분석하기 위해서 폭 60cm의 개수로에서 seeding 물질을 변경하면서 펌프의 조작에 의해 3가지 단면평균유속을 발생시키고, 각 평균유속조건에 대해 4가지의 바람세기 - 바람이 없을 때와 팬의 바람세기를 1단, 2단, 3단으로 조정 - 를 발생시켰으며, 개수로위에서 촬영한 이미지의 상류측기준점으로부터 0.3556m 하류 지점을 횡단하는 단면의 표면유속을 측정하여 비교하였고, 그 단면의 중앙에서 물표면 바로 위 지점의 풍속을 측정하였다. 각 Seeding 물질에 대해 팬을 켜지 않았을 때, 즉 바람의 영향이 없을 때 측정한 표면유속을 바람의 세기가 변한 경우의 기준 표면유속으로 이용하였다. 본 연구의 결과 비중이 0.01 내외인 Ecofoam과 white polystyrene에 비해 비중이 0.92인 black polypropylene은 대부분이 물속에 잠겨 있어 흐름과 거의 일치하여 움직임을 알 수 있었다. 또한 흐름의 평균유속이 0.165 m/s의 저유속에서 바람이 tracers에 미치는 영향이 평균유속 0.558m/s인 경우보다 커서, 바람의 세기의 증가에 따라 표면유속 측정값이 급속히 감소되었다. 흐름의 평균유속이 큰 경우에는 바람이 tracer에 마치는 영향이 현격히 줄어듬을 보이고 있다. 결론적으로 유속이 증가함에 따라 바람의 영향은 감소하나, 바람의 영향을 최소화시키기 위해서는 가급적 비중이 큰 물질(0.5

  • PDF