• 제목/요약/키워드: Source recognition

검색결과 379건 처리시간 0.025초

가상 복사조도 반구와 반사계수에 근거한 얼굴 재조명 (Face Relighting Based on Virtual Irradiance Sphere and Reflection Coefficients)

  • 한희철;손광훈
    • 방송공학회논문지
    • /
    • 제13권3호
    • /
    • pp.339-349
    • /
    • 2008
  • 본 논문에서는 임의의 알려지지 않은 조명 상황 하에서 3차원 객체의 텍스처 영상 한 장을 이용하여 광원의 위치를 추정하고 이를 이용해 조명에 의해 왜곡되어 있는 얼굴 영상을 재조명하는 기법을 제안한다. 우선 주어진 텍스처 영상으로부터 광원의 위치를 추정하기 위해 법선 벡터와 가중 양선형 보간을 이용하여 가상 복사조도 반구를 만들었다. 이를 이용해 추정된 주변광과 확산광 계수로 재조명 방정식을 도출하였다. 얼굴 텍스처 영상에서의 그림자와 음영을 원색으로 복원하는 알고리즘의 효율성과 정확성을 보이기 위해 광원의 위치 추정, 재조명, 얼굴 인식 등의 다양한 실험 결과를 보였다. 실험결과에 의하여 제안한 알고리즘은 조명에 강인한 얼굴 인식시스템뿐만 아니라 3차원 디스플레이에서의 작업 시 시각적 피로감을 줄이고 작업 효율을 높일 수 있음을 확인하였다.

아두이노를 사용하여 노약자 자동 인식 기술 구현 (Automatic recognition of the old and the infirm using Arduino technology implementation)

  • 최철길;이성진;최병윤
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2014년도 춘계학술대회
    • /
    • pp.454-457
    • /
    • 2014
  • 아두이노는 오픈 소스 기반 전자 프로토타이핑 플랫폼으로서, 예술가, 디자이너, 취미 활동가 등 인터랙티브 객체 또는 환경 구축에 관심이 있는 모든 이들을 위해 제작되었다. 아두이노의 강점은 하드웨어에 대한 깊은 지식이 없어도 손쉽게 하드웨어 어플리케이션을 제작할 수 있다. 아두이노의 구성은 AVR 마이크로컨트롤러 ATmega 168을 사용하며 아두이노를 동작시키기 위한 소프트웨어로는 아두이노 프로그램, MATLAB, Processing을 주로 사용하고 있다. 아두이노는 오픈 소스 기반이며 하드웨어를 직접 제작할 수 있거나 실드를 이용하여 추가적으로 아두이노를 결합할 수도 있다. 아두이노는 하드웨어의 결합을 통해 계속해서 확장이 가능한데 이를 실드라고 통칭하고 있다. 실드는 기본 보드로 주어지는 아두이노 Uno 보드를 다양한 방면으로 확장시켜 더 많은 기능을 탑재할 수 있게 도와준다. 실드의 종류로는 이더넷 실드, 모터 실드, RFID 실드 등이 있으며 이 실드는 다시 실드 위에 결합할 수 있어 단순한 확장성을 넘어선 하드웨어를 구성할 수 있다. 본 논문에서는 노약자 자동 인식 기술은 RFID 실드를 이용하여 노약자를 식별하고 있으며 이를 호환할 태그는 SM130 13.56Mhz 태그를 결합하여 하드웨어를 구성하였다.

  • PDF

Unsupervised Transfer Learning for Plant Anomaly Recognition

  • Xu, Mingle;Yoon, Sook;Lee, Jaesu;Park, Dong Sun
    • 스마트미디어저널
    • /
    • 제11권4호
    • /
    • pp.30-37
    • /
    • 2022
  • Disease threatens plant growth and recognizing the type of disease is essential to making a remedy. In recent years, deep learning has witnessed a significant improvement for this task, however, a large volume of labeled images is one of the requirements to get decent performance. But annotated images are difficult and expensive to obtain in the agricultural field. Therefore, designing an efficient and effective strategy is one of the challenges in this area with few labeled data. Transfer learning, assuming taking knowledge from a source domain to a target domain, is borrowed to address this issue and observed comparable results. However, current transfer learning strategies can be regarded as a supervised method as it hypothesizes that there are many labeled images in a source domain. In contrast, unsupervised transfer learning, using only images in a source domain, gives more convenience as collecting images is much easier than annotating. In this paper, we leverage unsupervised transfer learning to perform plant disease recognition, by which we achieve a better performance than supervised transfer learning in many cases. Besides, a vision transformer with a bigger model capacity than convolution is utilized to have a better-pretrained feature space. With the vision transformer-based unsupervised transfer learning, we achieve better results than current works in two datasets. Especially, we obtain 97.3% accuracy with only 30 training images for each class in the Plant Village dataset. We hope that our work can encourage the community to pay attention to vision transformer-based unsupervised transfer learning in the agricultural field when with few labeled images.

단일 훈련 샘플만을 활용하는 준-지도학습 심층 도메인 적응 기반 얼굴인식 기술 개발 (Development of Semi-Supervised Deep Domain Adaptation Based Face Recognition Using Only a Single Training Sample)

  • 김경태;최재영
    • 한국멀티미디어학회논문지
    • /
    • 제25권10호
    • /
    • pp.1375-1385
    • /
    • 2022
  • In this paper, we propose a semi-supervised domain adaptation solution to deal with practical face recognition (FR) scenarios where a single face image for each target identity (to be recognized) is only available in the training phase. Main goal of the proposed method is to reduce the discrepancy between the target and the source domain face images, which ultimately improves FR performances. The proposed method is based on the Domain Adatation network (DAN) using an MMD loss function to reduce the discrepancy between domains. In order to train more effectively, we develop a novel loss function learning strategy in which MMD loss and cross-entropy loss functions are adopted by using different weights according to the progress of each epoch during the learning. The proposed weight adoptation focuses on the training of the source domain in the initial learning phase to learn facial feature information such as eyes, nose, and mouth. After the initial learning is completed, the resulting feature information is used to training a deep network using the target domain images. To evaluate the effectiveness of the proposed method, FR performances were evaluated with pretrained model trained only with CASIA-webface (source images) and fine-tuned model trained only with FERET's gallery (target images) under the same FR scenarios. The experimental results showed that the proposed semi-supervised domain adaptation can be improved by 24.78% compared to the pre-trained model and 28.42% compared to the fine-tuned model. In addition, the proposed method outperformed other state-of-the-arts domain adaptation approaches by 9.41%.

A Hysteresis Current Controller for PV-Wind Hybrid Source Fed STATCOM System Using Cascaded Multilevel Inverters

  • Palanisamy, R.;Vijayakumar, K.
    • Journal of Electrical Engineering and Technology
    • /
    • 제13권1호
    • /
    • pp.270-279
    • /
    • 2018
  • This paper elucidates a hysteresis current controller for enhancing the performance of static synchronous compensator (STATCOM) using cascaded H-bridge multilevel inverter. Due to the rising power demand and growing conventional generation costs a new alternative in renewable energy source is gaining popularity and recognition. A five level single phase cascaded multilevel inverter with two separated dc sources, which is energized by photovoltaic - wind hybrid energy source. The voltages across the each dc source is balanced and standardized by the proposed hysteresis current controller. The performance of STATCOM is analyzed by connecting with grid connected system, under the steady state & dynamic state. To reduce the Total Harmonic Distortion (THD) and to improve the output voltage, closed loop hysteresis current control is achieved using PLL and PI controller. The performance of the proposed system is scrutinized through various simulation results using matlab/simulink and hardware results are also verified with simulation results.

Diffractive Optical Element for Noise-reduced Beam Shaping of Multi-array Point Light Source

  • Lee, Jonghyun;Hahn, Joonku;Kim, Hwi
    • Current Optics and Photonics
    • /
    • 제5권5호
    • /
    • pp.506-513
    • /
    • 2021
  • An arrayed diffractive optical element design for the beam-shaping of a multi-array light source is proposed. This is an essential device for recent optical security and face recognition applications. In practice, we devise a DC noise reduction technique featuring high fabrication error tolerance regarding the multi-array light source diffractive optical elements, as a necessary part of the proposed design method. The spherical diverging illumination leads to DC-conjugate noise spreading. The main idea is tested experimentally, and the multi-array light source diffraction pattern is investigated numerically.

신호의 복원된 위상 공간을 이용한 오디오 상황 인지 (A new approach technique on Speech-to-Speech Translation)

  • ;이승룡
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.239-240
    • /
    • 2009
  • We live in a flat world in which globalization fosters communication, travel, and trade among more than 150 countries and thousands of languages. To surmount the barriers among these languages, translation is required; Speech-to-Speech translation will automate the process. Thanks to recent advances in Automatic Speech Recognition (ASR), Machine Translation (MT), and Text-to-Speech (TTS), one can now utilize a system to translate a speech of source language to a speech of target language and vice versa in affordable manner. The three phase process establishes that the source speech be transcribed into a (set of) text of the source language (ASR) before the source text is translated into the target text (MT). Finally, the target speech is synthesized from the target text (TTS).

잡음에 강인한 음성인식을 위한 스펙트럼 보상 방법 (A Spectral Compensation Method for Noise Robust Speech Recognition)

  • 조정호
    • 전자공학회논문지 IE
    • /
    • 제49권2호
    • /
    • pp.9-17
    • /
    • 2012
  • 음성 인식 시스템의 용용에서 실제 문제점의 하나는 음성신호의 왜곡에 의한 인식성능의 저하이다. 음성신호의 왜곡에 가장 중요한 원인은 부가적인 잡음이다. 이 논문은 잡음에 강인한 음성인식을 위하여, 스펙트럼 피크 향상 기법과 효과적인 잡음 차감 기법에 기초한 스펙트럼 보상 방법을 기술한다. 제안한 방법은 음성 스펙트럼의 포먼트 구조를 향상시키고 스펙트럼 기울기를 보상하면서도 광 대역폭 스펙트럼 요소는 그대로 유지한다. 백색 가우스 잡음, 자동차 잡음, 음성 잡음 또는 지하철 잡음에 의해 왜곡된 음성을 이용한 인식실험을 수행한 결과, 새로운 방법은 스펙트럼 보상을 하지 않은 경우에 비해, 높은 SNR(Signal to Noise Ratio) 환경에서는 평균 오인식율을 약간 줄였으며, 낮은 SNR(10 dB) 환경에서는 평균 오인식율을 1/2로 크게 줄였다.

A New Endpoint Detection Method Based on Chaotic System Features for Digital Isolated Word Recognition System

  • 장한;정길도
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2009년도 정보 및 제어 심포지움 논문집
    • /
    • pp.37-39
    • /
    • 2009
  • In the research of speech recognition, locating the beginning and end of a speech utterance in a background of noise is of great importance. Since the background noise presenting to record will introduce disturbance while we just want to get the stationary parameters to represent the corresponding speech section, in particular, a major source of error in automatic recognition system of isolated words is the inaccurate detection of beginning and ending boundaries of test and reference templates, thus we must find potent method to remove the unnecessary regions of a speech signal. The conventional methods for speech endpoint detection are based on two simple time-domain measurements - short-time energy, and short-time zero-crossing rate, which couldn't guarantee the precise results if in the low signal-to-noise ratio environments. This paper proposes a novel approach that finds the Lyapunov exponent of time-domain waveform. This proposed method has no use for obtaining the frequency-domain parameters for endpoint detection process, e.g. Mel-Scale Features, which have been introduced in other paper. Comparing with the conventional methods based on short-time energy and short-time zero-crossing rate, the novel approach based on time-domain Lyapunov Exponents(LEs) is low complexity and suitable for Digital Isolated Word Recognition System.

  • PDF

OpenBR을 이용한 안면인식, 연령 산정, 성별 추정 프로그램 구현에 관한 연구 (Study on the Face recognition, Age estimation, Gender estimation Framework using OpenBR.)

  • 김남우;김정태
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2017년도 춘계학술대회
    • /
    • pp.779-782
    • /
    • 2017
  • OpenBR은 안면인식 관련 새로운 방식의 연구, 기존 알고리즘 개선, 상용 시스템과 상호 작용, 인식 성능 측정, 자동화 된 생체 인식 시스템을 배치하기 위한 프레임 워크입니다. 신속한 알고리즘 프로토타이핑을 용이하게 하기 위해 고안되었으며 성숙한 핵심 프레임 워크, 유연한 플러그인 시스템 및 개방형 및 폐쇄형 소스 개발 지원을 특징으로 한다. 기성의 알고리즘은 얼굴 인식, 연령 산정 및 성별 추정과 같은 특정 양식에 대해서도 사용할 수 있다. 본 논문에서는 OpenBR의 프레임 워크의 구성방법에 대해서 기술하고 지원되는 프로그램을 통해서 이용한 안면인식, 성별추정, 나이추정 구현하고 기술하였다.

  • PDF