Search | Korea Science

A Automated Method for Training Keyword Spotter based on Speech Synthesis (키워드 음성인식을 위한 음성합성 기반 자동 학습 기법)

Lim, Jaebong;Lee, Jongsoo;Cho, Yonghun;Baek, Yunju
- Proceedings of the Korea Information Processing Society Conference
- /
- 2021.05a
- /
- pp.494-496
- /
- 2021
최근 경량 딥러닝 기반 키워드 음성인식은 가전, 완구, 키오스크 등 다양한 응용에 음성 인터페이스를 쉽게 적용할 수 있는 기술로서 주목받고 있다. 키워드 음성인식은 일부 키워드만 인식 가능한 음성인식 기술로서 저성능 디바이스에서 활용 가능한 장점이 있다. 그러나 응용에 따라 필요한 키워드에 대하여 다시 음성데이터를 수집해야하고 이를 학습하여 모델을 새로 준비해야하는 단점이 있다. 따라서 본 연구에서는 음성데이터 수집 없이 음성합성을 통해 생성한 음성으로만 키워드 음성인식 모델을 학습하는 음성합성 기반 자동 학습 기법을 제안하였다. 생성한 음성데이터를 활용하고자하는 시도가 활발히 이루어지고 있으나, 기존 연구에서는 정확도를 유지하기 위하여 수집한 실제 음성데이터가 필요한 한계가 있다. 제안한 자동 학습 기법은 생성한 음성데이터에 대해 복합 데이터 증대 기법을 적용하여 실제 음성데이터 없이 키워드 음성인식의 정확도를 높였다. 제안한 기법에 대하여 상용 음성합성 서비스를 기반으로 수집한 한국어 키워드 데이터세트를 활용하여 성능평가를 진행하였다. 20개 한국어 키워드에 대해 실험한 결과, 제안한 기법을 적용하여 학습시킨 키워드 음성인식 모델의 정확도는 86.44%임을 확인하였다.
https://doi.org/10.3745/PKIPS.y2021m05a.494 인용 PDF

A Survey on Improving Realism for Image Composition (이미지 합성을 위한 현실성 향상 기술 분석)

Lee, Dong-Su;Ha, Ok-Kyoon;Jun, Yong-Kee
- Proceedings of the Korean Society of Computer Information Conference
- /
- 2017.01a
- /
- pp.37-38
- /
- 2017
이미지 합성은 전경과 배경이 조화롭게 나타나도록 표현하는 것이 필수적이다. 이미지 합성의 품질을 나타내는 현실성이 결여될 경우 객체와 배경이 조화롭게 합성되지 못해 뒤틀리거나 돌출되는 문제가 발생한다. 본 논문에서는 현실성 높은 합성을 위해 이미지 합성 기법들 중에서 현실성을 향상시키는 연구 동향을 조사한다. 이미지 합성 기법 분류에 따라 대표적인 기법을 선택하여 현실성 향상에 대한 연구를 중심으로 소개하고 발전방향을 제시한다.
PDF

Motion Vector Composition Scheme using activity information and overlapped extent on the Frame Dropping Transcoder (Frame Dropping Transcoder에서 활동정보 및 중첩영역의 크기를 고려한 모션벡터 합성 기법)

Kim, Sung-Min;Kim, Hyun-Hee;Tak, Kwang-ok;Lee, Seung-Won;Chung, Ki-Dong
- Proceedings of the Korea Information Processing Society Conference
- /
- 2004.05a
- /
- pp.1577-1580
- /
- 2004
여러 응용 서비스를 유 무선을 포함한 다양한 네트웍을 통해 제공하기 위해서는 네트웍에 적응할 수 있는 서비스 형태가 요구된다. 그 가운데 멀티미디어 서비스의 경우 네트웍이 서로 다른 환경에 적응할 수 있는 해결책으로 트랜스코딩 기술이 제시되었다. 하지만, 트랜스코딩을 위해 필요한 복호 부호의 처리 과정은 실시간으로 제공되는 멀티미디어 스트리밍의 경우에 제약조건으로 작용하고, 이에 따른 처리 과정을 대폭 줄이는 일부 기술들은 사용자 측의 서비스 품질에 문제점을 안고 있다. 본 논문에서는 트랜스코딩을 통한 처리 과정과 사용자 측 서비스 품질의 두 가지 측면을 고려하는 frame dropping 시의 모션 벡터 합성 기법에 대해서 언급한다. 또한, 본 논문에서는 기존의 기법과는 달리 양방향 예측 프레임이 포함된 경우에도 적용할 수 있는 확장성을 제공한다.
PDF

Synthetic Aperture Processing in Beamspace Using Twin-line Array (이중 선 배열을 이용한 빔 영역 합성 처리)

양인식;김기만;윤대희;오원천;도경철
- The Journal of the Acoustical Society of Korea
- /
- v.20 no.6
- /
- pp.82-86
- /
- 2001
In this Paper, we Propose synthetic aperture technique for twin-line may. Sin91e-line way is required long aperture size in order to achieve high SNR and angular resolution in shallow water Ultra low frequency signal from far-field has left-right ambiguity at sing1e-line array. To resolve these Problems, we'd like to adopt the synthetic aperture technique to twin-line array. The synthetic aperture method adopts coherent processing of sub-aperture signals at successive tine intervals in the beam domain. The proposed method shows low nile error and improved angular resolution. In simulation result, average sidelobe level is reduced about 7〔dB〕when the array Peformed 5-synthesis.
PDF

Synthetic data generation technique using object bounding box and original image combination (객체 바운딩 박스와 원본 이미지 결합을 이용한 합성 데이터 생성 기법)

Ju-Hyeok Lee;Mi-Hui Kim
- Proceedings of the Korea Information Processing Society Conference
- /
- 2023.05a
- /
- pp.476-478
- /
- 2023
딥러닝은 컴퓨터 비전의 상당한 발전을 기여했지만, 딥러닝 모델을 학습하려면 대규모 데이터 세트가 필요하다. 이를 해결하기 위해 데이터 증강 기술이 주목받고 있다. 본 논문에서는 객체 추출 바운딩 박스와 원본 이미지의 바운딩 박스를 결합하여 합성 데이터 생성기법을 제안한다. 원본 이미지와 동일한 범주의 데이터셋에서 참조 이미지의 객체를 추출한 다음 생성 모델을 사용하여 참조 이미지와 원본 이미지의 특징을 통합하여 새로운 합성 이미지를 만든다. 실험을 통해, 생성 기법을 통한 딥러닝 모델의 성능향상을 보여준다.
https://doi.org/10.3745/PKIPS.y2023m05a.476 인용 PDF

A QoS-aware Service Selection Method for Configuring Web Service Composition (웹 서비스 합성 구성을 위한 QoS고려 서비스 선택 기법)

Yoon, Kyoung-A;Kim, Yoon-Hee
- The KIPS Transactions:PartD
- /
- v.19D no.4
- /
- pp.299-306
- /
- 2012
To fulfill the complex user requirement, composition web service comprised of existing services is considered from the efficient and reusable point of view instead of making entirely new web service. However, with the growing the number of web services which provide the same functionality but differ in quality value, the service composition becomes a decision problem on which component services should be selected such that end-to-end QoS constraints by the client and overall QoS of the composition service are satisfied. QoS of service aspects is a determinant factor for selecting the services, since the performance of the composed service is determined by the performance of the involved component web service. In this paper, hybrid genetic algorithm is presented to select component services to take part in the QoS-aware composition. The local search method is used to be combined with the genetic algorithm to improve the individuals (component service) in population as well as composed service. The paper also presents a set of experiments conducted to evaluate the efficiency of selection algorithm using the real web service data.
https://doi.org/10.3745/KIPSTD.2012.19D.4.299 인용 PDF KSCI

Point Light Source Estimation from indoor environment from Light Probe (Light Probe를 이용한 제한된 실내 환경에 존재하는 점 광원 추정 기법)

Yoo, Jae-Doug;Park, Joung-Wook;Cho, Ji-Ho;Lee, K.H.
- 한국HCI학회:학술대회논문집
- /
- 2007.02a
- /
- pp.494-499
- /
- 2007
실제 영상과 가상의 오브젝트 또는 가상의 환경에 오브젝트를 합성하는 경우 등 사실적인 합성을 결과를 얻기 위해서는 실제 환경과 같은 배경 영상의 정확한 광원 정보가 필요하다. 본 논문에서는 실내 환경을 배경으로 영상을 합성 하는 과정에 필요한 광원정보를 카메라와 Light Probe를 이용하여 촬영된 단일 영상으로부터 추정하는 기법을 제안한다. 실내에 존재하는 광원들은 정확한 위치정보를 알 수 없는 실외환경에서와 달리 제한된 공간의 원점으로부터 3차원 공간에 위치한 좌표로 나타낼 수 있다. 광원을 추정하기 위해 먼저 실내 공간에 반사도가 높은 Light Probe를 위치하고 디지털 카메라의 적정 노출을 이용하여 광원 추정에 사용할 영상을 획득한다. 광원으로 존재하는 오브젝트의 경우 짧은 노출시간에도 카메라의 영상에 획득된다. 그렇기 때문에 단일 영상에서 광원의 영역을 추정하기 위해 영상처리를 통해 노출 시간을 짧게 하여 촬영한 영상과 비슷하게 밝은 영역만 표현되도록 처리를 한다. 전 처리된 영상으로부터 밝은 영역과 어두운 영역으로 구분을 하고 밝은 영역으로부터 광원의 정보를 추정한다. 추정된 광원들은 실제 렌더링에 곧바로 적용이 가능하며, 이를 통해 배경에 적합한 렌더링 결과를 얻을 수 있다.
PDF

Facial Image Synthesis Considering Illumination Variations on Mobile Devices (모바일 기기에서 조명 변화를 고려한 얼굴 영상 합성)

Kwon, Ji-In;Lee, Sang-Hoon;Choi, Soo-Mi
- Journal of the HCI Society of Korea
- /
- v.6 no.1
- /
- pp.21-26
- /
- 2011
This paper presents a robust method for facial image synthesis under varying illumination by combining illumination correction and Poisson image processing techniques. The presented method automatically detects skin area and corrects highly saturated regions that can cause bad effects on the final synthesis image. The developed method can be applied to various facial synthesis applications by correcting illumination variations that can occur frequently on photos taken with a camera phone.
PDF

On a Pitch Alteration Technique by Cepstrum Analysis of Flatten Excitation Spectrum (평탄화된 여기 스펙트럼에서 켑스트럼 피치 변경법에 관한 연구)

조왕래;함명규;배명진
- The Journal of the Acoustical Society of Korea
- /
- v.17 no.8
- /
- pp.82-87
- /
- 1998
음성합성은 합성방식에 따라 파형부호화법, 신호원부호화법, 혼성부호화법으로 분류 할 수 있다. 특히 고음질 합성을 위해서는 파형부호화를 이용한 합성방식이 적합하다. 그렇 지만, 파형부호화를 이용한 합성법은 여기 성분과 여파기 성분을 분리하지 않고 처리하기 때문에 음절단위나 음소단위의 합성기법으로는 바람직하지 못하다. 따라서 파형부호화법을 규칙에 의한 합성에 적용되도록 음원피치를 변경시키기 위한 피치 변경법이 필요하게 된다. 본 논문에서는 스펙트럼 왜곡을 최소화하기 위해 켑스트럼의 성질을 이용하여 피치를 변경 하는 방법에 대하여 제안하였다. 이 방법은 주파수영역상에서 여기 스펙트럼과 여파기 스펙 트럼을 분리하여 여기 스펙트럼을 여기 켑스트럼으로 변환한 후 영값 삽입이나 삭제에 의해 피치를 변경하고 스펙트럼영역에서 피치 변경된 스펙트럼을 재구성하는 기법을 적용하였다. 제안한 방법의 성능을 평가하기 위해 스펙트럼 왜곡율을 측정하여 본 결과 평균 스펙트럼 왜곡율은 평균 2.29%이하로 유지되었으며 주관적인 음질도 평균 3.74로 우수하였다.
PDF

Light Source Estimation for Realistic Rendering using Segmented HDR Images (사실적인 렌더링을 위한 분할된 HDR 영상으로부터의 광원 추정 기법)

Yoo, Jae-Doug;Cho, Ji-Ho;Lee, Kwan-H.
- Proceedings of the Korea Information Processing Society Conference
- /
- 2007.05a
- /
- pp.671-674
- /
- 2007
현재 다양한 분야(영화, 광고, AR 등)에서 영상합성 기법이 많이 사용되고 있다. 실제 영상에 가상의 객체를 합성하거나 가상의 환경에 객체를 합성하는 경우 등 영상과 객체간의 사실적인 합성결과를 얻기 위해서는 실제 환경에 적용된 광원의 정보가 필요하다. 본 논문에서는 실 세계 조명 정보를 표현하는 HDR(High Dynamic Range) 영상을 이용하여 실 세계의 광원을 추정하는 기법을 제안한다. 광원 추정을 위해 노출 시간을 달리한 일련의 LDR(Low Dynamic Range) 영상으로부터 실 세계정보를 선형적으로 표현할 수 있는 HDR 영상을 생성한다. HDR 영상을 가시화 한 후 영상에 나타나는 밝기 값을 기반으로 영상을 분할하고 분할된 영상들이 나타내는 빛의 세기에 비례하여 방향성 광원을 추정한다. 추정된 조명조건을 이용하여 IBL(Image Based Lighting)등의 전역조명 효과와 유사한 결과를 얻을 수 있으며 소수의 광원을 추정함으로써 실시간 렌더링이 중요한 가상현실이나 증강 현실 분야에도 적용할 수 있다. 또한 분할된 영상들로부터 광원을 추정하기 때문에 각각의 영상들이 오브젝트에 나타내는 조명효과도 확인할 수 있다.
PDF

Search Result 357, Processing Time 0.033 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)