통합 검색 | Korea Science

키워드 음성인식을 위한 음성합성 기반 자동 학습 기법 (A Automated Method for Training Keyword Spotter based on Speech Synthesis)

임재봉;이종수;조용훈;백윤주
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2021년도 춘계학술발표대회
- /
- pp.494-496
- /
- 2021
최근 경량 딥러닝 기반 키워드 음성인식은 가전, 완구, 키오스크 등 다양한 응용에 음성 인터페이스를 쉽게 적용할 수 있는 기술로서 주목받고 있다. 키워드 음성인식은 일부 키워드만 인식 가능한 음성인식 기술로서 저성능 디바이스에서 활용 가능한 장점이 있다. 그러나 응용에 따라 필요한 키워드에 대하여 다시 음성데이터를 수집해야하고 이를 학습하여 모델을 새로 준비해야하는 단점이 있다. 따라서 본 연구에서는 음성데이터 수집 없이 음성합성을 통해 생성한 음성으로만 키워드 음성인식 모델을 학습하는 음성합성 기반 자동 학습 기법을 제안하였다. 생성한 음성데이터를 활용하고자하는 시도가 활발히 이루어지고 있으나, 기존 연구에서는 정확도를 유지하기 위하여 수집한 실제 음성데이터가 필요한 한계가 있다. 제안한 자동 학습 기법은 생성한 음성데이터에 대해 복합 데이터 증대 기법을 적용하여 실제 음성데이터 없이 키워드 음성인식의 정확도를 높였다. 제안한 기법에 대하여 상용 음성합성 서비스를 기반으로 수집한 한국어 키워드 데이터세트를 활용하여 성능평가를 진행하였다. 20개 한국어 키워드에 대해 실험한 결과, 제안한 기법을 적용하여 학습시킨 키워드 음성인식 모델의 정확도는 86.44%임을 확인하였다.
https://doi.org/10.3745/PKIPS.y2021m05a.494 인용 PDF

이미지 합성을 위한 현실성 향상 기술 분석 (A Survey on Improving Realism for Image Composition)

이동수;하옥균;전용기
- 한국컴퓨터정보학회:학술대회논문집
- /
- 한국컴퓨터정보학회 2017년도 제55차 동계학술대회논문집 25권1호
- /
- pp.37-38
- /
- 2017
이미지 합성은 전경과 배경이 조화롭게 나타나도록 표현하는 것이 필수적이다. 이미지 합성의 품질을 나타내는 현실성이 결여될 경우 객체와 배경이 조화롭게 합성되지 못해 뒤틀리거나 돌출되는 문제가 발생한다. 본 논문에서는 현실성 높은 합성을 위해 이미지 합성 기법들 중에서 현실성을 향상시키는 연구 동향을 조사한다. 이미지 합성 기법 분류에 따라 대표적인 기법을 선택하여 현실성 향상에 대한 연구를 중심으로 소개하고 발전방향을 제시한다.
PDF

Frame Dropping Transcoder에서 활동정보 및 중첩영역의 크기를 고려한 모션벡터 합성 기법 (Motion Vector Composition Scheme using activity information and overlapped extent on the Frame Dropping Transcoder)

김성민;김현희;탁광옥;이승원;정기동
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2004년도 춘계학술발표대회
- /
- pp.1577-1580
- /
- 2004
여러 응용 서비스를 유 무선을 포함한 다양한 네트웍을 통해 제공하기 위해서는 네트웍에 적응할 수 있는 서비스 형태가 요구된다. 그 가운데 멀티미디어 서비스의 경우 네트웍이 서로 다른 환경에 적응할 수 있는 해결책으로 트랜스코딩 기술이 제시되었다. 하지만, 트랜스코딩을 위해 필요한 복호 부호의 처리 과정은 실시간으로 제공되는 멀티미디어 스트리밍의 경우에 제약조건으로 작용하고, 이에 따른 처리 과정을 대폭 줄이는 일부 기술들은 사용자 측의 서비스 품질에 문제점을 안고 있다. 본 논문에서는 트랜스코딩을 통한 처리 과정과 사용자 측 서비스 품질의 두 가지 측면을 고려하는 frame dropping 시의 모션 벡터 합성 기법에 대해서 언급한다. 또한, 본 논문에서는 기존의 기법과는 달리 양방향 예측 프레임이 포함된 경우에도 적용할 수 있는 확장성을 제공한다.
PDF

이중 선 배열을 이용한 빔 영역 합성 처리 (Synthetic Aperture Processing in Beamspace Using Twin-line Array)

양인식;김기만;윤대희;오원천;도경철
- 한국음향학회지
- /
- 제20권6호
- /
- pp.82-86
- /
- 2001
본 논문에서는 평행한 이중 선 배열을 위한 합성 기법을 제안하고자 한다. 일반적으로 천해에서 사용되는 단일 배열은 신호의 이득을 높이고 각 분해능을 높이기 위해서 긴 어퍼쳐 길이를 요구하고 있다. 그러나 원거리로부터 발생한 극 저주파 신호는 수신단에서 어레이를 기준으로 좌, 우 모호성을 드러낸다. 이러한 문제점을 해결하기 위해 평행한 이중 선 배열을 이용하면서 합성 기법을 적용하였다. 어레이 합성 기법은 연속적인 시간에서 얻어진 각각의 데이터들을 빔 영역에서 코히어런트한 합성을 거쳐 공간 영역에서 가상의 어레이로 확장하였다. 제안된 방법은 인접한 다중 음원 환경에서의 각도 오차를 줄이고 어레이 합성 횟수에 따라 향상된 분해능성능을 나타내었다. 시뮬레이션 결과 어레이 합성 기법을 적용하기 전과 5회의 합성을 수행했을 경우, 평균 부엽 레벨은 약 7dB가 향상되었다.
PDF

객체 바운딩 박스와 원본 이미지 결합을 이용한 합성 데이터 생성 기법 (Synthetic data generation technique using object bounding box and original image combination)

이주혁;김미희
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2023년도 춘계학술발표대회
- /
- pp.476-478
- /
- 2023
딥러닝은 컴퓨터 비전의 상당한 발전을 기여했지만, 딥러닝 모델을 학습하려면 대규모 데이터 세트가 필요하다. 이를 해결하기 위해 데이터 증강 기술이 주목받고 있다. 본 논문에서는 객체 추출 바운딩 박스와 원본 이미지의 바운딩 박스를 결합하여 합성 데이터 생성기법을 제안한다. 원본 이미지와 동일한 범주의 데이터셋에서 참조 이미지의 객체를 추출한 다음 생성 모델을 사용하여 참조 이미지와 원본 이미지의 특징을 통합하여 새로운 합성 이미지를 만든다. 실험을 통해, 생성 기법을 통한 딥러닝 모델의 성능향상을 보여준다.
https://doi.org/10.3745/PKIPS.y2023m05a.476 인용 PDF

웹 서비스 합성 구성을 위한 QoS고려 서비스 선택 기법 (A QoS-aware Service Selection Method for Configuring Web Service Composition)

윤경아;김윤희
- 정보처리학회논문지D
- /
- 제19D권4호
- /
- pp.299-306
- /
- 2012
웹 서비스 합성은 기존 단일 서비스들을 합성해서 제공하는 방식으로, 사용자의 다양한 요구를 만족시키기 위해서 새로운 웹 서비스를 만들기보다는 재사용과 효율성 측면에서 고려되고 있다. 그러나 유사 기능을 제공하지만 다른 서비스 품질을 제공하는 서비스의 수가 증가함에 따라, 서비스 합성 문제는 사용자의 전역 제약 조건과 합성서비스의 QoS를 만족시키기 위해서 어떤 구성 서비스들을 선택해야 하는지에 대한 선택 문제가 되었다. 합성 서비스의 수행은 구성 서비스의 수행에 의해 결정되므로, 합성 서비스에 포함될 구성 서비스 선택을 위해서는 가격, 지속성, 응답시간과 같은 QoS에 대한 고려는 필수적이다. 본 논문에서는 합성 서비스 선택 시 QoS를 고려한 기법으로 합성 유전자 알고리즘을 적용하였다. 유전자 알고리즘에 지역 탐색 방법을 결합하여 빠른 시간 안에 합성 서비스의 전반적인 QoS뿐만 아니라 구성 서비스의 품질을 향상 시킬 수 있는 서비스 선택 기법을 제시한다. 본 연구는 실제 웹상에 존재하는 실제 데이터를 이용하여 서비스 증가에 따른 시간 측정 및 최적화 정도를 비교 분석을 통해 선택 알고리즘의 유효성을 검증하였다.
https://doi.org/10.3745/KIPSTD.2012.19D.4.299 인용 PDF KSCI

Light Probe를 이용한 제한된 실내 환경에 존재하는 점 광원 추정 기법 (Point Light Source Estimation from indoor environment from Light Probe)

유재덕;박정욱;조지호;이관행
- 한국HCI학회:학술대회논문집
- /
- 한국HCI학회 2007년도 학술대회 1부
- /
- pp.494-499
- /
- 2007
실제 영상과 가상의 오브젝트 또는 가상의 환경에 오브젝트를 합성하는 경우 등 사실적인 합성을 결과를 얻기 위해서는 실제 환경과 같은 배경 영상의 정확한 광원 정보가 필요하다. 본 논문에서는 실내 환경을 배경으로 영상을 합성 하는 과정에 필요한 광원정보를 카메라와 Light Probe를 이용하여 촬영된 단일 영상으로부터 추정하는 기법을 제안한다. 실내에 존재하는 광원들은 정확한 위치정보를 알 수 없는 실외환경에서와 달리 제한된 공간의 원점으로부터 3차원 공간에 위치한 좌표로 나타낼 수 있다. 광원을 추정하기 위해 먼저 실내 공간에 반사도가 높은 Light Probe를 위치하고 디지털 카메라의 적정 노출을 이용하여 광원 추정에 사용할 영상을 획득한다. 광원으로 존재하는 오브젝트의 경우 짧은 노출시간에도 카메라의 영상에 획득된다. 그렇기 때문에 단일 영상에서 광원의 영역을 추정하기 위해 영상처리를 통해 노출 시간을 짧게 하여 촬영한 영상과 비슷하게 밝은 영역만 표현되도록 처리를 한다. 전 처리된 영상으로부터 밝은 영역과 어두운 영역으로 구분을 하고 밝은 영역으로부터 광원의 정보를 추정한다. 추정된 광원들은 실제 렌더링에 곧바로 적용이 가능하며, 이를 통해 배경에 적합한 렌더링 결과를 얻을 수 있다.
PDF

모바일 기기에서 조명 변화를 고려한 얼굴 영상 합성 (Facial Image Synthesis Considering Illumination Variations on Mobile Devices)

권지인;이상훈;최수미
- 한국HCI학회논문지
- /
- 제6권1호
- /
- pp.21-26
- /
- 2011
본 논문은 얼굴 영상을 합성할 때 조명 변화에 강인하도록 조명 보정 기법과 푸아송 영상 처리 기법을 결합한 얼굴 합성 방법을 제시한다. 제시된 방법은 얼굴 영상으로부터 자동적으로 피부 영역을 검출하고, 합성할 부위에서 합성 결과에 영향을 주는 세츄레이션된 부분을 보정한 후 최종적으로 대상 얼굴 영상에 합성하게 된다. 개발된 방법은 카메라가 부착된 모바일 기기에서 촬영된 영상 등에서 자주 발생할 수 있는 조명변화를 보완하여 다양한 얼굴합성 응용 분야에 활용될 수 있다.
PDF

평탄화된 여기 스펙트럼에서 켑스트럼 피치 변경법에 관한 연구 (On a Pitch Alteration Technique by Cepstrum Analysis of Flatten Excitation Spectrum)

조왕래;함명규;배명진
- 한국음향학회지
- /
- 제17권8호
- /
- pp.82-87
- /
- 1998
음성합성은 합성방식에 따라 파형부호화법, 신호원부호화법, 혼성부호화법으로 분류 할 수 있다. 특히 고음질 합성을 위해서는 파형부호화를 이용한 합성방식이 적합하다. 그렇 지만, 파형부호화를 이용한 합성법은 여기 성분과 여파기 성분을 분리하지 않고 처리하기 때문에 음절단위나 음소단위의 합성기법으로는 바람직하지 못하다. 따라서 파형부호화법을 규칙에 의한 합성에 적용되도록 음원피치를 변경시키기 위한 피치 변경법이 필요하게 된다. 본 논문에서는 스펙트럼 왜곡을 최소화하기 위해 켑스트럼의 성질을 이용하여 피치를 변경 하는 방법에 대하여 제안하였다. 이 방법은 주파수영역상에서 여기 스펙트럼과 여파기 스펙 트럼을 분리하여 여기 스펙트럼을 여기 켑스트럼으로 변환한 후 영값 삽입이나 삭제에 의해 피치를 변경하고 스펙트럼영역에서 피치 변경된 스펙트럼을 재구성하는 기법을 적용하였다. 제안한 방법의 성능을 평가하기 위해 스펙트럼 왜곡율을 측정하여 본 결과 평균 스펙트럼 왜곡율은 평균 2.29%이하로 유지되었으며 주관적인 음질도 평균 3.74로 우수하였다.
PDF

사실적인 렌더링을 위한 분할된 HDR 영상으로부터의 광원 추정 기법 (Light Source Estimation for Realistic Rendering using Segmented HDR Images)

유재덕;조지호;이관행
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2007년도 춘계학술발표대회
- /
- pp.671-674
- /
- 2007
현재 다양한 분야(영화, 광고, AR 등)에서 영상합성 기법이 많이 사용되고 있다. 실제 영상에 가상의 객체를 합성하거나 가상의 환경에 객체를 합성하는 경우 등 영상과 객체간의 사실적인 합성결과를 얻기 위해서는 실제 환경에 적용된 광원의 정보가 필요하다. 본 논문에서는 실 세계 조명 정보를 표현하는 HDR(High Dynamic Range) 영상을 이용하여 실 세계의 광원을 추정하는 기법을 제안한다. 광원 추정을 위해 노출 시간을 달리한 일련의 LDR(Low Dynamic Range) 영상으로부터 실 세계정보를 선형적으로 표현할 수 있는 HDR 영상을 생성한다. HDR 영상을 가시화 한 후 영상에 나타나는 밝기 값을 기반으로 영상을 분할하고 분할된 영상들이 나타내는 빛의 세기에 비례하여 방향성 광원을 추정한다. 추정된 조명조건을 이용하여 IBL(Image Based Lighting)등의 전역조명 효과와 유사한 결과를 얻을 수 있으며 소수의 광원을 추정함으로써 실시간 렌더링이 중요한 가상현실이나 증강 현실 분야에도 적용할 수 있다. 또한 분할된 영상들로부터 광원을 추정하기 때문에 각각의 영상들이 오브젝트에 나타내는 조명효과도 확인할 수 있다.
PDF

검색결과 359건 처리시간 0.025초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)