• 제목/요약/키워드: 음성 검색

검색결과 355건 처리시간 0.026초

영상과 음성 정보를 이용한 비디오 편집 및 검색 시스템 (Video Editing and Retrieval System Using Speech Recognition Technique)

  • 조현철;윤인구;김우생
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.228-230
    • /
    • 1998
  • 동영상 데이터가 갖는 복잡하고 다양한 관계성 때문에 기존의 키워드 기반 정보 검색 방법에는 한계가 있으면 비디오 내용에 기반해 검색을 하는 내용기반 검색기법이 요구된다. 현재 MPEG-7에서도 비디오 내용 표현 방식에 관한 국제 표준화 작업이 시작되고 있다. 본 논문에서는 영상정보와 음성정보를 사용해 비디오의 원하는 부분을 내용에 기반해 검색할 수 있는 비디오 편집 및 검색 시스템을 개발하였다.

  • PDF

음성특성을 이용한 LSP 변환시간 단축에 관한 연구 (A Study on the Reduction of LSP(Line Spectrum Pair) Transformation Time Using the Voice Characteristic)

  • 강은영;민소연;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.557-560
    • /
    • 2000
  • LSP 파라미터는 일정한 ,스펙트럼 민감도와 낮은 스펙트럼 왜곡을 보이고 선형보간이 용이하다는 장점을 갖는다. 피러나 LPC 계수를 LSP 파라미터로 변환하는 방법이 복잡하여 계산시간이 많이 소요된다. 기존의 LSP 변환 방법 중 음성 부호화기에 주로 사용되는 Real Root 방법은 근을 구하기 위해 주파수 역을 순차적으로 검색하기 때문에 계산시간이 많이 소요된다. 본 논문에서 제안하는 방법은 음성 특성을 이용하는 것으로, 묵음의 경우는 묵음 구간에서 일정하게 나타나는 LSP 파라미터의 분포 특성을 이용하여 검색하고 유/무성음에 대해서는 LSP 파라미터의 분포도에 따라 검색구간의 순서와 검색간격을 달리한다. 또한, 모음에 대해서는 제1 포만트와 제2 포만트의 연관성을 고려하여 검색구간을 조절한다. 기존의 Real Root 방법과 제안한 방법을 비교한 결과 검색시간이 평균 46.5% 단축되었다.

  • PDF

CELP 음성 부호화기의 성능 향상 방법 (Performance Improvement of CELP Speech Coder)

  • 박호종
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 학술발표대회 논문집 제17권 2호
    • /
    • pp.289-292
    • /
    • 1998
  • 본 논문에서는 CELP 음성 부호화기의 성능을 향상시키는 방법을 제안한다. 제안된 방법은 최적 코드북 검색 과정에서 추가적인 알고리듬의 지연 없이 미래 정보를 이용하고 두 인접한 코드북 부프레임 사이의 동시 최적화를 통하여 음성 부호화기의 성능을 향상시킨다. 또한, 제안된 코드북 검색 과정의 계산량을 조절하기 위한 방법도 제공된다. 제안된 방법의 성능을 검증하기 위하여 IS-96A QCELP 음성 부호화기를 이용하여 합성음의 스펙트럼과 Segmental SNR로 성능을 측정하는 모의실험을 실시하였으며, 제안된 방법을 적용한 QCELP 음성 부호화기가 기존의 QCELP에 비하여 향상된 성능을 보여주었다.

  • PDF

단어 임베딩과 음성적 유사도를 이용한 트위터 '서치 방지 단어'의 자동 예측 (Automatic Prediction of 'Anti-Search Variants' of Twitter based on Word Embeddings and Phonetic Similarity)

  • 이상아
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.190-193
    • /
    • 2017
  • '서치 방지 단어'는 SNS 상에서 사용자들이 작성한 문서의 검색 및 수집을 피하기 위하여 사용하는 변이형을 뜻한다. 하나의 검색 키워드가 있다면 그와 같은 대상을 나타내는 변이형이 여러 형태로 존재할 수 있으며, 이들 변이형에 대한 검색 결과를 함께 수집할 수 있다면 데이터 확보가 중요하게 작용하는 다양한 연구에 큰 도움이 될 것이다. 본 연구에서는 특정 단어가 주어진 키워드로부터 의미 벡터 상의 거리가 가까울수록, 그리고 주어진 키워드와 비슷한 음성적 형태 즉 발음을 가질수록, 해당 키워드의 변이형일 가능성이 높을 것이라고 가정하였다. 이에 따라 단어 임베딩을 이용한 의미 유사도와 최소 편집 거리를 응용한 음성적 유사도를 이용하여 주어진 검색 키워드와 유사한 변이형들을 제안하고자 하였다. 그 결과 구성된 변이형 후보의 목록에는 다양한 형태의 단어들이 포함되었으며, 이들 중 다수가 실제 SNS 상에서 같은 의미로 사용되고 있음이 확인되었다.

  • PDF

Frequency Scaling을 통한 LSP 파라미터 Fitting에 관한 연구 (A Study on the Fitting of LSP(Line Spectrum Pairs) Parameter using Frequency Scaling)

  • 민소연;배명진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.801-804
    • /
    • 2001
  • LSP 파라미터는 음성코덱(codec)이나 인식기에서 음성 신호를 분석하여 전송형이나 저장형 파라미터로 변환되어, 주로 저전송률 음성부호화기에 사용된다. 그러나 LPC 계수를 LSP로 변환하는 방법이 복잡하여 계산시간이 많이 소요된다는 단점이 있다[1]. 기존의 LSP 변환 방법 중 음성 부호화기에서 주로 사용하는 real root 방법은 근을 구하기 위해 주파수 영역을 순차적으로 검색하기 때문에 계산시간이 많이 소요되는 단점을 갖는다. 본 논문에서 비교 평가한 알고리즘은 첫 번째, 기존의 real root 알고리즘, 두 번째는, LSP 파라미터의 분포 특성을 조사하여 이를 토대로 검객구간의 순서와 검색간격을 달리한 경우, 세 번째는 검색 시 mel scale을 사용한 알고리즘이다. 실험결과, 기존의 real root 방식에 비하여 두 가지 방식 모두가 변환시간의 40% 이상이 감소되는데 반하여 통일한 관을 찾음을 알 수가 있었고, 특히 분포특성을 이용하여 검색순서와 간격조절을 한 경우에 있어서, 기존의 방식보다 40%이상이 감소되었다.

  • PDF

단어 임베딩과 음성적 유사도를 이용한 트위터 '서치 방지 단어'의 자동 예측 (Automatic Prediction of 'Anti-Search Variants' of Twitter based on Word Embeddings and Phonetic Similarity)

  • 이상아
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.190-193
    • /
    • 2017
  • '서치 방지 단어'는 SNS 상에서 사용자들이 작성한 문서의 검색 및 수집을 피하기 위하여 사용하는 변이형을 뜻한다. 하나의 검색 키워드가 있다면 그와 같은 대상을 나타내는 변이형이 여러 형태로 존재할 수 있으며, 이들 변이형에 대한 검색 결과를 함께 수집할 수 있다면 데이터 확보가 중요하게 작용하는 다양한 연구에 큰 도움이 될 것이다. 본 연구에서는 특정 단어가 주어진 키워드로부터 의미 벡터 상의 거리가 가까울수록, 그리고 주어진 키워드와 비슷한 음성적 형태 즉 발음을 가질수록, 해당 키워드의 변이형일 가능성이 높을 것이라고 가정하였다. 이에 따라 단어 임베딩을 이용한 의미 유사도와 최소 편집 거리를 응용한 음성적 유사도를 이용하여 주어진 검색 키워드와 유사한 변이형들을 제안하고자 하였다. 그 결과 구성된 변이형 후보의 목록에는 다양한 형태의 단어들이 포함되었으며, 이들 중 다수가 실제 SNS 상에서 같은 의미로 사용되고 있음이 확인되었다.

  • PDF

대화형 음성 지원을 통한 지능형 검색 시스템 (Intelligent Retrieval System with Interactive Voice Support)

  • 문규진;우요섭
    • 재활복지공학회논문지
    • /
    • 제9권1호
    • /
    • pp.29-35
    • /
    • 2015
  • 본 논문에서는 음성인식을 통해 상품검색을 도와주는 지능형 검색 시스템을 제안한다. 제안하는 시스템은 음성인식과정에서 잘못 인식된 어휘를 자동으로 수정하기 위해 어휘간의 관계를 이용한다. 본 연구에서는 제안하는 시스템의 유용성을 확인하기 위해 시스템을 시뮬레이션 할 수 있는 어플리케이션을 구현하였다. 실험 결과 간단한 유저 인터페이스를 통해 음성인식이 잘못된 어휘를 바로잡아 상품검색에 도움을 주는 것을 확인할 수 있었다.

  • PDF

음성인식 기반 지능형 노래 반주 시스템 개발 (Developing a Speech-Recognition-Based Intelligent Karaoke Bud System)

  • 오영진;장문수;정태의;강선미
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2005년도 춘계학술대회 학술발표 논문집 제15권 제1호
    • /
    • pp.415-418
    • /
    • 2005
  • 가정용 흑은 업소용 노래 반주 시스템에서 곡명을 선택하는 데에는 목록 책자를 찾거나 키보드를 이용하여 DB를 검색하는 방법이 일반적이다. 이 방법들은 책을 찾거나 키보드로 입력하는 불편함과 함께 곡명의 첫 글자부터 알고 있지 않으면 찾을 수 없는 문제점이 있다. 본 논문에서는 음성인식기술과 정보검색기술을 결합하여 이러한 문제점들을 동시에 보완하는 기술을 제안하고, 가정용 노래방 기기와 연동하여 기존 검색 방식을 대체하는 음성인식 노래반주시스템을 구성한다. 제안하는 시스템은 노래 곡명에 나오는 최다 빈도 단어를 이용하여 키보드 입력 없이 음성 인식으로 간단하게 원하는 곡명을 찾도록 한다. 또한, 인터넷 인기순위에 기반하여 곡명을 색인함으로써 검색 만족도를 향상시킨다.

  • PDF

G.729 음성 압축기의 계산량 감소 (Complexity Reduction of G.729 Vocoder)

  • 최윤창;박호종
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2000년도 학술발표대회 논문집 제19권 2호
    • /
    • pp.15-18
    • /
    • 2000
  • ACELP는 우수한 음질을 제공하지만 최적의 코드 벡터를 찾기 위한 계산량이 상당히 많은 단점이 있고, 이로 인하여 모든 시스템과 단말기에서는 고성능 DSP칩을 사용하여 동작시킨다. 본 논문에서는 고속 ACELP 코드북 검색 방법인 펄스 교환 검색 방법을 G.729 음성 압축기에 적용시켜 G.729 음성 압축기의 계산량을 감소시키는 방법을 연구하였다. 적용된 방법은 두 단계 과정을 가지며, 첫 단계에서는 완전 순차적 검색 방법을 통하여 매우 빠르게 대략적인 코드 벡터를 찾는다. 두 번째 단계에서는 앞에서 선택된 코드 벡터의 각 펄스의 중요도를 계산하여 역할이 적은 펄스를 제거하고 새로운 펄스로 교환하는 펄스 교환 과정을 통하여 코드 벡터의 성능을 향상시킨다. 적용된 방법은 표준에서 사용하는 코드북 검색 방법보다 적은 계산량을 가진다. 적용된 방법의 성능은 표준보다 0.3-0.5dB 정도의 SNRseg 감소를 보이지만 Fast Algorithm인 G.729A보다는 우수한 음질의 코드 벡터를 찾으며, 다양한 음성신호를 이용한 모의 실험을 통하여 이 결과를 확인하였다.

  • PDF

스마트폰의 음성 검색에서 퍼지 쿼리 처리를 위한 프로토타입 모델 (A Prototype Model for Handling Fuzzy Query in Voice Search on Smartphones)

  • 최대영
    • 정보처리학회논문지D
    • /
    • 제18D권4호
    • /
    • pp.309-312
    • /
    • 2011
  • 스마트폰의 음성 검색에서 퍼지 쿼리를 처리하는 것은 가장 어려운 문제 중의 하나이다. 이는 자연어에 내재된 자유도와 복잡성에 주로 기인한다. 스마트폰의 음성 검색에서 퍼지 쿼리의 자유도와 복잡성을 줄이기 위해 속성값에 기반을 둔 방법이 제안된다. 또한, 퍼지 쿼리 처리를 위한 속성값에 기반을 둔 새로운 페이지 등급 알고리즘이 제안된다. 이는 사용자의 검색 의도에 기반을 둔 위치기반의 개인화된 페이지 등급을 스마트폰 사용자에게 제공할 수 있다. 제안된 방법은 스마트폰 사용자를 위한 위치기반의 개인화된 웹 검색의 진일보한 방법이라고 할 수 있다. 본 논문에서는 스마트폰의 음성 검색에서 퍼지 쿼리 처리를 위한 프로토타입 모델을 설계하고, 기존 스마트폰과 비교하여 제안된 방법의 성능 실험 결과를 제시한다.