• 제목/요약/키워드: 단어 데이터베이스

검색결과 208건 처리시간 0.031초

동적 시간 신축 알고리즘을 이용한 화자 식별 (Speaker Identification Using Dynamic Time Warping Algorithm)

  • 정승도
    • 한국산학기술학회논문지
    • /
    • 제12권5호
    • /
    • pp.2402-2409
    • /
    • 2011
  • 음성에는 전달하고자 하는 정보 이외에 화자 고유의 음향적 특징을 담고 있다. 화자간의 음향적 차이를 이용하여 말하고 있는 사람이 누구인지 판단하는 방법이 화자 인식이다. 화자 인식에는 화자 확인과 화자 식별로 구분되는데 화자 확인은 1명의 음성을 대상으로 본인인지 아닌지를 검증하는 방법이다. 반면, 화자 식별은 미리 등록된 다수의 종속 문장으로부터 가장 유사한 모델을 찾아 대상 의뢰인이 누군지 식별하는 방법이다. 본 논문에서는 MFCC(Mel Frequency Cepstral Coefficient) 계수를 추출하여 특징 벡터를 구성하였고, 특징 간 유사도 비교는 동적 시간 신축(Dynamic Time Warping) 알고리즘을 이용한다. 각 화자마다 두 개의 종속 문장을 훈련 데이터로 사용하여 음운성에 기반을 둔 공통적 특징을 기술하였고, 이를 통해 데이터베이스에 저장되어 있지 않은 단어를 사용하더라도 동일 화자임을 식별할 수 있도록 하였다.

국내 재난 관련 연구 동향에 대한 계량정보학적 분석 (A Bibliometric Analysis of Research Trends on Disaster in Korea)

  • 이재윤;김수정
    • 정보관리학회지
    • /
    • 제33권4호
    • /
    • pp.103-124
    • /
    • 2016
  • 본 연구는 계량정보학적 분석을 통해 국내 재난 관련 연구의 동향을 파악하는 것을 목적으로 한다. 이를 위해 KCI 데이터베이스를 검색하여 2002년부터 2016년 사이에 출간된 재난 관련 학술지 논문 772편을 분석하였다. 논문들이 발표된 학문분야의 프로파일링 분석과 저널 프로파일링 분석 및 키워드 동시출현분석을 실시하였다. 분석 결과, 국내 재난 관련 연구의 수는 지속적으로 증가하고 있으며 특히 2014년 세월호 사건 이후에 재난 연구의 수가 급증하였다. 재난 연구의 주요 학문영역은 재난관리 정책을 제시하는 정책학/행정학 영역, 관련 기술을 개발하는 '공학' 영역, 지리정보시스템과 통신기술을 연구하는 'GIS/통신' 영역, 재난을 정신건강학 혹은 인문사회학적 측면에서 연구하는 '의학/인문사회과학' 영역으로 확인되었다. 시기별로 살펴보면, 2014년 이후에는 행정학과 정책학 분야의 비중이 감소한 반면에 법학, 의학, 신문방송학 등의 다양한 학문 분야에서 재난 관련 연구가 활발해졌다.

다층 퍼셉트론에서의 빠른 화자 적응을 위한 선택적 주의 학습 (Selective Attentive Learning for Fast Speaker Adaptation in Multilayer Perceptron)

  • 김인철;진성일
    • 한국음향학회지
    • /
    • 제20권4호
    • /
    • pp.48-53
    • /
    • 2001
  • 본 논문에서는 에러 역전파 알고리듬에 기반한 다층 퍼셉트론의 학습 속도를 개선하기 위해 선택적 주의 학습방식을 제안한다. 제안된 방식은 학습 과정에서 세 가지 선택적 주의 기준을 적용하여 학습 데이터베이스 내의 일부 데이터만을 입력 패턴으로 사용하거나 주어진 입력 패턴에 대해 신경회로망내의 특정 영역만 선택적으로 학습이 이루어지도록 한다. 이러한 선택적 주의 기준은 다층 퍼셉트론의 출력층에서 계산된 평균 자승 에러와 은닉층의 각 노드에서 획득된 클래스 의존적인 적합도(relevance)를 이용하여 설정된다. 학습 속도의 개선은 학습 반복 횟수 당 계산량을 줄임으로써 이루어진다. 본 논문에서는 고립 단어 인식시스템에서의 화자 적응 문제에 대해 제안한 선택적 주의 학습방법을 적용하여 그 유효성을 알아보았다. 실험 결과로부터 제안한 선택적 주의 기법이 학습 속도를 평균 60%이상 개선시킬 수 있음을 확인하였다

  • PDF

시간 영역 파형 패턴에 기반한 한국어 모음 'ㅗ'의 음성 인식 (Speech Recognition of the Korean Vowel 'ㅗ' Based on Time Domain Waveform Patterns)

  • 이재원
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권11호
    • /
    • pp.583-590
    • /
    • 2016
  • 최근 일상적인 인간 생활의 거의 모든 영역에서 사물 인터넷에 대한 관심이 급속히 증대되면서, 음성 인식은 중요한 HCI 수단으로 자리 잡고 있다. 더불어, 모바일 환경에서의 음성 인식 시스템에 대한 수요 또한 급속히 증대되고 있다. 모바일 환경을 위한 서버 기반의 음성 인식 시스템은 대체로 빠른 속도와 높은 인식률을 보이고 있지만, 데이터베이스에 저장되어 있는 단어를 단위로 하여 인식을 수행하므로, 인터넷이 연결되어 있어야 하고 서버에서의 많은 계산량을 필요로 한다. 본 논문은 음소 기반 한국어 음성 인식 시스템의 일부로서, 한국어 모음 'ㅗ'에 대한 새로운 인식 방식을 제안한다. 제안하는 방식은 주파수 영역에서의 분석 대신, 시간 영역에서의 파형 패턴에 기반하여 동작하므로, 계산 비용을 현저히 절감할 수 있다. 모음 'ㅗ'의 전형적인 파형 패턴들을 탐지하기 위한 요소 알고리즘들을 제시하며, 이를 결합하여 최종 판별을 수행한다. 실험 결과를 통해, 제안하는 방식이 89.9%의 인식 정확도를 달성할 수 있음을 확인하였다.

세미-마르코프 조건 랜덤 필드 기반의 수화 적출 (Sign Language Spotting Based on Semi-Markov Conditional Random Field)

  • 조성식;이성환
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권12호
    • /
    • pp.1034-1037
    • /
    • 2009
  • 수화 적출이란 연속된 영상에서 수화의 시작과 끝점을 찾고, 이를 사전에 정의된 수화 단어로 인식하는 방법을 말한다. 수화는 매우 다양한 손의 움직임과 모양으로 구성되어 있고, 그 변화가 다양하여 적출에 많은 어려움이 있다. 특히, 다양한 길이의 궤적 정보로 구성된 수화는 길이가 긴 수화에 대해 짧은 길이를 갖는 수화가 인식에 필요한 정보를 추출하기 어려운 문제점 있다. 본 논문에서는 다양한 길이를 갖는 입력 데이터의 특징을 반영할 수 있는 Semi-Markov Conditional Random Field에 기반하여 다양한 수화의 길이에 강인하게 수화를 적출하는 방법을 제안한다. 성능 평가를 위해 미국 수화와 한국 수화 데이터베이스를 사용하여 연속된 수화 영상에서의 수화 적출 성능을 평가하였고, 실험 결과 기존의 Hidden Markov Model과 Conditional Random Field보다 뛰어난 성능을 보였다.

논문 제목상의 문화적 흔적: 한국과 미국의 사회과학분야 비교 (Remnants of Culture in Journal Article Titles: A Comparison between the United States and Korea in the Field of Social Sciences)

  • Kim, Eungi
    • 한국도서관정보학회지
    • /
    • 제46권1호
    • /
    • pp.345-372
    • /
    • 2015
  • 국내 대다수의 학술지는 논문 제출시 한글로 쓴 논문 제목과 함께 영어로 된 논문 제목을 제출할 것을 요구한다. 그러나 일반적으로 논문작성자나 논문 심사자들 조차도 영문 논문 제목에 큰 비중을 두지 않는다. 본 논문은 미국과 한국에서 출판된 학술지의 논문제목에서 국가간 문화적 특성과 차이를 알아보기 위한 연구이다. Scopus와 RISS 데이터베이스를 이용하여 사회과학분야와 관련된 논문제목들을 발췌하여 이 연구를 진행하였다. 연구 대상이 된 논문의 제목은 제목의 길이, 종류 및 n-gram 문구 등의 여러 유형을 사용하여 분석 및 비교하였고, 샘플 논문 제목을 분석한 결과, 한글로 작성된 학술지 논문의 제목에서는 특별히 선호되는 단어와 구문의 유형을 발견하였다. 이러한 유형들의 관습적 사용들로써 논문의 제목에서 국가간의 문화적 차이가 나타난다는 결과를 도출하였다. 이 연구는 영문 제목을 붙일 때에 국내 논문에서 보여주는 전형적인 양상을 지적하고 국가간의 문화적 차이에 대해 좀더 인식하고 염두 해야 한다는 점을 주장한다.

감정 변화에 강인한 음성 인식 파라메터 (Robust Speech Recognition Parameters for Emotional Variation)

  • 김원구
    • 한국지능시스템학회논문지
    • /
    • 제15권6호
    • /
    • pp.655-660
    • /
    • 2005
  • 본 논문에서는 인간의 감정 변화에 강인한 음성 인식 기술 개발을 목표로 하여 감정 변화의 영향을 적게 받는 음성 인식시스템의 특징 파라메터에 관한 연구를 수행하였다. 이를 위하여 우선 다양한 감정이 포함된 음성 데이터베이스를 사용하여 감정 변화가 음성 인식 시스템의 성능에 미치는 영향에 관한 연구와 감정 변화의 영향을 적게 받는 음성 인식 시스템의 특징 파라메터에 관한 연구를 수행하였다. 본 연구에서는 LPC 켑스트럼 계수, 멜 켑스트럼 계수, 루트 켑스트럼 계수, PLP 계수와 RASTA 처리를 한 멜 켑스트럼 계수와 음성의 에너지를 사용하였다 또한 음성에 포함된 편의(bias)를 제거하는 방법으로 CMS와 SBR 방법을 사용하여 그 성능을 비교하였다. 실험 결과에서 RASTA 멜 켑스트럼과 델타 켑스트럼을 사용하고 신초편의 제거 방법으로 CMS를 사용한 경우에 HMM 기반의 화자독립 단어 인식기의 오차가 $7.05\%$로 가장 우수한 성능을 나타내었다. 이러한 것은 멜 켑스트럼을 사용한 기준시스템과 비교하여 $59\%$정도 오차가 감소된 것이다.

기업의 해외 진출 전략 연구 동향 (A Study on Trend of Overseas Expansion Strategy Research)

  • 서동필;김범석
    • 한국융합학회논문지
    • /
    • 제11권1호
    • /
    • pp.279-284
    • /
    • 2020
  • 기술의 발전은 많은 변화를 가져오고 있다. 한국의 경제성장과 더불어 국내 기업들이 과거와는 다르게 해외로의 진출이 활발해지고 있다. 최근에는 한류에 힘입어 동남아 시장을 중심으로 대기업 외에도 많은 중소 및 중견기업들이 진출하고 있다. 본 연구에서는 기업의 해외 진출 전략 동향을 파악하고자, 외국의 학술 데이터베이스인 scopus 활용하였다. 해외진출 전략이라는 단어를 제목으로 검색을 하고 이를 통해 총 153개의 논문의 초록을 확보하였다. 확보된 초록 논문을 전처리를 통해 분석에 가능한 데이터로 만들고 KoNLP를 활용하여 분석을 수행하였다. 분석결과 중요한 키워드가 10개 도출이 되었다. 본 연구의 결과는 기업들이 해외 진출에 대한 연구 동향을 파악하는데 목적이 있으며, 이를 통해 연구자들에게 해외 진출 전략의 동향을 제공하는데 그 목적이 있다. 이 연구는 향후 해외진출 전략에 대한 연구를 위한 가이드라인을 제공할 것으로 기대된다.

문자출력 무선호출기를 위한 음성인식 시스템 (Speech Recognition in the Pager System displaying Defined Sentences)

  • 박규붕;박전규;서상원;황두성;김현빈;한문성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.158-162
    • /
    • 1996
  • 본 논문에서는 문자출력이 가능한 무선호출기에 음성인식 기술을 접목한, 특성화된 한 음성인식 시스템에 대하여 설명하고자 한다. 시스템 동작 과정은, 일단 호출자가 음성인식 서버와 접속하게 되면 서버는 호출자의 자연스런 입력음성을 인식, 그 결과를 문장 형태로 피호출자의 호출기 단말기에 출력시키는 방식으로 되어 있다. 본 시스템에서는 통계적 음성인식 기법을 도입하여, 각 단어를 연속 HMM으로 모델링하였다. 가우시안 혼합 확률밀도함수를 사용하는 각 모델은 전통적인 HMM 학습법들 중의 하나인 Baum-Welch 알고리듬에 의해 학습되고 인식시에는 이들에 비터비 빔 탐색을 적용하여 최선의 결과를 얻도록 한다. MFCC와 파워를 혼용한 26 차원 특징벡터를 각 프레임으로부터 추출하여, 최종적으로, 83 개의 도메인 어휘들 및 무음과 같은 특수어휘들에 대한 모델링을 완성하게 된다. 여기에 구문론적 기능과 의미론적 기능을 함께 수행하는 FSN을 결합시켜 자연발화음성에 대한 연속음성인식 시스템을 구성한다. 본문에서는 이상의 사항들 외에도 음성 데이터베이스, 레이블링 등과 갈이 시스템 성능과 직결되는 시스템의 외적 요소들에 대해 고찰하고, 시스템에 구현되어 있는 다양한 특성들에 대해 밝히며, 실험 결과 및 앞으로의 개선 방향 등에 대해 논의하기로 한다.

  • PDF

고서목록 데이터베이스의 검색 인터페이스에 관한 연구 - 검색 기능을 중심으로 - (A Study on the Search Interface of Archival Databases in Korea: With a Focus on Search Functions)

  • 윤정옥
    • 한국도서관정보학회지
    • /
    • 제42권2호
    • /
    • pp.257-276
    • /
    • 2011
  • 이 연구의 목적은 국립중앙도서관의 '한국고전적종합목록시스템'과 국사편찬위원회의 '한국역사정보통합시스템' 이라는 두 고서 관련 정보 시스템의 검색 인터페이스 기능과 특성을 비교 및 분석하는 것이다. Breeding의 OPAC 표준 기능성 체크리스트를 사용하여 검색 관련 열한 개 항목을 네 개 범주로 나누어 분석한 결과, 키워드 검색, 질의에서 불리안 연산자 사용, 시대순 결과 정렬, 초기 단어 재입력 않고 탐색 수정 가능, 결과 집합 내 검색, 및 개별 도서관이나 장소로 결과 제한 가능 등 여섯 개 기능성은 두 시스템 모두 제공하였으나, 저자, 서명, 주제 브라우즈와 현재 세션의 검색 이력 보기와 불러오기는 두 시스템 다 제공하지 않았다. 이들은 OPAC의 표준 기능성 및 차세대 OPAC 기능성 반영, 이용자 요구와 정보추구행태의 심층적 분석, 주제 접근성 강화 등이 시급한 것으로 나타났다.