• 제목/요약/키워드: 정규고

검색결과 7,669건 처리시간 0.034초

음성인식에서 화자 내 정규화를 위한 진폭 변경 방법 (An Amplitude Warping Approach to Intra-Speaker Normalization for Speech Recognition)

  • 김동현;홍광석
    • 인터넷정보학회논문지
    • /
    • 제4권3호
    • /
    • pp.9-14
    • /
    • 2003
  • 기존의 성도 정규화 방법은 화자 간 정규화의 정확성을 개선하기 위한 매우 좋은 방법이다. 본 논문에서는 피치 변경 발성에 기반을 둔 새로운 화자 내 warping 인수 추정 방법을 제안한다. 화자 내 피치 변경 발성은 성문과 성도에 의해 발생되는 음성의 음향학적 차이 때문에 음성의 특징 공간 분포는 다르게 나타날 것이다. 발성의 변동은 frequency 성분과 amplitude 성분의 두가지 유형이 있다. 성도 정규화는 화자 간 정규화 방법들 중에서 주파수 정규화 방법이다. 여기에서는 화자 내 정규화를 위하여 진폭 변동을 정규화하는 방법을 제안한다. 참조 피치와 입력 피치의 역비례 계산에 의해서 진폭 warping 인수를 결정하는 것이 가능하다. 성능 평가를 위한 인식 실험 결과 숫자와 단어 인식에서 0.4%∼2.3% 정도의 인식 오류가 감소되었다.

  • PDF

문자클래스 매칭을 지원하는 정규표현식 매칭 프로세서 구조 (Regular Expression Matching Processor Architecture Supporting Character Class Matching)

  • 윤상균
    • 정보과학회 논문지
    • /
    • 제42권10호
    • /
    • pp.1280-1285
    • /
    • 2015
  • 고속 정규표현식 매칭을 수행하기 위한 여러 종류의 정규표현식 매칭 하드웨어 구조가 연구되었다. 특히 프로그램과 같이 패턴의 갱신이 쉽도록 범용 프로세서와 유사한 방식으로 정규표현식 매칭을 수행하는 ReCPU와 SMPU와 같은 정규표현식 프로세서가 연구되었다. 그렇지만 기존의 정규표현식 프로세서들은 문자클래스 매칭을 위한 별도의 기능을 제공하지 않아서 문자클래스 처리에 비효율적이다. 본 논문에서는 문자클래스 매칭을 지원하는 정규표현식 매칭 프로세서의 명령어 집합을 제시하고, 이에 대한 프로세서 구조를 설계 구현한다. 제시된 프로세서는 문자클래스, 문자 범위와 부정 문자클래스 처리 기능을 포함하고 있어서 문자클래스 매칭을 매우 효율적으로 처리할 수 있다.

함수에 의한 정규화를 이용한 local alignment 알고리즘 (A Local Alignment Algorithm using Normalization by Functions)

  • 이선호;박근수
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제34권5_6호
    • /
    • pp.187-194
    • /
    • 2007
  • Local alignment 알고리즘은 두 문자열을 비교하여 크기가 l, 유사도 점수가 s인 부분 문자열쌍을 찾는다. 크기가 충분히 크고 유사도 점수도 높은 부분 문자열 쌍을 찾기 위해 단위 길이당 유사도 점수 s/l을 최대화하는 정규화 방법이 제안되어있다. 본 논문에서는 증가함수 f, g를 도입하여 f(s)/g(l)을 최대화하는, 함수에 의한 정규화 방법을 제시한다. 여기서 함수 f, g는 DNA 서열을 비교하는 실험을 통해 정한다. 이러한 실험에서 함수에 의한 정규화 방법이 좋은 local alignment를 찾는다. 또한 유사도 점수의 기준으로 longest common subsequence를 채택한 경우, 기존의 정규화 알고리즘을 이용하면 별다른 시간 손실 없이 함수에 의해 정규화된 점수 f(s)/g(l)을 최대화 할 수 있음을 보인다.

비정규직, 가교(bridge) 인가 함정(trap) 인가? (Abnormal Work, a Bridge or a Trap?)

  • 남재량;김태기
    • 노동경제논집
    • /
    • 제23권2호
    • /
    • pp.81-106
    • /
    • 2000
  • 1990년대 중반 이후 비정규직의 급증은 우리 나라 노동시장의 변화를 보여주는 중요한 특정이다. 본고는 우리 나라의 비정규직이 근로자들에게 막다른 일자리인지 아니면 정규직으로 옮겨가는 과정에서 일시적으로 경험하게 되는 곳인지를 분석하고 있다. 이에 대한 이해는 노동시장을 분석하고 정책을 수립하는 데에 중요한 시사점을 제공할 것이다. 본 연구는 정태적인 측면과 동태척인 측면에서 이 문제에 접근하고 있다. 정태적인 측면만 보더라도 비정규직 종사자들은 주로 취약계층에 속하는 사람들로서 낮은 직무능력과 기능을 요구하는 분야에 종사하고 있어서 우리 나라의 비정규직은 함정일 가능성이 크다. 본고는 동태분석을 통해 이러한 가능성을 확인함과 동시에 보다 분명하고 구체척인 증거들을 제시하고 있다. 결국 우리나라의 비정규직은 주로 함정으로 역할을 하며 가교로서의 역할은 미미하다.

  • PDF

데이터 매칭을 이용한 비정규직의 임금격차 분석 (Wage Differentials between Regular and Irregular Workers)

  • 김선애;김진영
    • 노동경제논집
    • /
    • 제34권2호
    • /
    • pp.53-77
    • /
    • 2011
  • 최근 정규직과 비정규직 간의 고용형태 차이에 관한 연구, 특히 임금격차에 관한 연구가 활발하게 이루어지고 있다. 본 논문은 기존 연구에서 고용형태별 임금격차를 추정하기 위해 선형회귀 방법 등을 활용할 때 발생할 수 있는 추정의 문제점을 해결하기 위한 대안으로 데이터 매칭(matching)이라는 새로운 방법을 제시하고자 한다. 비정규직 근로자와 동일한 특성을 지닌 것으로 보이는 정규직 근로자를 매치하여 양자의 임금격차를 분석한 결과, 정규직과 비정규직의 임금 차이는 거의 존재하지 않음을 알 수 있다.

  • PDF

정규화된 주식가격의 평균추세-변동성 지표를 이용한 매매전략 -KOSPI200 을 중심으로- (Buy-Sell Strategy with Mean Trend and Volatility Indexes of Normalized Stock Price)

  • 유성모;김동현
    • 한국통계학회:학술대회논문집
    • /
    • 한국통계학회 2005년도 춘계 학술발표회 논문집
    • /
    • pp.277-283
    • /
    • 2005
  • 주식가격은 일반적으로 정규분포를 따르지 않으며 이러한 비정규성을 띤 주식의 매매전략은 일반적으로 추세 지표, 변동성 지표, 거래량 지표 등을 토대로 수립되며 통계적이기 보다는 직관적이라고 볼 수 있다. 주식가격의 비정규성 문제는 주식가격의 정규화 과정을 통해서 해결 될 수 있으며 통계적인 매매전략은 정규화된 주식가격의 평균추세 지표 및 변동성 지표를 결합하여 작성될 수 있다. 본 논문은 정규화된 주식가격의 평균추세 지표와 변동성 지표를 결합한 매매전략을 제시하였고 이를 KOSPI200에 적용한 결과 성공적인 매매전략이 될 수 있는 가능성을 확인하였다.

  • PDF

비정규삼각망 데이타구조에 의한 수치지형모델의 구성 (The Construction of Digital Terrain Models by a Triangulated Irregular Network)

  • 이석찬;조규전;이창경;최병길
    • 한국측량학회지
    • /
    • 제8권2호
    • /
    • pp.1-8
    • /
    • 1990
  • 수치지형모텔의 데이타 구조로는 정규격자망 및 비정규삼각망 데이타구조가 널리 이용되고 있다. 정규격자망은 그 구조가 단순하고 간단한 반면에 지형 특성을 잘 반영하지 못하며 많은 데이타 용량을 요한다. 이와는 반대로 비정규삼각망 데이타 구조는 그 구축 방법이 어렵지만 지형 특성을 잘 살릴 수 있으며 적은 양의 데이타로 그의 응용분야에 적합한 정확도를 얻을 수 있다. 본 연구는 Delaunay triangulation에 바탕을 두고, 비정규삼각망 데이터 구조를 연구 개선시킴으로써 좀더 효율적인 수치지형모텔을 구성하는데 목적을 두었다. 이를 위하여 기존의 지도로부터 정규 및 비정규 데이타가 추출되었으며 두 데이터 구조에 대한 상호 비교가 이루어졌다.

  • PDF

지진 이벤트 분류를 위한 정규화 기법 분석 (Analysis of normalization effect for earthquake events classification)

  • 장수;구본화;고한석
    • 한국음향학회지
    • /
    • 제40권2호
    • /
    • pp.130-138
    • /
    • 2021
  • 본 논문에서는 지진 이벤트 분류를 위한 다양한 정규화 기법 분석 및 효과적인 합성곱 신경망(Convolutional Neural Network, CNN)기반의 네트워크 구조를 제안하였다. 정규화 기법은 신경망의 학습 속도를 개선할 뿐만 아니라 잡음에 강인한 모습을 보여 준다. 본 논문에서는 지진 이벤트 분류를 위한 딥러닝 모델에서 입력 정규화 및 은닉 레이어 정규화가 모델에 미치는 영향을 분석하였다. 또한, 적용 은닉 레이어의 구조에 따른 다양한 실험을 통해 효과적인 모델을 도출하였다. 다양한 모의실험 결과 입력 데이터 정규화 및 제1 은닉 레이어에 가중치 정규화를 적용한 모델이 가장 안정적인 성능 향상을 보여 주었다.

한국어 분류를 위한 효율적인 서브 워드 분절 (Efficient Subword Segmentation for Korean Language Classification)

  • 서현진;남정재;김민석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.535-540
    • /
    • 2022
  • Out of Vocabulary(OOV) 문제는 인공신경망 기계번역(Neural Machine Translation, NMT)에서 빈번히 제기되어 왔다. 이를 해결하기 위해, 기존에는 단어를 효율적인 압축할 수 있는 Byte Pair Encoding(BPE)[1]이 대표적으로 이용되었다. 하지만 BPE는 빈도수를 기반으로 토큰화가 진행되는 결정론적 특성을 취하고 있기에, 다양한 문장에 관한 일반화된 분절 능력을 함양하기 어렵다. 이를 극복하기 위해 최근 서브 워드를 정규화하는 방법(Subword Regularization)이 제안되었다. 서브 워드 정규화는 동일한 단어 안에서 발생할 수 있는 다양한 분절 경우의 수를 고려하도록 설계되어 다수의 실험에서 우수한 성능을 보였다. 그러나 분류 작업, 특히 한국어를 대상으로 한 분류에 있어서 서브 워드 정규화를 적용한 사례는 아직까지 확인된 바가 없다. 이를 위해 본 논문에서는 서브 워드 정규화를 대표하는 두 가지 방법인 유니그램 기반 서브 워드 정규화[2]와 BPE-Dropout[3]을 이용해 한국어 분류 문제에 대한 서브 워드 정규화의 효과성을 제안한다. NMT 뿐만 아니라 분류 문제 역시 단어의 구성성 및 그 의미를 파악하는 것은 각 문장이 속하는 클래스를 결정하는데 유의미한 기여를 한다. 더불어 서브 워드 정규화는 한국어의 문장 구성 요소에 관해 폭넓은 인지능력을 함양할 수 있다. 해당 방법은 본고에서 진행한 한국어 분류 과제 실험에서 기존 BPE 대비 최대 4.7% 높은 성능을 거두었다.

  • PDF

URL정규화의 적용 효과 및 평가 (Effects and Evaluations of URL Normalization)

  • 정효숙;김성진;이상호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제33권5호
    • /
    • pp.486-494
    • /
    • 2006
  • 하나의 웹 문서는 문법적으로 서로 다른 두개 이상의 URL들로 표현 가능하다. URL 정규화는 URL을 정형화된 형태로 변환하는 과정이다. 정규화 과정을 통하여, 동일 웹 문서를 나타내는 URL들은 문법적으로 동일 URL들로 변환된다. 현재까지 정규화 방법의 개발 및 적용은 개발자의 경험적 지식에 기반을 두고 있으며, 체계적인 분석에 대한 연구가 부재하다. 본 논문에서는 웹 어플리케이션의 효율성과 효과성 측면에서 정규화 방법들을 평가하여 적절한 정규화 방법의 선택에 대한 지침 제공을 목적으로 한다. 또한, 웹 어플리케이션에서 정규화 적용으로 발생하는 효과를 분석하고, URL 정규화 평가를 위한 7가지 척도를 기술한다. 끝으로, 실제 웹 문서에서 추출된 약 2천 5백만개의 URL들을 대상으로 12개의 정규화 방법 이 평가된다.