• 제목/요약/키워드: 패턴인식알고리즘

검색결과 702건 처리시간 0.033초

모수적 궤적 기반의 분절 HMM을 이용한 연속 음성 인식 (Continuous Speech Recognition based on Parmetric Trajectory Segmental HMM)

  • 윤영선;오영환
    • 한국음향학회지
    • /
    • 제19권3호
    • /
    • pp.35-44
    • /
    • 2000
  • 본 논문에서는 음성 패턴을 효율적으로 모델링하고자 분절 특징(segmental feature)을 이 용하여 은닉 마코프 모델(hidden markov model)의 일반적인 형식에 기반한 새로운 모수적 궤적 모델 (parametric trajectory model)을 제안한다. 일반적으로 벡터의 열로써 표현되는 분절은 관측 열의 궤적(trajectory)으로 표현된다. 이 궤적은 연속적인 프레임들의 전이 정보(transitional information)를 표현하는 디자인 행렬을 이용하여 얻어지며, 다항식의 회귀 함수(polynomial regression function)로써 나타낼 수 있다. 이러한 궤적을 HMM에 적용하기 위해서 프레임 특징 대신 분절의 특성 을 표현하는 궤적으로 대치하고 우도(likelihood) 계산에 궤적들의 비교에 의한 확률 값을 반영시켜야 한다. 본 논문에서는 궤적간의 유사도를 측정하는 분절 우도(segment likelihood)와 모델을 구성하는 궤적변수의 추정 알고리즘을 제안한다. 임의의 분절에 대한 관측 확률은 제안된 분절 우도와 궤적의 추정 오차(estimation error of trajectories)의 곱으로써 표현된다. 궤적의 추정 오차는 상태에서 주어진 분절 우도의 가중치로 표현될 수 있으며, 이 가중치는 궤적과 대응되는 분절의 적합도를 표현하는 확률을 나타낸다. 본 논문에서 제 안된 모델은 일반적 인 HMM과 모수적 궤적 모델의 일반화(generalization) 또는 확장(extension) 모델로 생각될 수 있다. 본 모델의 성능을 평가하기 위하여 TIMIT 데이터에 기반한 실험을 한 결과, 분절 길이(segment length)와 회귀 차수(regression order)가 변할수록 일반적인 HMM에 비하여 뚜렷한 성능향상이 있음을 알 수 있었다.

  • PDF

가축분뇨처리공정의 자동제어 인자 신뢰성 평가 및 적정 외부탄소원 공급량 지표 확립 (Estimation of Reliability of Real-time Control Parameters for Animal Wastewater Treatment Process and Establishment of an Index for Supplemental Carbon Source Addition)

  • 박재인;라창식
    • Journal of Animal Science and Technology
    • /
    • 제50권4호
    • /
    • pp.561-572
    • /
    • 2008
  • 다양한 조건하에서 가축분뇨처리공정을 운전하면서 각 자동제어 인자의 반응을 분석하고 ORP, DO, pH(mV)-time profile를 이용한 자동제어 신뢰성을 평가하였다. 또한 무산소 조건에서의 잔존 유기물 및 미생물 자기산화에 의한 탈질율을 고려한 적정 외부탄소원 공급량 지표를 파악하였다. 실험은 45L의 유효용적을 지닌 실험실 규모의 SBR 공정을 이용하여 수행되었다. ORP-와 pH(mV)-, DO-time profile 상에서 완전질산화를 의미하는 NBP가 뚜렷하게 발현하던 중 NH4-N의 낮은 부하와 고농도 NOx-N 함유 폐수의 유입 및 불충분한 무산소 조건 제공이 이루어졌을 때 ORP-와 DO-time profile 상에서 NBP가 사라지기 시작하였으며 NOx-N의 지속적인 증가에 의해 ORP 값의 민감성이 둔화되기 시작하였다. 그러나 pH(mV)-time profile은 항상 일정한 변화패턴을 유지하면서 암모니아성 질소의 완전 질산화가 이루어졌을 때 뚜렷한 NBP를 발현하였다. NOx-N/NH4-N의 비가 80:1 수준까지 높아지는 조건하에서도 pH(mV)- time profile상에서의 이러한 안정적 NBP의 발현은 지속되었으며 발현되는 NBP는 MSC(Moving Slope Change)의 변화 패턴을 추적함에 의해 인식되도록 프로그램 할 수 있었다. pH(mV)-time profile에서의 NBP의 발현과 MSC를 이용한 자동제어시점 인식은 반응조내 NOx-N 농도가 무려 300mg/L 이상의 수준에서도 안정적이었다. 유기물 농도에 따른 자동제어 인자의 반응을 분석한 시험에서도 반응조내 유기물의 농도가 STOC 기준 약 10,000mg/L 수준으로 증가함에도 불구하고 pH(mV)-time profile 상에서의 이러한 NBP 발현은 지속되었으며 고농도 유기물 축적 하에서도 동일한 자동제어 알고리즘이 이용될 수 있음을 알 수 있었다. 잔존 유기물과 미생물 자기산화에 의한 탈질율은 약 0.4mg/L.hr로 분석되었으며 안전지수 0.1을 도입하여 산출된 NOx-N 기준 적정 외부탄소원 공급량은 0.83 STOC/NOx-N으로 파악되었다.

패턴인식 알고리즘을 적용한 임플란트 주변골 흡수 분석 (Marginal Bone Resorption Analysis of Dental Implant Patients by Applying Pattern Recognition Algorithm)

  • 정민기;김성민;김명주;이종호;명훈;김명진
    • Maxillofacial Plastic and Reconstructive Surgery
    • /
    • 제35권3호
    • /
    • pp.167-173
    • /
    • 2013
  • Purpose: The aim of this study is to analyze the series of panoramic radiograph of implant patients using the system to measure peri-implant crestal bone loss according to the elapsed time from fixture installation time to more than three years. Methods: Choose 10 patients having 45 implant fixtures installed, which have series of panoramic radiograph in the period to be analyzed by the system. Then, calculated the crestal bone depth and statistics and selected the implant in concerned by clicking the implant of image shown on the monitor by the implemented pattern recognition system. Then, the system recognized the x, y coordination of the implant and peri-implant alveolar crest, and calculated the distance between the approximated line of implant fixture and alveolar crest. By applying pattern recognition to periodic panoramic radiographs, we attained the results and made a comparison with the results of preceded articles concerning peri-implant marginal bone loss. Analyzing peri-implant crestal bone loss in a regression analysis periodic filmed panoramic radiograph, logarithmic approximation had highest $R^2$ value, and the equation is as shown below. $y=0.245Logx{\pm}0.42$, $R^2=0.53$, unit: month (x), mm (y) Results: Panoramic radiograph is a more wide-scoped view compared with the periapical radiograph in the same resolution. Therefore, there was not enough information in the radiograph in local area. Anterior portion of many radiographs was out of the focal trough and blurred precluding the accurate recognition by the system, and many implants were overlapped with the adjacent structures, in which the alveolar crest was impossible to find. Conclusion: Considering the earlier objective and error, we expect better results from an analysis of periapical radiograph than panoramic radiograph. Implementing additional function, we expect high extensibility of pattern recognition system as a diagnostic tool to evaluate implant-bone integration, calculate length from fixture to inferior alveolar nerve, and from fixture to base of the maxillary sinus.

다각 다단 구조 헬릭스 안테나 설계 (On the Design of Multi-layered Polygonal Helix Antennas)

  • 주재율;추호성;박익모;오이석
    • 한국전자파학회논문지
    • /
    • 제17권3호
    • /
    • pp.249-258
    • /
    • 2006
  • 본 논문에서는 새로운 구조의 헬리컬 안테나를 UHF 대역 RFID 리더용 안테나로 제안하였다. 제안된 헬리컬 안테나는 안테나의 선로가 다각 구조의 외부단에서 내부단으로 감겨 들어가는 형태를 가져 복사 이득과 복사 패턴의 조절이 용이하고, 감긴 선로의 수평 회전각과 수직 회전각을 조절하여 양질의 원형 편파를 복사할 수 있다. 세부적인 안테나 설계 변수는 Pareto 유전자 알고리즘을 사용하여 RFID 리더 특성에 적합하도록 최적화 시켰다. 최적화된 RFID 리더 안테나들 중 2단 구조의 표본 안테나를 선별하여 유연한 유전체인 종이 위에 스트립 선로로 제작하였으며, 제작된 안테나의 측정간을 시뮬레이션 결과와 비교, 분석하였다. 제작된 안테나는 kr=3.2의 크기를 가지며 21.4 %의 반사 손실 대역폭, 31.9 %의 원형 편파 대역폭, 약 $5.5m^2$의 인식 영역 특성을 보였다. 안테나 선로의 전류 분포와 선로 구조의 민감도를 조사한 결과, 급전 부위 근처에서 선로가 $0.25{\lambda}$ 정합기로 동작하게 되어 광대역의 정합 특성을 가지며, 꺾이는 스트립 선로 구조는 최적의 진행파를 형성하여 양질의 원형 편파를 발생시키는 것을 확인하였다.

시공간 순차 정보를 이용한 내용기반 복사 동영상 검출 (Content based Video Copy Detection Using Spatio-Temporal Ordinal Measure)

  • 정재협;김태왕;양훈준;진주경;정동석
    • 대한전자공학회논문지SP
    • /
    • 제49권2호
    • /
    • pp.113-121
    • /
    • 2012
  • 본 논문은 대용량 동영상을 관리하기 위한 빠르고 효율적인 내용기반 중복 동영상 검출 알고리즘을 제안한다. 효율적인 중복 동영상 검출을 위해 대용량의 동영상을 처리하기 쉬운 작은 단위로 나누는 동영상 장면 전환 기반 분할 기술을 적용하였다. 동영상 서비스 및 저작권 보호 관련 사업모델의 경우, 필요한 기술은 아주 작은 구간의 동영상이나 한 장의 영상 을 검색하기보다는 상당한 길이 이상 일치하는 동영상을 파악하는 기술이 필요하다. 이러한 중복 동영상 검출을 위해 본 논문에서 동영상을 장면 전환을 기준으로 분할하여, 나누어진 장면 내에서 움직임 분포 서술자와 대표 프레임을 선택하여 프레임 서술자를 추출한다. 움직임 분포 서술자는 동영상 디코딩 과정에서 얻어지는 매크로 블록의 움직임 벡터를 이용한 장면 내 움직임 분포 히스토그램을 구성하였다. 움직임 분포 서술자는 정합시 고속 정합이 가능하도록 필터링 역할을 한다. 반면 움직임 정보만는 낮은 변별력을 가진다. 이를 높이기 위해 움직임 분포 서술자를 이용하여 정합된 장면 간에 선택된 대표 프레임의 패턴 서술자를 이용하여 동영상의 중복 여부를 최종 판단한다. 제안된 방법은 실제 동영상 서비스 환경에서 우수한 인식률과 낮은 오인식률을 가질 뿐만아니라 실제 적용이 가능할 정도의 빠른 정합 속도를 얻을 수 있었다.

작업자 안전관리를 위한 유비쿼터스-실시간 위치추적시스템 연구 (A study of ubiquitous-RTLS system for worker safety)

  • 김영백
    • 한국통신학회논문지
    • /
    • 제37권1C호
    • /
    • pp.1-7
    • /
    • 2012
  • 산업현장에서는 작업 효율을 높이기 위해 공정 과정에 자동화를 진행하고 있지만 전 공정에 자동화를 구축하기 어려운 반자동화 공간에서 작업하는 작업자들은 항상 위험에 노출되어 있다. 이러한 위험으로부터 작업자를 보호하기 위해, 본 논문에서는 Ubiquitous-Wireless Sensor Network(이하 U-WSN) 기반 위치인식 시스템을 이용한 산업현장에서의 작업자 안전관리 시스템을 연구하였다. 무선 신호를 이용하여 두 디바이스 사이의 거리를 측청하고, 3차원 삼각측량으로 작업자의 위치를 계산 할 수 있지만 무선 신호는 철과 구조물이 많은 산업현장에서는 신호의 반사, 멀티패스 등에 따라 오차가 발생하여 정확한 위치를 찾는 것에 많은 어려움이 있는 것이 현실이다. 이러한 문제를 해결하기 위해서 첫째, 작업현장에 적합한 원형편파 패치 안테나를 적용한 Line Of Sight(이하 LOS)에서 안테나 방사 패턴에 의해 발생 할 수 있는 오차를 개선한다. 둘째, 3차원에서 위치를 계산 할 수 있는 3차원 위치계산 방법과 필터링 알고리즘을 활용한 위치 정확도를 개선한다. 개발된 시스템은 항만부두 크레인에 적용하여 정확성 및 실효성을 검증 하였고 본 시스템은 산업현장에서 작업자의 안전에 크게 기여 할 것으로 기대된다.

전극 개수에 따른 근전도 기반 휴먼-컴퓨터 인터페이스의 정확도에 대한 연구 (Human-Computer Interface using sEMG according to the Number of Electrodes)

  • 이슬비;지영준
    • 한국HCI학회논문지
    • /
    • 제10권2호
    • /
    • pp.21-26
    • /
    • 2015
  • NUI(Natural User Interface)는 사용자의 자연스러운 동작이나 동작 시 발생하는 생체 신호를 해석하여 기계에 명령을 내리는 것을 말한다. 물리적인 변화가 있어야 사용이 가능한 가속도 센서나 영상 기반의 NUI와는 달리 특정 동작과 관련된 근육의 표면 근전도(surface Electromyogram, sEMG)를 측정하면 실제 움직임이 발생하지 않아도(isometric contraction) 동작 의도를 예측할 수 있다. 본 연구에서는 근전도 기반으로 손목 동작 의도를 분류할 때 전극 개수에 따른 정확도를 확인하고, 키보드 등에 적용 가능한 인터페이스 기술을 제안한다. 손목의 동작 중 신전(extension, up), 굴곡(flexion, down), 외전(abduction, right), 내전(adduction, left)의 네 가지 동작 의도를 분류하는 실험을 진행하였다. 50ms 간격으로 계산된 제곱평균제곱근(Root Mean Square, RMS)을 특징으로 사용하였고, 동작 의도 인식을 위해 역전파 알고리즘으로 학습한 다층 퍼셉트론 분류기를 사용하였다. 전극 쌍의 개수를 네 개(91.9%), 세 개(87.0%), 두 개(78.9%)로 줄여가며 정확도를 확인했다. 전극 쌍의 개수가 네 개에서 두 개로 줄었을 때 정확도는 약 13% 감소하였다. 두 쌍의 전극만 사용하는 경우의 분류 정확도를 높이기 위하여 직전의 RMS를 특징에 추가하였다. 150 ms 이전까지의 정보를 사용하였을 때, 분류 정확도가 78.9%에서 83.6%로 4.6% 증가하였다. 전극 쌍의 개수가 감소함에 따라 정확도는 감소하였지만, 이전 데이터를 함께 사용한 경우 부분적으로 증가 시킬 수 있음을 확인하였다.

다층 퍼셉트론의 학습 성능 개선을 위한 일반화된 시그모이드 베이시스 함수 (Generalized Sigmidal Basis Function for Improving the Learning Performance fo Multilayer Perceptrons)

  • 박혜영;이관용;이일병;변혜란
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권11호
    • /
    • pp.1261-1269
    • /
    • 1999
  • 다층 퍼셉트론은 다양한 응용 분야에 성공적으로 적용되고 있는 대표적인 신경회로망 모델이다. 그러나 다층 퍼셉트론의 학습에서 나타나는 플라토에 기인한 느린 학습 속도와 지역 극소는 실제 응용문제에 적용함에 있어서 가장 큰 문제로 지적되어왔다. 이 문제를 해결하기 위해 여러 가지 다양한 학습알고리즘들이 개발되어 왔으나, 계산의 비효율성으로 인해 실제 문제에는 적용하기 힘든 예가 많은 등, 현재까지 만족할 만한 해결책은 제시되지 못하고 있다. 본 논문에서는 다층퍼셉트론의 베이시스 함수로 사용되는 시그모이드 함수를 보다 일반화된 형태로 정의하여 사용함으로써 학습에 있어서의 플라토를 완화하고, 지역극소에 빠지는 것을 줄이는 접근방법을 소개한다. 본 방법은 기존의 변형된 가중치 수정식을 사용한 학습 속도 향상의 방법들과는 다른 접근 방법을 택함으로써 기존의 방법들과 함께 사용하는 것이 가능하다는 특징을 갖고 있다. 제안하는 방법의 성능을 확인하기 위하여 간단한 패턴 인식 문제들에의 적용 실험 및 기존의 학습 속도 향상 방법을 함께 사용하여 시계열 예측 문제에 적용한 실험을 수행하였고, 그 결과로부터 제안안 방법의 효율성을 확인할 수 있었다. Abstract A multilayer perceptron is the most well-known neural network model which has been successfully applied to various fields of application. Its slow learning caused by plateau and local minima of gradient descent learning, however, have been pointed as the biggest problems in its practical use. To solve such a problem, a number of researches on learning algorithms have been conducted, but it can be said that none of satisfying solutions have been presented so far because the problems such as computational inefficiency have still been existed in these algorithms. In this paper, we propose a new learning approach to minimize the effect of plateau and reduce the possibility of getting trapped in local minima by generalizing the sigmoidal function which is used as the basis function of a multilayer perceptron. Adapting a new approach that differs from the conventional methods with revised updating equation, the proposed method can be used together with the existing methods to improve the learning performance. We conducted some experiments to test the proposed method on simple problems of pattern recognition and a problem of time series prediction, compared our results with the results of the existing methods, and confirmed that the proposed method is efficient enough to apply to the real problems.

자연영상에서 문자의 형태 분석을 이용한 문자영역 추출에 관한 연구 (A Study on Extraction of text region using shape analysis of text in natural scene image)

  • 양재호;한현호;김기봉;이상훈
    • 한국융합학회논문지
    • /
    • 제9권11호
    • /
    • pp.61-68
    • /
    • 2018
  • 본 논문에서는 일상에서 획득할 수 있는 자연 영상에서 문자를 검출하기 위해 영상 개선 및 문자의 형태를 분석하여 문자를 검출하는 방법을 제안한다. 제안하는 방법은 자연 영상에서 문자로 인식될 영역의 검출률을 향상시키기 위해 객체부분의 경계를 언샤프 마스크를 사용하여 강조하였다. 향상된 객체의 경계 부분을 이용하여 영상의 문자 후보영역을 MSER(Maximally Stable Extermal Regions)을 이용하여 검출하였다. 검출된 문자 후보영역에서 실제 문자로 판단될 영역을 검출하기 위해 각 영역들의 형태를 분석하여 글자의 특성을 갖는 영역외의 비 문자영역을 제거하여 실제 문자영역 검출률을 높였다. 본 논문의 정량적 평가를 위해 문자 영역의 검출률과 정확도를 이용하여 기존의 방법들과 비교하였다. 실험결과 기존의 문자 검출 방법보다 제안하는 방법이 비교적 높은 문자영역의 검출률 및 정확도를 보였다.

효과적인 입력변수 패턴 학습을 위한 시계열 그래프 기반 합성곱 신경망 모형: 주식시장 예측에의 응용 (A Time Series Graph based Convolutional Neural Network Model for Effective Input Variable Pattern Learning : Application to the Prediction of Stock Market)

  • 이모세;안현철
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.167-181
    • /
    • 2018
  • 지난 10여 년간 딥러닝(Deep Learning)은 다양한 기계학습 알고리즘 중에서 많은 주목을 받아 왔다. 특히 이미지를 인식하고 분류하는데 효과적인 알고리즘으로 알려져 있는 합성곱 신경망(Convolutional Neural Network, CNN)은 여러 분야의 분류 및 예측 문제에 널리 응용되고 있다. 본 연구에서는 기계학습 연구에서 가장 어려운 예측 문제 중 하나인 주식시장 예측에 합성곱 신경망을 적용하고자 한다. 구체적으로 본 연구에서는 그래프를 입력값으로 사용하여 주식시장의 방향(상승 또는 하락)을 예측하는 이진분류기로써 합성곱 신경망을 적용하였다. 이는 그래프를 보고 주가지수가 오를 것인지 내릴 것인지에 대해 경향을 예측하는 이른바 기술적 분석가를 모방하는 기계학습 알고리즘을 개발하는 과제라 할 수 있다. 본 연구는 크게 다음의 네 단계로 수행된다. 첫 번째 단계에서는 데이터 세트를 5일 단위로 나눈다. 두 번째 단계에서는 5일 단위로 나눈 데이터에 대하여 그래프를 만든다. 세 번째 단계에서는 이전 단계에서 생성된 그래프를 사용하여 학습용과 검증용 데이터 세트를 나누고 합성곱 신경망 분류기를 학습시킨다. 네 번째 단계에서는 검증용 데이터 세트를 사용하여 다른 분류 모형들과 성과를 비교한다. 제안한 모델의 유효성을 검증하기 위해 2009년 1월부터 2017년 2월까지의 약 8년간의 KOSPI200 데이터 2,026건의 실험 데이터를 사용하였다. 실험 데이터 세트는 CCI, 모멘텀, ROC 등 한국 주식시장에서 사용하는 대표적인 기술지표 12개로 구성되었다. 결과적으로 실험 데이터 세트에 합성곱 신경망 알고리즘을 적용하였을 때 로지스틱회귀모형, 단일계층신경망, SVM과 비교하여 제안모형인 CNN이 통계적으로 유의한 수준의 예측 정확도를 나타냈다.