통합 검색 | Korea Science

MLP-VQ와 가중 DHMM을 이용한 연결 숫자음 인식에 관한 연구 (A study on the connected-digit recognition using MLP-VQ and Weighted DHMM)

정광우;홍광석
- 전자공학회논문지S
- /
- 제35S권8호
- /
- pp.96-105
- /
- 1998
본 논문에서는 화자 독립 연속 숫자음 인식 시스템의 성능향상을 위하여 MLP-VQ (Multi-Layer Perceptron-Vector Quantizer)를 이용한 가중 DHMM(WDHMM : Weighted Discrete Hidden Markov Models)을 제안한다. MLP 신경망의 출력분포는 입력 패턴과 학습 패턴들간의 비선형 매핑을 통해 각 패턴들간의 유사도를 나타내는 확률분포를 갖는다. 본 논문에서는 MLP 신경망의 출력분포중 가장 높은 출력 값을 갖는 MLP 신경망의 출력 노드를 인덱스를 이용하여 코드워드를 생성하는 MLP-VQ를 제안하였다. 제안된 MLP-VQ는 기존의 VQ에 비해 현재 입력패턴과 학습된 각 class 패턴들간의 유사성 정도를 인식모델을 반영할 수 있는 특징을 갖는다. 또한 MLP 신경망의 출력분포를 DHMM의 심벌 발생 확률의 가중치로 이용하는 가중 DHMM보다는 음소 클래스간의 관계를 인식모델에 반영할 수 있기 때문에 적은 계산양의 증가로 인식기의 성능을 14.71%개선할 수 있었다. 실험결과에 의하면, MLP-VQ와 WDHMM에 의한 화자독립 연결 숫자음 인식율은 84.22%이다.
PDF

비정형 정보와 CNN 기법을 활용한 이진 분류 모델의 고객 행태 예측: 전자상거래 사례를 중심으로 (Customer Behavior Prediction of Binary Classification Model Using Unstructured Information and Convolution Neural Network: The Case of Online Storefront)

김승수;김종우
- 지능정보연구
- /
- 제24권2호
- /
- pp.221-241
- /
- 2018
최근 딥러닝 기술이 주목을 받고 있다. 대중들의 관심을 받았던 국제 이미지 인식 기술 대회(ILSVR)와 알파고(AlphaGo)에서 사용된 딥러닝 기술이 바로 합성곱 신경망(CNN; Convolution Neural Network)이다. 합성곱 신경망은 입력 이미지를 작은 구역으로 나누어 부분적인 특징을 인식하고 이것을 결합하여 전체를 인식하는 특징을 가진다. 이러한 딥러닝 기술이 우리의 생활에 있어 많은 변화를 야기할 것이라는 기대를 주고 있지만 현재까지는 이미지 인식과 자연어 처리 등에 그 성과가 국한되어 있다. 비즈니스 문제에 대한 딥러닝 활용은 아직까지 초기 연구 단계로 향후 마케팅 응답 예측이나 허위 거래 식별, 부도 예측과 같은 전통적 비즈니스 문제들에 대해 보다 깊게 활용되고 그 성능이 입증된다면 딥러닝 기술의 활용 가치가 보다 더 주목받게 될 것으로 기대된다. 이러한 때 비교적 고객 식별이 용이하고 활용 가치가 높은 빅데이터를 보유하고 있는 전자상거래 기업의 사례를 바탕으로 하여 딥러닝 기술의 비즈니스 문제 해결 가능성을 진단해보는 것은 학술적으로 매우 의미 있는 시도라 할 수 있겠다. 이에 본 연구에서는 전자상거래 기업의 고객 행태 예측력을 높이기 위한 방안으로 합성곱 신경망을 활용한 '이종 정보 결합(Heterogeneous Information Integration)의 CNN 모델'을 제시한다. 이는 정형과 비정형 정보를 결합하여 다층 퍼셉트론 구조의 합성곱 신경망에서 학습시키는 모델로서 최적의 성능을 발휘하도록 '이종 정보 결합'과 '비정형 정보의 벡터 전환', 그리고 '다층 퍼셉트론 설계'로 하는 3개의 내부 아키텍처를 정의하고 각 아키텍처 단위로 구성되는 방식에 따른 성능을 평가하여 그 결과를 바탕으로 제안 모델을 확정하고 그 성능을 평가해보고자 한다. 고객 행태 예측을 위한 목표 변수는 전자상거래 기업에서 중요하게 관리하고 있는 재구매 고객, 이탈 고객, 고빈도 구매 고객, 고빈도 반품 고객, 고단가 구매 고객, 고할인 구매 고객 등 모두 6개의 이진 분류 문제로 정의한다. 제안한 모델의 유용성을 검증하기 위해서 국내 특정 전자상거래 기업의 실제 데이터를 활용하여 실험을 수행하였다. 실험 결과 정형과 비정형 정보를 결합하여 CNN을 활용한 제안 모델이 NBC(Naïve Bayes classification)과 SVM(Support vector machine), 그리고 ANN(Artificial neural network)에 비해서 예측 정확도와 F1 Measure가 높게 평가되었다. 또 NBC, SVM, ANN에서 정형 정보만을 사용할 때 보다 정형과 비정형 정보를 결합하여 입력 변수로 함께 활용한 경우에 예측 정확도가 향상되는 것으로 나타났다. 따라서 실험 결과로부터 비정형 정보의 활용이 고객 행태 예측의 정확도 향상에 기여한다는 점과 CNN 기법의 특징 추출 알고리즘이 VOC에 사용된 단어들의 분포와 위치 정보를 해석하여 문장의 의미를 파악하는데 효과적이라는 점을 실증적으로 확인하였다는데 그 의미가 있다고 할 수 있겠다. 이를 통해서 CNN 기법이 지금까지 소개된 이미지 인식이나 자연어 처리 분야 외에 비즈니스 문제 해결에도 활용 가치가 높다는 점을 확인하였다는데 이 연구의 의의가 있다 하겠다.
https://doi.org/10.13088/jiis.2018.24.2.221 인용 PDF KSCI

고유특징과 다층 신경망을 이용한 얼굴 영상에서의 눈과 입 영역 자동 추출 (Automatic Extraction of Eye and Mouth Fields from Face Images using MultiLayer Perceptrons and Eigenfeatures)

류연식;오세영
- 전자공학회논문지CI
- /
- 제37권2호
- /
- pp.31-43
- /
- 2000
본 논문은 얼굴영상에서 눈과 입 부위를 추출하기 위한 알고리즘을 제안하였다. 첫째로, 눈과 입의 에지 이진 화소 집합의 고유 값 (Eigenvalue) 과 고유 벡터 (Eigenvector) 로 부터 추출한 정보들은 눈과 입을 찾기 위한 좋은 특징이 된다. 눈과 입 부위의 긍정적 샘플과 부정적 샘플로부터 추출한 고유 특징들로 다층 신경망을 학습하여 특정 영역이 눈과 입 부위 포함하는 정도를 나타내도록 하였다. 둘째로, 시스템의 강건성 확보를 위해 서로 다른 구조의 단일 MLP를 묶어서 그 결과를 이용하는 Ensemble network 구조를 사용하였다. 두 눈과 입에 각각 별도의 Ensemble network을 사용하였고, 각 Ensemble network내 MLP들의 출력이 최대가 되는 영역의 중심 좌표들을 평균하여 최종 위치를 결정하였다. 셋째로, 특징 정보 추출 검색 영역을 즐기기 위해 얼굴 영상 에지 정보와 눈과 입의 위치 관계를 이용해 눈과 입의 대략적인 영역을 추출하였다. 제안된 시스템은 적은 수의 정면 얼굴에서 추출한 고유 특징들로 학습된 Ensemble network을 사용하여 학습에 사용되지 않은 다른 사람들의 정면얼굴 뿐만 아니라 일정한 범위 내 자세 변화에서도 좋은 일반화 성능을 얻고 있으며, 작은 범위 내에서의 얼굴 크기 변화나 좌우 20°이내의 자세 변화에 대해서도 신경망의 일반화 기능을 이용하여 강건한 결과를 얻고 있음을 확인하였다.
PDF

고유 숫자를 이용한 번호판 숫자 인식 (Recognition of Numeric Characters in License Plates using Eigennumber)

박경수;강현철;이완주
- 대한전자공학회논문지SP
- /
- 제44권3호
- /
- pp.1-7
- /
- 2007
자동차 번호판을 인식하기 위해서는 차량 영상에서 번호판을 추출하고, 추출된 번호판으로부터 문자를 분리하여야 하고, 각 문자들에 대해서 특징 벡터를 추출하고 신경망을 이용하여 인식한다. 이때 인식의 기준이 되는 특징 벡터의 선정은 데이터양의 감소뿐 만 아니라 인식 성능에 많은 영향을 미친다. 본 논문에서는 숫자를 고유 숫자(eigennumber)의 선형 조합으로 분해하여 특징 벡터를 추출하는 새로운 특징 벡터 추출 기법을 제안하고, 자동차 번호판의 숫자 인식에 적용함으로써 그 유효성을 검증하였다. 실험 결과, 고유 숫자 공간상에서 다층 퍼셉트론 신경망을 이용하여 95.3%의 인식률을 보였고, 이는 일반적인 메쉬 특징과 비교하여 약 5%의 향상된 결과이다.
PDF KSCI

神經網을 利用한 韓國語數字音認識에 관한 硏究 (A Study on the Spoken KOrean-Digit Recognition Using the Neural Netwok)

박현화;강해동;배건ㅅ성
- 한국음향학회지
- /
- 제11권3호
- /
- pp.5-13
- /
- 1992
한국어 숫자음이 단음절인 특성을 이용하여 각 숫자음에 대해 시간정합을 필요로 하지 않으면서 일정한 수를 갖는 특징벡터를 추출하여 다층구조 신경망으로 인식실험을 하였다. 음성신호의 시작점/끝점과 더불어 모음의 최대 피크점을 기준으로 해석구간을 초성, 중성, 종성의 세 부분으로 나누었으며, 음성신호의 특징벡터로는 반사계수, 켑스트럼, ${\Delta}$켑스트럼, ${\Delta}$에너지 등을 이용하여, 각 특징벡터 및 입력층과 은닉층의 노드 수에 따른 인식율 및 학습속도 등을 비교하였다. 신경망의 입력층의 특징벡터로서 반사계수를 사용한 경우보다 켑스트럼을 사용했을 때가 더 좋은 인식율을 보였다. ${\Delta}$켑스트럼의 특성이 전체 인식율에 미치는 영향이 그다지 크지 않았는데, 이는 한국어 숫자음이 단음절로 구성되어 있는 특징을 이용해 분석 구간을 stationary한 특성을 갖는 세 부분으로 구분하였기 때문이라 생각된다. 각 숫자음에 대해 150개의 켑스트럼을 사용한 경우에 97.8%의 인식율을 얻었다.
PDF

원격 카메라 로봇 제어를 위한 동적 제스처 인식 (Dynamic Gesture Recognition for the Remote Camera Robot Control)

이주원;이병로
- 한국정보통신학회논문지
- /
- 제8권7호
- /
- pp.1480-1487
- /
- 2004
본 연구에서는 원격 카메라 로봇 제어를 위한 새로운 제스처 인식 방법을 제안하였다. 제스처 인식의 전처리 단계인 동적 제스처의 세그먼테이션이며, 이를 위한 기존의 방법은 인식 대상에 대한 많은 칼라정보를 필요로 하고, 인식단계에서는 각각 제스처에 대한 많은 특징벡터들을 요구하는 단점이 있다. 이러한 단점을 개선하기 위해, 본 연구에서는 동적 제스처의 세그먼테이션을 위한 새로운 Max-Min 탐색법과 제스처 특징 추출을 위한 평균 공간 사상법과 무게중심법, 그리고 인식을 위한 다층 퍼셉트론 신경망의 구조 둥을 제안하였다 실험에서 제안된 기법의 인식율이 90%이상으로 나타났으며, 이 결과는 원격 로봇 제어를 위한 휴먼컴퓨터 인터페이스(HCI : Human Compute. Interface)장치로 사용 가능함을 보였다.
PDF KSCI

OTT(Over-the-Top) 서비스의 몰아보기 시청행위 영향 요인 탐색 (Examining Factors Affecting the Binge-Watching Behaviors of OTT Services)

황경호;김경애
- 한국융합학회논문지
- /
- 제11권3호
- /
- pp.181-186
- /
- 2020
본 연구는 온라인동영상서비스 OTT(Over-the-Top) 이용자의 몰아보기(Binge-watching) 시청행위에 영향을 미치는 요인을 실증적으로 탐색하였다. 이를 위해 2018년 한국언론진흥재단 미디어연구센터의 'OTT 서비스 이용자 인식조사'에 참여한 OTT 이용 경험자 1,000명의 자료를 수집하여 분석하였다. 종속변수는 OTT 서비스 몰아보기로 설정하였으며, 독립변수는 성별, 연령, OTT 서비스 이용 빈도, OTT 콘텐츠 프로그램 추천 알고리즘 만족도, OTT에서 주로 이용하는 콘텐츠 유형을 포함하였다. OTT 몰아보기 시청행위의 예측 요인은 다층 퍼셉트론(MLP) 인공신경망 알고리즘을 이용하여 분석하였다. 연구결과, 연령, OTT 콘텐츠 프로그램 추천 알고리즘 만족도, OTT 서비스 이용 빈도, OTT에서 주로 이용하는 콘텐츠 유형 중 국내드라마, 국내영화, 해외드라마 등이 OTT 몰아보기 시청행위에 중요도가 높은 요인으로 밝혀졌다.
https://doi.org/10.15207/JKCS.2020.11.3.181 인용 PDF KSCI

망 분리를 이용한 딥러닝 학습시간 단축에 대한 연구 (A Study on Reducing Learning Time of Deep-Learning using Network Separation)

이희열;이승호
- 전기전자학회논문지
- /
- 제25권2호
- /
- pp.273-279
- /
- 2021
본 논문에서는 딥러닝 구조를 분할을 이용한 개별 학습을 수행하여 학습시간을 단축하는 알고리즘을 제안한다. 제안하는 알고리즘은 망 분류 기점 설정 과정, 특징 벡터 추출 과정, 특징 노이즈 제거 과정, 클래스 분류 과정 등의 4가지 과정으로 구성된다. 첫 번째로 망 분류 기점 설정 과정에서는 효과적인 특징 벡터 추출을 위한 망 구조의 분할 기점을 설정한다. 두 번째로 특징 벡터 추출 과정에서는 기존에 학습한 가중치를 사용하여 추가 학습 없이 특징 벡터를 추출한다. 세 번째로 특징 노이즈 제거 과정에서는 추출된 특징 벡터를 입력받아 각 클래스의 출력값을 학습하여 데이터의 노이즈를 제거한다. 네 번째로 클래스 분류 과정에서는 노이즈가 제거된 특징 벡터를 입력받아 다층 퍼셉트론 구조에 입력하고 이를 출력하고 학습한다. 제안된 알고리즘의 성능을 평가하기 위하여 Extended Yale B 얼굴 데이터베이스를 사용하여 실험 하였다. 실험 결과, 1회 학습에 소요되는 시간의 경우 제안하는 알고리즘이 기존 알고리즘 기준 40.7% 단축하였다. 또한 목표 인식률까지 학습 횟수가 기존 알고리즘과 비교하여 단축하였다. 실험결과를 통해 1회 학습시간과 전체 학습시간을 감소시켜 기존의 알고리즘보다 향상됨을 확인하였다.
https://doi.org/10.7471/ikeee.2021.25.2.273 인용 PDF KSCI

개선된 특징 추출을 이용한 원전SG 세관 결함 패턴 분류에 관한 연구 (A Study on the Classification of Steam Generator Tube Defects Using an Improved Feature Extraction)

조남훈;이향범
- 비파괴검사학회지
- /
- 제29권1호
- /
- pp.27-35
- /
- 2009
본 논문에서는 개선된 특징추출을 이용한 원자력 발전소 증기발생기 세관의 결함 형태 분류에 대한 연구를 수행한다. 본 논문에서는 4가지 축대칭 결함, 즉 I-In 형태, I-Out 형태, V-In 형태, V-Out 형태 결함을 고려한다. 유한요소법에 기초한 수치해석 프로그램을 이용하여 결함의 폭과 깊이를 변화시켜가면서 400개의 와전류탐상시험(ECT) 신호를 생성하였다. 이와 같이 생성된 ECT 신호로부터 새로운 특징을 제안하였는데, 여기에는 최대 임피던스 값을 갖는 점과 최대 임피던스 값의 1/2의 값을 갖는 점 사이의 위상각과 최대임피던스 값을 갖는 점과 최대 임피던스 값의 10%, 20%, 30%, 40%를 갖는 점사이의 위상각들이 포함된다. 또한, 결함형태를 분류하기 위하여 은닉층이 하나인 다층퍼셉트론을 사용하였다. 컴퓨터 모의실험 연구를 통하여 제안된 방법이 최대오차와 평균제곱오차 측면에서 향상된 결함 분류 성능을 얻는다는 것을 보였다.
PDF KSCI

신경회로망을 이용한 4차원 방사선치료에서의 조사 표적 움직임 예측 (Prediction of Target Motion Using Neural Network for 4-dimensional Radiation Therapy)

이상경;김용남;박경란;정경근;이창걸;이익재;성진실;최원훈;정윤선;박성호
- 한국의학물리학회지:의학물리
- /
- 제20권3호
- /
- pp.132-138
- /
- 2009
호흡으로 인한 방사선 치료 표적의 움직임을 고려함으로써 치료 성적 향상과 동시에 주변 장기 보호를 지향하는 4차원 방사선 치료의 구현, 성능 개선의 연구가 활발히 진행되고 있다. 환자가 자연스럽게 호흡하도록 하는 장점이 있는 호흡 동기방식이나 종양추적방식을 사용하는 경우, 방사선조사 표적의 움직임을 예측, 방사선조사 시 이를 보정하여 줌으로써 방사선치료 효과를 극대화할 수 있다. 신경회로망은 통계 수식에 의존하지 않고 주어진 자료를 표현하는 일종의 규칙을 찾아내므로, 방사선 치료 표적의 실시간 움직임과 같은 비선형성을 가진 시계열(Time Series)을 표현하는 데에 유리하다. 본 연구에서는 신경회로망 예측 알고리즘의 4차원 방사선치료에 적용 가능성을 평가하였다. Multi-layer Perceptron으로 신경회로망을 구성하였고 Scaled Conjugate Gradient 알고리즘을 신경회로망 학습 알고리즘으로 사용하였다. RPM 시스템을 이용하여 획득한 실제 임상 현장의 환자에 대한 호흡 자료를 기반으로 학습한 신경회로망 예측 결과를 RPM 시스템의 측정치와 상호 비교하였다. 10명의 환자에의 적용 결과, 신경회로망 학습에 사용된 자료가 환자의 호흡 범위 전체를 포함하지 않는 경우를 제외하고는, 최대절대오차 3 mm 미만의 우수한 예측 성능을 보였다. 학습 영역 이외의 호흡 자료 예측 시 발생하는 상당한 오차는 신경회로망의 외삽에 대한 학습능력 부족을 보이는 것으로, 오차의 원인을 제거하기 위한 일환으로, 호흡자료를 측정할 때 최대 호흡을 하도록 하여 충분한 학습 자료를 확보하는 방안을 고려해 볼 수있겠다. 4차원 방사선치료 시스템 성능 개선에의 직접 활용을 위하여, 다양한 시스템 대기시간에 따른 예측 성능 평가와 방사선 조사 장치와 연동, 실용 타당성 검증의 추가 연구가 진행될 것이다.
PDF

검색결과 244건 처리시간 0.024초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)