• 제목/요약/키워드: 학습노드

검색결과 329건 처리시간 0.021초

DP 알고리즘에 의한 발음사전 전처리와 문맥종속 자소별 MLP를 이용한 영어 발음사전 생성기의 개선 (Improvements of an English Pronunciation Dictionary Generator Using DP-based Lexicon Pre-processing and Context-dependent Grapheme-to-phoneme MLP)

  • 김회린;문광식;이영직;정재호
    • 한국음향학회지
    • /
    • 제18권5호
    • /
    • pp.21-27
    • /
    • 1999
  • 본 논문에서는 가변어휘 단어 인식기에 사용하기 위한 개선된 MLP 기반 영어 발음사전 생성기를 제안한다. 가변어휘 단어 인식기는 인식대상 도메인이 수시로 바뀌는 상황에서 현재의 인식 도메인에 의해 결정되는 임의의 한국어 어휘들에 대해 처리 할 수 있다. 이 시스템을 영어 단어에 대해서도 처리할 수 있도록 하기 위해서는 미리 정의된 사전에 포함할 수 없는 영어 고유명사와 같은 단어의 발음열을 구할 수 있는 방법이 필요하다. 영어 발음사전 생성기를 구현하기 위하여 본 연구에서는 각 자소를 음소로 변환해 주는 문맥종속 다층 퍼셉트론 구조를 제안한다. 각 자소별 다층 퍼셉트론을 훈련하기 위해서는 표준 발음사전으로부터 각 자소에 대응하는 음소 학습용 데이터를 준비해야 한다. 이를 위해 본 연구에서는 적절한 거리척도를 사용하는 동적 프로그래밍 알고리즘을 사용한다. 훈련 및 평가를 위한 데이터로는 116,191개 영어 단어의 발음사전을 사용하였다. 평가 결과 각각 30~50개의 히든 노드를 가지는 26개 자소별 MLP와 예외 자소 발음사전을 가지고 표준 발음사전에 대하여 72.8%의 단어 정확도를 얻었으며, 이것은 기존의 규칙 에 기반한 발음사전 생성의 정확도인 24.0% 보다 매우 우수한 결과임을 보여주었다.

  • PDF

한국어 음성인식 성능향상을 위한 문맥의존 음향모델에 관한 연구 (A Study-on Context-Dependent Acoustic Models to Improve the Performance of the Korea Speech Recognition)

  • 황철준;오세진;김범국;정호열;정현열
    • 융합신호처리학회논문지
    • /
    • 제2권4호
    • /
    • pp.9-15
    • /
    • 2001
  • 본 연구에서는 한국어 음성인식 성능향상을 위한 문맥의존 음향 모델을 개선하기 위하여 한국어 음성학적 지식과 결정트리를 접목한 음소결정트리 기반 상태분할 알고리즘으로 한국어에 적합한 문맥의존 음향 모델에 관해 고찰한다. HMM (Hidden Markov Model)의 각 상태를 네트워크로 연결하여 문맥의존 음향모델로 표현하는 HM-Net(Hidden Markov Network)이 있는데 이는 SSS(Successive State Splitting) 알고리즘으로 작성한다. 이 방법은 음향 모델의 상태공유관계와 모델의구조를 결정하는데 효율적이지만 모델을 학습할때 문맥환경에 따라 출현하지 않는 문맥이 존재하는 문제점이 있다 본 연구에서는 이러한 문제점을 해결하기 위해 2진 결정트리와 SSS 알고리즘의 장점을 결합하여 문맥방향 상태분할을 수행할 때 각 노드에서 한국어 음성학적 지식으로 구성된 음소 질의어에 따라 상태분할 하는 방법으로서 PDT-SSS(Phonetic Decision Tree-based SSS) 알고리즘을 적용한다. 적용한 방법으로 작성한 문맥의존 음향 모델의 유효성을 확인하기 위해 국어공학센터 (KLE)m이 452 단어와 항공편 예약관련 200문장(YNU 200)에 대해 화자독립 음소, 단어 및 연속음성인식 실험을 수행하였다. 인식실험결과, 문맥 의존 음향모델에 대한 화자독립 음소, 단어 및 연속음성 인식실험에서 기존의 단일 HMM 모델보다 향상된 인식률을 보여, 한국어에 적합한 문맥의존 음향 모델을 작성하는데 한국어 음성학적 지식과 음소결정트리 기반 상태분할 알고리즘이 유효함을 확인하였다.

  • PDF

실행공동체 멤버 재구성을 통한 조직차원에서의 지식공유 활동 개선 방안 연구 (A New Approach to Improve Knowledge Sharing Activities at the Organizational Level by Rearranging Members of Current CoPs)

  • 이수철;서의호;홍대근
    • 경영정보학연구
    • /
    • 제13권2호
    • /
    • pp.1-16
    • /
    • 2011
  • 실행공동체는 특정 주제에 대해 관심을 가지고 있는 조직 구성원들이 자발적인 상호작용을 기반으로 학습을 수행하는 접근법으로, 성공적인 지식경영을 위한 혁신 인프라 요소 중 하나로 강조되고 있다. 최초의 실행공동체는 자발적이고 비공식적으로 운영되는 것을 전제로 하였으나, 실행공동체의 전략적 활용 가능성이 알려지면서 많은 기업들이 공식적인 관리와 지원을 하고 있다. 따라서 이러한 기업들은 실행공동체 구성원의 활발한 참여를 장려하는 방법을 모색하고 있다. 본 연구에서는 실행공동체 구성원 재구성을 통해 조직차원에서의 새로운 지식공유 활동 개선 방안을 제시하고자 한다. 실제적으로 지식공유활동을 활발히 하는 실행공동체 구성원들이 그들이 속한 실행공동체 전체의 지식 공유활동을 이끌고 있으며, 따라서 이와 같은 활발한 구성원을 재배치함으로써 기업 조직차원에서 실행공동체 전체의 지식공유 활성화를 기대할 수 있다. 본 연구에서는 이러한 사항을 반영하여, 조직차원에서의 새로운 지식공유 활동 개선을 목적으로 실행공동체 구성원의 최적 재구성 방안을 찾기 위한 수리모텔을 수립하였다. 수립된 수학모델은 비선형 해를 찾는 문제이므로 해당 문제를 차량경로문제로 전환하여 휴리스틱 알고리즘을 적용하여 풀고자 시도하였다. 실행공동체를 경로, 구성원을 노드, 구성원 유형의 중요도를 거리에 대응함으로써 문제 변환을 하였으며, 휴리스틱 알고리즘 중 다수이동 방법을 적용하여 가능해를 도출하였다. 이와 같은 알고리즘을 적용하기 위한 솔루션 프로그램을 개발하였으며, 솔루선 프로그램의 적합성을 검증하기 위해 실제로 실행 공동체를 전략적으로 활용하고 있는 기업 A의 자료를 이용하여 효과성을 검증하였다.

베이지안 네트워크 개선을 통한 탐지율 향상의 IDS 모델 (IDS Model using Improved Bayesian Network to improve the Intrusion Detection Rate)

  • 최보민;이정식;한명묵
    • 한국지능시스템학회논문지
    • /
    • 제24권5호
    • /
    • pp.495-503
    • /
    • 2014
  • 최근 보안 분야에서는 네트워크 패킷이나 로그와 같은 네트워크 정보를 수집하고 분석함으로써 네트워크 위협에 대응할 수 있는 침입탐지 시스템에 대한 연구를 활발히 진행되고 있다. 특히, 베이지안 네트워크는 주어진 몇 몇 자료만으로도 정확도 높은 침입에 대한 추론이 가능한 이점으로 이를 이용한 침입탐지 시스템의 모델링 기법들이 이전에도 진행되어 왔다. 그러나 이전 연구들에서는 네트워크 패킷간의 복잡성 문제와 이용되는 패킷 데이터의 연속성 문제를 반영하지 못하고 있기 때문에 높은 탐지정확도 산출에 한계가 있다. 따라서 본 논문에서는 이전 모델들이 갖는 문제들의 개선을 통하여 탐지율을 향상시키기 위해 K-means 클러스터링 기반의 두 가지 방법론을 제안한다. 첫 번째로는 K-means 클러스터링 기반의 정교한 노드구간 범위를 설정방법을 제안하여 연속성 데이터 처리 문제를 개선할 수 있다. 또한, 두 번째로는 K-means 클러스터링 기반으로 산출된 가중치를 학습에 적용하여 보다 견고한 CPT를 산출하여 탐지성능을 향상 시킬 수 있다. 제안하는 방법론들의 성능을 입증하기 위하여 방법론 모두를 적용한 K_WTAN_EM에 대한 탐지율을 이전 모델들과 비교 실험을 수행하였다. 실험 결과 제안하는 모델의 탐지율이 이전의 순수베이지안 네트워크기반(NBN) 모델 보다는 약 7.78%의 향상도를 보였고 트리확장 순수베이지안 네트워크(TAN) 모델 보다는 약 5.24%의 향상도를 산출하여 제안하는 방법의 우수성을 입증하였다.

대용량 데이터를 위한 전역적 범주화를 이용한 결정 트리의 순차적 생성 (Incremental Generation of A Decision Tree Using Global Discretization For Large Data)

  • 한경식;이수원
    • 정보처리학회논문지B
    • /
    • 제12B권4호
    • /
    • pp.487-498
    • /
    • 2005
  • 최근 들어, 대용량의 데이터를 처리할 수 있는 트리 생성 방법에 많은 관심이 집중되고 있다 그러나 대용량 데이터를 위한 대부분의 알고리즘은 일괄처리 방식으로 데이터를 처리하기 때문에 새로운 데이터가 추가되면 이 데이터를 반영한 결정 트리를 생성하기 위해 처음부터 트리를 다시 생성해야 하다. 이러한 재생성에 따른 비용문제에 보다 효율적인 접근 방법은 결정 트리를 순차적으로 생성하는 접근 방법이다. 대표적인 알고리즘으로 BOAT와 ITI를 들 수 있으며 이들 알고리즘은 수치형 데이터 처리를 위해 지역적 범주화를 이용한다. 그러나 범주화는 정렬된 형태의 수치형 데이터를 요구하기 때문에 대용량 데이터를 처리해야하는 상황에서 전체 데이터에 대해 한번만 정렬을 수행하는 전역적 범주화 기법이 모든 노드에서 매번 정렬을 수행하는 지역적 범주화보다 적합하다. 본 논문은 수치형 데이터 처리를 위해 전역적 범주화를 이용하여 생성된 트리를 효율적으로 재생성하는 순차적 트리 생성 방법을 제안한다. 새로운 데이터가 추가될 경우, 전역적 범주화에 기반 한 트리를 순차적으로 생성하기 위해서는 첫째, 이 새로운 데이터가 반영된 범주를 재생성해야 하며, 둘째, 범주 변화에 맞게 트리의 구조를 변화시켜야한다. 본 논문에서는 효율적인 범주 재생성을 위해 샘플 분할 포인트를 추출하고 이로부터 범주화를 수행하는 기법을 제안하며 범주 변화에 맞는 트리 구조 변화를 위해 신뢰구간과 트리 재구조화기법을 이용한다. 본 논문에서 피플 데이터베이스를 이용하여 기존의 지역적 범주화를 이용한 경우와 비교 실험하였다.

다중요인모델에 기반한 텍스트 문서에서의 토픽 추출 및 의미 커널 구축 (Multiple Cause Model-based Topic Extraction and Semantic Kernel Construction from Text Documents)

  • 장정호;장병탁
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권5호
    • /
    • pp.595-604
    • /
    • 2004
  • 문서 집합 내의 개념 또는 의미 관계의 자동 분석은 보다 효율적인 정보 획득과 단어 이상의 개념 수준에서의 문서간 비교를 가능케 한다. 본 논문에서는 다중요인모델에 기반 하여 텍스트 문서로부터 토픽들을 추출하고 이로부터 의미 커널(semantic kernel)을 구축하여 문서간 유사도를 측정하는 방안을 제시한다. 텍스트 문서는 내재된 토픽들의 다양한 결합에 의해 생성된다고 가정하며 하나의 토픽은 공통 주제에 관련되거나 적어도 자주 같이 나타나는 단어들의 집합으로 정의한다. 다중요인모델은 은닉층을 갖는 하나의 네트워크 형태로 표현되며, 토픽을 표현하는 단어 집합은 은닉노드로부터의 가중치가 높은 단어들로 구성된다. 일반적으로 이러한 다중요인 네트워크에서의 학습과 추론과정을 용이하게 하기 위해서는 근사적 확률 추정 기법이 요구되는데, 본 논문에서는 헬름홀츠 머신에 의한 방법을 활용한다. TDT-2 문서 집합에 대한 실험에서 토픽별로 관련 있는 단어 집합들을 추출할 수 있었으며, 4개의 텍스트 집합에 대한문서 검색 실험에서는 다중요인모델의 분석결과에 기반 한 의미 커널을 사용함으로써 기본 벡터공간 모델에 비해 평균정확도 면에서 통계적으로 유의한 수준의 성능 향상을 얻을 수 있었다.

시간적 일화기억인출에 관여하는 뇌기능연결성 연구 (Interactivity within large-scale brain network recruited for retrieval of temporally organized events)

  • 나윤진;이종현;한상훈
    • 인지과학
    • /
    • 제29권3호
    • /
    • pp.161-192
    • /
    • 2018
  • 부호화된 사건의 시간적 정보를 기반으로 한 인출은 일화기억의 중요한 통제기제 중 하나이다. 기억인출과 관련한 수많은 신경영상 연구들이 진행되었음에도 아직 시간적으로 구성된 일화기억의 인출에 관여하는 뇌신경연결망 패턴에 대해서는 알려진 바가 많지 않다. 본 연구에서는 두가지 다른 순차적 인출 뇌신경 기제를 구분하기 위하여 과제기반 기능적 연결성 다변량 패턴분석 방법을 사용하였다. 참가자들은 시간적 일화기억과제를 수행하였고, 순서대로 부호화된 기억자극을 순방향 혹은 역방향으로 인출하도록 지시를 받았다. 부분적으로 분류된 국소적 신경네트워크 패턴은 두 인출기제를 잘 구분하지 못한 반면, 기억과 관련된 인지통제 영역과 목표-지향적 인지기제처리에 관련된 것으로 알려진 여러 피질-피질하 노드들을 아우르는 전뇌신경네트워크 패턴은 시간적 일화기억 인출기제를 잘 구분하였다. 이 영역들은 측면/내측 전전두엽 영역, 하부 두정엽, 중간 측두회, 선조체 영역 등을 포함하며 기계학습을 이용한 분류에서 높은 분류 예측률을 보였다. 본 연구의 결과는 일화기억의 시간적 인출기제에 관여하는 피질-피질하 여러 영역의 관여를 확인하였고, 대역적 네트워크 패턴의 기능적 연결성이 질적으로 다른 인출기제에 관여함을 확인하였다는데에 중요성을 갖는다.

인과적 사슬구조에서의 범주기반 속성추론 (Category-based Feature Inference in Causal Chain)

  • 최인범;이형철;김신우
    • 감성과학
    • /
    • 제24권1호
    • /
    • pp.59-72
    • /
    • 2021
  • 개념과 범주는 관찰하지 못한 속성을 추론할 수 있는 기반을 제공한다. 무의미 속성을 사용한 범주기반 속성추론 연구들은 범주 및 속성의 유사성이 추론을 설명하는 핵심 요인이라는 것을 제안했다(Rips, 1975; Osherson et al., 1990). 이후 연구들은 사람들의 사전지식이 범주기반 추론에 막대한 영향을 미치며 심지어 유사성 효과가 완전히 사라지는 경우도 있음을 보고했다. 본 연구는 범주 속성들이 사전지식의 한 종류인 인과적 지식에 의해 사슬구조로 연결되었을 때의 범주기반 속성추론을 검증했으며 그 결과를 예측하는 속성추론모형을 제안했다. 참가자들은 네 개의 속성들이 사슬구조를 이루는 인과적 범주를 학습한 뒤 해당 범주의 다양한 범주 예시들의 숨겨진 속성에 대한 추론을 실시했다. 그 결과 인과적으로 직접 연결된 속성뿐만 아니라 다른 속성 노드에 의해 차폐된 속성들도 추론에 영향을 미치는 비독립성이 나타났다(인과적 마코프 조건의 위배). 인과모형이론(Sloman, 2005)에 기반한 속성추론모형을 적용하여 참가자들의 추론을 모델링한 결과 인과적 연결의 직접 효과뿐만 아니라 간접 효과 즉 인과추론의 비독립성도 예측하는 것으로 나타났다. 다만 간접적으로 연결된 속성들은 인과적 거리와 무관하게 참가자들의 추론평정에 동일하게 영향을 미쳤지만 모형은 거리가 멀어짐에 따라 추론에 미치는 영향이 작아짐을 예측했다.

한국농수산대학 신입생 자기소개서의 텍스트 마이닝과 연관규칙 분석 (1) (Text Mining and Association Rules Analysis to a Self-Introduction Letter of Freshman at Korea National College of Agricultural and Fisheries (1))

  • 주진수;이소영;김종숙;신용광;박노복
    • 현장농수산연구지
    • /
    • 제22권1호
    • /
    • pp.113-129
    • /
    • 2020
  • 본 연구는 2020년 한농대 입학생의 비정형 텍스트인 자소서에서 의미 있는 정보 혹은 규칙을 추출하기 위하여 고교 재학 중 '학업 및 학습경험'과 '교내 활동'을 기술한 두 개 문항에 대하여 텍스트 마이닝에 의한 토픽 분석과 연관성 분석을 하였다. 모집 전형을 구분하지 않은 텍스트 마이닝 분석 결과에서 '학업 및 학습 경험' 항목과 관련된 주요 키워드는 '공부', '생각', '노력', '문제', '친구' 등의 순으로 많이 나타났으며, '교내 활동' 항목과 관련된 주요 키워드는 '활동', '생각', '친구', '동아리', '학교' 등의 순으로 빈도가 높게 나타났다. 그러나 도시 인재 전형과 농수산 인재 전형 신입생들의 키워드 빈도 순위는 두 항목 모두 전형 특성에 따른 약간의 차이를 나타냈다. 빈도 분석에 결과는 빈도수 상위 50위까지의 키워드를 워드 클라우드로 시각화하여 키워드를 알기 쉽게 표현하였다. 연관 분석은 apriori() 함수를 사용하였으며 적정한 계산을 위하여 support(지지도)와 confidence(신뢰도)의 기준값을 항목별로 설정하였다. 먼저 '학업' 항목에 대한 연관 규칙은 46개를 추출하였으며, 그 가운데 {공부} => {생각}, {성적} => {공부} 및 {과목} => {공부} 등의 규칙에서 높은 연관성을 볼 수 있었다. 이 규칙을 바탕으로 매개체 역할의 키워드를 평가하는 관계 중심성 평가와 노드에 연결된 edge의 수에 따라 중요도를 파악하는 연결 중심성 평가에서는 '생각', '공부', '노력', '시간' 등의 키워드가 중심적인 역할을 하는 정보를 획득하였다. 다음으로 '교내 활동' 항목에서는 45개의 연관 규칙을 생성하여 {활동} => {생각}, {동아리} => {활동} 등의 규칙에서 높은 연관성을 볼 수 있었으며, 관계 중심성 평가와 연결 중심성 평가에서는 '생각', '활동', '학교', '시간', '친구' 등의 키워드가 중심 키워드라는 결과를 얻었다. 다음 연구에서는 자소서의 나머지 두 개의 문항 '배려·나눔·협력·갈등관리' 항목과 한농대 '지원동기와 향후 진로계획' 항목을 분석한다. 분석에는 '키워드의 빈도'에 '문서 빈도의 역수'를 곱하여 주로 다량의 문서에서 핵심어를 추출하는 TF-IDF(Term Frequency-Inverse Document Frequency) 분석을 추가한다.