• 제목/요약/키워드: 구문패턴

검색결과 112건 처리시간 0.02초

문장 단위 운율 제어를 위한 신경망의 입력 패턴에 관한 연구 (A Study on the Input Pattern of Neural Network for Prosody Control in a Korean Sentence)

  • 민경중
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.105-109
    • /
    • 1998
  • 법칙 합성 시스템은 합성 단위, 합성기, 합성방식 등 여러 가지 다양한 시스템이 있으나 순수한 법칙 합성 시스템이 아니고 기본 합성 단위를 연결하여 합성음을 발생시키는 연결 합성 시스템은 연결 단위사이 그리고 문장 단위에서의 매끄러운 합성 계수의 변화를 구현하지 못해 자연감이 떨어지는 실정이다. 자연감에 영향을 끼치는 주요 원인중의 하나가 운율 법칙의 부정확한 구현이므로 자연음으로부터 추출한 운율에 관한 법칙을 알고리듬화하는 대신 신경망으로 하여금 이 운율 법칙을 학습하도록 하여 좀더 자연음의 운율에 근접한 운율을 발생시키고자 하였다. 신경망으로 운율을 발생시키기 위해 먼저 운율에 영향을 주는 요소들을 정해 신경망 입력 패턴을 선정해야 한다. 먼저 분절요인에 의한 영햐응ㄹ 고려해주기 위해 전후 3음소를 동시에 입력시키고 문장내에서의 구문론적인 영향을 고려해주기 위해 해당 음소의 문장내에서의 위치, 운율구에 관한 정보등을 신경망의 입력 패턴으로 구성하였다.

  • PDF

웹 데이터 마이닝을 위한 정보 추출패턴의 기계학습 (Machine Learning of Information Extract ion Patterns for Web Data Mining)

  • 김동석;차정원;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.115-122
    • /
    • 2001
  • 정보추출 기법을 논의할 때 핵심 역할을 차지하는 것이 추출 패턴(규칙)을 표현하는 종류와 규칙을 만들어 내는 기계학습의 방법이다. 본 논문에서는 mDTD(modified Document Type Definition)라는 새로운 추출패턴을 제안한다. mDTD는 SGML에서 사용되는 DTD를 구문과 해석 방식을 변형하여 일반적인 HTML에서의 정보추출에 활용되도록 설계하였다. 이러한 개념은 DTD가 문서에 나타나는 객체를 지정하는 역할을 하는 것을 역으로 mDTD를 이용하여 문서에 나타는 객체를 식별하는데 사용하는 것이다. mDTD 규칙을 순차기계학습으로 확장시켜서 한국어와 영어로된 인터넷 쇼핑몰 중에서 AV(Audio and Visual product) 도메인에 적용하여 실험하였다 실험 결과로 정보추출의 평균 정확도은 한국어와 영어에 대해서 각각 91.3%와 81.9%를 얻었다.

  • PDF

패턴인식기법을 이용한 편목전문가시스템 설계에 관한 연구 (A Study on Design Of Cataloging Expert System Using Pattern Recognition Techniques)

  • 김현희;곽병희
    • 정보관리학회지
    • /
    • 제11권2호
    • /
    • pp.131-164
    • /
    • 1994
  • 본 연구에서는 표제면과 판권지의 서지요소의 레이아웃 특성과 구문적 특성을 이용하여 서지요소의 종류를 패턴인식 지식베이스와 전거화일들을 이용하여 자동 인지하고 인지된 서지요소를 한국문헌자동화목록형식(KORMARC)과 한국문헌자동화목록법(KORMARC) 기술규칙에 기초하여 KORMARC 형태로 출력해 주는 편목전문가시스템을 구축하였다. 이 시스템의 성능을 평가하기 위해서 패턴인식 지식베이스의 생성을 위해 분석한 155종의 실험문헌집단과 86종의 검증문헌집단을 이용하여 적중률을 조사해 보니 실험문헌집단의 경우는 94%, 검증문헌집단의 경우는 93%의 적중률을 나타냈다.

  • PDF

술어-논항 구조의 패턴 유사도를 활용한 혼합 커널 기반 관계 추출 (Relation Extraction based on Composite Kernel using Pattern Similarity of Predicate-Argument Structure)

  • 정창후;전홍우;최윤수;송사광;최성필
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.276-279
    • /
    • 2011
  • 문서 내에 존재하는 개체 간의 관계를 자동으로 추출할 때 다양한 형태의 문서 분석 결과를 활용할 수 있다. 본 논문에서는 기존에 개발되어 비교적 높은 성능을 보여준 트리 커널의 구절 구조 유사성 정보와 두 개체 사이의 유의미한 연관관계를 표현하는 술어-논항 구조 패턴의 유사성 정보를 활용하는 혼합 커널을 제안한다. 구문적 구조를 이용하는 기존의 트리 커널 기법에 술어와 논항 간의 의미적 구조를 활용하는 술어-논항 구조 패턴 유사도 커널을 결합하여 상호보완적인 혼합 커널을 구성하였고, 실험을 통하여 개발된 커널의 성능을 측정하였다. 실험 결과 구절 구조 정보를 이용하는 트리 커널만을 단독으로 사용했을 때보다 술어-논항 구조의 패턴 정보를 결합한 혼합 커널을 사용했을 때에 더 좋은 성능을 보이는 것을 확인할 수 있었다. 이는 관계 인스턴스에 대한 구절 구조 정보뿐만 아니라 개체 간의 유의미한 연관관계를 표현해주는 술어-논항 구조 패턴 또한 관계 추출 작업에 매우 유용한 정보임을 입증하고 있다.

정의형 질의응답 시스템을 위한 정답 패턴 (Answer Pattern for Definitional Question-Answering System)

  • 서영훈;신승은
    • 한국콘텐츠학회논문지
    • /
    • 제5권3호
    • /
    • pp.209-215
    • /
    • 2005
  • 본 논문에서는 정의형 질의응답 시스템을 위한 정답 패턴에 대하여 기술한다. 정의형 질의응답 시스템은 정의형 질의에 대한 정답으로 단답형 정답이 아닌 서술형 정답을 제공하기 때문에, 정답 추출 방법이 일반적인 단답형 정답 추출 방법과 다르다. 정의형 정답 패턴을 이용한 정의형 정답 추출은 의미 분석없이 정확한 정의형 정답을 추출할 수 있다. 정의형 정답 패턴은 정확한 정답 추출을 위해 정답 패턴과 패턴별 제약 규칙, 우선순위로 구성된다. 정의형 정답 학습 코퍼스로부터 정답 패턴을 추출하고, 각각의 정답 패턴에 대한F-measure에 따라 최적화하여 패턴별 제약 규칙을 구성한다. 마지막으로 정확률과 정답 패턴 구문 구조를 이용하여 우선순위를 결정한다. 제안한 정의형 정답 패턴을 이용한 정의형 정답 추출은 실험 코퍼스에 대해 정확률 0.8207, 재현율 0.9268, F-measure 0.8705를 보였다. 이것은 제안한 방법이 정의형 질의응답 시스템에 효율적으로 사용될 수 있음을 의미한다.

  • PDF

토지이용-교통 통합적 분석을 통한 도로 기반 도시 형태학적 변화에 관한 연구 (A Study on the Movement of Street-based Urban Morphology Using Analysis of Integrated Land Use-Transportation)

  • 주용진
    • Spatial Information Research
    • /
    • 제19권3호
    • /
    • pp.63-72
    • /
    • 2011
  • 도시의 공간구조는 교통로와 같은 도시 인프라의 정비에 따라 상당한 영향과 변화를 나타낸다. 이에 도시의 발전 과정에 가장 많은 영향을 주는 도로 접근성과 도시 인프라 수준 변화를 동시에 고려하여 공간적 분포 및 패턴을 규명하기 위한 계량적 분석 방법론의 정립이 요구된다. 이에 본 연구에서는 수십 년 간 급격한 인구증가와 도시화 지역의 급속한 팽창이 이루어진 서울을 중심으로 도시 지역의 인구 및 공간 구조와 교통 인프라 중 도로의 분포 패턴을 고려한 시공간 도시 형태(Urban morphology)를 상호 분석하는 것을 목적으로 한다. 이를 위해 도시 공간구조와 교통에 영향을 주는 요소를 시계열로 분석하기 위해 지난 70여 년간의 지형도와 Landsat MSS, TM 등 활용 가능한 데이터를 사용하여 시공간 GIS 데이터베이스를 구축하였다. 특히, 가로체계 변화 분석은 가시 접근성과 공간 인지를 통해 위계적 공간 구조를 파악하는 공간구문이론을 사용하였으며, IPA 분석을 통해 권역별 도시 공간 형태와 가로체계와의 관계를 분석하고 이를 가시화 하였다. 토지이용 교통 통합 측면에서 공간 구문론의 접근은 교통의 다양한 현상이 도시 개발 패턴에 미치는 영향을 파악함으로 효과적인 공간계획에 이바지할 수 있을 것을 기대한다.

일본의 한일(韓日) 기계번역(機械飜譯) 시스템에 있어서의 오역(誤譯)과 그 언어환경 (Errors and Their Circumstances in Korean Japanese M/T Systems in Japan)

  • 강용희
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1997년도 제9회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.303-310
    • /
    • 1997
  • 일본의 한일(韓日) 기계번역(機械飜譯) 시스템을 평가한 결과 각기 다른 번역 시스템임에도 불구하고 오역(誤譯)의 패턴에 있어서는 유사(類似)한 점이 많았다. 이는 사전(辭典)의 입력 단위와 구문(構文)분석의 해석단계에서 오역(誤譯)의 언어환경에 대비하지 못한 점을 지적할 수 있다. 본 연구는 오역(誤譯)의 TYPE을 언어적 환경과 기계적 환경으로 구분하여 그 영향관계를 밝혀서 오역(誤譯)의 환경에 대비한 사전(辭典)과 그 모듈의 작성을 목적으로 삼는다.

  • PDF

구문론적 해석에 의한 근전도 신호의 패턴 분류 (Pattern classification of EMG signals by the syntactic analysis)

  • 왕문성;박상희;정태윤;변윤식
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 1987년도 한국자동제어학술회의논문집; 한국과학기술대학, 충남; 16-17 Oct. 1987
    • /
    • pp.699-701
    • /
    • 1987
  • This paper deals With the EMG signal processing to apply the EMG signal to the Prosthetic arm. The EMG signals are generated by the voluntary contractions of the subject's musculature and is coded into binary words by the pulse width modulation. Command strings or sentences are constructed by concatenating several words, and are syntactically described by a context free grammar in Chomsky normal form and is tried to classify the movement pattern by the CYK algorithm.

  • PDF

고성능 한국어 형태소 분석을 위한 어미 분류 (A Classification of Endings for an Efficient Morphological Analysis of Korean)

  • 은종진;박선영
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.41-47
    • /
    • 2000
  • 한국어 형태소 분석에서 가장 중요한 부분 중 하나가 바로 용언구(서술어)를 분석하는 것이다. 형태소 분석 뿐만 아니라 구문 분석, 의미 분석 단계에서도 정확한 용언구 분석은 매우 중요한 작업 중의 하나이다. 또한, 용언구에는 [체언+지정사+어미] 패턴도 포함되므로, 정보 검색기의 핵심 모듈인 명사 추출기(색인기)의 성능에도 용언구의 분석은 높은 비중을 차지한다. 본 논문에서는 용언구 분석의 정확성을 높이고, 견고하면서 속도도 향상시킬 수 있는 방법으로 새로운 어미 분류를 제안하고자 한다.

  • PDF

패턴 부트스트랩핑을 이용한 특허 문헌에서의 시맨틱 트리플 추출 (Extracting Semantic Triples from Patent Documents Using Pattern Bootstrapping)

  • 정창후;전홍우;최윤수;송사광;최성필;조민희;정한민
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2012년도 춘계 종합학술대회 논문집
    • /
    • pp.281-282
    • /
    • 2012
  • 문서에 존재하는 중요한 개체를 인식하고 그것들 간의 관계를 식별하는 시맨틱 트리플 추출은 문헌 분석의 기반이 되는 중요한 작업이다. 본 논문에서는 특허 문헌에서 이러한 시맨틱 트리플을 추출하는 방법에 대해서 설명한다. 특허 문헌의 효과적인 자동 분석을 위하여 문장 내의 다양한 구문적 변형을 인식하여 하나의 정규화된 의미 형태로 표현해주는 술어-논항 구조 기반의 패턴을 사용하였고, 패턴의 자동화된 확장을 위하여 부트스트랩핑 방법을 적용하였다. 이러한 방법은 소규모의 시드 데이터를 활용하여 특정의미 관계를 갖는 패턴을 자동으로 확장하고 최종적으로는 유의미한 트리플을 추출하는 방법으로 다량의 이진 관계 집합을 처리해야 할 때 아주 유용한 방법이다. 시스템 적용을 통하여 특허 문헌에 적합한 38개의 연관관계 집합을 생성하였고, 32,608개의 유의미한 트리플을 추출하였다.

  • PDF