• Title/Summary/Keyword: 문장 분할

검색결과 131건 처리시간 0.027초

문형과 단문 분할을 이용한 한국어 구문 모호성 해결 (Resolution of Korean Syntactic Ambiguity using Sentence Patterns Information and Clausal Segmentation)

  • 이현영;황이규;이용석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.116-123
    • /
    • 2000
  • 한국어 구문 분석은 체언구 부착이나 부사구 부착의 문제를 가진다. 이런 부착의 문제는 많은 구문 모호성을 만들어 내어 올바른 의미를 가지는 파스 트리의 선택을 어렵게 한다. 한국어에서 이런 부착의 문제는 대부분 한국어 문장이 내포문을 포함하는 복문의 형태로 구성되어 있기 때문이다. 단문에서는 부착의 문제가 발생하지 않지만 복문에서는 체언구나 부사구가 어떤 용언에 부착하느냐에 따라 체언구 부착이나 부사구 부착의 문제가 발생한다. 따라서 용언이 가지는 정보를 이용하여 내포문의 범위를 결정해서 하나의 구문범주의 기능을 가지도록 분할한다. 이를 단문 분할이라 하며 문형이 가지는 필수격들을 최대로 부착하여 이루어진다. 단문분할을 하면 복문의 구조가 단문으로 바뀌므로 이런 부착의 문제가 자연스럽게 해결된다. 본 논문에서는 문형과 단문 분할을 이용하여 많은 구문 모호성을 해결할 수 있음을 제안한다.

  • PDF

우리말 연속음성의 음절 분할법 (A Syllabic Segmentation Method for the Korean Continuous Speech)

  • 한학용;고시영;허강인
    • 한국음향학회지
    • /
    • 제20권3호
    • /
    • pp.70-75
    • /
    • 2001
  • 본 논문은 우리말 연속음성에 대한 음절단위 분할법을 제안한다. 이 방법은 다음 3단계로 이루어진다: (1) 음성의 시간영역 분할 파라메터인 피치, 에너지, ZCR, PVR을 이용하여 음성데이터를 자음, 자음. 묵음 단위로 라벨링하여 토큰 (Token)을 형성, (2) 형성된 토큰을 유한상태오토마타를 이용하여 한국어 음절구조로 파서 (Parser)를 설계하여 스캐닝 (Scanning), (3) 의사 음절핵 정보를 이용하여 두개 혹은 여러 개의 음절을 가지는 음성부분에 대한 재분할을 통하여 음절단위 분할 완성. 제안된 방법에 대한 성능 평가를 위해서 문장과 단어단위 연속음성에 대한 분할 실험결과 각각 73.7%와 85.9%의 분할률을 얻었다.

  • PDF

지식베이스 확장을 위한 행렬 분해 모델 (Matrix Factorization Models for Knowledge Base Population)

  • 김지호;남상하;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.3-7
    • /
    • 2017
  • 지식베이스의 목표는 세상의 모든 지식을 데이터베이스화 하는 것이지만 지식 획득 능력의 부족으로 항상 지식 부족 문제에 시달린다. 지식 획득은 주로 웹 상에 있는 자연언어문장을 지식화 하는 외부적인 지식 획득을 통해 이루어지지만, 지식베이스 내부에서 지식을 확장해 나가는 방법에 대해서는 연구가 소홀히 이루어지고 있다. 따라서 본 논문에서는 내부적인 지식 획득을 위한 지식베이스 행렬 분해 모델을 소개한다. 본 논문에서 소개하는 방법은 지식베이스를 행렬로 변환한 뒤 행렬 분해 모델을 통해 새로운 지식에 대한 신뢰도를 점수화하는 방법이다. 본 논문에서 소개한 방법의 우수성과 실효성을 입증하기 위해 한국어 지식베이스인 한국어 디비피디아(2016-10)를 대상으로 본 모델의 정확도 측정 실험 결과를 소개한다.

  • PDF

지식베이스 확장을 위한 행렬 분해 모델 (Matrix Factorization Models for Knowledge Base Population)

  • 김지호;남상하;최기선
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.3-7
    • /
    • 2017
  • 지식베이스의 목표는 세상의 모든 지식을 데이터베이스화 하는 것이지만 지식 획득 능력의 부족으로 항상 지식 부족 문제에 시달린다. 지식 획득은 주로 웹 상에 있는 자연언어문장을 지식화 하는 외부적인 지식 획득을 통해 이루어지지만, 지식베이스 내부에서 지식을 확장해 나가는 방법에 대해서는 연구가 소홀히 이루어지고 있다. 따라서 본 논문에서는 내부적인 지식 획득을 위한 지식베이스 행렬 분해 모델을 소개한다. 본 논문에서 소개하는 방법은 지식베이스를 행렬로 변환한 뒤 행렬 분해 모델을 통해 새로운 지식에 대한 신뢰도를 점수화하는 방법이다. 본 논문에서 소개한 방법의 우수성과 실효성을 입증하기 위해 한국어 지식베이스인 한국어 디비피디아(2016-10)를 대상으로 본 모델의 정확도 측정 실험 결과를 소개한다.

  • PDF

최소자원 최대효과의 구문분석 (Maximally Efficient Syntactic Parsing with Minimal Resources)

  • 신효필
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.242-248
    • /
    • 1999
  • 이 논문은 지역적 동사구 분할에 바탕을 두고 서술어가 문말에 위치하는 언어에 특성에서 기인하는 속성을 반영하는 부분적 그러나 빠른 구문분석에 관해 논한다. 즉 완벽성 보다는 신속함 그리고 신뢰에 바탕을 둔 새로운 한국어 구문분석에 대해 논의한다. 기존의 문법이론 대신 한국어의 형태적 통사적 특성에 기인한, 성분들의 분할(partitions)에 의한 단위 (chunks) 분석방법을 제안한다. 근간은 동사구 장벽(VP-barrier) 알고리즘이며, 이 알고리즘은 한 문장안에서의 다양한 동사의 파생접사에 의해 형성되는 관형화, 명사화, 부사화 등의 파생구조와 내포된 동사구(인용문, 종속문 등)에 의해 형성되는 지역적 동사구내에서 그 성분들의 논리적인 분할을 구성하고 다시 그 다음 요소와 체계적으로 결합하는 관계로 확장하여 가능한 구조들을 생성한다. 다시 언어의존적인 발견적 규칙(heuristics)들을 점수화하여 가장 높은 점수의 단위구조를 적격한 구조로 선택한다. 이 방법은 하위범주화 및 의미정보를 사용하지 않는, 빠른 구문분석이 요구되는 시스템을 위해 고안되었으며, 집단적인 노력이 아닌 개인적인 노력 및 최소의 자원으로도 최대의 효과를 얻을 수 있다는데 그 의의가 있다.

  • PDF

소프트웨어의 유지보수를 위한 PSDG기반 의미분할모형의 설계 (A design of the PSDG based semantic slicing model for software maintenance)

  • 여호영;이기오;류성열
    • 한국정보처리학회논문지
    • /
    • 제5권8호
    • /
    • pp.2041-2049
    • /
    • 1998
  • 소프트웨어의 품질을 향상시키며, 기존코드의 결함식별을 용이하게 하는 방법으로 프로그램의 후상태 종속성 분석을 통한 프로그램 ?살 및 유지보수지원 기법을 제안한다. 결함을 식별하고 분석하기에 이해도가 중요시 되는 교정유지보수를 위해서, 기존 코드의 분석 및 세그먼트화를 후상태 종속성모형(PSDG)을 이용하여 정적분할과 동적분할 및 의미분할의 장점을 살린 코드분할로 수행한다. 분할의 원리는 기존코드의 상태 종속성을 추적하여 그래프로 모형화한 후, 조각화(Clustering)와 강조분할(Highlighting)을 통해서 프로그램을 분할한다. PSDG 모형화의 결과로 비효율적인 프로그램 결함코드(Deadcode)의 식별 및 제거가 가능하며, 관련 프로그램 문장들을 일반화할 수 있고, 상태전이도 모형과의 확장연계로 분석 및 설계의 문서로 이용될 수 있다.

  • PDF

의존문법 기반의 구간 분할법을 활용한 한국어 구문 분석기 (Korean Parser Using Segmentation Based on Dependency Grammar)

  • 박용욱
    • 한국정보통신학회논문지
    • /
    • 제13권8호
    • /
    • pp.1705-1712
    • /
    • 2009
  • 최근 대부분의 한국어 구문분석기는 의존문법(Dependency Grammar)을 사용하고 있는데, 그 이유는 한국어의 특성인 어순이 비교적 자유롭고 생략이 잦은 문장에 대한 처리가 용이하기 때문이다. 하지만 의존문법을 이용한 한국어 구문분석은 많은 중의성을 도출하는 문제점이 대두되고 있다. 본 논문에서는 이러한 중의성을 보다 효과적으로 해결하기 위하여 200개가 넘는 의존문법 규칙과 문장의 구성성분을 이용한 구간분할방법, 관형형어미가 붙은 용언에 대한 처리 및 같은 용언에 중복된 구성성분 결합제한 방법을 사용한 구문분석기를 제안한다. 실험 결과 중의성 제거에 많은 효과가 있음을 보여준다.

초등학교 장애학생 수학 문장제 문제 국내 연구 동향 및 질적지표에 의한 분석: 단일대상연구를 중심으로 (A Systematic Literature Review on Teaching Mathematical Word Problems for Elementary School Students with Disabilities)

  • 박지윤;강소라
    • 한국수학교육학회지시리즈C:초등수학교육
    • /
    • 제26권1호
    • /
    • pp.29-43
    • /
    • 2023
  • 수학교과에서 단순히 수학적 개념을 습득하는 것보다 수학과 관련된 문제를 실생활에 적용하는 맥락적 문제해결의 중요성이 강조되고 있다. 이에 본 연구는 장애학생을 대상으로 실제적 상황을 나타내는 문장제 문제에 대한 연구 동향을 살펴보고자 하였다. 이를 위해 2000년에서 2022년까지 발행된 단일대상실험설계를 사용하여 중재의 효과를 탐구한 논문 최종 12편을 선정하여 참여학생 특성, 중재 환경, 중재 방법 및 교수전략 등에 대해 분석하였다. 그 결과, 초등학교 고학년을 대상으로 연구가 가장 많이 이루어졌고, 학습장애, 자폐성장애, 지적장애를 포함하는 다양한 장애 유형을 대상으로 연구가 진행된 것을 확인하였다. 중재는 대부분 연구자에 의해 이루어졌고, 1회기 당 30~40분 정도로 중재가 제공되었다. 장애학생을 위한 수학문장제 문제 중재 방법으로 도식 기반 교수, 인지-초인지 전략 교수, 테크놀로지 기반 교수를 적용한 것으로 나타났고, 대부분 명시적 교수를 함께 사용한 것으로 확인되었다. 또한 본 연구에 포함된 12편의 단일대상연구가 방법론적으로 타당하게 실행되었는지를 분석하고자 Council of Exceptional Children에서 제시한 질적지표를 사용하여 평가하였고, 이러한 결과를 종합하여 향후 장애학생을 위한 문장제 문제 연구 방향에 대해 논의하였다.

언어 학습 음원 분석 방법 및 언어 학습 음원을 재생하는 전자 디바이스 연구 (LANGUAGE LEARNING SOURCE ANALYSIS METHOD AND ELECTRONIC DEVICE FOR PLAYING LANGUAGE LEARNING SOURCE RESEARCH)

  • 송규빈;오정현;황채원;유동완
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.355-357
    • /
    • 2020
  • 언어 학습 음원 분석 방법 및 언어 학습 음원을 재생하는 전자 디바이스 연구로, 음원을 문장 단위로 분할하여 스크립트화하는 것을 주요 목표로 한다. 분석과정은 크게 세단계로 나눌 수 있다. 무음 구간 분석, 음원 분할 및 STT 구간, 스크립트 재구성이다. 이런 분석 과정을 통해 나온 결과물의 정확도는 90%로서 본 연구의 목표를 달성한다.

관계형 DBMS를 이용한 XML 질의 처리 시스템 XPERT의 개발 (XPERT : An XML Query Processing System using Relational Databases)

  • 정민경;홍동권
    • 정보처리학회논문지D
    • /
    • 제13D권1호
    • /
    • pp.1-10
    • /
    • 2006
  • 본 논문은 관계형 DBMS를 사용한 XML 질의 처리 시스템 XPERT(XML Query Processing Engine using Relational Technologies)의 개발 내용을 소개한다. 본 논문의 XPERT에서 제안하는 XML 저장 방식은 XML 문서를 여러 구성 성분별로 나누어 관계형 테이블에 저장하는 분할(decomposition 또는 shredded) 방식을 사용하고, 분할된 관계형 테이블을 바탕으로 XML 질의를 SQL로 변환하고, 관계형 DBMS에서 변환된 SQL을 실행하여 결과를 반환하는 방식을 사용한다. 제안한 XQuery 변환 방식은 먼저 XQuery의 구문 분석을 통하여 AST(Abstract Syntax Tree)를 생성하고, AST를 순회하면서 SQL 문장을 생성한다. 생성된 SQL 문장은 XML 문서의 경로를 사용함으로써 XQuery 연산의 조인 횟수를 감소시키며, 계층적 정보 검사나 문서에 내재된 결과의 순서를 지키기 위하여 사용하는 순서 정보는 Dewey 번호를 효과적으로 사용한다. 특히 XQuery의 XPath와 FLWOR 연산을 SQL로 변환하고 실행하는 효과적인 방법을 제시하고 제안된 XPERT시스템의 프로토타입을 개발하여 그 기능을 평가한다.