• 제목/요약/키워드: 문장종속

검색결과 54건 처리시간 0.026초

술어 기반 문형 정보를 이용한 한국어의 의미 구조 생성에 관한 연구 (A Study on the Generation of Semantic Structure of Korean using Sentence Pattern Information based on Predicates)

  • 박인철;배우정;안동언;이용석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.43-49
    • /
    • 1995
  • 대부분 자연 언어 이해 시스템이나 중간 언어 방식을 이용한 기계 번역 시스템에서 자연 언어 문장을 이해하고 번역하기 위해서는 대량의 지식을 이용한 의미 구조의 생성이 요구된다. 따라서 개념 그래프를 이용하여 한국어 문장의 내부 의미 구조를 생성하기 위해서는 각 단어에 해당하는 개념과 개념들 사이의 개념적 관계를 나타내는 지식들이 요구된다. 그러나 이를 위한 의미 구조 생성 방법과 요구되는 지식 베이스를 정확하게 구축하는 것은 어렵고 응용 도메인에 종속한다는 문제가 있다. 본 논문에서 우리는 문형 이론을 도입하여 문형을 중심으로 의미 구조 생성을 위한 변환 규칙을 설계하고 이를 이용하여 방대한 지식 베이스의 구축없이 의미 구조를 생성할 수 있는 방법에 논의한다. 또한 본 논문에서 문형을 이용하면 몇 가지 모호성 문제를 해결할 수 있음을 보이고 문형의 한계에 대해서도 살펴본다.

  • PDF

유창성 실어증자의 이야기 이해와 산출능력 (Narrative discourse in patients with fluency aphasia)

  • 양용선;김수진
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2006년도 춘계학술대회
    • /
    • pp.125-130
    • /
    • 2006
  • 원활한 의사소통을 위해서는 문장들을 연결하여 흐름을 조직하고 말로 산출하고 전체적인 의미를 파악할 수 있어야 한다. 이야기는 이러한 문장들이 연결되어있는 것으로, 종속적이거나 나열적인 이야기 특성은 의사소통장애인의 이야기 이해와 산출의 수행에 영향을 미칠 수 있다. 본 연구에서는 이야기 특성에 따른 유창성 실어증환자의 이야기 이해 및 산출의 능력을 알아보고, 이해과제 수행이 산출과제에 미치는 영향을 분석해보았다. 이야기 종류로는 시간적 나열 이야기와 인과적 관계 이야기, 유머가 있는 이야기를 사용하였으며, 사실적 정보, 텍스트 추론, 빠진 정보추론 등 세 가지의 이해과제를 통하여 이해 능력을 측정하였다. 산출능력은 이해과제 전과 후에 CIU 비율로 질적인 측면을 측정하고, 분당어절 수를 이용하여 양적인 측면을 분석하였다. 그 결과 이해측면은 세 가지 이야기 모두 사실적 정보에 대한 이해 능력이 상대적으로 좋았으며, 오류의 형태는 추론오류가 가장 많이 나타났다. 산출에서는 인과적 관계이야기에서의 CIU 비율이 가장 높았고, 이해과제 전, 후의 차이를 비교한 결과, CIU 비율은 변화하지 않았으나, 분당 어절수에서는 증가하고 있음을 보여주었다. 이야기의 종류에 따라서 유창성 실어증화자의 산출과제의 수행수준은 다르게 나타났다. 그리고 이해과제의 수행이 산출과제에서 양적인 증가는 가져왔으나 질적인 수준에는 아무런 영향을 미치지 않았다.

  • PDF

문장종속 화자확인 시스템을 위한 개선된 군집화 알고리즘에 관한 연구 (A Study on Modified Clustering Algorithm for Text-Dependent Speaker Verification System)

  • 강철호;정희석
    • 한국음향학회지
    • /
    • 제23권7호
    • /
    • pp.548-553
    • /
    • 2004
  • 본 연구에서는 집단화 오차를 최소로 하기위해 개선된 LBG 알고리즘을 제안한다. 기존의 LBG 알고리즘은 화자확인 시스템에 적용시 소량의 학습 데이터의 분포가 가지는 특수성으로부터 기인하는 문제점들이 발생한다. 즉, 개인별 특성을 무시하고 항상 일정한 크기의 코드북을 생성해야 하는데서 기인하는 군집화 오류와 분할할 (Splitting) 방향을 잘못 선택하면서 발생하는 집단화의 오류가 전체 화자 인식율 저하의 원인이 된다. 따라서, 본 연구에서는 개인별로 최적의 크기를 가지는 가변길이 코드북 생성 기법과 중심값으로부터 최외곽의 멤버 벡터 인덱스를 찾고 다시 최외곽 멤버 벡터에서 가장 먼 멤버 벡터 인덱스를 찾음으로써 분할할 방향을 인위적으로 지정해 주는 개선된 군집화 알고리즘을 제안한다. 실험 결과, 제안된 방식을 적용한 화자확인 시스템이 기존의 LBG알고리즘을 사용한 시스템보다 오거부율(FR)은 3.165%, 오수락율 (FA)는 0.06%씩 각각 향상 되었다.

중국대학생 동영상 학습에서 텍스트 제시방식과 이미지 제시방식이 학습몰입, 학습만족, 학업성취에 미치는 효과 (Effect of text and image presenting method on Chinese college students' learning flow, learning satisfaction and learning outcome in video learning environment)

  • 장정;제혜금;김보경
    • 한국산학기술학회논문지
    • /
    • 제22권1호
    • /
    • pp.633-640
    • /
    • 2021
  • 본 연구는 동영상 학습에서 텍스트와 이미지 제시방식이 학습자의 학습몰입, 학습만족, 학업성취에 미치는 차이를 분석하였다. 이때 텍스트 제시방식은 2~3단어로 구성된 짧은 문장형태와 키워드형태로 구분하였고, 이미지 제시방식은 상세정보와 관계정보를 모두 표현하는 이미지와 관계정보만을 표현하는 이미지로 구분하였다. 실험연구를 위해 중국 형태대학교 1학년 167명을 텍스트와 이미지 제시방식에 따른 4가지 유형의 동영상 집단에 무선배정한 후 학습하게 하였다. 분석하기 위해 SPSS 25.0을 사용하여 다변량분산분석(MANOVA)을 실시하였다. 연구결과, 짧은 문장형태로 텍스트가 제시된 동영상을 학습한 집단이 키워드 형태의 텍스트가 제시된 동영상을 학습한 집단보다 학습몰입, 학습만족, 학업성취가 통계적으로 유의하게 높았다. 둘째, 상세정보와 관계정보를 모두 표현하는 이미지가 제시된 동영상을 학습한 집단이 관계정보만 표현하는 이미지가 제시된 동영상을 학습한 집단보다 학습몰입, 학습만족, 학업성취가 통계적으로 유의하게 높았다. 짧은 문장형태의 텍스트와 관계정보만 표현한 이미지가 제시된 동영상을 학습한 집단의 종속변인 평균이 가장 높았다. 반면에, 키워드 형태의 텍스트와 관계정보만 표현한 이미지가 제시된 동영상을 학습한 집단의 종속변인 평균이 가장 낮았다. 이러한 결과는 교수자 내레이션이 포함된 동영상을 설계할 때 이미지와 텍스트의 제시할 때 시사점을 준다.

소셜 미디어 상 고객피드백을 위한 감성분석 (The Sensitivity Analysis for Customer Feedback on Social Media)

  • 송은지
    • 한국정보통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.780-786
    • /
    • 2015
  • SNS 등과 같은 소셜 미디어는 실시간으로 자발적인 고객의 의견들을 대거 포함하고 있어 최근 기업들은 효율적인 경영을 위해 소셜 미디어상의 빅 데이터를 분석하는 시스템을 이용하여 고객피드백에 관한 정보를 수집하고 분석하고 있다. 그러나 온라인 사이트에서 수집한 데이터는 띄어쓰기와 철자 오류가 많아 기존의 형태소 분석기로는 정확한 분석을 할 수 없다. 또한 온라인 상의 문장은 짧다는 특징이 있어 상호 정보량, 카이제곱 통계량 등과 같은 기존의 의미 선택 방법을 이용하게 되면 문장 내 선택 할 수 있는 의미의 부재로 인해 정확한 감성 분류를 할 수 없다는 문제점이 있다. 이러한 문제점들을 해결하기 위해서 본 논문에서는 초/중성 및 어절 패턴 사전을 이용해서 보정할 수 있는 모듈과 문장 내 품사의 우선순위를 이용한 의미 선택 방법을 제안한다. 이러한 방법으로 형태소 분석기에서 추출된 품사 정보를 기반으로 용언과 체언을 분리해서 분석 해당 품사에 종속적인 속성 DB 구축 한 후 학습에 의해 누적된 속성 DB를 사용하여 보다 정확한 긍/부정 감성을 추출한다.

자바 프로그래밍에서 병렬처리를 위한 중첩 루프 구조의 다중스레드 변환 (Transform Nested Loops into MultiThread in Java Programming Language for Parallel Processing)

  • 황득영;최영근
    • 한국정보처리학회논문지
    • /
    • 제5권8호
    • /
    • pp.1997-2012
    • /
    • 1998
  • 병렬 시스템에서 순차 자바 프로그램을 재 사용할 수 있기 위해서는 자바 프로그램 내에 존재하는 병렬성을 찾아내는 것이 중요하다. 자바 프로그램을 병렬 시스템에서 실행할 경우 루프는 전체 수행 시간 중 많은 부분을 차지하므로 병렬성 검출의 기본이 되지만 데이터 종속으로 인하여 완전한 병렬 수행을 쉽게 이룰 수 없다. 따라서, 본 논문은 기존의 중첩 루프 구조를 갖는 자바 프로그래밍에서 데이터 종속성 분석에 의한 종속 그래프를 구성하여 묵시적 병렬성을 검출하는 방법을 제안한다. 또한 재구성 컴파일러에 의하여 자바 원시 프로그램을 자바 프로그래밍 언어 자체에서 지원하는 다중스레드 기법으로 변환하여 병렬 시스템에서 실행하는 방법을 제안한다. 스레드 문장으로 변환된 프로그램에 대해 루프의 반복계수와 스레드 수를 매개변수로 하여 성능 분석을 하였다. 재구성 컴파일러에 의한 장점은 사용자의 병렬성 검출에 대한 오버해드를 줄이고, 순차 자바 프로그램에 대한 효과적인 병렬성 검출을 가능하게 하여 병렬 시스템에서 실행 시간을 단축할 수 있다.

  • PDF

Blind speech segmentation과 에너지 가중치를 이용한 문장 종속형 화자인식기의 성능 향상 (Performance improvement of text-dependent speaker verification system using blind speech segmentation and energy weight)

  • 김정곤;김형순
    • 대한음성학회지:말소리
    • /
    • 제47호
    • /
    • pp.131-140
    • /
    • 2003
  • We propose a new method of generating client models for HMM based text-dependent speaker verification system with only a small amount of training data. To make a client model, statistical methods such as segmental K-means algorithm are widely used, but they do not guarantee the quality or reliability of a model when only limited data are avaliable. In this paper, we propose a blind speech segmentation based on level building DTW algorithm as an alternative method to make a client model with limited data. In addition, considering the fact that voiced sounds have much more speaker-specific information than unvoiced sounds and energy of the former is higher than that of the latter, we also propose a new score evaluation method using the observation probability raised to the power of weighting factor estimated from the normalized log energy. Our experiment shows that the proposed methods are superior to conventional HMM based speaker verification system.

  • PDF

최소자원 최대효과의 구문분석 (Maximally Efficient Syntactic Parsing with Minimal Resources)

  • 신효필
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.242-248
    • /
    • 1999
  • 이 논문은 지역적 동사구 분할에 바탕을 두고 서술어가 문말에 위치하는 언어에 특성에서 기인하는 속성을 반영하는 부분적 그러나 빠른 구문분석에 관해 논한다. 즉 완벽성 보다는 신속함 그리고 신뢰에 바탕을 둔 새로운 한국어 구문분석에 대해 논의한다. 기존의 문법이론 대신 한국어의 형태적 통사적 특성에 기인한, 성분들의 분할(partitions)에 의한 단위 (chunks) 분석방법을 제안한다. 근간은 동사구 장벽(VP-barrier) 알고리즘이며, 이 알고리즘은 한 문장안에서의 다양한 동사의 파생접사에 의해 형성되는 관형화, 명사화, 부사화 등의 파생구조와 내포된 동사구(인용문, 종속문 등)에 의해 형성되는 지역적 동사구내에서 그 성분들의 논리적인 분할을 구성하고 다시 그 다음 요소와 체계적으로 결합하는 관계로 확장하여 가능한 구조들을 생성한다. 다시 언어의존적인 발견적 규칙(heuristics)들을 점수화하여 가장 높은 점수의 단위구조를 적격한 구조로 선택한다. 이 방법은 하위범주화 및 의미정보를 사용하지 않는, 빠른 구문분석이 요구되는 시스템을 위해 고안되었으며, 집단적인 노력이 아닌 개인적인 노력 및 최소의 자원으로도 최대의 효과를 얻을 수 있다는데 그 의의가 있다.

  • PDF

Java 프로그래밍에서 단일 루프 구조의 병렬성 검출 (Exploiting implicit Parallelism for Single Loops in Java Programming Language)

  • 황득영;권오진;최영근
    • 한국정보처리학회논문지
    • /
    • 제5권7호
    • /
    • pp.1730-1745
    • /
    • 1998
  • 순차 Java 프로그램을 병렬 시스템에서 실행할 경우 루프는 전체 수행 시간 중 많은 부분을 차지하므로 병렬성 검출의 기본이 된다. 본 논문은 기존에 작성된 단일 루프 구조를 갖는 Java 프로그래밍 언어에서 종속성 분석을 수행하여 묵시적 병렬성을 검출하는 방법을 제안한다. 또한 재구성 컴파일러에 의하여 병렬 코드를 생성하는 방법과 Java 원시 프로그램을 Java 프로그래밍 언어 자체에서 지원하는 다중스레드 기법으로 변환하는 방법을 제안한다. 스레드 문장으로 변환된 프로그램에 대해 루프의 반복계수와 스레드 수를 매개변수로 하여 성능 분석을 하였다. 재구성 컴파일러에 의한 장점은 사용자의 병렬성 검출에 대한 오버헤드를 줄이고, 순차 Java 프로그램에 대한 효과적인 병렬성 검출을 가능하게 한다.

  • PDF

복합 커널을 사용한 한국어 종속절의 의존관계 분석 (Analyzing dependency of Korean subordinate clauses using a composit kernel)

  • 김상수;박성배;박세영;이상조
    • 인지과학
    • /
    • 제19권1호
    • /
    • pp.1-15
    • /
    • 2008
  • 한국어에서 절들의 의존관계를 밝히는 작업은 구문 분석 작업에서 가장 어려운 작업들 중에 하나로 인식되고 있다. 절의 의존관계를 파악하는 일은 표면적으로 나타나는 정보만을 가지고 처리할 수 없고, 의미정보와 같은 추가적인 정보가 필요할 것으로 판단하고 처리해 왔다. 본 논문에서는 추가적인 정보를 사용하지 알고, 문장에서 얻을 수 있는 표면적인 정보만을 사용하여 절들 간의 의존관계를 파악하는 방법을 제안한다. 문장에서 얻을 수 있는 표면적인 정보는 문장의 구문 정보(tree structure information)와 어휘 및 거리 정보를 가지고 있는 정적인 정보(static information)로 나누어 볼 수 있다. 본 논문에서는 절들 간의 의존 관계 파악을 위하여 구문 정보와 정적 정보를 다루는 하나 이상의 커널의 결합해서 사용하는 복합 커널(composite kernel)을 제안하고, 이 커널에 맞는 다양한 인스턴스 공간의 설정을 제안한다. 실험은 최적화된 인스턴스 공간을 절들 간의 의존관계 파악 및 문장 수준에서 성능을 검정하였다. 관계 인스턴스 공간은 절들 간의 연결 및 하부절의 표현 유무로 나누었고, 결정된 인스턴스 공간에서 복합커널을 사용한 방법이 좋은 성능을 발휘함을 보였다.

  • PDF