• 제목/요약/키워드: 문장틀

검색결과 45건 처리시간 0.023초

문장틀 기반 Sequence to Sequence 구어체 문장 문법 교정기 (Template Constrained Sequence to Sequence based Conversational Utterance Error Correction Method)

  • 정지수;원세연;서혜인;정상근;장두성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.553-558
    • /
    • 2022
  • 최근, 구어체 데이터에 대한 자연어처리 응용 기술이 늘어나고 있다. 구어체 문장은 소통 방식 등의 형태로 인해 정제되지 않은 형태로써, 필연적으로 띄어쓰기, 문장 왜곡 등의 다양한 문법적 오류를 포함한다. 자동 문법 교정기는 이러한 구어체 데이터의 전처리 및 일차적 정제 도구로써 활용된다. 사전학습된 트랜스포머 기반 문장 생성 연구가 활발해지며, 이를 활용한 자동 문법 교정기 역시 연구되고 있다. 트랜스포머 기반 문장 교정 시, 교정의 필요 유무를 잘못 판단하여, 오류가 생기게 된다. 이러한 오류는 대체로 문맥에 혼동을 주는 단어의 등장으로 인해 발생한다. 본 논문은 트랜스포머 기반 문법 교정기의 오류를 보강하기 위한 방식으로써, 필요하지 않은 형태소인 고유명사를 마스킹한 입력 및 출력 문장틀 형태를 제안하며, 이러한 문장틀에 대해 고유명사를 복원한 경우 성능이 증강됨을 보인다.

  • PDF

한글의 글자꼴과 문장의 가독성 (The Effects of Hangul Letter Form On Readability)

  • 정우현;한재준;정찬섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.207-216
    • /
    • 1993
  • 네모틀 글자꼴인 명조체와 고딕체, 탈네모틀 글자꼴인 샘물체와 한체, 한체로서 받침없는 글자의 높낮이를 조절한 변형한체, 명조체로서 가로대 세로의 비율을 변형시킨 장평50과 장평150의 글자꼴을 문장의 가독성과 미려함의 차원에서 비교하였다. 또한 글줄간격에 따라 이들 글자꼴에서의 차이가 어떻게 달라지는지 살펴보았다. 연구결과, 네모틀 글자꼴의 가독성이 대체로 탈네모틀 글자꼴보다 더 좋았으나, 이러한 차이는 글줄간격에 따라 다르게 나타났다. 미려함 차원에서도 네모틀 글자꼴이 탈네모틀 글자꼴보다 더 높게 평정되었다.

  • PDF

PC통신과 웹에서 지역알림정보의 작성을 돕는 전문가적인 서비스 모형에 관한 연구: 지역주민의 견문을 중심으로 (Expertise Service Model Aiding Local Information Writing on the Web)

  • 이태영
    • 정보관리학회지
    • /
    • 제16권1호
    • /
    • pp.89-117
    • /
    • 1999
  • 지역정보 쓰기에서 이용자들을 돕기 위해 (1) 글 구조, (2) 단락 구성, (3) 문장 작성, (4) 어휘 구사에 대한지식을 글 분석을 통해 연구하였다. 글 구상과 단락 구성을 각각 도와주는 글틀과 단락틀 지식베이스가 고안되었고 단어, 절, 문장의 구현에 필요한 단어와 절 및 문장의 예들을 모은 사전 데이터베이스도 만들었다. 서비스의 질을 높이기 위해 전문가 지향적인 시스템을 추구하였다. PC통신과 웹에서 실용적인 시스템이 되려면 앞으로 (1) 글틀과 단락틀의 주제 추출, (2) 문장의 대표어 작성, (3) 각종 규칙의 정제, (4) 정밀한 지식베이스 구축이 필수적이라고 사려된다.

  • PDF

한국어(韓國語) 초록문(抄錄文)의 문장(文章)과 내용(內容)에 대한 연구(硏究) (A Study on the Contents and Sentences of Korean Abstract)

  • 이태영
    • 정보관리연구
    • /
    • 제21권1호
    • /
    • pp.1-33
    • /
    • 1990
  • 품사(品詞), 격(格), 기본동작(基本動作), 기본상태(基本狀態)를 이용(利用)하여 영어(英語)와 한국어(韓國語) 지시초록(指示抄錄)의 문장(文章)을 고찰(考察)하였다. 문(文)과 문장(文章)의 길이(문장(文章)의 결합정도)를 측정(測定)하고, 문장구조(文章構造)와 전개과정(展開過程)을 분석(分析)하였으며 당위적인 초록문형(抄錄文型)을 예시(例示)하였다. 그리고 기본동작(基本動作)과 상태(狀態)를 중심(中心)으로 격관계(格關係)를 밝힌 초록문(抄錄文)의 문장틀을 제시(提示)하였다.

  • PDF

언어이해과정에서의 구문/의미요소 분리에 대한 ERP특성연구 (Detection of Syntactic and Semantic Anomaly in Korean Sentences: an ERP study)

  • 김충명;이경민
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 춘계 학술대회
    • /
    • pp.61-67
    • /
    • 2000
  • 본고는 텍스트로 제시된 한국어 문장의 형태통사론적 오류와 의미적 논항결합시 하위범주화요건을 위배하는 논항선택 오류의 인식 및 판단에 따른 ERP(Event-Related Potential)를 검출하여, 이에 대한 문장이해과정의 시간추이적 양상을 연구의 대상으로 하였다. 참여한 피험자로부터 각각의 유형에 대한 통계분석 결과, 통사적 오류 추출에서 의미적 오류 추출에 이르기까지 기존의 연구에서 제시된 오류패턴 요소들(ELAN, N400, P600)을 확인하였으며, 아울러 한국어 문장이해과정의 특이성을 관찰할 수 있었다. 이를 통해 문장묵독시 일어나는 여러 종류의 문법오류에 대한 개별적 성격규명과 함께, 이들의 문법틀 내에서의 상호관계에 대한 일련의 가설설정이 이루어질 수 있으며, 또한 문장이해 메커니즘의 신경적 기전의 특성 규명으로 부수될 인간지능 모사가능성에 생리학적 토대가 더해 질 것으로 추정되는 바, 언어이해와 대뇌기전지형을 결정짓는 또 다른 규준이 될 것이다.

  • PDF

문장 형태 정보를 이용한 조건단일화 기반 한국어 파싱 (A Conditional Unification Based Parsing for Korean Using Sentence-Type Information)

  • 양승원
    • 한국산업정보학회논문지
    • /
    • 제9권4호
    • /
    • pp.1-7
    • /
    • 2004
  • 본 논문에서는 한국어 문장의 구조를 파악하는 데에 결정적인 역할을 하는 조사에 대한 정보를 보다 적극적으로 이용하는 파싱 방법을 기술한다. 이러한 방법을 실현하기 위하여 용언을 세밀하게 분류하였으며, 이를 바탕으로 문장의 형태를 분류하고 이 문장 형태에 필수적으로 나타나는 명사구의 문법적 역할을 파악하는 방법을 이용한 파싱을 시도하였다. 또한, 내부적으로는 언어학적인 틀에서 크게 벗어나지 않는 범위 내에서 약간의 경험지식을 동원하였다. 이를 구현함에 있어서 문법의 수준에서 파싱을 직접 제어하기 위하여 조건단일화 파싱을 사용하였다. 본 논문에서 제시한 파싱 방법은 분석의 초기에 불필요한 가지를 전지함으로써 결과 트리가 간략해져 복잡한 문장의 모호성을 상당두분 제거할 수 있게 해준다.

  • PDF

굽타의 진리 수정론

  • 송하석
    • 논리연구
    • /
    • 제1권
    • /
    • pp.65-93
    • /
    • 1997
  • 거짓말쟁이 역설에 대한 전통적인 설명은 다음 두 가지로 주어진다. 역설을 일으키는 거짓말쟁이 문장이 자기지시적이기 때문에 역설이 발생하므로 자기지시적 문장을 금함으로써 그 역설을 피할 수 있다는 것이 첫 번째이고, 둘째는 모든 문장을 참이나 거짓이라고 주장하는 진리값에 대한 배중률(principle of bivalence)에 집착하기 때문에 그 역설이 발생한다고 생각하고 제3의 진리값을 갖는 문장이 있음을 인정해야 한다는 것이다. 이러한 전통적인 설명과 달리 진리 개념을 비일관적인 개념으로 보고 진리 술어와 그 외의 술어의 용법상의 차이를 설명함으로써 거짓말쟁이 역설에 대한 새로운 설명을 시도하고자 하는 것이 굽타의 "진리 수정론"이다. 굽타의 진리 수정론에 따르면, 진리 술어 외의 술어들은 그 외연이 고정적으로 산출되고 그 과정은 적용 규칙(rule of application)에 의해서 설명되지만 진리 술어는 순환적 정의처럼 고정된 외연을 만들어내지 못하고 단지 가설적 외연만 만들어 낼 뿐이다. 이렇게 진리술어의 가정적 외연을 산출해내는 과정은 수정규칙(rule of revision)에 의해서 설명된다. 요컨대 진리 수정론은 순환적 개념도 의미를 가질 수 있음을 보여주는 의미론적 구조틀이 있다는 것과 진리개념이 바로 그러한 의미구조틀에 의해서 의미를 갖는 순환적 개념이라는 것이다. 그리고 굽타는 그러한 의미구조 틀을 일정한 규칙을 갖는 함수로 설명하려고 시도한다. 즉 진리개념을 일관적인 것으로 보고 거짓말쟁이 역설을 해결해야 할 병리적 현상으로 보는 진리의 일관성론과 달리 굽타의 진리 수정론은 진리술어 자체가 비일관적이기 때문에 거짓말쟁이 역설은 그 술어의 속성상 자연스러운 것이지 피해야 만할 병리적 현상이 아니라고 주장한다. 필자는 의미론적 역설에 대한 여러 가지 설명 중에서 진리 수정론이 가장 설득력 있는 것으로 인정하고 그에 대한 가능한 반론을 검토하고 그에 대한 답변을 시도했다. 또한 진리 수정론을 통해서 거짓말쟁이 역설을 설명하고 -해결하려는 것이 아니라- 나아가서 진리 개념에 대한 이해를 제공해보려고 시도했다.

  • PDF

자연어 문장을 이용한 자동 프로그래밍 시스템의 명세서에 관한 연구 (A Study on the Specification of an Automatic Programming System using Natural Language Sentence)

  • 김태용;황인환;이정현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.479-482
    • /
    • 1994
  • 자동 프로그램이란 인간이 프로그램 언어를 습득하는데 드는 노력과 시간을 감소시키고 프로그램하는 과정의 일부나 전부를 컴퓨터가 대신하도록 하여 프로그램 환경을 개선하고 유지, 보수의 비용을 줄이는데 그 목적이 있으며, 자동 프로그램 4대 구성 요소중 프로그램 명세서를 초고급언어나 예제에 의한 방법 또는 트레이스(Trace)로 기술하는 것이 일반적이다. 그러나 이 방법은 전문가가 아니면 이해하기 어렵고, 불량이 많은 작성하기 어려운 문제점이 있다. 본 논문에서는 이런 단점을 개선하기 위해서 일반 사용자가 접하기 쉽고, 이해하기 용이한 자연어 문장으로 명세서를 작성한다. 그러나 자연어에는 많은 애매성이 존재하는데 이것을 방지하기 위해 사용자에게 미리 자연어 프로그램 틀을 제시한다. 자연어 문장으로 작성된 명세서는 형태소 분석과 구문 분석에 의해 처리되며, 구문 분석시 복합문과 내포문은 단문으로 분리한 다음, 동사를 중심으로한 격 프레임(case frame)를 만들며, 이것을 바탕으로 중간언어를 생성하는 방법을 제안한다.

  • PDF

전치문과 도치문의 담화화용론적인 비교 (A Discourse-Pragmatic Study of Preposing and Inversion in English.)

  • 박원경
    • 한국영어학회지:영어학
    • /
    • 제3권1호
    • /
    • pp.37-54
    • /
    • 2003
  • 본 논문에서는 문장의 어떤 구성성분을 앞으로 이동한 후 주어-동사의 표준어순으로 나타나는 전치문과 동사-주어의 비표준어순으로 나타나는 도치문에 대하여 각각의 통사적 특징과 담화 화용론적 기능을 살펴보고, 전치문과 도치문을 비교하여 그 차이점과 공통점을 알아보았다. 다양한 구성요소의 이동에 따라 명사구 전치, 전치사구 전치, 형용사구 전치, 동사구 전치, 분사구 전치 등으로 구별되어 고려되어왔던 다양한 전치문들을 주제화라는 하나의 통합된 규칙으로 설명하였으며, 모든 전치 구성성분은 현 담화를 이전담화에 연결시키며, 이전 담화로부터 주어진 요소임과 동시에 현 담화의 틀을 제공한다는 점에서 그 문장 또는 그 담화의 주제라고 보았다. Ward(1990)가 논의한 동사구 전치의 네 가지 기능, 즉 독립적 명제확인, 양보적확인, 정도확인, 명제유보의 기능을 하나로 일반화하여 주제에 대한 논평을 첨가하는 ‘주제+논평’ 구조로 보았다. 전치와 후치를 모두 포함하고 있는 도치문에서 전치되는 요소들은 문장 또는 담화 내에서 구정보를, 후치된 성분은 신정보를 표시한다. 즉, 문장요소의 담화상의 친숙도가 이동하는 구성성분의 문장내의 위치를 결정하는데 결정적이다. 도치문에서 전치된 요소는 문장 내에서 ‘실용’, ‘연결’, ‘강조’, ‘소개’ 등의 다양한 기능을 하는데 이를 전치성분은 후치된 명사구를 이전 담화에 명시적으로 나타났거나 추론가능한 정보와 연결하는 ‘연결’기능을 하는 것으로 설명하였다. 전치문과 도치문은 이전 담화와 어떻게든 연결관계를 갖는다는 것이 공통적인데, 전치문에서 전치요소는 절대적인 구정보를 표시하나, 도치문에서는 담화상 상대적 구정보를 표시하기만 하면 된다. 이것으로 화자가 발화시 전치시키는 요소는 그 요소가 청자의 지식 내에서 어떤 정보상태에 있다고 화자가 평가하는가에 따라 전치문을 선택할지 도치문을 선택할지가 결정됨을 알 수 있다.

  • PDF

선행하는 행(行)에 의해 긴장되는 시조: 왕방연의 작품들을 중심으로 (The Sijo Strained by the Preceding Line: Focusing on the Works of Bang-yeon Wang)

  • 박인과
    • 문화기술의 융합
    • /
    • 제4권2호
    • /
    • pp.149-153
    • /
    • 2018
  • 본 연구의 목적은 시조의 긴장의 유형을 문학치료 프로그램에 적극적으로 활용하기 위한 것이다. 왕방연의 시조를 대상으로 살펴보고자 한다. 왕방연의 시조는 잘 알려지지 않고 있어 논의해 보기로 하는 것이다. 왕방연의 시조는 수식어가 다음 문장에 긴장을 일으키며 의미를 전달하는 효과를 지니고 있다. 이러한 문학적 틀은 문학치료의 프로그램에 유용하게 사용될 수 있을 것으로 사료된다.