• 제목/요약/키워드: 문법 제시

검색결과 225건 처리시간 0.019초

한.영 기계번역을 위한 한국어 품사 분류 (Classification of Korean Parts-of-Speech for Korean-English Machine Translation)

  • 송재관;박찬곤
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.165-167
    • /
    • 1998
  • 본 논문에서는 한.영 기계번역을 위한 한국어 품사 분류를 한다. 한국어 표준문법에서 제시되는 품사 분류 기준은 의미, 기능, 형식의 세 가지 기준을 적용하고 있으며, 자연언어처리에서도 같은 분류 기준을 바탕으로 하고 있다. 품사 분류에 여러 가지 기준을 적용하는 것은 문법구조 이해 및 품사 분류를 어렵게 한다. 또한 한.영 기계번역시 품사의 불일치로 전처리가 필요하다. 이러한 문제를 해결하기 위하여 본 논문에서는 하나의 기준을 적용하여 품사 분류를 한다. 방법으로 한국어 표준문법에 의하여 말뭉치에 태깅하고 문제점을 찾아내며, 새로운 기준에 의하여 품사 분류를 한다. 본 논문에서 분류된 품사는 한국어 문장에서 통사적 역할이 동일하고, 영에서의 사전 품사와 동일하다. 또한 품사 분류의 모호성을 제거하고, 한국어의 문장 구조를 명확히 표현하며, 한.영 기계번역시 패턴 매칭에 의한 목적언어 생성이 가능하다.

  • PDF

뉴스 기사의 문장 요약 (Sentence Summarization of News Articles)

  • 최동현;신지애;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.269-275
    • /
    • 2007
  • 텔레비전 뉴스에서 부제목을 만들거나, 문장을 PDA나 휴대폰과 같은 작은 화면에 출력하고 싶은 경우, 가능한 방법은 두 가지가 있다. 첫번째는 사람에 의해 직접 만드는 방식이다. 두번째는 자동화된 문장 요약 시스템을 사용하는 방법이다. 따라서 문장 요약 알고리즘은 그 중요성이 계속해서 커지고 있다. 본 논문에서는 구문 트리의 서브 트리가 변화할 수 있는 규칙을 제시하는 방법에 (1)공기 정보와 (2) 문법적으로 올바른 구조를 유지하기 위해 핵심적인 부분(주요 문법 구조) 및 같이 요약되어야 할 절을 표시하는 휴리스틱, (3)주어진 문장이 포함된 글의 제목 정보를 추가로 사용하여 문장 요약을 실행하였다. 본 시스템의 결과와 기존의 요약 방식을 비교하는 실험을 분야 전공자들에 의한 주관적 평가로 수행한 결과, 본 시스템의 알고리즘이 기존에 사용되던 구문서브트리 변환 방법보다 중요한 부분 및 문법적으로 올바른 부분을 많이 유지하는 요약임을 확인하였다.

  • PDF

구조화된 상세 정보를 제공하는 한국어 형태소 분석기: KMM (KMM: A Detailed Morphological Analysis for Korean)

  • 김수라
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.202-206
    • /
    • 2010
  • 이 논문에서는 한국어 형태소 분석기 KMM(Korean Malaga Morphology)을 소개하고자 한다. KMM의 개발 동기는 이후 자연언어 처리 단계의 기반으로 사용될 수 있을 뿐 아니라 이론 형태론 연구의 도구로도 사용될 수 있도록 상세한 형태 동사 의미 정보를 제공하는 것이었다. 이론적 틀은 좌연접 문법(Left-Associative Grammar)에 기초한 LA-MORPH이며, 좌연접 기반 문법 개발 도구인 MALAGA로 구현되었다. LA-MORPH에 기반한 KMM은 분석 실행중이 아닐 때에는 사전의 규모를 최소한으로 유지하다가 분석에 필요할 때에만 분석용 사전을 자동으로 생성한다. 형태소 분석은 분석용 사전에 근거하여, 매칭과 결합이라는 단순한 알고리즘만을 사용한다. KMM의 분석은 동사 어절의 경우, 시제, 서법, 문형, 대우법, 명사 어절의 경우 격정보, 수사 결합어절의 경우 추출된 수랑 정보 등과 같은 상세한 정보를 제시한다. 세종 말뭉치와 KIBS 말뭉치를 KMM 을 이용해서 분석한 결과 각각의 94.96%와 94.59%의 분석률과 88.4%와 90.7%의 정확도를 보였다.

  • PDF

VoIP를 위한 Session Description Protocol 스택에 관한 연구 (A Study on the Session Description Protocol Stack for VoIP)

  • 정성옥;고광만
    • 대한전자공학회논문지TC
    • /
    • 제38권3호
    • /
    • pp.19-27
    • /
    • 2001
  • 현재 국내.외적으로 VoIP 관련 시장의 지속적인 성장으로 인해 VoIP 표준 프로토콜에 대한 국제 표준화 작업과 병행하여 프로토콜 스텍과 같은 소프트웨어 개발이 절실한 상황이다. 본 논문에서는 IETF RFC2327에서 제시한 SDP 문법을 기반으로 문법 지식적 변환 기법으로 SDP 요청 메시지를 구조체 형태로 변환하는 앤코더와 구조체 형태를 갖는 SDP 응답 메시지를 텍스트 형태로 변환하는 디코더를 구현하였다. 이를 위해 IETF RFC2327에 제시한 Augmented BNF 형식의 SDP 문법을 BNF 형식으로 기술하여 어휘 분석기 및 구문 분석기를 자동 생성한 후 구문 트리를 구성하였다. 또한 SDP 문법으로부터 생성 가능한 모든 규칙에 대한 정보를 저장할 수 있는 구조체 형태의 헤더 파일을 자동 생성하였다.

  • PDF

언어이해과정에서의 구문/의미요소 분리에 대한 ERP특성연구 (Detection of Syntactic and Semantic Anomaly in Korean Sentences: an ERP study)

  • 김충명;이경민
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 춘계 학술대회
    • /
    • pp.61-67
    • /
    • 2000
  • 본고는 텍스트로 제시된 한국어 문장의 형태통사론적 오류와 의미적 논항결합시 하위범주화요건을 위배하는 논항선택 오류의 인식 및 판단에 따른 ERP(Event-Related Potential)를 검출하여, 이에 대한 문장이해과정의 시간추이적 양상을 연구의 대상으로 하였다. 참여한 피험자로부터 각각의 유형에 대한 통계분석 결과, 통사적 오류 추출에서 의미적 오류 추출에 이르기까지 기존의 연구에서 제시된 오류패턴 요소들(ELAN, N400, P600)을 확인하였으며, 아울러 한국어 문장이해과정의 특이성을 관찰할 수 있었다. 이를 통해 문장묵독시 일어나는 여러 종류의 문법오류에 대한 개별적 성격규명과 함께, 이들의 문법틀 내에서의 상호관계에 대한 일련의 가설설정이 이루어질 수 있으며, 또한 문장이해 메커니즘의 신경적 기전의 특성 규명으로 부수될 인간지능 모사가능성에 생리학적 토대가 더해 질 것으로 추정되는 바, 언어이해와 대뇌기전지형을 결정짓는 또 다른 규준이 될 것이다.

  • PDF

한국어의 굴절 : 변이와 상호결합 (Flexion im Koreanischen - Allomorphie und Konkatenation -)

  • 김수라
    • 한국독어학회지:독어학
    • /
    • 제3집
    • /
    • pp.185-209
    • /
    • 2001
  • 필자는 이 논문에서 LA-MORPH 개념에 바탕을 둔 한국어 어형 분석시스템을 구현하기 위한 사전 작업으로서 한국어 동사의 활용 현상을 기술하였다. 한국어 동사 활용의 특징인 동사의 다형성은 크게 두 가지 측면으로 나눠서 관찰할 수 있다. 하나는 동사 및 어미의 변이형 형성과 관련된 측면이고 다른 하나는 이들 동사 및 어미 변이형의 상호 결합에 관련된 측면이다. 관찰의 출발점은 동사가 구체적으로 실현되어 나타나는 단어 형태이다. 규칙 활용 및 불규칙 활용 동사의 실현 형태를 어간 및 어미로 분절하고 이 작업을 통해 얻어진 동사 및 어미의 변이형과 그 기본형 사이에 존재하는 규칙성을 토대로 변이형 유도 모형을 유형별로 제시하였다. 어미를 어간과의 결합 유형에 따라 세 가지로 분류하고 각각에 대해 동사 변이형과의 결합 양상을 제시하였다. 한국어 정서법의 특성을 고려함으로써 동사 활용현상 중 특히 동사 변이형 및 어미 변이형들 간의 결합 양상 및 규칙 등 기존 문법 및 사전이 완전히 기술하지 못하는 부분을 보완할 수 있었다. 더 나아가 'ㄹ' 불규칙 활용, '으' 불규칙 활용 등 기존 문법에서 불규칙적이라고 간주되는 활용 현상에도 일정한 정도의 규칙성이 존재함을 보였다.

  • PDF

유사구조 및 유사의미 문장 생성 방법 (Semantic and Syntax Paraphrase Text Generation)

  • 서혜인;정상근;정지수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.162-166
    • /
    • 2020
  • 자연어 이해는 대화 인터페이스나 정보 추출 등에 활용되는 핵심 기술 중 하나이다. 최근 딥러닝을 활용한 데이터 기반 자연어 이해 연구가 많이 이루어지고 있으며, 이러한 연구에 있어서 데이터 확장은 매우 중요한 역할을 하게 된다. 본 연구는 자연어 이해영역에서의 말뭉치 혹은 데이터 확장에 있어서, 입력으로 주어진 문장과 문법구조 및 의미가 유사한 문장을 생성하는 새로운 방법을 제시한다. 이를 위해, 우리는 GPT를 이용하여 대량의 문장을 생성하고, 문장과 문장 사이의 문법구조 및 의미 거리 계산법을 제시하여, 이를 이용해 가장 유사하지만 새로운 문장을 생성하는 방법을 취한다. 한국어 말뭉치 Weather와 영어 말뭉치 Atis, Snips, M2M-Movie M2M-Reservation을 이용하여 제안방법이 효과적임을 확인하였다.

  • PDF

영어 시제와 상 (Tense and Aspect in English)

  • 김정오
    • 한국콘텐츠학회논문지
    • /
    • 제13권3호
    • /
    • pp.502-510
    • /
    • 2013
  • 본고에서는 시제의 일반적 정의와 상에 관한 개념들을 정리 하였다. 시제는 시간을 나타내는 동사의 굴절형'이고 따라서 시제는 문법범주의 하나로서 영어의 경우 현재시제와 과거시제를 인정하고 있다. 시제처럼 상을 문법범주로 인정한다면 그 기술 대상은 당연히 문법적 표현에 국한될 것이고 반대로 문법범주가 아닌 의미범주로 간주하면 문법적 표현은 물론이고 어휘적 표현까지 기술대상이 될 것이다. 따라서 상은 문법범주로서 명시되어 있고 특히 영어의 상은 진행형과 완료형의 두 형태로 국한하고 있다. 이 경우에 진행상(the progressive aspect)은 진행형, 완료상(the perfect aspect)은 완료형을 가리킨다. 제 2장에서는 여러 학자들의 시제에 관한 정의를 살펴보고 또한 각 시제의 용법들을 정의 하였다. 3장에서는 상의 정의를 제시하였고, 상에는 문법적, 의미적상이 있음을 여러 학자들의 정의를 통하여 알아보았다. 시제와 상은 어떻게 보면 간단한 문법 범주이나 시각을 좀더 달리하면 다양한 스펙트럼을 가진 범주로 볼 수 있다. 따라서 시제와 상의 정의가 명확해지면 영어교육의 피대상자가 언어를 이해하는데 많은 도움이 될 것이다. 더하여 다양한 영역에서 시제와 상에 관한 개념정의가 필요하고 더 많은 연구가 있어야 할 것으로 여겨진다.

영어 문법 실력 향상을 위한 인공지능 챗봇 활용에 관한 연구 (A Study on the Use of Artificial Intelligence Chatbots for Improving English Grammar Skills)

  • 김나영
    • 디지털융복합연구
    • /
    • 제17권8호
    • /
    • pp.37-46
    • /
    • 2019
  • 본 연구는 인공지능 챗봇을 활용한 채팅 활동이 국내 대학생의 영어 문법 능력 향상에 미치는 영향을 조사한 것으로, 챗봇과의 채팅을 통해 실험 참가자의 영어 문법 능력이 실제로 상승하는지에 대한 여부를 알아보는 데 그 목적이 있다. 총 16주 동안 70명의 참가자가 챗봇 그룹과 인간 그룹으로 나뉘어 본 연구에 참여하였고, 참여인원은 각각 36명, 34명이었다. 챗봇 그룹은 수업시간에 배운 내용을 주제로 챗봇과의 채팅에 참여하였고, 인간 그룹은 같은 반 학생들끼리 짝지어 채팅을 진행하였다. 채팅 활동의 효과를 파악하기 위하여 본 연구 시작 전과 종료 후, 사전 사후 영어 문법 시험을 실시하였고, 그룹 간 비교를 위하여 독립표본 t검증을 실시하였다. 주요 결과 및 시사점은 다음과 같다. 사전 사후 평가 분석 결과, 두 그룹 모두에서 영어 문법 능력이 유의미하게 상승한 것으로 나타나 채팅 활동의 효과를 증명하였다. 문법 능력 상승에 대한 그룹 간 차이 역시 통계적으로 유의미한 것으로 밝혀져 국내 영어 교육에 있어서 챗봇의 긍정적인 역할을 확인하였다. 본 연구는 영어 문법 능력 향상을 위한 인공지능 챗봇 활용에 대한 시사점을 제시하는데 그 의의를 갖는다.

과학 학습 언어의 문법적 특성을 고려한 초등학생의 과학적 의사소통 능력 고찰 (Investigation of Elementary Students' Scientific Communication Competence Considering Grammatical Features of Language in Science Learning)

  • 맹승호;이관희
    • 한국초등과학교육학회지:초등과학교육
    • /
    • 제41권1호
    • /
    • pp.30-43
    • /
    • 2022
  • 이 연구는 초등학생의 과학 수업 대화 및 글쓰기에 구현된 언어 표현의 국어 문법적 특성에 근거하여 그들의 과학적 의사소통 능력의 양상을 조사하였다. Brown et al. (2010)의 증거에 기반한 추론 프레임웍을 순환학습모형에 접목하여 작성한 수업안을 초등학교 5학년을 대상으로 "날씨와 우리 생활" 단원에 적용하였다. 수업 대화에 활발히 참여한 학생 8명의 대화 전사본과 그 학생들의 과학 글쓰기 문장을 연구 자료로 활용하였으며, 텍스트의 내용 및 논리 관계 분석 방법을 적용하여 문법적 특성을 조사하였다. 연구에 참여한 초등학생들은 데이터 분석, 증거 해석, 규칙 적용, 설명 구성 등의 맥락에서 사용되는 과학 언어의 문법적 구조와 일치하지 않는 언어 사용의 양상을 보였다. 그러나 부분적으로 명사화 방식의 문법적 은유를 사용하거나, 적절한 인과 관계의 문법 구조를 사용한 글쓰기 사례도 제시되었다. 교사의 교수법적 안내 발화나 교과서 텍스트의 문법 구조를 통해 학생들이 과학의 문화에서 사용되는 언어 활동의 양태를 경험하면 초등학생도 유사한 과학적 말하기와 글쓰기를 나타낼 수 있었다. 학생들이 증거에 기반한 추론에 근거한 과학지식 구성의 맥락에 적절한 언어 사용 이해와 이에 대한 문식 기능을 습득할 수 있게 하려면, 과학 학습에 관한 언어 사용 모델을 접할 기회를 충분히 제공해 주는 것이 필요함을 논의하였다.