• 제목/요약/키워드: 대용어해결

검색결과 36건 처리시간 0.023초

지동통역에서의 대화체 기계번역을 위한 문맥의 구축과 이용 (Contet Construction and Tt's Using for Dialogue Machine Translation in Automatic Interpreting Telephony)

  • 이재원
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.80-85
    • /
    • 1994
  • 자동통역에서의 대화체 기계번역은 일반적인 문어체 문장 번여고가는 다른 몇가지 특징을 고려하여야 한다. 첫째, 자동통역에서의 기계번역은 음성인식의 결과를 번역하는 부분으로, 하나의 문장이 아닌 다중 입력을 받아 이 중 가장 올바른 문장을 번역하여야 한다. 둘째, 대화체 문장에서는 일반적으로 생략을 포함하는 단편적인 발화나 대용어의 사용빈도가 많다. 그러나, 이러한 현상은 언어마다 다소 다르게 사용되기 때문에 이들에 대한 올바른 해석을 한 후 번역하는 것이 필요하다. 대화체 기계번역이 이러한 문제점들을 해결하기 위해서는 문맥정보를 필요로 한다. 대화는 상호간 밀접한 관련성을 가지고 진행되기 때문이다. 이에 본 논문에서는 담화분석을 통해 올바르게 구축하고, 이 정보를 이용하여 앞에서 언급한 문제점들을 해결하기 위한 방법론에 대해 논하고자 한다.

  • PDF

한국어 내포문을 단문으로 분리하는 시스템의 구현 (Implementation of the System Dividing Simple Sentences from Embedded Sentence in Korean)

  • 김광진;송영훈;이정현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.25-34
    • /
    • 1993
  • 한국어의 내포문은 컴퓨터에 의한 자연어 이해 및 처리에 많은 어려운 문제점의 원인이 되고 있다. 이러한 문제점을 해결하기 위하여 본 논문에서는 한국어 내포문을 단문으로 분리하는 시스템을 설계 및 구현한다. 내포문에서 생략성분을 효율적으로 복원하기 위해 안긴문장의 생략된 부분을 통제할 수 있도록 용언을 유형별로 분류한다. 내포문을 단문으로 분리할 때 내포문에 비해 분리된 단문의 의미가 결여 될 수 있다. 이러한 문제점을 해결하기 위해 대용어를 첨가시키는 방법을 사용한다. 그리고 명사 의미표지로부터 용언의 하위범주의미역으로의 변환 테이블을 구성하여 문맥적으로 틀린 문장을 검색, 처리할 수 있는 방법을 제안한다.

  • PDF

객체지향형 교육용프로그래밍언어 두리틀의 다중 예약어 지원 체계 (Multi-reserved Words Supporting System for Object-Oriented Educational Programming Language "Dolittle")

  • 최해심;권대용;김형신;염용철;유승욱;이원규
    • 컴퓨터교육학회논문지
    • /
    • 제8권2호
    • /
    • pp.23-32
    • /
    • 2005
  • 교육용프로그래밍언어는 학습자에게 친근감 있고 사용이 편리하고 간단해야 한다. 객체지향형 교육용프로그래밍언어 두리틀(Dolittle)은 국어 어순에 따른 한글 프로그래밍 방식을 지원하지만 명령어가 초 중등학생들에게 낯설거나 다양한 학습상황에 맞지 않아 프로그래밍과정의 사고흐름을 표현하는 데에 한계가 있었다. 본 연구는 한글 교육용프로그래밍 언어인 두리틀에서 학습자가 친숙한 명령어로 프로그래밍을 작성할 수 있도록 융통성 있는 예약어 집합을 제공하여 학습자의 수준, 기호, 적용분야에 따라 적합한 명령어집합을 이용하여 프로그램을 작성할 수 있도록 말글의 특징을 살린 1:n 다중예약어 집합을 제시한다. 연구의 결과 다중예약어가 적용된 두리틀로 프로그램을 작성할 때 학습자는 예약어에 구애받지 않고 문제해결을 위한 사고에 집중하여 자연스럽게 개념을 학습할 수 있음을 확인하였다.

  • PDF

자아성찰 프로젝트 "Who?" (Who Am I ?)

  • 김대용;박지인
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2013년도 제47차 동계학술대회논문집 21권1호
    • /
    • pp.329-331
    • /
    • 2013
  • 본 어플은 사회적 문제를 기술적 패러다임에 맞춰 해결하고자 기획되었다. 일반적으로 자기 자신의 문제점보다 다른 사람의 문제점이 더 쉽게 보이고 인식하게 된다. 작은 문제로 볼 수 있지만 최근 사회적 문제로 발생하고 있는 "따돌림" 문제는 인간의 존엄성마저 잃어버리게 하고 있다. 친구들의 문제뿐 아니라 부모와 자식, 형제, 자매 등 가족들과의 의사 단절 등으로 확대되고 있으며, 이런 문제를 해결하기위하여 많은 노력들을 하고 있지만, 실제 치료의 시간도 오래 걸리고 많은 금전도 필요하게 된다. 이렇기에 최근 트랜드의 축이 되고 있는 "스마트폰"을 활용하여 시간적, 공간적 제약을 최소화하고 더불어 수익성을 고려하여 "WHO"의 어플을 기획하게 되었다. 특히, 사후문제 처리가 아닌 "예방"의 목적으로 상대방의 문제점을 파악하는 것과 자신의 문제점을 인지하고 해결하는데 중점을 두었다. 내가 아닌 지인이 나에 대한 평가를 보다 객관적인 평가를 하기 위하여 대상자를 자신의 스마트폰 주소록에 한정하였으며, 악위적인 댓글 등을 최소화하기 위하여 금지어, 입력글자 개수제한 등을 추가하였다. 평점을 줄 수 있게 하여 상대적이고 객관적인 점수로 자신의 평점을 알 수 있게 하였고 보다 빠른 인지를 위하여 별모양의 그래픽을 사용하여 평가하도록 하였다. 특히, 본 어플은 설치자만이 사용할 수 있기 때문에 주소록에 있는 명단에서 "초대하기"기능으로 설치를 유도하였다. 본 어플을 개발 후 2주간의 테스트를 통하여 어플의 기대효과에 대한 가능성에 대해 확인할 수 있었으며 추가로 개발될 어플에는 분야별 항목을 추가하여 보다 섬세한 자아평가를 가능하도록 기획하고 있다.

  • PDF

맵리듀스를 이용한 통계적 접근의 감성 분류 (Statistical Approach to Sentiment Classification using MapReduce)

  • 강문수;백승희;최영식
    • 감성과학
    • /
    • 제15권4호
    • /
    • pp.425-440
    • /
    • 2012
  • 인터넷의 규모가 커지면서 주관적인 데이터가 증가하였다. 이에 주관적인 데이터를 자동으로 분류할 필요가 생겼다. 감성 분류는 데이터를 여러 감성 종류에 따라 나누는 것을 말한다. 감성 분류 연구는 크게 자연어 처리와 감성어 사전 구축을 중심으로 이루어져 왔다. 이전의 감성 분류 연구는 자연어 처리 과정에서 형태소 분석이 제대로 이루어지지 않는 문제와 감성어 사전구축 시 등록할 단어를 선별하고 단어의 감성 정도를 정하는 데에 명확한 기준을 정하기 힘든 문제가 있다. 이러한 어려움을 해결하기 위하여 감성 분류에 대용량 데이터와 통계적 접근의 조합을 제안한다. 본 논문에서 제안하는 방법은 단어의 의미를 찾는 대신 수많은 데이터에서 등장하는 표현들의 통계치를 이용하여 감성 판단을 하는 것이다. 이러한 접근은 자연어 처리 알고리즘에 의존하던 이전 연구와 달리 데이터에 집중한다. 대용량 데이터 처리를 위해 하둡과 맵리듀스를 이용한다.

  • PDF

Coreference Resolution을 위한 3인칭 대명사의 선행사 결정 규칙 (Antecedent Decision Rules of Personal Pronouns for Coreference Resolution)

  • 강승식;윤보현;우종우
    • 정보처리학회논문지B
    • /
    • 제11B권2호
    • /
    • pp.227-232
    • /
    • 2004
  • 정보 검색 시스템에서 문서의 내용을 대표하는 용어를 추출하거나 정보 추출 및 텍스트 마이닝에서 특정 정보만을 추출하려면 고유명사에 대한 대용어 문제가 해결되어야 한다. 대용어 해소 문제는 인칭 명사에 대한 대명사의 선행사 결정 문제가 대표적이다. 본 논문에서는 한국어에서 문서의 내용을 보다 정확히 분석하기 위해 3인칭 대명사 “그/그녀/그들/그녀들”의 선행사를 결정하는 방법을 제안한다. 일반적으로 3인칭 대명사의 선행사는 현재 문장 또는 이전 문장의 주어인 경우가 많고, 또한 3인칭 대명사가 2회 이상 반복되는 경우가 자주 발생한다. 이러한 특성을 이용하여 현재 문장과 이전 문장에 출현한 인칭 명사들 중에서 선행사로 사용되는 경우를 조사하여 선행사 결정 규칙을 발견하였다. 이 경험 규칙은 3인칭 대명사의 격에 따라 조금씩 달라지기 때문에 대명사의 격에 따라 주격, 목적격, 소유격으로 구분하여 기술하였다. 제안한 방법의 타당성을 검증하기 위하여 신문 기사의 정치 관련 문서에서 대명사의 격에 따라 100개씩 총 300개의 실험 대상을 선정하였으며, 실험 결과로 3인칭 대명사의 선행사 결정 정확도는 재현율이 79.0%, 정확률이 86.8%로 나타났다.

한국어 문장내 체언류 조응대용어의 해결방안 (A method of the the substantives anaphora resolution in korean intra-sentential)

  • 김정해;이상국;이상조
    • 전자공학회논문지B
    • /
    • 제33B권4호
    • /
    • pp.183-190
    • /
    • 1996
  • The purpose of this paper is to show that the solutions of the problem for the anaphor ocured in korean senstence, by means of one-direction activated chart parsing leaded by a head. This is the phenomenon frequently occured in the conversation of natural language and the part necessarily required in the construction of natural language processing system for the practical use. To solve the problem of anaphor in the korean language, we have computerized definition and the management conditions necessary in the semantic classification between the anaphor and its antecedent and index are added in the feature structure in lexicon. To deal with anaphor in parser and algorithm is proposed to solve the problem for anaphor. The range of management of pareser is extended to solve the problem for anaphor of the indeclinable parts of speech in korean occured in all the sentences the parser HPSG developed previously manages.

  • PDF

객체지향 기법을 이용한 시소러스 관리 시스템의 개발에 관한 연구 (Development of a Thesaurus Management System based on the Object-Oriented Technique)

  • 박계숙
    • 정보관리학회지
    • /
    • 제13권2호
    • /
    • pp.5-18
    • /
    • 1996
  • 시소러스를 구축하기 위해서는 새로운 단어의 입력, 수정, 삭제 및 단어간 관계생성 등의 동적인 변하에 신속 정확히 대용할 수 있도록 시소러스 관리 시스템이 개발되어야 한다. 본 연구에서 개발한 시소러스 관리 시스템은 객체지향적 구조로 데이터베이스를 설계하였으며, GUI화면을 제공하여 이용자 인터페이스를 향상시켰다. 또한 시소러스를 구축하는데 있어서 동일한 영문 용어의 다양한 한글표기로 인한 정보검색 효율 저하 문제를 해결하기 위해 동의어의 확장에 역점을 두었다.

  • PDF

정보검색 표준 프로토콜 Z39.50 서버의 설계 및 구현 (Design and Implementation of Information Retrieval Standard Protocol Z39.50 Server)

  • 손충범;송석일;최길성;조기형;유재수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제5권1호
    • /
    • pp.99-108
    • /
    • 1999
  • 정보검색 프로토콜 Z39.50은 시스템마다 다른 환경의 차이에서 생긴 정보검색상의 문제점을 해결하기 위해 제시되었다. 본 논문에서는 Z39.50 프로토콜 버전 3의 기능을 지원하는 Z39.50서버를 설계하고 구현한다. 또한 상용검색엔진인 Verity 와 연동하여 하나의 완전한 정보검색 시스템인 Zverity를 구축한다. 구현한 시스템은 버전 2의 기본적인 서비스 외에 검색어를 조회하는 스캔서비스, 대용량의 데이터를 전송하기 위한 분할 서비스, 서버의 구현정보를 제공하는 설명 기능을 지원한다.

문학 텍스트의 머신러닝 활용방안 연구 - 화자 지시어 분석을 위한 규칙 선별을 중심으로 - (A Study on the Application of Machine Learning in Literary Texts - Focusing on Rule Selection for Speaker Directive Analysis -)

  • 권경아;고일주;이인성
    • 문화기술의 융합
    • /
    • 제7권4호
    • /
    • pp.313-323
    • /
    • 2021
  • 본 연구는 문학 텍스트를 활용한 머신러닝 기반 가상 캐릭터(virtual character) 구현을 위해 텍스트 내의 화자 지시어가 지시하는 화자를 판별할 수 있는 규칙을 제안하는 것을 목적한다. 선행 연구에서, 본 연구자는 문학 텍스트를 기계 학습에 적용할 때, 별칭, 별명, 대명사와 같은 화자 지시어들이 특정한 분석 규칙 없이는 기계가 화자를 제대로 파악하지 못하여 학습을 제대로 수행할 수 없다는 점을 발견하였다. 본 연구는 이를 해결하는 방법으로 '화자 지시어(대명사 포함)가 지시하는 화자를 찾는 9가지 규칙'을 소개한다: 위치, 거리, 대명사, 가주어/진주어, 인용문, 화자수, 등장인물 외 지시, 복합 단어 지시, 화자명 분산이 그것이다. 문학 텍스트 내의 등장인물을 가상 캐릭터로 활용하기 위해서는 기계가 이해할 수 있는 방식으로 학습 텍스트를 제공해야 한다. 본 연구자는 본 논문을 통해 제안한 화자 찾기 규칙이 문학 텍스트를 머신러닝에 활용할 때 발생할 수 있는 시행착오를 줄이고, 원활한 학습을 수행하게 하여 질적으로 우수한 학습 결과를 산출할 수 있게 해 줄 것으로 기대한다.