• 제목/요약/키워드: 대용

검색결과 6,366건 처리시간 0.041초

담화에서의 어휘지도를 이용한 한국어 무형대용어 탐지 및 해결 말뭉치 생성 (Building a Korean Zero-Anaphora Detection and Resolution Corpus in Korean Discourse Using UWordMap)

  • 윤호;남궁영;박혁로;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.591-594
    • /
    • 2020
  • 담화에서 의미를 전달하는 데 문제가 없을 경우에는 문장성분을 생략하여 표현한다. 생략된 문장성분을 무형대용어(zero anaphora)라고 한다. 무형대용어를 복원하기 위해서는 무형대용어 탐지와 무형대용어 해결이 필요하다. 무형대용어 탐지란 문장 내에서 생략된 필수성분을 찾는 것이고, 무형대용어 해결이란 무형대용어에 알맞은 문장성분을 찾아내는 것이다. 본 논문에서는 담화에서의 무형대용어 탐지 및 해결을 위한 말뭉치 생성 방법을 제안한다. 먼저 기존의 세종 구어 말뭉치에서 어휘지도를 이용하여 무형대용어를 복원한다. 이를 위해 본 논문에서는 동형이의어 부착과 어휘지도를 이용해서 무형대용어를 복원하고 복원된 무형대용어에 대한 오류를 수정하고 그 선행어(antecedent)를 수동으로 결정함으로써 무형대용어 해결 말뭉치를 생성한다. 총 58,896 문장에서 126,720개의 무형대용어를 복원하였으며, 약 90%의 정확률을 보였다. 앞으로 심층학습 등의 방법을 활용하여 성능을 개선할 계획이다.

  • PDF

무형대용어 해결 기술을 이용한 백과사전 표제어 복원 (Restoring Encyclopedia Title Words Using a Zero Anaphora Resolution Technique)

  • 황민국;김영태;나동열;임수종
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.65-69
    • /
    • 2014
  • 한국어 문장의 경우 문맥상 추론이 가능하다면 용언의 격이 생략되는 현상 즉 무형대용어 (zero anaphora) 현상이 흔히 발생한다. 무형대용어를 채울 수 있는 선행어 (명사구)를 찾는 문제는 대용어 해결 (anaphora resolution) 문제와 같은 성격의 문제이다. 이러한 생략현상은 백과사전이나 위키피디아 등 백과사전류 문서에서도 자주 발생한다. 특히 선행어로 표제어가 가능한 경우 무형대용어 현상이 빈번히 발생한다. 백과사전류 문서는 질의응답 (QA) 시스템의 정답 추출 정보원으로 많이 이용되는데 생략된 표제어의 복원이 없다면 유용한 정보를 제공하기 어렵다. 본 논문에서는 생략된 표제어 복원을 위해 무형대용어의 해결을 기반으로 하는 시스템을 제안한다.

  • PDF

다중모드 대화 시스템에서 이중 캐시 모델의 센터링 알고리즘을 이용한 명사 대용어구 처리 (Resolution of Anaphoric Noun Phrases using a Centering Algorithm with a Dual Cache Model in a Multimodal Dialogue System)

  • 김학수;서정연
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권11호
    • /
    • pp.1133-1140
    • /
    • 2000
  • 다중모드 대화에서 나타나는 대용어는 언어만을 사용하는 대화에서 나타나는 것과 비교하여 매우 다른 형태와 특징을 가진다. 그것은 행위나 시각이 대용 행위로 사용될 수 있기 때문이다. 본 논문에서는 터치스크린 인터페이스를 이용한 홈쇼핑 가구점 영역의 다중모드 대화 시스템에서 나타나는 다양한 대용어의 처리 방법을 알아본다. 먼저, 화면 대용어와 참조 대용어를 정의하여 다양한 형태의 대용어를 분류한다. 그리고 각 대용어를 처리할 수 있는 두 가지의 일반적인 방법을 제안한다. 하나는 지시 행위를 수반하거나 생략한 채 발화되어 현재 화면에 나타나 있는 아이템을 참조하는 대용어를 처리하는 단순한 매핑 알고리즘이다. 다른 하나는 다중 모드 대화 시스템을 위해 워커(Walker)의 센터링 알고리즘을 확장한 이중 캐시 구조의 센터링 알고리즘이다. 확장된 센터링 알고리즘은 발화와시각 정보 그리고 화면 전환 시간을 유지할 수 있기 때문에 다중모드 대화에서 발생하는 다양한 대용어를 처리하기에 적합하다. 실험에서 제안된 시스템은 40개의 대화에서 나타난 402개의 대용어(발화당 0.54)중에서 387개를 처리하여 96.3%의 정확도를 보였다.

  • PDF

초고속 대용량 라우터 기술

  • 이형호;이규호;주성순
    • 정보와 통신
    • /
    • 제17권2호
    • /
    • pp.41-53
    • /
    • 2000
  • 본 고에서는 코아 백본 시스템으로 사용될 수 있는 수준으로 고성능, 대용량화한 고성능 라우터시스템을 초고속 대용량 라우터로 정의하고, 초고속 대용량 라우터에 포함되어야 할 기술을 분석하였다. 또한 현재 출시되었거나 출시 예정인 초고속 대용량 라우터 및 고성능 라우터시스템을 간단히 소개하였다.

  • PDF

중심어 주도 단방향 차트 파싱을 이용한 문맥 대용어 해결 (A Resolution of Text Anaphora using Unidirection Chart Parsing in HPSG)

  • 김정해;조준모;이상국;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.386-392
    • /
    • 1996
  • 대용어(anaphor)는 한 문장이나 문장과 문장간에 같은 요소가 되풀이될 때 언어 사용의 경제성(language economy)을 위하여 잉여적 표현을 제거하는 방법으로, 좀 더 간략한 언어 표현으로 대치하여 쓰는 현상이다. 따라서 본 논문에서는 중심어 주도의 단방향 활성 차트 파싱을 이용하여 한국어 문장내에서 야기되는 문맥 대용어의 해결 방안에 대해 제안한다. 이는 자연어를 입력으로 하는 실용목적의 자연어처리 시스템 구축에 있어 필수적으로 요구되는 부분이다. 대용어 해결을 위해 먼저 전산학적인 대용어 정의를 내리고, 대용어와 선행어사이의 의미 분류 및 대용어 해결 과정에 필요한 처리 조건등을 설정하였다 또한 파서내에 대용어 처리를 위해 사전내 자질구조로 ANAPMAJ, ANAPMIN, PERSON, NUM, INDEX자질을 추가하였고, 대용어 해결을 위한 알고리즘을 제안하였으며, 기존에 개발된 HPSG 파서가 처리하는 모든 문장에서 야기된 문맥 대용을 해결하여 파서이후의 응용 시스템에서 이용할 수 있는 내적 표현을 보다 분명하게 형식화하였다.

  • PDF

지칭의 대용어 이론과 이에 대한 비판들 (The Anaphoric Theory of Reference and Objections Against It)

  • 이병덕
    • 논리연구
    • /
    • 제18권2호
    • /
    • pp.217-241
    • /
    • 2015
  • 브랜덤은 지칭의 대용어 이론을 주장한다. 이 이론에 따르면 지칭은 언어적인 것들 사이의 대용어적 의존관계이지 결코 언어적인 것과 비언어적인 것 사이의 실질적 관계가 아니다. 또한 '지칭한다'는 '''라이프니츠"라고 지칭된 사람'과 같은 대용어적 간접 기술어구를 형성하기 위해 사용되는 대명사형성 조작어이다. 그런데 최근 보베는 이 이론에 대해 세 가지 비판들을 제기한다. 첫째, 대용어 이론은 일상적 기술어구와 대용어적 간접 기술어구를 반복 가능성 조건으로 구분한다. 그러나 이 조건은 대용어적 간접 기술어구들이 고유한 의미론적 범주를 형성한다고 주장할 수 있는 적절한 근거가 아니다. 둘째, '그'와 같은 대명사를 포함한 문장과 '''라이프니츠"라고 지칭된 사람'과 같은 대용어적 간접 기술어구를 포함한 문장은 양상적 위상에서 차이가 있다. 따라서 대용어적 간접 기술구들은 의미론적으로 전형적인 대용어들과 다르다. 셋째, 대용어 이론에 따르면 'a' 형태의 표현들과 이에 대응하는 '''a"에 의해 지칭되는 것'은 서로 대체될 수 있다. 그런데 대용어, 선행어 등과 같은 개념들 대신 동등함, 대체가능성 등과 같이 보다 일반적인 의미론적 개념들을 사용함으로써 동등한 주장을 할 수 있기 때문에 대용어 이론은 설명적으로 공허하다. 이 논문에서 필자는 보베의 비판들이 지칭의 대용어 이론에 큰 문젯거리가 아님을 주장한다. 이를 통해 지칭의 대용어 이론이 '지칭한다'에 관해 옳은 통찰을 주는 유망한 이론이라고 주장한다.

  • PDF

고내압$\cdot$대용량 GCT 사이리스터와 그 응용

  • 대한전기협회
    • 전기저널
    • /
    • 통권255호
    • /
    • pp.76-83
    • /
    • 1998
  • 대용량 파워일렉트로닉스기기의 보다 대용량화$\cdot$소형경량화 및 저손실화 요구에 응하기 위하여 조지전압 4.5KV, 가제어전류 4KA의 고내압$\cdot$대용량 CGT(gate commutated turn-off : 게이트 전류형 턴오프) 사이리스터를 개발하여 상품화하였다. GCT사이리스터는 대용량 파워일렉트로닉스기기의 키파트로서 폭넓게 사용되고 있는 GTO(Gate turn-off)사이리스터와 Turn-on동작이 같고 gto사이리스터의 이점이 저On전압특성을 그대로 갖는 한편 턴오프동작은 ''턴오프 게인이 1''인 새로운 원리에 기초하고 있으며 턴오프특성에서는 GTO사이리스터에 비해 다음과 같은 특징을 갖고있다. (1)GTO사이리스터응용에서 턴오프시 dv/dt를 억제하기 위하여 필요한 스나버회로가 없어도 턴오프동작이 가능하다. (2)축적시간을 종래 GTO사이리스터의 약 1/10로 저감할 수 있다. (3)게이트축적전하를 종래의 GTO사이리스터의 약 1/2로 저감할 수 있다. 이러한 턴오프특성에 의하여 GCT사이리스터는 대용량 파워 일렉트로니스기기에 스나버회로 손실발생의 억제에 의한 손실의 저감, 고속동작화, 직병렬접속 응용에 의한 대용량화의 용이성, 게이트구동회로의 용량을 반감하는 등 많은 메리트를 가져다 준다.

  • PDF

한국어 복합문의 영 대용어 해결 (Zero Anaphora Resolution in Korean Complex Sentences)

  • 김미진;강보영;구상옥;박미성;이상조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.694-696
    • /
    • 2002
  • 본 논문은 한국어 복합문에서의 영 대용어 해결을 위해 복합문 분해 알고리즘과 영 대용어 복원규칙을 제안하고, 해결 방법을 제시한다. 복합문 분해를 위해서는 복합문 구성에 관여하는 활용 어미들을 이용하고, 영 대용어 복원을 위해서는 생략될 때 적용된 통사규칙을 역으로 이용한다. 제안한 방법을 이용한 결과 전체 영 대용어 중 83.53%가 해결 가능하며 11.52%는 부분적으로 해결 가능하다.

  • PDF

Oracle 기반의 대용량 지도 서비스를 위한 XServer의 설계 및 구현 (Design and Implementation of the XServer for Oracle-based Mass Map Services)

  • 신중수;김동오;강홍구;박춘걸;한기준
    • 한국공간정보시스템학회:학술대회논문집
    • /
    • 한국공간정보시스템학회 2005년도 추계학술대회
    • /
    • pp.47-54
    • /
    • 2005
  • 정보 사회가 발전하고 정보의 활용이 늘어남에 따라 공간 데이타가 다양한 분야에서 활용되고 있다. 그리고, 공간 데이타가 널리 활용됨에 따라 ESRI와 같은 다양한 지리 정보 시스템(Geography Information System)이 발전하게 되었다. 그러나, 기존의 지리 정보 시스템은 다양한 분야에서의 활용을 위해 많은 기능을 제공함으로 인해 일반적으로 대용량 공간 데이타에 대한 검색이 비효율적이다. 특히, 네트워크 환경이 발전하고 컴퓨팅 파워가 증가함에 따라 점차 대용량의 지도 서비스를 제공하는 분야에서 기존의 지리 정보 시스템 적용 시공간 데이타 검색 속도가 저하되는 문제가 발생한다. 따라서, 본 논문에서는 안정적인 상용 DBMS인 Oracle을 기반으로 대용량 공간 데이터를 효율적으로 검색할 수 있는 Oracle 기반의 대용량 지도 서비스를 위한 XServer를 설계 및 개발하였다. XServer는 다양한 클라이언트의 질의를 효율적으로 처리하기 위한 질의 처리 관리자, 대용량의 공간 데이타를 빠르게 검색하기 위한 공간 인덱스 관리자 및 데이타 버퍼 관리자, 대용량의 공간 데이타를 안정적으로 저장하기 위해서 Shape 화일에서 추출한 공간 데이타를 Oracle에 저장 및 관리하기 위한 수입/수출 관리자와 DB 관리자로 구성되어있다. 마지막으로, 본 연구에서 개발한 Oracle 기반의 대용량 지도 서비스를 위한 XServer와 Oracle Spatial을 비교함으로써 기능을 검증하고 성능의 우수함을 입증하였다.

  • PDF

GIS에서 대용량 파일을 위한 대용량 공유 디스크 파일시스템의 메타데이터 구조 (Metadata Structrues of Huge Shared Disk File System for Large Files in GIS)

  • 김경배;이용주;박춘서;신범주
    • Spatial Information Research
    • /
    • 제10권1호
    • /
    • pp.93-106
    • /
    • 2002
  • 기존의 과일시스템은 소형의 과일을 효과적으로 저장하고 관리하기 위해서 설계되었다. 따라서 기존의 유닉스나 리눅스와 같은 과일 시스템은 지리정보시스템에서 발생되는 대용량의 지리정보 데이터를 효과적으로 처리하는 것은 어렵다. 본 논문에서는 지리정보시스템에서 발생되는 기가에서 테라바이트의 대용량 데이터 파일을 저장하기 위한 효과적인 메타데이터 구조 및 관리 기법을 제안한다. 제안된 기법에서는 대용량 파일을 저장하기 위해 동적 다단계 기법을 사용하고 있으며, 대용량의 파일 시스템을 제공하기 위하여 동적 비트맵 기법을 사용한다 본 논문에서 제안된 기법은 SAN 환경에서의 대용량 공유 디스크 파일시스템인 SANtopia에서 구현되었다.

  • PDF