• 제목/요약/키워드: syntactic

검색결과 717건 처리시간 0.035초

대화행위의 연쇄관계와 대화흐름에 대하여 -[일정협의 대화] 중심으로 (On the Sequences of Dialogue Acts and the Dialogue Flows-w.r.t. the appointment scheduling dialogues)

  • 박혜은;이민행
    • 인지과학
    • /
    • 제10권2호
    • /
    • pp.27-34
    • /
    • 1999
  • 이 연구의 목적은 대화행위 개념을 이용하여 독일어 일정협의 대화에서 나타나는 대화의 일반적인 흐름을 밝히는 데에 있다. 이 연구의 기본가정은 대화행위 개념의 도입이 자동번역시스템의 성능향상에 기여한다는 것이다. 그 이유는 통사적인 분석이나 의미적인 분석이 해결하지 못하는 문제들을, 문맥지식을 활용하여 해결하는 데에 있어 대화행위개념이 매우 유용하기 때문이다. 이 대화행위 개념의 하위분류작업은 독일에서 수행되고 있는 VERBMOBIL 프로젝트에서 이루어진 것이다. 본 연구에서는 전문가들에 의해 전사된 실제 대화 자료들을 대화행위의 개념을 활용하여 분석하고, 하나의 대화차례 안에서 발생하는 대화행위들의 연쇄와 각각의 대화차례 사이에서 발생하는 대화행위 연쇄를 조사했다. 여기서 분석대상으로 삼은 전사자료가 다른 연구에서 제시된 전사 자료와는 다소 차이를 보였기 때문에, 본 연구에서는 연쇄 개념을 대화차례사이에 뿐만 아니라 하나의 대화차례 내부까지 적용시켰다. 그리고 대화행위들간의 연쇄관계를 조사함으로써‘일정협의 대화’의 대화 흐름 도를 도출하였다. 이 대화 흐름 도는 통계분석 절차를 통해 가장 빈도수가 높게나온 대화행위 연쇄들을 토대로 만들어진 모형이기 때문에, 일상적인‘일정협의 대화’에 대한 대표성을 갖는다고 볼 수 있다.

  • PDF

단음절 단어의 사건 관련 전위 (Event-Related Potentials of a Monosyllabic Word)

  • 민병경;김명선;윤탁;김재진;권준수
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2002년도 춘계학술대회
    • /
    • pp.211-215
    • /
    • 2002
  • 본 실험은 종합적 인지과정을 추론할 수 있는 결합 문제(binding problem)를 언어적인지 과정을 통해 알아 본 실험으로, 총 10 명(남:61여:4, 평균나이:24.40 $\pm$ 1.35)의 정상군을 대상으로, 4개의 음소로 이루어진 단음절 명사를 목표 자극(target stimulus)으로 하고, 4개 음소의 임의적인 조합으로서 글자를 이루지 못하는 비목표 자극(non-target stimulus)을, 각각 200 회와 800 회씩 시각적으로 0.5초씩 무작위로 제시하여 128 채널 고밀도 사건관련전위(ERP)를 측정하였다. 이번 실험 결과의 주요 특징은 글자가 아닌 비목표 자극보다 글자인 목표 자극에서 두드러지게 나타난 두정엽 부근의 P500 과 N900 이라고 할 수 있다. 자극 제시 비율의 차이에서 오는 oddball 효과로 인한 기존 P300 의 인지적 의미를 이번 결과의 P500 이 함축한다고 볼 수 있으며, 단음절 단어를 인지할 때, 글자임을 인식하는 순간은 의미적인지 과정이 진행되었다기보다 그 글자의 형태만으로 낯익은 글자인지를 분간하는 것으로 보인다 따라서, 이 경우 기존 언어 실험에 자주 등장하던 의미론적 peak 인 N400 은 보이지 않고, 곧바로 형태적이고, 통사적(syntactic)인 인지 처리 과정인 P500이 나타났다고 해석할 수 있다. 하지만, 이번 실험에서는 N400 대신에 N900 이 나타났다. 이 결과는 이번 ERP 실험과 병행된 프로토콜 분석을 통해, 피험자가 자극 제시 후, 약 900ms 정도에, 이미 제시되고 사라진 글자 자극을 다시 한번 떠올리는 인지 과정이 일어난다는 점과 관련 지어 해석하면, 기존에 의미적(semantic) 인지 과정으로만 해석했던 negative-peak 를 생각(thinking)과 같은 내재적인지 과정(internal cognitive process)으로 확장하여 일반화하는 추론도 생각해 볼 수 있다. 요컨대, 언어인지를 통한 이번 실험을 통해, 뇌파에서 검출되는 negative-peak 은 internal cognitive process로 추측되고, positive-peak 는 external cognitive process 라고 생각된다. 덧붙여, 유의해서 볼 점은 각 peak-topology 에서 Cz 의 진폭이 Fz 보다 크게 나온 점과, 일반적으로 언어 기능을 담당한다는 좌측 측두엽(T7)이 우측(T8)보다 통계적으로 더 유의미한 차이를 보였다는 점등이다.

  • PDF

감정 온톨로지의 구축을 위한 구성요소 분석 (Component Analysis for Constructing an Emotion Ontology)

  • 윤애선;권혁철
    • 인지과학
    • /
    • 제21권1호
    • /
    • pp.157-175
    • /
    • 2010
  • 의사소통에서 대화자 간 감정의 이해는 메시지의 내용만큼이나 중요하다. 비언어적 요소에 의해 감정에 관한 더 많은 정보가 전달되고 있기는 하지만, 텍스트에도 화자의 감정을 나타내는 언어적 표지가 다양하고 풍부하게 녹아들어 있다. 본 연구의 목적은 인간언어공학에 활용할 수 있는 감정 온톨로지를 구축할 수 있도록 그 구성요소를 분석하는 데 있다. 텍스트 기반 감정 처리 분야의 선행 연구가 감정을 분류하고, 각 감정의 서술적 어휘 목록을 작성하고, 이를 텍스트에서 검색함으로써, 추출된 감정의 정확도가 높지 않았다. 이에 비해, 본 연구에서 제안하는 감정 온톨로지는 다음과 같은 장점이 있다. 첫째, 감정 표현의 범주를 기술 대상과 방식에 따라 6개 범주로 분류하고, 이들 간 상호 대응관계를 설정함으로써, 멀티모달 환경에 적용할 수 있다. 둘째, 세분화된 감정을 분류할 수 있되, 감정 간 차별성을 가질 수 있도록 24개의 감정 명세를 선별하고, 더 섬세하게 감정을 분류할 수 있는 속성으로 강도와 극성을 설정하였다. 셋째, 텍스트에 나타난 감정 표현을 명시적으로 구분할 수 있도록, 경험자 기술 대상과 방식 언어적 자질에 관한 속성을 도입하였다. 넷째, 본 연구의 감정분류는 Plutchik의 분류와 호환성을 갖고 있으며, 언어적 요소의 기술에서 국제표준의 태그세트를 수용함으로써, 다국어 처리에 활용을 극대화할 수 있도록 고려했다.

  • PDF

규칙 정보를 이용한 은행 전표 상의 필기 한글 금액 인식 (Handwritten Korean Amounts Recognition in Bank Slips using Rule Information)

  • 지태창;이현진;김은진;이일병
    • 한국정보처리학회논문지
    • /
    • 제7권8호
    • /
    • pp.2400-2410
    • /
    • 2000
  • 한글 인식에 관한 기존의 연구는 한글 낱자 인식에 치우쳐 왔고, 실제 문서 인식 시스템 개발을 위한 연구는 거의 이루어지지 않았다. 그래서, 본 논문에서는 인식된 문자열의 오류 교정에 관한 연구로서 한글 금액열 인식기를 개발하였다. 한글 낱자 인식에서 문제가 되는 부분은 데이터의 방대함 때문에 발생한다. 컴퓨터상에서 표현될 수 있는 한글 낱자의 개수는 2000여 자 이상이다. 따라서, 기존의 연구들은 이러한 문제점을 해결하기 위해서 실생활에서 많이 쓰이는 낱자에 대해서만 실험을 했다. 하지만, 실험 대상 낱자의 개수를 1000여 자 정도로 줄였어도, 여전히 80%대 이하의 저조한 인식률을 보이고 있다. 이렇게 인식률이 저조한 범용 한글 낱자 인식기를 한글 금액 인식이라는 제한된 상황에서 사용하는 것은 적합하지 않다. 따라서, 본 연구에서는 한글 금액에 사용되는 16자의 한글 낱자만 인식할 수 있는 인식기를 제안하였다. 제안한 한글 낱자 인식기는 통계적 인식기를 사용한 다중 인식기 형태로 만들었고, 이를 통해 개별적인 특징으로 인한 인식률의 저하를 방지할 수 있다. 금액의 후처리는 한글 금액열 내에 내재되어 있는 금액에 대한 구조적인 규칙 정보를 이용하였다. 이 규칙을 이용하여 한글 금액의 후처리는 한글 금액열 내에 내재되어 있는 금액애 대한 구조적인 규칙 정보를 이용하였다. 이규칙을 이용하여 한글 금액의 인식 단위에 대한 인식 결과의 오류 보정을 할 수 있다. 실험 결과 제안한 한글 낱자 인식기의 1후보까지 인식률은 95.49%였고, 4후보까지 인식률은 99.72%였다. 그리고, 후처리기의 처리를 거친 금액열에 대해서는 신뢰도가 96.42%였다. 본 논문에서는 사용된 낱자의 개수가 적고, 구조안에 규칙 정보가 존재하는 한글 문자열의 경우에 제한된 글자를 인식하는 낱자 인식기와 오류를 교정할 수 있는 후처리기로 문자열 인식의 신뢰도를 향상시킬수 있는 방법을 제안하였다.

  • PDF

PPEditor: 한국어 의존구조 부착을 위한 반자동 말뭉치 구축 도구 (PPEditor: Semi-Automatic Annotation Tool for Korean Dependency Structure)

  • 김재훈;박은진
    • 정보처리학회논문지B
    • /
    • 제13B권1호
    • /
    • pp.63-70
    • /
    • 2006
  • 말뭉치(corpus)는 많은 언어 정보를 포함하고 있으며, 언어처리 및 계산언어학 분야에서 다양한 용도로 사용되고 있다. 그러나 말뭉치에 언어 정보를 부착하는 데는 많은 시간과 인력이 소요된다. 이 문제를 완화시키기 위해서 말뭉치 구축 도구가 반드시 요구된다. 본 논문에서는 한국어 의존구조 부착을 위한 말뭉치 구축 도구의 설계 및 구현에 관해서 기술한다. 가장 이상적인 방법은 주석자가 전혀 개입하지 않고, 말뭉치를 구축하는 것이나 이것은 사실상 불가능하다. 따라서 대부분의 말뭉치 구축 도구는 반자동으로 구성되어 있으며, 본 논문에서 제안된 도구도 반자동이다. 제안된 도구는 언어 분석기의 분석 결과에 내포된 오류를 효과적으로 수정할 수 있고, 또한 가능한 한 반복적인 작업을 피할 수 있으며 쉽게 사용할 수 있도록 인터페이스를 설계하였다. 제안된 시스템을 이용해서 20어절 이상의 1만 문장에 의존구조를 부착해 보았다. 잘 훈련된 8명의 주석자들이 매일 4시간씩 2개월 동안 구축하였으며, 그 결과는 정확하고 일관성 있는 말뭉치를 구축할 수 있었으며, 작업 시간과 인력도 크게 줄일 수 있었다.

VHDL 컴파일러 후반부의 VHDL-to-C 사상에 관한 설계 및 구현 (A design and implementation of VHDL-to-C mapping in the VHDL compiler back-end)

  • 공진흥;고형일
    • 전자공학회논문지C
    • /
    • 제35C권12호
    • /
    • pp.1-12
    • /
    • 1998
  • 본 논문은 VHDL 컴파일러 시스템에서 후반부의 VHDL-to-C 사상 과정을 설계 및 구현한 연구에 관하여 기술한다. 컴파일러 전반부가 VHDL 설계 프로그램으로부터 발생시킨 중간 형식의 분석 데이터는 컴파일러 후반부의 VHDL-to-C 사상을 통해서 VHDL 어의가 구현된 C 코드 모델로 변환된다. 기본적으로 VHDL 어의를 표현하기 위한 C 코드 모델은 선언부, 구축부, 초기화부 및 실행부의 4개 기능적 템플릿으로 구성된다. 사상 과정에서는 사상 단위와 기능분류에 따른 129개 C 사상 템플릿과 반복적 알고리듬을 통하여 터미널 정보를 이용해서 C 코드를 생성하게 된다. C 프로그램의 구성은 코드를 직접 템플릿으로 출력하거나, 생성된 코드를 데이터큐에 중간 저장시키고 상위사상 결과에 결합시켜서 이루어진다. 설계 및 구현된 VHDL-to-C 사상기는 Validation Suite의 96% VHDL 구문 구조에 대해서 100% C 코드 모델을 완벽하게 사상할 수 있음을 보였다. 또한 VHDL-to-C 사상의 성능에서 생성된 코드의 메모리 오버헤드가 해석기 방식보다는 작고 직접코드 방식보다는 크지만 VHDL 프로그램 크기에 대해서 완만한 증가 경향을 보이고 있으며, 사상처리 시간에서는 사상 메카니즘의 구현에서 최적화 및 개선이 요구됨을 나타내었다.

  • PDF

지역 및 전역 의미집합을 이용한 온톨로지 병합 및 정렬 알고리즘 (An Algorithm for Ontology Merging and Alignment using Local and Global Semantic Set)

  • 김재홍;이상조
    • 전자공학회논문지CI
    • /
    • 제41권4호
    • /
    • pp.23-30
    • /
    • 2004
  • 기존 웹의 단점을 보완하기 위해 시맨틱 웹 개념이 제안되었고, 시맨틱 웹에서 중요한 역할을 하는 온톨로지는 분산 독립된 형태로 개발되는 특성으로 인해 동일한 도메인에 대해 중복 저작될 수 있는 문제점을 가지고 있다. 따라서 온톨로지의 공유와 재사용이 중요한 문제로 부각되고 있으며, 온톨로지 병합 덴 정렬이 한 해결책이 될 수 있다. 현재까지 제안된 반자동 방식의 온톨로지 병합 및 정렬 알고리즘은 온톨로지 전체에서 가지는 의미정보가 아닌 지역적 구문정보만을 이용하고, 반자동 작업 특징으로 인해 온톨로지 엔지니어에게는 지루한 작업이 되어 결과의 품질이 낮아질 수 있다는 단점이 있다. 본 논문에서는 지역 및 전역 의미집합 개념을 이용하여 이러한 단점을 개선한 온톨로지 병합 및 정렬 알고리즘을 제안하였다. 제안된 알고리즘을 구현하여 OWL 언어로 작성된 온톨로지에 대해 실험한 결과 91%의 정확도를 보였다. 본 논문에서 제안하는 알고리즘을 이용하여 온톨로지 병합 및 정렬 작업을 수행하면 온톨로지 공유 및 재활용률을 높이고, 기존 온톨로지를 활용한 새로운 온톨로지의 저작시간도 단축시킬 수 있을 것으로 기대된다. 또한, 온톨로지 매핑등 온톨로지들 간의 의미 정보 교환이 필요한 다른 어떤 분야에도 쉽게 적용이 가능할 것으로 기대된다.

상황정보를 기반으로 한 서비스 관리 시스템 설계 (Design of Service Management System based on Context Information)

  • 이승근;임기욱;이정현
    • 전자공학회논문지CI
    • /
    • 제42권5호
    • /
    • pp.49-58
    • /
    • 2005
  • 상황 인식 기반 편재형 컴퓨팅(Pervasive Computing) 환경의 다양한 응용에 관심이 증대되고 있으며, 개발자들이 상황인식 응용을 보다 쉽게 개발할 수 있도록 지원하는 개발환경들에 대한 연구가 활발하게 이루어지고 있다. 서비스 관리 시스템은 상황 인식 응용이 필요로 하는 서비스를 찾아서 제공해 주는 시스템으로 상황 인식 응용 개발환경에 필수적인 부분이다. 그러나, 기존 연구에서는 단순 구문 매칭이나 서비스 타입 등의 제한적인 온톨로지 기반 매칭을 사용하고 있으며 상황 정보에 대한 고려가 없다. 또한, 사용자가 원하는 서비스가 없는 경우 기존 서비스들을 조합해서 이용할 수 있도록 할 수 있어야 한다. 이 논문에서는 상황 정보 기반 서비스 관리 시스템을 제안한다. 제안하는 시스템은 온톨로지를 이용한 의미적 매칭 방법과 상황 정보를 고려함으로써 보다 정확한 검색이 가능하게 하고, 서비스 조합 기능을 제공함으로써 사용자가 원하는 서비스가 서비스 레지스트리에 없는 경우에는 기존 서비스들을 조합하는 서비스 리스트를 제공할 수 있다. 설계한 시스템을 평가하기 위해서 서비스 질의를 위한 프로토타입을 개발하였으며 이를 통해서 상황 정보 기반 검색과 서비스 조합이 적절하게 지원함을 보였다.

문법화와 코퍼스의 관점에서 본 영어 분리부정사 통사구조 (Syntactic Structure of English Split Infinitives from the Perspectives of Grammaticalization and Corpus)

  • 김양순
    • 문화기술의 융합
    • /
    • 제6권3호
    • /
    • pp.245-251
    • /
    • 2020
  • 영어의 분리부정사구문을 통시적 연구인 문법화의 관점에서 중세영어이후 출현 동기를 살펴보고 COHA, COCA와 같은 코퍼스에 기반하여 주로 미국영어에 나타나는 현재영어(PDE)의 분리부정사의 정당성을 논의하는 것이 연구의 목표이다. 중세영어 이전에는 비문법적이었던 부정사 첨사인 to와 원형동사 사이에 부사 등이 위치하는 [to + 부사 + 동사] 형태의 분리부정사가 어떻게 현재영어에서는 문법적 구문이 되었는지에 대한 출현 동기와 정당성을 살펴본다. 문법화와 코퍼스의 실증적 자료에 기초하여 분리부정사구문의 문법성을 입증하고 영어 분리부정사구문의 출현에 관한 통시적 분석인 문법화 과정을 그 증거로 제시한다. 분리부정사가 왜 만들어지는가의 질문에 대한 답으로 동사이동의 소멸이라는 통시적 문법화를 들 수 있다. 코퍼스 자료에 기초한 통사·화용적인 이유는 표현의 명확성 즉, 탈중의성을 위한 것이거나 분리자인 부사를 통해 인상적인 강조를 하기 위한 것이다. 결론적으로 부사가 to와 원형동사를 분리할 것인가 말 것인가의 문제는 더 이상 문법적 논의의 대상이 아니며 앞으로도 분리부정사의 형태는 자연스러운 문법적 구문으로 문맥상 필요한 경우 더욱 증가하는 추세를 보일 것이다.

문서내 단어간 비교를 통한 철자오류 검출 (Detecting Spelling Errors by Comparison of Words within a Document)

  • 김동주
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권12호
    • /
    • pp.83-92
    • /
    • 2011
  • 일반 출판물과는 달리 문서 편집기를 사용하여 작성중에 있는 문서에는 사용자의 실수에 의한 오타 오류가 자주 발생한다. 이와 같은 온라인 문서에서 맞춤법 오류의 다수를 차지하는 사용자의 오타 오류는 대부분 자판을 입력할 때 주위 문자를 잘못 입력하는 경우이다. 통상적인 철자 검사기는 이러한 오류들을 형태소 분석기를 이용하여 검출하고 교정하게 된다. 즉, 입력된 어절에 대해 형태소 분석을 시도하고 분석되지 않은 어절을 철자 오류로 간주하게 된다. 그러나 오타 입력된 어절임에도 불구하고 형태소 분석에 성공한 경우에는 이와 같은 방법으로는 검출이 불가능하다. 본 논문에서는 기존 방법들이 검출하지 못했던 철자 오류들을 검출해 낼 수 있는 방법을 제시한다. 이 방법은 문서 작성자의 오타 입력은 반복하여 입력되지 않는 경향이 있으므로 저빈도로 발생한다는 특성에 기반하여 제안되었다. 저빈도의 어절의 자소 대치를 통해 문서의 특정 구간 내의 다른 단어와 비교하여 오타일 확률이 적은 단어인 자주 나오는 단어와 매칭이 된다면 일단 오류 후보로 가정하는 것이다. 여기에는 몇 가지 경험적인 제약이 추가되어야 한다. 이러한 단어간 비교에 의한 추정은 기존에 발견하지 못했던 구문오류뿐만 아니라 일부 의미오류까지 검출할 수 있으며, 교정 후보 선정시 가중치 적용에도 사용될 수 있다.