• 제목/요약/키워드: syntactic

검색결과 717건 처리시간 0.025초

대명사의 성별단서와 선행어 격이 참조해결의 즉각성에 미치는 효과 (The Effects of Gender Cue and Antecedent Case on the Immediacy of Pronominal Resolution)

  • 이재호
    • 인지과학
    • /
    • 제4권1호
    • /
    • pp.51-86
    • /
    • 1993
  • 대명사의 성별단서와 선행어의 격이 참조해결에 즉각적으로 작용하는지를 살펴보기 위해서 선행어의 점화효과를 시간경과에 따라 측정한 세개의 실험이 실시되었다. 실험1은 성별단서와 선행어 격에 따라서 선행어의 활성화 수준이 변화하는지를 알아보기 위해서 자율조절읽기과제를 실시하면서 대명사 직후와 문장 마지막 위치에서 선행어에 대한 탐사재인과제를 실시하였다. 선행어의 활성화 수준은 성별단서나 선행어 격의 영향을 받지않았으며, 그것의 수준은 대명사 직후에서 문자의 마지막까지 일정한 수준을 유지하였다. 실험2에서는 RSVP(rapid stimulus visual presentation) 방법을 사용하여 300msec에서 단위로 맥락글을 제시한후에 대명사 제시후 시간경과 0와 250msec에서 선행어와 비선행어에 대한 탐사재인과제를 실시하였다. 대명사의 성별단서가 명료한 경우에는 선행어가 비선행어에 비해서 탐사재인이 빨랐다. 시간경과 0mesc에서는 성별단서의 효과가 두드러졌으며, 시간경과 250msec에서는 선행어의 격효과가 두드러졌다. 조건에서 선행어의 격효과를 시간경과 250과 750msec에서 탐사재인과제를 실시하였다. 선행어가 주격인 조건이 선행어가 목적격인 조건에 비해서 점화효과가 많았다. 세개의 실험에서 나타난 결과는 대명사의 선행어 할당이 즉각적으로 일어난다는 사실을 분명히 하였다. 그렇지만 선행어 할당이 즉각적으로 일어나기 위해서는 먼저 대명사의 성별단서가 일차적으로 선행어 할당에 작용하며, 그다음에 선행어의 격효과가 순차적으로 작용한다는 사실을 입증하였다.

잘못 형성된 입력문장에 대한 CHART PARSER (CHART PARSER FOR ILL-FORMED INPUT SENTENCES)

  • 민경호
    • 인지과학
    • /
    • 제4권1호
    • /
    • pp.177-212
    • /
    • 1993
  • 본 연구는 잘못 형성된 입력에 대한 멜리쉬의 연구(1989)에 기반하고 있다. 이 글은 chart-based parser를 이용하여 구문론적 차원에서 잘못 형성된 입력 문자의 복구에 촛점을 둔다. 멜리쉬의 체계는 두가지 분석기, 즉 잘형성된 입력 분석기와 잘못 형성된 입력 분석기로 구성되는데, 필자의 연구는 그에 생각을 따르고 있다. 이글에서는 주로 chartparsing의 개념, 잘못형성된 입력에 대한 분석전략이 논의된다. 또한 필자가 제시하는 체계의 디자인과 구현, 필자의 체계를 멜리쉬의 체계와의 비교와 같은 사항들이 다루어질 것이다.

시소러스를 기반으로 하는 자동색인 시스템에 관한 연구 (The Development of an Automatic Indexing System based on a Thesaurus)

  • 임형묵;정상철
    • 인지과학
    • /
    • 제4권1호
    • /
    • pp.213-242
    • /
    • 1993
  • 그동안 자동색인 기법에 대해서는 단일어 색인,구색인,시소러스 기반 색인 등의 연구가 이루어져 왔는데,단일어 색인 기법이 단일어에 기초한 단순한 색인 방법 임에도 불구하고 다른 두가지 기법보다 일반적으로 우수하다고 알려져왔다. 시소러스 기반 색인은 이중에서도 검색효율이 낮은 것으로 알려져 왔는데,이는 일반적으로 시소러스가 포함하고 있는 색인용어들이 한정되어 있어 색인하려는 자료들이 이색인 용어에 부합(match)되지 않을 경우 색인 자체가 이루어 지지 않기 때문이다. 본 연구에서는 시소러스 기반 색인이 지금까지 기법으로는 검색효율이 좋지 않지만 실제 전문 색인들이 하는 색인과 매우 유사하다는 장범에 기초하여,입력 자료를 구문분석하고,분석된 자료들과 색인용어들을 정확부합(exact match)이 아닌 부분부합(partial match)을 통하여 색인 함으로써 검색효율이 우수한 시소러스기반 자동 색인 시스템을 개발하고자 한다. 본 연구에서 개발된 색인 시스템이 THINS는 우선 시소러스를 트리형태로 구성하고 입력자료들을 KAIST에서 개발한 언어번역기 MATES/EK를 통하여 구문분석한 후 명사구들만 뽑아낸다.그다음 명사구에 있는 용어들중 불용어를 제거하고 스테밍작업을 진행한후 생기는 형태를 색인 용어들과 부분부합 과정을 반복하여,유사한 색인 용어들과 가능하면 색인이 되도록 한다. 본 연구에서는 CACM 데이타 집합을 가지고 본 시소러스 기반 색인 시스템과 단일어 색인방식을 혼성지식기반 시스템인 HYKIS에서 성능을 평가하였다.이 성능평가에서 시소러스를 기반으로 하는 색인 시스템이 단일어 색인방식보다 회상도에서는 8-9%떨어지지만 정확도에서는 10%정도 높은 결과를 나타내었다.그러나 이는 기존의 시소러스 기반시스템이 단일어 색인 방식보다 정확도가 25%-30%정도 떨어진다는 것을 비추어 볼때 기존의 방식보다 우수한 것이라 평가된다.또한 CACM 에서 제공하는 시소러스인 CRCS 가 1000여개의 색인어밖에 포함하고 있어 매우 불완전한 것이라는 것을 고려하면,THINS가 최근에 개발되고 있는 시소러스와 접속된다면 매우 우수한 검색효율을 내리라 사료된다.

도메인 적응 기술을 이용한 한국어 의미역 인식 (Korean Semantic Role Labeling Using Domain Adaptation Technique)

  • 임수종;배용진;김현기;나동렬
    • 정보과학회 논문지
    • /
    • 제42권4호
    • /
    • pp.475-482
    • /
    • 2015
  • 높은 성능의 의미역 인식 시스템의 개발을 위해서는 대상 도메인에 대한 대량의 수동 태깅 학습 데이터가 필요하다. 그러나 충분한 크기의 의미역 인식용 학습 데이터는 오직 소수의 도메인에서만 존재한다. 소스 도메인의 시스템을 상대적으로 매우 작은 학습 데이터를 가진 다른 도메인에 적용할 경우 한국어 의미역 인식 기술은 15% 정도 성능 하락이 발생한다. 이러한 도메인 변경에서의 성능 하락 현상을 최소화하기 위해 본 논문에서는 2 가지 기법을 제시한다. 첫째, 도메인 적응 방법론의 하나인 Prior 모델에 기반하여 개발된 한국어 의미역 인식 시스템을 위한 도메인 적응 알고리즘을 제안한다. 둘째, 크기가 작은 타겟 도메인 데이터를 이용할 때 데이터 희귀 문제의 감소를 위해 소스 도메인 데이터 이용시 보다 단순화된 형태소 태그와 구문 태그 자질을 사용할 것을 제안한다. 뉴스 도메인에서 개발된 시스템의 위키피디아 도메인에의 적용과 관련하여 다른 연구의 도메인 적응 기술과 우리가 제안한 방법을 비교 실험하였다. 우리의 두 가지 방법을 같이 사용할 때 더 높은 성능을 달성하는 것을 관찰하였다. 우리 시스템은 F1-score 64.3% 성능으로서 기존의 다른 도메인 적응 기술들과 비교하여 2.4~3.1% 더 높은 성능을 가지는 것으로 관찰되었다.

한국어 내포 머리어 관계절의 통사적 특성과 습득 연구 (A Study of Syntactic Properties and Acquisition of Head-Internal Relative Clauses in Korean)

  • 조수근
    • 인지과학
    • /
    • 제14권2호
    • /
    • pp.49-56
    • /
    • 2003
  • 이 논문은 한국어 내포 머리어 관계절의 통사적인 특징을 살펴보고 이 구문이 한국어를 모국어로 사용하는 아동들에 의해 어떻게 습득되는가를 조사하는데 그 목적이 있다. 먼저, 한국어 내포 머리어 관계절 구문의 통사적인 특징을 살펴보기 위하여 내포 머리어 관계절을 생성문법에 비추어 분석을 하였다. 이 분석을 통해, 한국어의 내포 머리어 관계절은 일반적인 외포 머리어 관계절에 비해 통사적으로 사용이 더 제한되어 있다는 것을 알 수 있었다. 다시 말해, 내포 머리어 관계절은 여러 개의 절을 넘어 관계화가 일어날 수 있는 외포 머리어 관계절과 달리 하나 이상의 절을 넘어 관계화가 일어날 수 없다. 또한 내포 머리어 관계절은 주어, 직접목적어, 간접목적어, 전치사의 목적어 등이 관계화될 수 있는 외포 머리어 관계절과 달리 단지 주어와 직접목적어만이 관계화가 가능하다. 그리고, 내포 머리어 관계절의 습득 연구를 위해 관찰 방법을 이용한 내포 머리어 관계절의 자료뿐만 아니라 이해도 측정 실험과 산출 실험을 이용한 자료도 같이 분석하였다. 이들 자료의 분석을 통해, 내포 머리어 관계절은 외포 머리어 관계절에 비하여 아동들이 이해하고 말하기가 더 쉽고 따라서 외포 머리어 관계절에 비해 아동들에 의해 더 일찍 습득됨을 알 수 있었다. 보통 내포 머리어 관계절은 성인들에게는 잘 사용되지 않는다고 알려져 있는데 아동들에게 특히 언어 발달 과정의 이른 시기에 있는 아동들에게 외포 머리어 관계절의 습득에 앞서 많이 사용되어진다는 습득 연구에서의 결과는 언어발달의 이른 시기에 있는 아동들이 내포 머리어 관계절을 어떻게 이용하는지를 말해준다. 다시 말해, 아동들은 언어 발달의 이른 시기에는 이해하고 말하기 어려운외포 머리어 관계절 대신 쉬운 내포 머리어 관계절을 임시적으로 사용하는 것으로 볼 수 있겠다. 실제, 외포 머리어 관계절은 언어 발달 과정에서 늦게 습득이 되는 것으로 보고되고 있다.

  • PDF

볼프강 바인가르트의 구문론적 특성에 의한 타이포그래피 고찰 (Considerations on Wolfgang Weingart's Typography based on Syntactic Characteristics)

  • 허진
    • 한국콘텐츠학회논문지
    • /
    • 제12권7호
    • /
    • pp.86-93
    • /
    • 2012
  • 현대 타이포그래피 발전의 토대는 정확한 의미전달을 위한 형태적 기능성과 합리성에 가치를 두었던 모더니즘과 스위스국제타이포그래피 시대에 걸쳐 이루어 졌다. 그러나 포스트모더니즘으로 넘어가면서 타이포그래피의 합리적인 기능성 보다 미학적 혹은 관념적인 부분까지 확대 해석되어야 한다는 의견이 유행하였다. 실제로 포스트모더니즘의 대표적인 그래픽디자이너로 꼽히는 댄 프리드먼이나 에이프릴 그레이먼의 작품들은 모더니즘 시대의 작품들과 달리 그래픽디자인도 때로는 자율적인 예술표현의 매체가 될 수 있음을 보여 주었다. 그 변화의 처음에 볼프강 바인가르트가 있었다. 그가 보여준 타이포그래피의 개념 확장을 위한 다채로운 시도는 훗날 '뉴웨이브' 발달에 커다란 영향을 끼쳤으며 그의 실험주의 정신은 오늘날 타이포그래피의 기능성과 조형성 표현에 획기적인 가치변화를 주었다. 그러나 본 논문에서는 그의 선구자적 역할에 대한 가치평가가 아닌 그의 작품에 표현된 타이포그래피의 이론적 배경과 그에 따른 실험적 방법에 대하여 고찰하고자 한다. 이는 바인가르트의 작품배경이 포스트모더니즘의 작가주의적 견해에서 비롯된 것이 아닌 구문론적 이론에 근거한 타이포그래피의 개념 확장을 위한 것임을 재조명하고자 한다.

문장추상화 : 개념추상화를 도입한 문장교열 (Sentence ion : Sentence Revision with Concept ion)

  • 김곤;양재곤;배재학;이종혁
    • 정보처리학회논문지B
    • /
    • 제11B권5호
    • /
    • pp.563-572
    • /
    • 2004
  • 문장추상화(Sentence Abstraction)는 문장의 의사전달 기능이 보존된 단순화이다. 이는 문장교열(Sentence Revision)과 개념추상화(Concept Abstraction)를 동시에 가능하게 한다. 문장교열은 사람이 생각한 바와 문장으로 표현된 의미의 차이를 해결하는 방법이다. 개념추상화는 개념들의 공통된 요소로부터 얻은 보편적인 관념을 표현하는 것이다. 문장추상화는 문장의 주요구성성분들을 선별해 내고, 이들의 의미적인 정보를 파악하여 상위개념을 표현함으로써 문장교열과 개념추상화를 가능하게 한다. 본 논문에서는 문장추상화를 위한 구문분석기 LGPI+와, 온톨러지 OfN을 구체화하였다. 문장추상기 SABOT는 LGPI+와 OfN을 활용하며, 구문분석 결과를 처리하여 문장에서 추상화 할 후보난어를 선택한다. 문장추상화를 활용한 원문이해 시스템으로 23개 이야기의 58개 문단에 대해 중요 문장에 대한 문장재현율과 선별된 문장들의 주제관련성을 확인해 보았다. 실험결과, 문장재현율은 54~72%의 범위이었고, 주제관련성은 76~86% 정도의 비율로 나타났다. 이를 유사 시스템과 비교해 보았을 때, 약 10~20% 정도의 성능향상을 보인다. 본 논문에서는 문장추상화를 활용하여 글의 화제문을 효율적으로 선택할 수 있는 문장교열과 원문의 이해심도를 보다 더 깊게 할 수 있는 개념추상화가 가능함을 확인하였다.

통사화용의 접합면에서 본 영어 헤지표현의 유형과 기능 (Types and Functions of English Hedges at a syntax-pragmatics Interface)

  • 홍성심
    • 문화기술의 융합
    • /
    • 제6권1호
    • /
    • pp.381-388
    • /
    • 2020
  • 본 논문의 목적은 주로 사회언어학과 화용론 분야에서 연구되어 온 영어 '헤지(Hedges)' 혹은 헤지표현을 형태통사적 관점과 화용적 관점을 연관지어 논의하는 것이다. 일반적으로, '헤지표현이 없는 자연언어는 없다'는 추론이 가능한데, 그것은 어떤 자연언어에나 공손성, 혹은 화자가 청자보다 낮은 자세로 말하고자 하는 문법기제가 있음이 널리 인정되고 있기 때문이다. 헤지에 대한 기존의 이론적 연구는 주로 화용적 관점에서 헤지의 유형 분류와 화용적 기능, 그리고 출현빈도 비교 등의 수준에 그치고 있다. 즉, 헤지표현을 형태통사적 개념인 자질로 나타내려는 시도는 거의 발견되지 않는다. 언어현상으로서의 헤지는 유무에 따라, 화용부와 통사부의 접합면에서 [+hedged]와 [-hedged]로 이분지화 가능하며, 이 화용자질은 형태통사부와 상호작용 하므로 협의의 통사부에서 분리될 수 없다. 본 논문에서, 헤지는 공손성이 표현되는 화용자질로서, 그 자질이 표시되는 접합면 영역이 구조적으로 있음을 지적하였다. 즉, CP+층위가 화용자질인 헤지자질이 인코딩되는 영역임을 제안하였다. 최근에는 범언어적 관점에서 혹은 영어교육의 학술적 EFL/ESL 글쓰기, 또는 담화분석 등에 헤지 표현의 식별 여부나 용례를 연구하는 경향이 있다. 본 논문은 그동안 간과되어온 동등접속문, 병렬종속문, 부분사 구문 등을 헤지에 포함시키고, 보다 구조적이고 이분지적(±)인 방식을 제안함으로서, 제2언어습득의 이해, 글로벌 커뮤니케이션 혹은 인공지능 자연언어 알고리즘에 화용 자질을 도입할 수 있는 구조적이고 이론적인 기반을 제공하는데 그 목적이 있다.

창의적 이야기 작문용 세 그림의 동형 조사: 'Dog Owners,' 'Lost Dog,' 'Overslept' (An Investigation into the Equivalence of Three Pictures for Creative Story Writing: 'Dog Owners', 'Lost Dog', and 'Overslept')

  • 서희정;배정옥
    • 영재교육연구
    • /
    • 제26권4호
    • /
    • pp.699-719
    • /
    • 2016
  • 창의적 사고와 언어기술을 평가하는데 동형검사로 판명된 대체 그림들이 절실히 요구되고 있다. 본 연구는 창의적 쓰기 과제용으로 최근 개발된 세 그림(이름: 'Dog Owners,' 'Lost Dog,' 'Overslept')이 동형 검사지가 되는지 조사하였다. 183명의 중학생들이 무작위로 배분된 세 그림 중 하나에 의거하여 영어로 이야기를 작성하였다. 작문은 네 가지 쓰기요소(유창성, 어휘 다양성, 구조 복잡성, 그리고 시간성)에 대해 Coh-Metrix와 MANCOVA로 분석되었다. 이 세 그림은 변별력에 있어 대체로 위 모든 요소에 대해 비슷하였다. 그러나 이들의 난이도는 요소별로 볼 때 반드시 같지는 않았다. Dog Owners와 Lost Dog 그림은 변별력과 난이도에 있어 동형으로 판명되었다. 그러므로 이 두 그림은 반복 측정에서 타당한 동형 검사지로 추천된다. Overslept 그림은 다양한 어휘와 시간 연결사들을 유발시키는 데에 다른 두 그림 보다 용이하였다. 그림의 난이도가 다를 수 있다는 결과는 반복시험에서 대체 그림을 사용할 시 이들 그림이 동형 검정을 거치지 않고서는 그 타당성이 의심스러울 수 있음을 환기시켜 준다.

동적 윈도우를 갖는 조건부확률 모델을 이용한 한국어 문맥의존 철자오류 교정 규칙의 재현율 향상 (Improving Recall for Context-Sensitive Spelling Correction Rules using Conditional Probability Model with Dynamic Window Sizes)

  • 최현수;권혁철;윤애선
    • 정보과학회 논문지
    • /
    • 제42권5호
    • /
    • pp.629-636
    • /
    • 2015
  • 한국어 맞춤법 검사기가 교정하는 오류어의 유형은 크게 단순 철자오류와 문맥의존 철자오류로 구분할 수 있다. 이 중 문맥의존 철자오류는 어절(word)단위로 봤을 때는 올바르지만, 문맥을 고려하였을 때 오류가 되는 유형으로, 교정 난도가 매우 높다. 문맥의존 철자오류는 글을 쓰는 사람들도 자주 저지르는 오류이므로, 이를 잘 검색하여 정확하게 교정하는 것이 맞춤법 검사기의 사용자가 갖는 신뢰도에 큰 영향을 미친다. 높은 정확도가 매우 중요하므로, 문맥의존 철자오류의 교정 방법은 대부분 규칙에 기반한다. 반대 급부로 재현율이 매우 낮다는 단점을 갖는다. 문맥의존 철자오류의 교정에서 재현율을 높이기 위한 방법은 크게 언어지식을 이용하여 규칙을 일반화하는 방법과 통계 정보에 기반을 하여 공기 어휘의 제약 조건을 확장하는 방법으로 나뉠 수 있다. 기존 연구는 언어지식을 이용하여 규칙을 일반화하는 다양한 방식을 연구했으나, 최고 성능이 평균 정확도 95.19%, 평균 재현율 37.56%을 보였다. 본 논문에서는 통계정보에 기반한 규칙의 확장 방식을 제안한다. 동적 윈도우를 갖는 조건부확률 모델을 이용한 방법이며, 최고 성능은 평균 정확도 97.23%, 평균 재현율 50.50%을 보여주었다.