• 제목/요약/키워드: syntactic

검색결과 717건 처리시간 0.026초

복합명사 분할과 명사구 합성을 이용한 통합 색인 기법 (Integrated Indexing Method using Compound Noun Segmentation and Noun Phrase Synthesis)

  • 원형석;박미화;이근배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권1호
    • /
    • pp.84-95
    • /
    • 2000
  • 본 논문에서는 명사구 색인과 복합명사 분할을 포함한 복합명사 처리를 위해 통계 정보와 자연언어 처리를 제한적으로 이용 가능하게 하는 통합적 색인 기법을 제안한다. 먼저 색인과 검색에서 복합명사 분할 및 합성 모두를 고려한 통합 기법을 제시하고, 이를 위해 통계 정보와 제한적인 자연언어 처리를 모두 이용하는 통합 색인 기법을 제안한다. 먼저 형태소 분석 및 태깅 과정에서 단일어를 색인어로 추출하고 구문분석의 결과에서 명사구를 합성해 낸다. 구문 분석 실패 시에는 형태소 분석 및 태깅의 결과만을 사용하게 된다. 또한 태깅의 결과에서 복합명사를 골라 통계 정보를 이용하여 단일 명사로 분할하고 재합성한다. 분할된 단일 명사와 합성된 명사구는 기존의 단일어로만 이루어진 색인어를 보완하기 위해 색인어로 사용된다. 실험은 한국어 정보검색의 실험 집합인 KTSET 2.0과 KRIST SET을 사용하여 통합색인 기법이 복합명사 처리에 효율적임을 보였다.

  • PDF

복합 레이블을 적용한 한국어 구문 규칙 (Korean Syntactic Rules using Composite Labels)

  • 김성용;이공주;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권2호
    • /
    • pp.235-244
    • /
    • 2004
  • 본 논문에서는 한국어 구문 분석 및 구문 트리 표현을 위한 복합 레이블 생성 방법을 제안한다. 기존의 구문 트리 표현에서는 미리 정의된 구문 트리 레이블을 사용하여 구문 정보를 표현하였다. 본 논문에서는 이진 규칙하에서 품사태그 정보만을 이용하여 구문 레이블을 자동으로 생성하는 방법을 제시한다. 제안된 구문 레이블은 두 개의 하위 구성체의 품사정보를 적절히 구성하여 형성되며, 동시에 현 구성체의 상태 및 역할 정보를 표현할 수 있도록 고안되었다. 이와 같이 함으로써 품사태그 정보가 가지고 있는 정보를 그대로 구문 트리에 반영시킬 수 있었다. 또한, 품사 정보와 이진규칙만을 이용하여 구문 트리를 표현하기 때문에, 다양한 구문 규칙을 채택하고 있는 서로 다른 구문 분석기의 결과를 정규화 하는 데 적용할 수 있을 것이며, 일본어와 같은 다른 언어에도 쉽게 적용 가능하다. 약 31,080 문장에 대한 구문 분석의 결과, 79.30%의 정확도를 얻을 수 있었으며, 이는 제안된 구문 트리 표현 방법이 구문 분석기의 효율에도 좋은 영향을 미침을 보이는 것이다.

지능 에이전트 구현의 인지적 접근 (Cognitive Approach for Building Intelligent Agent)

  • 태강수
    • 인터넷정보학회논문지
    • /
    • 제5권2호
    • /
    • pp.97-105
    • /
    • 2004
  • 에이전트가 지각이나 행위의 표상을 이해할 수 없는 이유는 의미론적 자질을 문자열로 변환하는 구문론적 표상방식에 의해서 일어난다. 자율적으로 학습하는 인지 에이전트를 구현하기위해 코헨은 에이전트가 sensor와 effector를 사용하여 주위환경과 물리적으로 직접적인 상호작용을 통하여 물리적 스키마의 의미 표상을 학습하는 의미론적 방법을 제안하였다. 본 논문에서는 부정(negation)은 그러한 물리적 스키마를 인식하게 하는 메타 스키마임을 제안한다. 최근에 Graphplan은 계획 시스템의 성능을 향상하기 위하여 inconsistency를 이용하는 제어규칙을 사용하지만, 구문론적으로 접근하여서 부정의 의미 개념을 이해하지 못하고 중복표현의 문제를 야기한다. IPP는 부정 함수인 not을 도입하여 중복문제를 해결하지만 여전히 구문론적으로 접근하며 또한 시간과 공간에서 비효율적이다. 본 논문에서는 의미론적인 접근법을 도입하여 부정을 위해서 반대 개념이라는 긍정 아톰(atom)을 사용하는 것이 지능 에이전트를 구현의 효율적 기법이라고 제안하고, 이 가설을 지지하는 실험적 결과를 제시한다.

  • PDF

행위공동체 내의 언어·사회·문화: 국내외 사례를 통한 영어간판의 오류분석과 사회·문화적 양상 (The Language·Society·Culture in a Community of Practice: Error Analysis and Socio-cultural Aspects on English Signboards of the Domestic and a Foreign Country)

  • 이영화
    • 한국콘텐츠학회논문지
    • /
    • 제19권6호
    • /
    • pp.504-512
    • /
    • 2019
  • 본 연구는 국내외 도시 지역 영어간판의 언어적 오류를 살펴보고, 이를 비교해 봄으로써 공동체의 언어 사회 문화적 양상을 고찰해 보는 것을 목적으로 한다. 자료 수집으로 국내 5개 도시와 프랑스 파리 지역의 영어 간판을 촬영하였다. 분석 결과, 국내 영어간판의 39.2%가 오류를 포함한 반면 파리 시내 영어간판의 오류 비율은 24.7%였다. 국내에서는 명동 지역이 영어간판은 물론 오류도 가장 많은 반면, 파리에서는 에펠탑을 중심으로 한 7구역에서 영어간판이 가장 많았고, 오류는 마레지역 3, 4구역이 가장 높았다. 업종과 관련, 국내에서는 주류, 음식, 의류 순으로 간판 오류가 많은 반면, 프랑스에서는 의류, 음식, 문화 순으로 오류 비율이 높아 두 나라간 차이를 보였다. 국내와 프랑스 공히 의미, 형태, 통사 요소의 순으로 오류를 보였다. 국내나 프랑스 모두 옥외광고물 언어에 관한 규정이 존재하고 있으나 제대로 지켜지고 않고 있었다. 따라서 영어간판 사용이 필요 불가결한 글로벌 시대에서 조화로운 영어간판 문화의 정착을 위해선 보다 실제적이고 합리적인 정책 수립이 필요하다.

읽기장애아동과 일반아동의 통사적 다양성에 따른 운율 특성 비교 (A comparative study of prosodic features according to the syntactic diversities between children with reading disability and nondisabled children)

  • 박성숙;성철재
    • 말소리와 음성과학
    • /
    • 제13권4호
    • /
    • pp.55-66
    • /
    • 2021
  • 읽기와 관련된 운율은 내용의 전체적인 맥락에 연결되어 독자가 전달하고자 하는 의미를 자연스럽게 표현할 수 있도록 음도, 강도, 발화속도 등의 변화로 나타난다. 읽기장애아동은 자연스러운 운율을 사용한 읽기에 어려움이 있어 표현력 있게 정보를 전달하지 못하는 경향이 있다. 이와 관련하여 본 연구는 문장 유형에 따른 읽기 과제를 통하여 읽기장애아동 집단과 일반아동 집단 간의 운율 특성 차이를 규명하였다. 초등학교 3-6학년 읽기장애아동 15명, 일반아동 15명을 대상으로 통사적으로 다양한 문장 유형(단문, 의도, 가정/조건, 관형절 내포문)에 따른 읽기 과제를 실시하였다. 읽기장애아동은 일반아동에 비해 음도 범위가 넓었으며 읽기 속도와 조음 속도가 느렸다. 또한 휴지 빈도가 높았으며 전체 휴지 지속시간도 길었다. 읽기장애아동은 문미 억양구와 문장 내 어절 단위 음도 기울기에서 일반아동에 비해 기울기 값이 컸으며 이상의 내용은 모두 통계적으로 유의하였다. 결과적으로 문장 유형에 따른 읽기 과제에서 읽기장애아동은 일반아동에 비해 자연스럽고 표현력 있는 읽기에 어려움을 보였다. 본 연구를 통해 읽기장애아동의 운율 특성을 파악하였고, 효과적인 중재를 위한 접근 방법의 필요성을 제시했다.

검색 엔진의 ‘색인 모듈’의 문제와 합성어 사전 및 구문 정보 사전의 필요성 (Problems of Indexing Module in IR Systems and Lexicons of Complex Items and Syntactic Structures)

  • 남지순;최기선
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1997년도 제4회 학술대회 논문집
    • /
    • pp.5-15
    • /
    • 1997
  • 기존의 대부분의 정보 검색 시스템은 문서에 대한 ‘자동 색인 단계’를 거쳐 질의자의 요구에 적합한 문서들을 추출하도록 되어 있다. 이 과정에서 얼마나 적합한 문서를 빠짐없이 검색하였는가 하는 문제가, 검색 시스템의 효율성들 판단하는 데 가장 중요한 열쇠가 된다. 이 글에서는 ‘명사’ 중심의 키워드 추출이 안고 있는 몇 가지 문제점들에 관해서 논의하였다. 즉, 합성어 키워드 구축의 필요성, 동사 구문 정보에 대한 필요성, 부사구 표현에 대한 기술 필요성, 그리고 발화 상황이 고려되어야 하는 점등이 검토되었고, 이에 관한 해결책으로, 어휘정보 및 어절 정보, 나아가 구문 정보들을 담고 있는, 보다 체계적인 한국어 사전 시스템이 구축되어야 함을 강조하였다.

  • PDF

문서 영상의 논리적인 구조 분석을 위한 구문론적인 접근 방식 (A Syntactic Approach for Logical Structure Analysis of Document Images)

  • 이경호;최윤철;조성배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권7호
    • /
    • pp.524-536
    • /
    • 2001
  • 본 논문에서는 다수의 페이지로 구성된 복잡한 구조의 문서로부터 SGML/XML에 기반한 전자 문서를 생성하기 위한 구문론적인 구조분석 방법을 제안한다. 특히 제안된 파싱 기법은 텍스트 라인을 기본 단위로 하는 기존 연구보다 논리적인 계층 구조를 보다 정확하고 빠르게 생성하기 위하여 텍스터 영역의 계층적인 트리 구조를 입력으로 받아들인다. 또한 문서 유형의 논리적인 구조 정보와 기하적인 특성을 효과적으로 기술할 수 있는 문서모델을 정의하고, 이의 자동 생성과 점증적인 학습 방법을 제안한다. 제안된 방법의 성능을 평가하기 위하여 과학 기술 논문으로부터 스캐닝한 372개의 논문 연상으로 실험한 결과, 제안된 방법은 기존 연구와 달리 다수의 문서 영상으로 구성된 문서에 대하여 논리적인 구조분석과 문서 모델의 자동 생성을 효율적으로 지원하였다. 특히 제안된 방법은 논리적인 구조분석의 최종 결과로서 SGML/XML 문서를 생성하기 때문에 문서의 재 사용성과 호환성을 높인다.

  • PDF

Topic Classification for Suicidology

  • Read, Jonathon;Velldal, Erik;Ovrelid, Lilja
    • Journal of Computing Science and Engineering
    • /
    • 제6권2호
    • /
    • pp.143-150
    • /
    • 2012
  • Computational techniques for topic classification can support qualitative research by automatically applying labels in preparation for qualitative analyses. This paper presents an evaluation of supervised learning techniques applied to one such use case, namely, that of labeling emotions, instructions and information in suicide notes. We train a collection of one-versus-all binary support vector machine classifiers, using cost-sensitive learning to deal with class imbalance. The features investigated range from a simple bag-of-words and n-grams over stems, to information drawn from syntactic dependency analysis and WordNet synonym sets. The experimental results are complemented by an analysis of systematic errors in both the output of our system and the gold-standard annotations.

A Corpus-Based Study on Korean EFL Learners' Use of English Logical Connectors

  • Ha, Myung-Jeong
    • International Journal of Contents
    • /
    • 제10권4호
    • /
    • pp.48-52
    • /
    • 2014
  • The purpose of this study was to examine 30 logical connectors in the essay writing of Korean university students for comparison with the use in similar types of native English writing. The main questions addressed were as follows: Do Korean EFL students tend to over- or underuse logical connectors? What types of connectors differentiate Korean learners from native use? To answer these questions, EFL learner data were compared with data from native speakers using computerized corpora and linguistic software tools to speed up the initial stage of the linguistic analysis. The analysis revealed that Korean EFL learners tend to overuse logical connectors in the initial position of the sentence, and that they tend to overuse additive connectors such as 'moreover', 'besides', and 'furthermore', whereas they underuse contrastive connectors such as 'yet' and 'instead'. On the basis of the results of this study, some pedagogical implications are made concerning the need for teaching of the semantic, stylistic, and syntactic behavior of logical connectors.

Configurational Analysis of Contemporary Korean-Style Houses Regarding the Expression of Their Koreanity

  • Chang, Dong-Kuk;Shim, Jae-Choon
    • Architectural research
    • /
    • 제13권4호
    • /
    • pp.3-10
    • /
    • 2011
  • This research focuses on how the 'Koreanity' inherent in many traditional Korean houses of the upper class is expressed in contemporary 'Korean-style' houses, and how aspects regarded as configurational characteristics of traditional houses are expressed in them. Three types of Korean house (traditional upper class, contemporary Korean-style and contemporary architect) are quantitatively analysed using the space syntax method to investigate of the spatial configuration and their syntactic properties. The research results show that the spatial configuration of traditional houses is more integrated than that of contemporary houses. Furthermore, contemporary Korean-style houses are similar to architect's houses in terms of their spatial configurations. The configurational analyses reveal that the way in which spatial configuration is expressed in contemporary Korean-style houses is significantly different from traditional Korean houses. This result is in direct contrast to the architects' claim that their houses maintain the configurational chracteristics of traditional Korean houses.