• 제목/요약/키워드: Korean Language Sentence Patterns

검색결과 49건 처리시간 0.033초

문형 사전을 위한 문형 빈도 조사 (Studying the frequencies of sentence pattern for a entence patterns dictionary)

  • 김유미
    • 인지과학
    • /
    • 제16권2호
    • /
    • pp.123-140
    • /
    • 2005
  • 이 논문은 한국어 교육에서 문형 전자 사전을 바탕으로 하는 자동문형 검사기를 설계하기 위해 문형의 출현 빈도와 사용 빈도 조사를 목적으로 하였다. 먼저 한국어 교육에서의 문형의 개념을 정의하고 그 유형을 구문 문형과 표현 문형으로 나누어 분류하였다. 서술어 중심의 구문 문형과 의존명사, 어미, 조사가 중심인 표현 문형이 학습자 코퍼스에서 어떻게 나타나는지 분석하였다. 학습자 코퍼스는 학습자들이 꼭 배워야 하는 것으로 표준 코퍼스와 학습자들의 생산물인 오류 코퍼스로 나누어 구축하였다. 한국어 교재로 구성된 표준 코퍼스에서의 문형 출현 빈도와 학습자들이 직접 작성한 글을 모은 오류 코퍼스에서 어떻게 문형이 사용되고 있는지 사용 빈도를 조사하였다. 학습자들의 문형 사용 빈도순은 문형 전자 사전에 기술되고, 이것은 문형 검색 속도를 최적화할 것이다.

  • PDF

구문 제약으로 문형을 사용하는 CFG기반의 한국어 파싱 (CFG based Korean Parsing Using Sentence Patterns as Syntactic Constraint)

  • 박인철
    • 한국산학기술학회논문지
    • /
    • 제9권4호
    • /
    • pp.958-963
    • /
    • 2008
  • 한국어는 용언이 의미적 제약을 통해 문장을 지배하며 대부분의 한국어 문장은 주절과 내포문을 가지는 복문으로 구성되어 있다. 따라서 한국어에 맞는 구문 문법이나 구문 제약을 기술하는 것은 매우 어렵고 한국어를 파싱 하면 다양한 구문 모호성이 발생한다. 본 논문에서는 구문 제약으로 문형(sentence patterns)을 사용하는 CFG기반의 문법을 기술하여 구문 모호성을 해결하는 방법을 제안한다. 이를 위해 내포문을 포함하는 복문도 문형으로 분류하였으며 44개의 문형을 사용한다. 그러나 한국어 특성상 문형 정보만으로는 모든 구문 모호성을 해결할 수가 없기 때문에 문형에 의미 제약(semantic constraint)을 가한 의미 지표(semantic marker)를 사용하여 파싱을 수행한다. 의미 지표는 보조사의 처리나 공동격 조사에 의해 발생되는 구문 모호성을 해결하는데 이용될 수 있다.

Semi-automatic Legal Ontology Construction based on Korean Language Sentence Patterns

  • Jo, Dae Woong;Kim, Myung Ho
    • 한국컴퓨터정보학회논문지
    • /
    • 제22권6호
    • /
    • pp.69-77
    • /
    • 2017
  • The information related to legislation is massive, and it takes much time and effort to manually build the legislation ontology. Thus, studies on machine-based automated building methods are underway. However, the studies to automatically construct such systems focus on using TBox construction, and those based on automated ABox construction, which corresponds to instances, theoretical systems and data building cases, has not yet been sufficiently developed. Therefore, this paper suggests using a semi-automatic ABox construction method based on sentence patterns to automatically build the ontology for the legislation of the Republic of Korea. Precision and Recall experiments were conducted to further discuss the performance of the suggested method. These experiments provide a comparison between the manual classification, and the triples built by the machines of the legal information by assessing the corresponding numerical values.

의미패턴에 기반한 대화체 한영 기계 번역 (Machine Translation of Korean-to-English spoken language Based on Semantic Patterns)

  • 정천영;서영훈
    • 한국정보처리학회논문지
    • /
    • 제5권9호
    • /
    • pp.2361-2368
    • /
    • 1998
  • 본 논문에서는 한국어대화체를 분석하고 의미패턴에 기반한 대화체 한영 기계번역 시스템에 대하여 기술한다. 한영 기계번역에서 구문정보를 이용한 한국어 모호성은 의미패턴을 이용하여 해결할 수 있다. 따라서 대화체 번역을 위하여 한국어 스케쥴링 도메인으로부터 추출된 의미패턴에 기반한 시스템을 구성한다. 번역의 강건함을 위하여 한국어 문장 분석시 음절을 건너뛰어 분석할 수 있도록 하였으며, 패턴수를 줄이기 위하여 의미패턴에 옵션을 부가하였다. 실험을 위하여 사용된 데이터는 스케쥴링 도메인으로 실험결과 88%의 번역율을 보인다.

  • PDF

하위범주화에 의한 한국어 파싱 설계 (A Design of Korean Language Parsing based on Subcategorization)

  • 이호석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (C)
    • /
    • pp.242-247
    • /
    • 2008
  • 본 논문은 하위범주화에 의한 한국어 파싱의 설계를 논의한다. 우선, 기계 번역에 중요한 영향을 끼치는 한국어 문법구성 요소인 통사 범주, 조사, 어미, 통사적 접사, 의존 명사 등을 논의하고 하위 범주화와 표현 패턴을 논의한다. 다음에 간단한 한국어 파서의 기본 골격을 제시한다. 첫 번째 과정은 입력 단계로서 문장을 스캐닝(scanning) 하고 관사, 명사, 수사, 통사적 접사, 조사, 의존 명사, 어미활용, 형용사, 부사, 조동사 들을 처리한다. 두 번째 과정에서는 하위범주화 패턴과 표현 패턴을 처리한다. 세 번째 단계에서는 절을 처리하고, 네 번째 단계에서는 SEA(Sentence Ending+Auxiliary)를 처리한다.

  • PDF

언어발달장애 아동의 문법형태소 산출 (The Production of Grammatical Morphemes of Korean Children with Developmental Language Impairments)

  • 황민아
    • 음성과학
    • /
    • 제10권3호
    • /
    • pp.47-64
    • /
    • 2003
  • In the present study, the production of grammatical morphemes of Korean-speaking children with and without developmental language impairments was investigated. Ten children with language impairments (LI) (CA: 4; 4-6; 11, LA: 3; .6-5; 10) and 10 normal children (CA: 3;1-6;3, LA: 3;5-5;11) with matched language abilities participated in the study. Sixty pairs of pictures were used to elicit 12 types of predetermined grammatical morphemes. The two pictures of a pair were designed to elicit two sentences of the same sentence structure. After the investigator described one picture of a pair, the children were asked to describe the other picture. The LI children made more errors than the normal children in the production of 6 types of grammatical morphemes including: locative case marker, dative case marker, two connective endings of predicates representing cause and goal, and suffixes for passive and causative verbs. However, the LI children produced some grammatical morphemes as accurately as. the normal children. The two groups were similar in their error patterns. Some explanations for Korean-speaking LI children's use of grammatical morphemes were suggested.

  • PDF

영한자동번역에서의 두단계 영어 전산문법

  • 최승권
    • 한국언어정보학회지:언어와정보
    • /
    • 제4권1호
    • /
    • pp.97-109
    • /
    • 2000
  • Application systems of natural language processing such as machine translation system must deal with actual texts including the full range of linguistic phenomena. But it seems to be impossible that the existing grammar covers completely such actual texts because they include disruptive factors such as long sentences, unexpected sentence patterns and erroneous input to obstruct well-formed analysis of a sentence. In order to solve analysis failure due to the disruptive factors or incorrect selection of correct parse tree among forest parse trees, this paper proposes two-level computational grammar which consists of a constraint-based grammar and an error-tolerant grammar. The constraint-based computational grammar is the grammar that gives us the well-formed analysis of English texts. The error-tolerant computational grammar is the grammar that reconstructs a comprehensible whole sentence structure with partially successful parse trees within failed parsing results.

  • PDF

An Experimental Study on the Sentence Stress Effect

  • Park, Hee-Suk
    • 음성과학
    • /
    • 제9권4호
    • /
    • pp.143-148
    • /
    • 2002
  • This study examined the foreign accent of Korean speakers of English concerning vowel length and utterance position. It then attempts to explain the foreign accent of Koreans when they speak English. The method was to measure the sentence-initial and sentence-final vowels as spoken by Koreans. I chose these two positions, sentence-initial and sentence-final, in order to know if Korean speakers of English, compared with native English speakers, show a difference in sentence stress. I chose English diphthongs, because most Koreans have difficulty pronouncing these sounds. I found that Korean speakers of English as a second language do not know English sentence stress patterns and show a foreign accent, especially when using diphthongs.

  • PDF

초등학교 예비교사들의 수학적 '문제 만들기'에 나타나는 문장의 오류 유형 분석 (Analysis on Sentence Error Types of Mathematical Problem Posing of Pre-Service Elementary Teachers)

  • 허난;신호철
    • 한국학교수학회논문집
    • /
    • 제16권4호
    • /
    • pp.797-820
    • /
    • 2013
  • 본 논문은 초등학교 예비교사 100명을 대상으로 수학적 '문제 만들기'의 문장에 나타나는 오류를 분석하고 그에 대한 간단한 예방책을 기술한 논의이다. '문제 만들기' 문장에는 '음운 오류, 단어 오류, 문장 오류, 의미 오류, 표기 오류' 등 5가지 오류 유형이 나타났다. 이를 다시 14개의 세부 유형으로 구분하여 세부적으로 논의하였다. 곧 음운 오류의 유형은 'ㄹ'첨가 오류와 조사끼리의 준말 사용 오류가 있다. 단어 오류는 크게 '부적절한 사용 오류'와 '부당한 생략 오류'로 구분하고 이를 다시 조사, 어미, 어휘의 사용 오류와 조사와 어휘의 부당한 생략 오류로 유형화하였다. 문장 오류는 '지시 대상의 오류, 문장 성분의 생략 오류, 어순 오류, 자체 비문'의 네 가지로 유형화하였다. 의미 오류는 논리적 모순 관계 오류와 중의성을 띄는 의미 오류에 대해서만 논의하였고, 표기 오류는 띄어쓰기와 문장 부호, 철자에 관한 한글 맞춤법 오류와 외래어 표기법 오류 등에 대하여 논의하였다. 또한 14개의 문법적 세부 오류 유형을 방지하기 위한 예방책을 제시하였다. 먼저 구어와 문어의 차이를 인식하고, 둘째 글을 쓰는 문어 상황에 맞도록 구어적 표현을 지양하도록 하는 것, 셋째 국어 기본 문형 학습에 대한 강조, 넷째 단어 의미의 명확한 이해를 바탕으로 한 의미의 논리적 전개 인식을 제안하였으며, 끝으로 국어 어문 규정에 대한 학습을 제안하였다. 그리고 대학생 글쓰기 교육에 대한 필요성에 대한 재인식을 결론으로 갈음하였다.

  • PDF

Acquisition of prosodic phrasing and edge tones by Korean learners of English

  • Choe, Wook Kyung
    • 말소리와 음성과학
    • /
    • 제8권4호
    • /
    • pp.31-38
    • /
    • 2016
  • The purpose of the current study was to examine the acquisition of the second language prosody by Korean learners of English. Specifically, this study investigated Korean learners' patterns of prosodic phrasing and their use of edge tones (i.e., phrase accents and boundary tones) in English, and then compared the patterns with those of native English speakers. Eight Korean learners and 8 native speakers of English read 5 different English passages. Both groups' patterns of tones and prosodic phrasing were analyzed using the Mainstream American English Tones and Break Indices (MAE_ToBI) transcription conventions. The results indicated that the Korean learners chunked their speech into prosodic phrases more frequently than the native speakers did. This frequent prosodic phrasing pattern was especially noticeable in sentence-internal prosodic phrases, often where there was no punctuation mark. Tonal analyses revealed that the Korean learners put significantly more High phrase accents (H-) on their sentence-internal intermediate phrase boundaries than the native speakers of English. In addition, compared with the native speakers, the Korean learners used significantly more High boundary tones (both H-H% and L-H%) for the sentence-internal intonational phrases, while they used similar proportion of High boundary tones for the sentence-final intonational phrases. Overall, the results suggested that Korean learners of English successfully acquired the meanings and functions of prosodic phrasing and edge tones in English as well as that they are able to efficiently use these prosodic features to convey their own discourse intention.