• Title/Summary/Keyword: 형태/통사적 제약

Search Result 10, Processing Time 0.032 seconds

Performance Improvement of Dependency Parser using Syntactic Constraint Rules (통사적 제약규칙에 기반을 둔 의존문법 구문 분석의 성능 향상)

  • Nam, Woong;Kim, Hyemi;Kwon, Hyuk-Chul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.05a
    • /
    • pp.353-355
    • /
    • 2013
  • 한국어는 어근의 형태가 변하는 굴절어인 영어와 달리, 한 어절이 어근과 접사가 결합하여 각자 고유한 의미를 지닌다. 이 때문에 하나의 어절에 대한 형태소 분석 후보가 여러 개가 나올 수 있어 구문 분석을 더욱 어렵게 만든다. 본 논문에서는 한국어의 통사적 특성에 적합한 의존문법을 이용하여 구분 분석을 수행한다. 모든 형태소 분석 후보에 의존관계를 부여하고 통사적 제약규칙을 통해 의존관계를 줄여나간다. 특히, 기존의 통사적 제약규칙에 형용사의 결합정보와 논항정보를 이용한 통사적 제약규칙을 추가하여 생성 가능한 의존관계의 수를 줄인다.

On the development of a computational lexical database of idiomatic expressions in the frmework of 21st Sejong Project (21세기 세종계획 관용표현 전자사전 구축에 대하여)

  • Pak, Man-Ghyu;Yi, Sun-Woong;Na, Yun-Hee;Lee, Kwang-Ho
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.334-340
    • /
    • 2001
  • 본고는 올해 처음 시도하는 세종계획 관용표현 전자사전 구축에 관한 글이다. 본 전자사전이 완성되면 관용표현의 총체적 정보(형태, 통사, 의미, 화용 정보)를 수록하는 최초의 업적이 될 뿐만 아니라 실제 언어 자료에서 흔히 볼 수 있는 관습적 표현까지 모두 포괄하는 4만 표제어의 대규모 사전이 될 것이다. 본 사전에서는 관용표현의 형태 통사적 구성과 그 분포적 속성뿐 아니라, 관용표현이 가지는 논항의 존재 유무, 구조, 조사 통합 양상, 그리고 고정명사에 대한 수식어 제약, 어휘적 통사적 변형 양상, 선어말어미 제약, 어말어미 제약, 문장 유형 제약 등이 수록된다. 또한 각 논항의 의미역과 선택제약에 관한 정보, 그 외 다양한 의미 화용 정보 어원 표기 정보 등도 담기게 된다. 본고에서는 그러한 정보의 표기 양식을 하나하나 명시적으로 설명할 것이다.

  • PDF

Processing Idiomatic Expressions in Korean (한국어 숙어의 유형과 처리 방법: 제약기반이론적 접근)

  • Chan, Chung;Kim, Jong-Bok
    • Korean Journal of Cognitive Science
    • /
    • v.18 no.4
    • /
    • pp.417-444
    • /
    • 2007
  • Canonical idioms are in general syntactically opaque and semantically non-compositional. However, there also exist many idioms whose component parts are rather morpho-syntactically transparent and semantically decomposable. This paper identifies two types of Korean idioms and review their basic properties. Based on these empirical studies, the paper then proposes a constraint-based approach that can allow us to process these two different types of idioms.

  • PDF

Syntactic informations in the Sejong Electronic Dictionary of Korean Nouns (세종명사전자사전의 통사정보)

  • Hong, Chai-Song;Ko, Kil-Soo
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.348-355
    • /
    • 2001
  • 세종전자사전은 한국어 어휘의 정보를 총체적으로 표상하는 전산어휘자료체이다. 세종전자사전은 궁극적으로 다양한 유형과 기능의 한국어 자동처리에의 활용을 목표로 한다. 세종체언전자사전은 최종적으로 5만여 항목을 대상으로 구축될 것이다. 세종명사전자사전은 전산적 효율성을 고려하여 명사 어휘의 정보를 8개의 하위정보구획과 50여개의 세부정보항목으로 구분하여 표상한다. 특히, 명사의 어휘 통사적인 결합에 관한 정보는 한국어 명사구와 문장의 자동생성에 직접 활용될 수 있는 정보이다. 명사는 수식어 요소 또는 조사와 결합하여 명사구를 형성하고, 동사 및 형용사와 결합하여 문장의 생성에 참여한다. 개별 명사들은 이 과정에서 다양한 제약적인 양상들을 보여주고 있으며, 세종명사전자사전은 이 정보들을 명시적으로 표상한다. 또한 명사는 기능동사와 결합하는 술어명사와 그렇지 않은 비술어명사로 구분이 된다. 술어 명사가 기능동사와 결합하여 문장을 형성할 때, 명사와 그 논항들은 다양한 통사적 기능을 담당한다. 또한 술어명사는 논항과 결합하여 명사구를 형성한다. 그러나, 술어명사의 명사구 형성과 기능동사의 결합은 불규칙적이고, 명사와 기능동사의 의미적 특성에 따라 다양한 제약이 발견된다. 이 정보들의 정밀한 표상은 개별 술어명사로부터 생성될 수 있는 가능한 명사구와 문장의 형태를 구체적으로 밝혀주게 된다. 세종명사전자사전의 어휘 통사적인 결합에 관한 정보들은 명사구 또는 문장의 자동생성의 정확성과 효율성을 높여줄 것이다.

  • PDF

Patterns of categorical perception and response times in the matrix scope interpretation of embedded wh-phrases in Gyeongsang Korean (경상 방언 내포문 의문사의 작용역 범주 지각 양상과 반응 속도 연구)

  • Weonhee Yun
    • Phonetics and Speech Sciences
    • /
    • v.15 no.2
    • /
    • pp.1-11
    • /
    • 2023
  • This study investigated the response time and patterns of categorical perception of the wh-scope of an embedded clause with the non-bridge verb, "gung-geum hada 'wonder'," in the matrix verb phrase in Gyeongsang Korean. Using the same procedure as Yun (2022), 72 responses and response times for each stimulus were collected from 24 participants over the course of three trials. The stimuli were recorded readings of 40 speakers (20 male, 20 female). Context was provided to induce a matrix scope interpretation of the embedded wh-phrase in the target sentence. We sorted the 40 stimuli according to the number of matrix scope responses each received, and charted the response times for each stimulus. Although there was considerable overlap for the different types of wh-scope interpretations, there was a clear difference in categorical perception between the matrix and embedded scopes. The 24 participants also differed in their categorical perceptions. The results suggested that response time and wh-scope interpretation were not directly related and that two main weighted factors affected wh-scope interpretation: morpho-syntactic constraints and prosodic structural integrity. The weighting of each of these factors was inversely correlated and varied among subjects.

The Description of Korean particles and endings in the Sejong Electronic Dictionary (세종전자사전에서의 조사.어미 기술)

  • Kim, Chang-Seop;Kim, Jin-Hyeong
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.326-333
    • /
    • 2001
  • 조사어미사전은 한국어 연구 및 교육, 정보처리 분야에 두루 이용될 수 있는 범용적 전자사전을 지향하는 세종전자사전의 한 위성사전으로서, 한국어 조사와 어미에 대한 각종 언어 정보를 체계적이고 일관된 형식으로 표상하는 것을 목적으로 하고 있다. 그러한 목적을 달성하기 위해 본 연구 작업에서는 조사와 어미의 형태적 변이 양상과 조건을 상세히 밝히는 한편, 의미 통사적 특성과 제약에 관한 다양한 정보들을 가능한 한 풍부하게 제시하고 있다. 조사와 어미에 대하여 사전에 풍부하고 다양한 언어 정보를 표상하는 작업은 기존의 한국어 인쇄사전은 물론 전자사전에서도 본격적으로 시도되지 않았던 것으로, 본 사전에서 현재까지 기술하고 있는 다양한 정보들은 앞으로 한국어에 대한 순수 언어학적 연구만이 아니라 한국어 정보 처리 분야의 발전에 있어서도 기여하는 바가 적지 않을 것으로 기대한다.

  • PDF

Selecting Model of Head in Support Verb Constructions for Phrase-Pattern-based Korean-to-English Machine Translation (구 단위 패턴 기반 한영 기계 번역에서의 기능동사 구문의 중심어 선택 모델)

  • Kim, Hae-Gyung;Chae, Young-Soog;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.203-208
    • /
    • 1999
  • 한국어는 잉여성과 중의성의 범 언어적인 특징과 함께 다른 언어에 비해 주어의 생략이 두드러지며 어순이 자유롭기 때문에 구문 형식의 지배를 덜 받는다는 개별적인 특성을 지닌다. 이러한 특성으로 인해 기계번역의 패턴을 추출할 때 서로 유사 가능성이 있는 패턴에 대한 고려가 없이는 같은 의미의 서로 다른 여러 개의 패턴을 모두 하나의 패턴으로 처리하는 오류를 범할 위험이 있다. 본 연구에서 사용되는 구 단위 패턴은 동사구, 명사구, 형용사구 그리고 부사구를 중심으로 한국어 패턴, 패턴 대표 카테고리, 한국어 패턴의 중심어 및 제약조건 대역영어패턴 의미코드로 나뉜다. 범 언어적인 특성의 한국어와 영어간 격차를 해소하기 위해 각각의 명사에 의미코드를 사용하여 다중 언어기반 체계를 구축하였으며. 한국어의 개별적인 특성으로 인해 발생하는 문제를 해소하기 위해 중심어 부과 자질을 사용하였다. 중심어 부과 자질에 있어서, 특히 술어기능명사를 중심어로 하는 기능동사 '하-' 구문은 다른 동사 구문의 형식과는 달리 논항의 수와 형태를 동사가 아닌 명사가 수행하게 된다. 이러한 특징에 대한 변별적인 자질 부여는 구문의 형태-통사적 특징 뿐만이 아니라 의미적인 고유의 특성까지도 잘 뒷받침하면서 패턴 추출에 월등한 효율성을 제시할 수 있다. 향후 이에 대한 연구는 전반적인 기능동사 구문뿐만이 아니라 개별적인 특징을 보이는 모든 구문에 대한 연구로 확대되어 패턴 기반 기계번역의 패턴 추출에 기본적인 정보의 역할을 담당해야 할 것이다.

  • PDF

A study on the Form of Sijo seen from Various Aspects (다각적 관점에서 본 시조 형식 연구)

  • Im, Jong-Chan
    • Sijohaknonchong
    • /
    • v.30
    • /
    • pp.147-164
    • /
    • 2009
  • The conclusion of this paper is as follows. First, the authentic syllable count of sijo can be summed up as following: Second, the structure of the statement can be summed up as following: 1) Each statement extremely excludes the use of modifiers to clarify the development of the logic. 2) The meaning of each of the three statement, chojang (the 1st statement), jungjang (the middle statement) and jongjang (the last statement), is connected to the previous one closely, so the text as a whole is perfect. 3) The last statement identifies itself as the conversion or conclusion of the whole text. Therefore, the last statement should begin with a connective adverb like 'Therefore' or 'Then'. But in ancient sijo works, this sort of connected adverb is normally omitted. 4) Each statement of sijo is composed of one of the 4 structures suggested below: a) subjective phrase + predicative phrase b) the formal clause + the latter clause c) location-indicating phrase + sentence d) objective phrase + predicative phrase Since the text of a sijo work is formed like this, sijo is said to be composed of three jang (statement) & six gu (phrase), which is the very feature that proves that sijo is a fixed form of verse.

  • PDF

Effect of Eff Component on Stability of IgY Antibody Acitivity to In Vitro Digestion (In Vitro 소화시 lgy항체 활성의 안정성에 대한 계란 성분의 효과)

  • 이승배;최석호
    • Food Science of Animal Resources
    • /
    • v.20 no.4
    • /
    • pp.303-310
    • /
    • 2000
  • In vitro 소화시 계란 성분이 anti-Y ruckeri IgY 항세 활성을 안정화시키는데 어떡해 관여하는지를 SDS-PAGE와 ELISA로 조사한 결과는 다음과 같다. Anti-Y ruckeris IgY 항체와 난황 및 난백으로 혼합 후 펩신으로소화시킨 후 경우 1시간 후 난황 및 난백이 혼합된 시료에서 모두 anti-Y ruckeri IgY 항체의 heavy chain과 light chain이 분해는 되었지만 어느 정도 밴드를 관찰할 수있었으며, anti-Y, ruckeri IgY 항체 활성 측정한 결과 난황시료는 35%, 난백시료는 61%의 항체 활성을 유지시켰다. Anti-Y ruckeri IgY 항체와 오보알부민, 오보뮤우신, 라이소자임 및 오보뮤코이드를 혼합 한 후 펩신으로 소화시킨 경우 1시간 우에는 anti-Y, ruckeri IgY항체의 heavy chain의 밴드르 fdjsm 정도 볼 수 있는 형태로 나타났으며, anti-Y, ruckeri IgY 항체의 light chain는 오보뮤우신 및 오보뮤코이드가 홉합되어 펩신으로 소화시킨 경우 1시간 후에는 밴드를 거의 볼수 없었으나 오보알부민 오보트란스훼린 및 라이소자임에 혼합된 시료에서 밴드를 관찰할수 있었다. 특히 라이소자임과 오보트란스훼린의 경우 펩신 호화 2시간 우에도 anti-Y, ruckeri IgY 항체의 light 밴드가 관찰되었다. 펩신소화 1시간 후에 난백성분이오보알부민, 오보뮤우신, 라이소자임, 오보트란스웨린 및 오부뮤코이드 중에서 단지 오보트란스훼린만이 38%의 anti-Y, ruckeri IgY 항체 활서을 보인후 2시간 후에도 15% 정동의 활성을 나타내었다. anti-Y, ruckeri IgY항체와 난백 및 전란을 혼합한 다음 무지개송어 위 추출액으로 소화시 2시간 후에 난백은 14%, 전란은 69%로 anti-Y, ruckeri IgY 항체 활성을 유지시킨 것으로 나타났다.X> $e_{I}$ WPi_BE_QE]]]]]로 상징하며 WLWQ에 적용되는 몇 가지 제약을 관찰하고 이를 일반적인 언어원리로 설명한다. 첫째, XP는 주어로만 해석되는데 그 이유는 XP가 목적어 혹은 부가어 등 다른 기능을 할 경우 생략 부위가 생략의 복원 가능선 원리 (the deletion-up-to recoverability principle)를 위배하기 때문이다. 둘째, WLWQ가 내용 의문문으로만 해석되는데 그 이유는 양의 공리(the maxim of quantity: Grice 1975) 때문이다. 평서문으로 해석될 경우 WP에 들어갈 부분이 XP의 자질의 부분집합에 불과하므로 명제가 아무런 정보제공을 하지 못한다. 반면 의문문 자체는 정보제공을 추구하지 않으므로 앞에서 언급한 양의 공리로부터 자유롭다. 셋째, WLWQ의 XP는 주제어 표지 ‘는/-은’을 취하나 주어표지 ‘가/-이’는 취하지 못한다(XP-는/-은 vs. XP-가/-이). 이는 IP내부 에 비공범주의 존재 여부에 따라 C의 음운형태(PF)가 시성이 정해진다는 가설로 설명하고자 했다. WLWQ에 대한 우리의 논의가 옳다면, 본 논문은 다음과 같은 이론적 함의를 기닌다. 첫째, WLWQ의 존재는 생략에 대한 두 이론 즉 LF 복사 이론과 PF 삭제 이론 중 전자의 입장을 지지한다. 둘째, WP를 XP로부터 복원할 때 부분 자질만 복사된다. 이는 어휘가 통사층위로 들어온 이후에도 어휘 자질들이 완전히 동결되는 것이 아니라 계속 지시될 수 있다는 가설을 지지한다.

  • PDF

Bioactivities and Isolation of Functional Compounds from Decay-Resistant Hardwood Species (고내후성 활엽수종의 추출성분을 이용한 신기능성 물질의 분리 및 생리활성)

  • 배영수;이상용;오덕환;최돈하;김영균
    • Journal of Korea Foresty Energy
    • /
    • v.19 no.2
    • /
    • pp.93-101
    • /
    • 2000
  • Wood of Robinia pseudoacacia and bark of Populus alba$\times$P. glandulosa, Fraxinus rhynchophylla and Ulmus davidiana var. japonica were collected and extracted with acetone-water(7:3, v/v) in glass jar to examine whether its bioactive compounds exist. The concentrated extracts were fractionated with hexane, chloroform, ethylacetate and water, and then freeze-dried for column chromatography and bioactive tests. The isolated compounds were sakuranetin-5-O-$\beta$-D-glucopyranoside from Populus alba $\times$Pl glandulosa, 4--ethyoxy-(+)-leucorobinetinidin frm R. pseudoacacia and fraxetion from F. rhynchophylla and were characterized by $^1H$ and$^{13}C $ NMR and positive FAB-MS. Decay-resistant activity was expressed by weight loss ratio and hyphae growth inhibition in the wood dust agar medium inoculated wood rot fungi. R. pseudoacacia showed best anti-decaying property in both test and its methanol untreated samples, indicating higher activity than methanol treated samples in hyphae grwoth test. In antioxidative test, $\alpha$-tocopherol, one of natural antioxidants, and BHT, one of synthetic antioxidants, were used as references to cmpare with the antioxidant activities of the extacted fractions. Ethylacetate fraction of F. rhynchophylla bark indicated the hightest activity in this test and all fractions of R. pseudiacacia extractives also indicated higher activities compared with the other fractions. In the isolated compounds, aesculetin isolated from F. rhynchophylla bark showed best activity and followed by robonetinidin from R. pseudoacaica.

  • PDF