• Title/Summary/Keyword: 한국어 문형

Search Result 49, Processing Time 0.028 seconds

An Analysis of Korean Dependency Relation by Homograph Disambiguation (동형이의어 분별에 의한 한국어 의존관계 분석)

  • Kim, Hong-Soon;Ock, Cheol-Young
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.3 no.6
    • /
    • pp.219-230
    • /
    • 2014
  • An analysis of dependency relation is a job that determines the governor and the dependent between words in sentence. The dependency relation of predicate is established by patterns and selectional restriction of subcategorization of the predicate. This paper proposes a method of analysis of Korean dependency relation using homograph predicate disambiguated in morphology analysis phase. The disambiguated homograph predicates has each different pattern. Especially reusing a stage transition training dictionary used during tagging POS and homograph, we propose a method of fixing the dependency relation of {noun+postposition, predicate}, and we analyze the accuracy and an effect of homograph for analysis of dependency relation. We used the Sejong Phrase Structured Corpus for experiment. We transformed the phrase structured corpus to dependency relation structure and tagged homograph. From the experiment, the accuracy of dependency relation by disambiguating homograph is 80.38%, the accuracy is increased by 0.42% compared with one of undisambiguated homograph. The Z-values in statistical hypothesis testing with significance level 1% is ${\mid}Z{\mid}=4.63{\geq}z_{0.01}=2.33$. So we can conclude that the homograph affects on analysis of dependency relation, and the stage transition training dictionary used in tagging POS and homograph affects 7.14% on the accuracy of dependency relation.

Satzmodelle im Koreanischen und Deutschen im Hinblick auf ihre didaktische Verwertbarkeit ($\cdot$독 문형의 비료설정 시론)

  • Min Chun-Gi
    • Koreanishche Zeitschrift fur Deutsche Sprachwissenschaft
    • /
    • v.7
    • /
    • pp.85-104
    • /
    • 2003
  • In der vorliegenden Arbeit werden die deutschen Satzmodelle $f\"{u}r$ Zwecke des DaF-Unterrichts in Korea untersucht. Dabei gehen wir davon aus, dass man die deutschen Satzmodelle vergleichend mit den koreanischen neu aufbauen sollte, um sie im Deutschunterricht fur Koraner recht benutzen zu konnen. Dafur haben wir hier zunachst untersucht, wie man die koreanischen Satzmodelle im Hinblick auf den didaktischen Zweck modifizieren muss. Unter $Ber\"{u}cksichtigung$ des dabei erzielten Ergebnisses wurden $anschlie{\ss}end$end die deutschen Satzmodelle rekonstruiert. Im Koreanischen wurden die Satzmodelle ab Ende der 1960er Jahre verschiedenartig untersucht. Zwar gibt es bisher noch keine Arbeit, die Ergebnisse dieser Forschungen zusammenfasst, dennoch versuchen wir hier aus einigen bisherigen Untersuchungen einen begrenzten Rahmen von koreanischen Satzmodellen herauszufinden. Als Resultat haben wir funf grundlegende Satzmolle hergestellt: (1) Subjekt + $Pr\"{a}dikat$, (2) Subjekt + $Pr\"{a}dikativ$ + $Pr\"{a}dikat$, (3) Subjekt + Objektiv + $Pr\"{a}dikat$, (4) Subjekt + Adverbiale + $Pr\"{a}dikat$, (5) Subjekt + Obj. + Obj./$Pr\"{a}dikativ$/Advb. + $Pr\"{a}dikat$. Das Modell (1) $umfa{\ss}t$ drei $Pr\"{a}dikate$, die sich nach den Wortarten unterscheiden: (intransitives) Verb, Adjektiv und Substantiv. Auch beim Fall (5) $k\"{o}nnen$ drei verschiedene Untermodelle nach der $Kombinationsm\"{o}glichkeit$ auftreten: Sub + Obj. + $Pr\"{a}d$., Sub. + Obj. + $Pr\"{a}dikativ$ + $Pr\"{a}d$., Sub. + Obj. + Advb. + $Pr\"{a}d$. Auch im Deutschen kann man ahnlich wie im Koreanischen didaktisch geeignete Satzmodelle herausarbeiten. Auch dabei wurden bisherige Untersuchungen zu den deutschen Satzmodellen herangewgen. Zu der $d\"{a}fur$ $ausgew\"{a}hlten$ Terminologie $geh\"{o}ren$ Subjekt(S), $Pr\"{a}dikat(P)$, $Pr\"{a}dkativerganzung(PE)$, $Objekterg\"{a}nzung(OE)$, $Adverbialerg\"{a}nzung(AE)$. In der deutschen Sprache werden nach den $Valenzm\"{o}glich­keiten$ des $Pr\"{a}dikativteils$ folgende Modelle unterschieden: S + P, S + P + PE, S + P + OE, S + P + AE, S + P + OE + OE/PE/AE. Unter die OE werden okk. OE, dat. OE, $pr\"{a}d$. OE, refl. OE usw. subsumiert. Um die Stichhaltigkeit der in dieser Schrift neu festgestellten Satzmodelle zu $\"{u}berpr\"{u}fen$, sollten sie anhand eines Textkorpus heutiger Texte in weiteren Untersuchungen validiert werden. Ferner ist es zu empfehlen, die Anwendbarkeit der hier vorgestellten Satzrnodelle im Deutschunterricht $f\"{u}r$ Koreaner $gr\"{u}ndlich$ zu testen

  • PDF

Document Embedding for Entity Linking in Social Media (문서 임베딩을 이용한 소셜 미디어 문장의 개체 연결)

  • Park, Youngmin;Jeong, Soyun;Lee, Jeong-Eom;Shin, Dongsoo;Kim, Seona;Seo, Junyun
    • Annual Conference on Human and Language Technology
    • /
    • 2017.10a
    • /
    • pp.194-196
    • /
    • 2017
  • 기존의 단어 기반 접근법을 이용한 개체 연결은 단어의 변형, 신조어 등이 빈번하게 나타나는 비정형 문장에 대해서는 좋은 성능을 기대하기 어렵다. 본 논문에서는 문서 임베딩과 선형 변환을 이용하여 단어 기반 접근법의 단점을 해소하는 개체 연결을 제안한다. 문서 임베딩은 하나의 문서 전체를 벡터 공간에 표현하여 문서 간 의미적 유사도를 계산할 수 있다. 본 논문에서는 또한 비교적 정형 문장인 위키백과 문장과 비정형 문장인 소셜 미디어 문장 사이에 선형 변환을 수행하여 두 문형 사이의 표현 격차를 해소하였다. 제안하는 개체 연결 방법은 대표적인 소셜 미디어인 트위터 환경 문장에서 단어 기반 접근법과 비교하여 높은 성능 향상을 보였다.

  • PDF

Semantic Types and Representation of Korean Set Time Expressions (한국어 집합 시간 표현의 의미 유형과 표상)

  • Kim, Mun-Hyong;Jo, Yu-Mi;You, Hyun-Jo;Jang, Ha-Yeon;Kim, Yoon-Shin;Nam, Seung-Ho;Shin, Hyo-Pil
    • Language and Information
    • /
    • v.16 no.1
    • /
    • pp.25-43
    • /
    • 2012
  • This study introduces set-denoting time expressions in Korean, which can be divided into simple and complex types. It was found that while the simple type expressions are easily represented within ISO-TimeML, a time-expression markup language, some complex type set-denoting expressions are not. Therefore, this study analyzes the reason for these difficulties in representing complex type expressions, as well as suggests the introduction of @measure and @interpretation attributes in the TIMEX3 tag. The @measure attribute represents the time interval, and the @interpretation attribute is used to distinguish distributive readings from cumulative readings. Additionally this paper suggests that a mapping between these and other attributes are required in TLINK.

  • PDF

Dependency parsing applying reinforced dominance-dependency constraint rule: Combination of deep learning and linguistic knowledge (강화된 지배소-의존소 제약규칙을 적용한 의존구문분석 모델 : 심층학습과 언어지식의 결합)

  • JoongMin Shin;Sanghyun Cho;Seunglyul Park;Seongki Choi;Minho Kim;Miyeon Kim;Hyuk-Chul Kwon
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.289-294
    • /
    • 2022
  • 의존구문분석은 문장을 의존관계(의존소-지배소)로 분석하는 구문분석 방법론이다. 현재 사전학습모델을 사용한 전이 학습의 딥러닝이 좋은 성능을 보이며 많이 연구되지만, 데이터셋에 의존적이며 그로 인한 자료부족 문제와 과적합의 문제가 발생한다는 단점이 있다. 본 논문에서는 언어학적 지식에 기반한 강화된 지배소-의존소 제약규칙 에지 알고리즘을 심층학습과 결합한 모델을 제안한다. TTAS 표준 가이드라인 기반 모두의 말뭉치로 평가한 결과, 최대 UAS 96.28, LAS 93.19의 성능을 보였으며, 선행연구 대비 UAS 2.21%, LAS 1.84%의 향상된 결과를 보였다. 또한 적은 데이터셋으로 학습했음에도 8배 많은 데이터셋 학습모델 대비 UAS 0.95%의 향상과 11배 빠른 학습 시간을 보였다. 이를 통해 심층학습과 언어지식의 결합이 딥러닝의 문제점을 해결할 수 있음을 확인하였다.

  • PDF

Processing of the Syntactic Ambiguity Resolution in English as a Foreign Language (외국어로서의 영어 구문 중의성 해결 과정)

  • 정유진;이윤형;황유미;남기춘
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.05a
    • /
    • pp.261-266
    • /
    • 2000
  • 글을 이해하기 위해서는 어휘와 어휘간의 연결 및 전체 구조를 아는 것이 필요하다. 이는 비단 한국어뿐만 아니라 영어나 기타 다른 외국어에서도 마찬가지일 것이다. 본고는 두 가지를 고찰하기 위해 진행되었는데 우선 외국어로서 영어를 처리하는데 발생하는 구문적 중의성을 해결하는데 Garden Path Sentence(GPS), Late Closure(LC), PP의 세 문형에 따라 어떻게 해결하는지 알아보기 위한 것이다. 그리고 각 문형의 중의적 어절에서의 반응과 애매성 해소 어절에서의 반응에 따라 sysntactic module이 작용하는 것인지 알아보고자 한다. 예를 들어 "The boat floated down the streams sank"란 Garden Path 문장이 제시된 경우에 독자는 "sank"란 어휘가 제시되기 전까지 "floated"를 동사로 생각하게 되나 다음에 본동사인 "sank"가 제시될 경우 문장의 해석에 혼란을 갖게 될 것이다. 예문에서 "floated"가 문장에서 어떤 역할을 하는지 결정하는 것은 "sank"를 보고서야 가능하다. 이런 구문적 중의성을 해결하는 방식을 알아보기 위해 어절 단위로 제시된 자극을 읽는 자기 조절 읽기 과제(self-paced reading task)를 사용하였다. 각 어절을 읽는데 걸리는 시간을 측정한 실험 결과 GPS, PP, LC 모두 중의성을 지닌 영역이 중의성을 해소한 후와 각각 유형적으로 큰 차이가 없는 것으로 나타났다. 다만 GPS, CGPS, PP와 CPP는 어절 후반으로 갈수록 반응시간이 짧아졌다. 이는 우리나라 사람의 경우 외국어인 영어의 구문 중의성 해소는 구문 분석 단원(syntactic module)에 의한 자동적 처리라기보다 의미를 고려해 가면서 문법지식을 이용해 추론을 통한 구문 분석이라 할 수 있다.에 의한 자동적 처리라기보다 의미를 고려해 가면서 문법지식을 이용해 추론을 통한 구문 분석이라 할 수 있다.많았다(P<0.05).조군인 Group 1에서보다 높은 수준으로 발현되었다. 하지만 $12.5{\;}\mu\textrm{g}/ml$의 T. denticola sonicated 추출물로 전처리한 Group 3에서는 IL-2와 IL-4의 수준이 유의성있게 억제되어 발현되었다 (p < 0.05). 이러한 결과를 통하여 T. denticola에서 추출된 면역억제 단백질이 Th1과 Th2의 cytokine 분비 기능을 억제하는 것으로 확인 되었으며 이 기전이 감염 근관에서 발견되는 T. denticola의 치수 및 치근단 질환에 대한 병인기전과 관련이 있는 것으로 사료된다.을 보였다. 본 실험 결과, $Depulpin^{\circledR}은{\;}Tempcanal^{\circledR}와{\;}Vitapex^{\circledR}$에 비해 높은 세포 독성을 보여주공 있으나, 좀 더 많은 임상적 검증이 필요할 것으로 사료된다.중요한 역할을 하는 것으로 추론할 수 있다.근관벽을 처리하는 것이 필요하다고 사료된다.크기에 의존하며, 또한 이러한 영향은 $(Ti_{1-x}AI_{x})N$ 피막에 존재하는 AI의 함량이 높고, 초기에 증착된 막의 업자 크기가 작을 수록 클 것으로 여겨진다. 그리고 환경의 의미의 차이에 따라 경관의 미학적 평가가 달라진 것으로 나타났다.corner$적 의도에 의한 경관구성의 일면을 확인할수 있지만 엄밀히 생각하여 보면 이러한 예의 경우도 최락의 총체적인 외형은 마찬가지로 $\ulcorner$순응$\lrcorner$의 범위를 벗어나지 않는다. 그렇기 때문에도 $\ulcorner$순응$\lrcorner$$\ulcorner$표현$\lrcorner$의 성격과 형태를 외형상으로 더욱이 공간상에서는 뚜렷하게 경계

  • PDF

Automatic Construction of Syntactic Relation in U-WIN (U-WIN의 구문관계 자동구축 방법)

  • Im, Jihui;Kim, Dongmyoung;Choe, Hoseop;Yoon, Hwa-Mook;Ock, Cheolyoung
    • Annual Conference on Human and Language Technology
    • /
    • 2007.10a
    • /
    • pp.84-90
    • /
    • 2007
  • 일반적인 어휘망이 의미 관계에 의한 연결 구조를 중심으로 연구 개발된 것과는 달리, U-WIN은 의미관계를 비롯하여 개념 관계, 형태 관계, 구문 관계 등과 같이 의미 관계의 범위를 확장한 어휘 관계를 적용하여 구축하고 있다. 본 연구에서는 U-WIN의 어휘 관계 중의 하나인 구문관계를 자동으로 구축하는 방법을 제시하고자 한다. 먼저, 용언의 용례에서 문형정보를 기준으로 구문관계를 형성할 수 있는 후보명사를 추출하였으며, 추출한 후보명사는 용언의 세분화된 의미별로 정확하고 다양하게 추출할 수 있었다. 그러나 U-WIN은 다의어의 뜻풀이 하나하나를 개별적인 어휘로 구분하여 구축하였으므로, 어휘 간의 구문관계를 설정하기 위해서는 후보명사의 여러 의미 중에서 하나의 의미로 결정해야 한다. 그래서 본 연구에서는 용례 매칭 규칙, 구문패턴, 의미 유사도 등을 차례로 적용하여 후보명사의 의미를 분별하였으며, 또한 구문패턴의 빈도 정보를 이용하여 용례에 나타나지 않지만 구문관계를 형성할 수 있는 명사를 추출하여 구문관계를 확장하고자 하였다. 이러한 연구는 명사 중심의 어휘망이 용언과의 구문관계 구축을 통해 형태소 분석, 구문 분석, 의미 분석 등에 광범위하게 활용할 수 있는 어휘망의 기반을 다지는 작업이 될 수 있을 것이다.

  • PDF

KNU Korean Sentiment Lexicon: Bi-LSTM-based Method for Building a Korean Sentiment Lexicon (Bi-LSTM 기반의 한국어 감성사전 구축 방안)

  • Park, Sang-Min;Na, Chul-Won;Choi, Min-Seong;Lee, Da-Hee;On, Byung-Won
    • Journal of Intelligence and Information Systems
    • /
    • v.24 no.4
    • /
    • pp.219-240
    • /
    • 2018
  • Sentiment analysis, which is one of the text mining techniques, is a method for extracting subjective content embedded in text documents. Recently, the sentiment analysis methods have been widely used in many fields. As good examples, data-driven surveys are based on analyzing the subjectivity of text data posted by users and market researches are conducted by analyzing users' review posts to quantify users' reputation on a target product. The basic method of sentiment analysis is to use sentiment dictionary (or lexicon), a list of sentiment vocabularies with positive, neutral, or negative semantics. In general, the meaning of many sentiment words is likely to be different across domains. For example, a sentiment word, 'sad' indicates negative meaning in many fields but a movie. In order to perform accurate sentiment analysis, we need to build the sentiment dictionary for a given domain. However, such a method of building the sentiment lexicon is time-consuming and various sentiment vocabularies are not included without the use of general-purpose sentiment lexicon. In order to address this problem, several studies have been carried out to construct the sentiment lexicon suitable for a specific domain based on 'OPEN HANGUL' and 'SentiWordNet', which are general-purpose sentiment lexicons. However, OPEN HANGUL is no longer being serviced and SentiWordNet does not work well because of language difference in the process of converting Korean word into English word. There are restrictions on the use of such general-purpose sentiment lexicons as seed data for building the sentiment lexicon for a specific domain. In this article, we construct 'KNU Korean Sentiment Lexicon (KNU-KSL)', a new general-purpose Korean sentiment dictionary that is more advanced than existing general-purpose lexicons. The proposed dictionary, which is a list of domain-independent sentiment words such as 'thank you', 'worthy', and 'impressed', is built to quickly construct the sentiment dictionary for a target domain. Especially, it constructs sentiment vocabularies by analyzing the glosses contained in Standard Korean Language Dictionary (SKLD) by the following procedures: First, we propose a sentiment classification model based on Bidirectional Long Short-Term Memory (Bi-LSTM). Second, the proposed deep learning model automatically classifies each of glosses to either positive or negative meaning. Third, positive words and phrases are extracted from the glosses classified as positive meaning, while negative words and phrases are extracted from the glosses classified as negative meaning. Our experimental results show that the average accuracy of the proposed sentiment classification model is up to 89.45%. In addition, the sentiment dictionary is more extended using various external sources including SentiWordNet, SenticNet, Emotional Verbs, and Sentiment Lexicon 0603. Furthermore, we add sentiment information about frequently used coined words and emoticons that are used mainly on the Web. The KNU-KSL contains a total of 14,843 sentiment vocabularies, each of which is one of 1-grams, 2-grams, phrases, and sentence patterns. Unlike existing sentiment dictionaries, it is composed of words that are not affected by particular domains. The recent trend on sentiment analysis is to use deep learning technique without sentiment dictionaries. The importance of developing sentiment dictionaries is declined gradually. However, one of recent studies shows that the words in the sentiment dictionary can be used as features of deep learning models, resulting in the sentiment analysis performed with higher accuracy (Teng, Z., 2016). This result indicates that the sentiment dictionary is used not only for sentiment analysis but also as features of deep learning models for improving accuracy. The proposed dictionary can be used as a basic data for constructing the sentiment lexicon of a particular domain and as features of deep learning models. It is also useful to automatically and quickly build large training sets for deep learning models.

Interpretation and Education of topic phrase shown on the Analects of Confucius (1) - Based on the examples of the 'DO' eventuality meaning phrase (논어 화제구의 해석과 교육(1) - '활동(DO)' 사건의미 표시구의 예를 중심으로)

  • 김종호
    • Journal of Sinology and China Studies
    • /
    • v.79
    • /
    • pp.245-275
    • /
    • 2019
  • The Chinese language is a topic-prominent language and the ancient form of the language is not an exception. This literature examines the theta roles and cases of the arguments by setting sentence structures regarding 'TopP', which marks the eventuality meaning of 'DO', from the Analects of Confucius. Summary of the analysis is as follows: 1. Like the contemporary Chinese, ancient Chinese has two topic types; one is a base-generated topic(so called dangling topic) and the other is a topic generated by the interior movement in the TP. 2. The sentence structure of TopP from the Analects of Confucius that marks the eventuality meaning of 'DO' can be divided into seven categories which are: T+S+V+O', 'T+ES+V+EO', 'T+ES+V+EO', 'T+S+V+EC', 'T+ES+V+C', 'T+ES+V+O+C', 'T+S+V+EO+C'. 3. The predicate(V-v) of TopP from the Analects of Confucius that marks the eventuality meaning of 'DO' has a meaning characteristics of [+ will] and [+ progressive]. 4. The subject of TopP from the Analects of Confucius that marks the eventuality meaning of 'DO' is assigned a thematic role of an , and the object is assigned a thematic role of a . 5. The complement of TopP from the Analects of Confucius that marks the eventuality meaning of 'DO' is composed of overt preposition head and its complements, which receives diverse thematic roles from the preposition. However, it does not have a direct selective relationship but an indirect relationship with the main verb of the sentence. 6. Every argument, which is the subject, object, complement, and adverb, of TopP from the Analects of Confucius that marks the eventuality meaning of 'DO' can theoretically be moved in front of the subject and be topicalized. 7. The topic phrase from the Analects of Confucius that marks the eventuality meaning of 'DO' is derived in the order of predicate(V-v), object, complement, adjunct, subject, and topic, but when interpreting it in Korean it is in inverse order, which is in the order of topic, subject, adjunct, complement, object and predicate(V-v).