• Title/Summary/Keyword: 관용표현

Search Result 37, Processing Time 0.045 seconds

Korean Idiom Classification Using Word Embedding (워드 임베딩을 활용한 관용표현 인식 연구)

  • Park, Seo-Yoon;Kang, Ye-Jee;Kang, Hye-Rin;Jang, Yeon-Ji;Kim, Han-Saem
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.548-553
    • /
    • 2020
  • 우리가 쓰는 일상 언어 중에는 언어적 직관이 없는 사람은 의미 파악이 힘든 관용표현이 존재한다. 관용표현을 이해하기 위해서는 표현에 대한 형태적, 의미적 이해가 수반되어야 하기 때문이다. 기계도 마찬가지로 언어적 직관이 없기 때문에 관용표현에 대한 자연어 처리에는 어려움이 따른다. 특히 일반표현과 중의성 관계에 있는 관용표현의 특성이 고려되지 않은 채 문자적으로만 분석될 위험성이 높다. 본 연구에서는 '관용표현은 주변 문맥과의 관련성이 떨어진다'라는 가정을 중심으로 워드 임베딩을 활용한 관용표현과 일반표현에 대한 구분을 시도하였다. 실험은 4개 표현에 대해 이루어 졌으며 Skip-gram, Fasttext를 활용한 방법을 통해 관용표현은 주변 단어들과의 유사성이 떨어짐을 확인하였다.

  • PDF

Embedding with different levels for idiom disambiguation (관용표현 중의성 해소를 위한 다층위 임베딩 연구)

  • Park, Seo-Yoon;Kang, Ye-Jee;Kang, Hye-Rin;Jang, Yeon-Ji;Kim, Han-Saem
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.167-172
    • /
    • 2021
  • 관용표현 중에는 중의성을 가진 표현이 많다. 즉 하나의 표현이 맥락에 따라 일반적 의미와 관용적 의미 두 가지 이상으로 해석될 가능성이 있어 이런 유형의 관용표현을 중의성 해소 없이 자연어 처리 태스크에 적용할 경우 문제가 발생하게 된다. 본 연구에서는 관용표현의 특성인 중의성과 더불어 '관용표현은 이미 사용자의 머릿속에 하나의 토큰으로 저장되어 있다'라는 'Idiom Principle'을 바탕으로 관용표현에 대해 각각 표면형, 단순 단일 토큰형, stemming 단일 토큰형 층위의 임베딩을 만들어 관용표현 분류 연구를 진행하였으며, 실험 결과 표면형 및 stemming을 적용하지 않은 단순 단일 토큰으로 학습하는 것보다, stemming을 적용한 후 단일 토큰으로 학습하는 것이 관용표현의 중의성 해소에 유의미한 효과가 있음을 확인하였다.

  • PDF

A Study Regarding Education Method on Idiomatic Expressions Appearing in the Korean Drama for Learners of Korean Language (한국어 학습자를 위한 드라마 <도깨비> 속 관용표현 교육 방안 연구)

  • Song, Dae-Heon
    • Journal of Korea Entertainment Industry Association
    • /
    • v.14 no.5
    • /
    • pp.181-191
    • /
    • 2020
  • The purpose of this study is to suggest a direction for efficient teaching and learning idiomatic expressions in Korean to improve the vocabulary of Korean language learners. In order to make learning more interesting and enhance learning effectiveness for Korean language learners, the drama, , which was popular in Korea, was used as educational material. Since idomatic language is formed and used based on Korean history, culture, and social background, dramas containing Korean culture and sentiments can be said to be suitable materials for the teaching and learning of Korean idiomatic expressions. By analyzing the drama , 277 significant vocabularies were extracted from the drama based on vocabulary actually used. Among these, 124 idiomatic expressions were extracted after excluding overlapping expressions. Idiomatic expressions extracted in this way were classified based on vocabulary used more than 2 times. In addition, in order to select idiomatic expressions suitable for the level of the learners, 46 final expressions for Korean language education were selected considering the difficulty of vocabulary. Lastly, when the materials selected in the drama were used for education, the precautions for teaching and learning, and the direction of education on idiomatic language were classified into elementary, intermediate, and advanced grades and presented.

On the development of a computational lexical database of idiomatic expressions in the frmework of 21st Sejong Project (21세기 세종계획 관용표현 전자사전 구축에 대하여)

  • Pak, Man-Ghyu;Yi, Sun-Woong;Na, Yun-Hee;Lee, Kwang-Ho
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.334-340
    • /
    • 2001
  • 본고는 올해 처음 시도하는 세종계획 관용표현 전자사전 구축에 관한 글이다. 본 전자사전이 완성되면 관용표현의 총체적 정보(형태, 통사, 의미, 화용 정보)를 수록하는 최초의 업적이 될 뿐만 아니라 실제 언어 자료에서 흔히 볼 수 있는 관습적 표현까지 모두 포괄하는 4만 표제어의 대규모 사전이 될 것이다. 본 사전에서는 관용표현의 형태 통사적 구성과 그 분포적 속성뿐 아니라, 관용표현이 가지는 논항의 존재 유무, 구조, 조사 통합 양상, 그리고 고정명사에 대한 수식어 제약, 어휘적 통사적 변형 양상, 선어말어미 제약, 어말어미 제약, 문장 유형 제약 등이 수록된다. 또한 각 논항의 의미역과 선택제약에 관한 정보, 그 외 다양한 의미 화용 정보 어원 표기 정보 등도 담기게 된다. 본고에서는 그러한 정보의 표기 양식을 하나하나 명시적으로 설명할 것이다.

  • PDF

The Idiom, the Lexicon, and the Formation of a Sentence (관용 표현과 어휘부, 그리고 문장의 형성)

  • Hwang, Hwa-sang
    • Korean Linguistics
    • /
    • v.65
    • /
    • pp.295-320
    • /
    • 2014
  • The idiom is listed in the lexicon, because it's meaning cannot be inferred from it's constituents. And the idiom is a single semantic unit. Thus the idiom is inserted to the syntax in the quality of a word. But the idiom is not always inserted to the syntax as a word. In the process generating the sentence, we can recognize the categorial property of the idiom that it is formally equal to the syntactic phrase. Then each of the constituents of the idiom can be inserted to the syntax. This is why the syntactic operation(as modification, topicalization, relativization, etc) can be applied to the constituent of the idiom. In this respect the idiom is a flexible construction as the listeme of a lexicon. The flexible property of the idiom is related to the dynamicity of a lexicon. The formal or semantic transformation of the idiom is the good example to show the dynamicity of a lexicon.

A recognition algorithm of Korean verb and noun idiomatic phrases (한국어 동사와 명사 관용구 인식 알고리즘)

  • Lee, Ho Suk
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.170-175
    • /
    • 2009
  • 본 논문은 한국어 관용구 인식 알고리즘에 대하여 논의한다. 다음(daum) 전자 사전에는 관용구의 의미를, "두 개 이상의 단어로 이루어져 있으면서, 그 단어들의 의미만으로는 전체 의미를 알 수 없는, 특수한 의미를 나타내는 어구" 라고 설명되어 있다. 한국어 관용구의 길이는 2글자 ~ 4글자인 경우가 많으며 그 이상인 경우도 있다. 대부분의 관용구는 일반 사전에 동사와 명사를 기준으로 분류되어 있으며, 품사 표시나 구절 표시 없이 어절의 문자열 형태로만 표현되어 나타난다. 본 논문에서는 전자 사전에 품사 표시나 구절 표시 없이 어절 문자열 형태로 저장되어 있는 한국어 관용구를 입력 문장에서 인식하는 관용구 인식 알고리즘에 대하여 논의한다. 그리고 연어 인식과 명사의 의미 속성 처리에 대하여서도 논의한다.

  • PDF

Verarbeitungsprozess der Bedeutungen von sprachlichen $Ausdr\"{u}cken$ (언어표현에 나타난 의미의 처리과정)

  • OH Young Hun
    • Koreanishche Zeitschrift fur Deutsche Sprachwissenschaft
    • /
    • v.3
    • /
    • pp.277-301
    • /
    • 2001
  • 우리가 간단히 사용하는 언어는 실제적으로 아주 복잡한 진행과정을 가지고 있다. 사전상의 각 어휘는 대화상황에서 상호 작용하는 초기단계의 역할을 하며, 표현은 과거나 현재에 행해지는 대화상황 및 대화참여자의 발화 과정에서 생기는 일종의 일체감을 표시한다. 의사 소통을 한다는 것은 단어나 문장에 대한 다양한 의미와 각각의 개념에서 지시되는 표현을 수단으로 발생하는 대화상의 연관성을 의미한다. 이러한 모든 것은 의사소통에 있어 의미의 다양성과 관련을 맺고있다. 우리는 표현을 통하여 매우 복잡하고 다양한 양상들을 볼 수 있다. 대화내용에 따라 똑같은 표현들이 서로 다르게 이해될 수 있기 때문이다. 언어는 단지 사람이 행하는 언어처리의 일부만을 보여줄 뿐이다 언어를 처리하는데 있어서 문제가 되는 것은 매우 복잡하고 구성적인 진행과정이다. 청자는 의사소통이 진행되는 과정에서 활자와 함께 주어진 정보를 처리함으로써 상황을 내적 형상화하게 된다. 따라서 청자는 표현의 의미를 이해하려고 노력하며, 다양한 방법을 동원한 지식을 사용한다. 의사소통에 있어서 통사적$\cdot$의미적인 지식, 문맥에 맞는 대화지식 혹은 일반 지식을 대화상황에 맞게 적용하는 것이 그 예라 할 수 있다. 지시적 언어의 표현은 사전적으로 고정된 단어의 의미를 규정하거나 또는 이와 같은 단어의 의미에 정확하고 적절한 지시사를 규정하는 근거가 된다. 인칭$\cdot$장소$\cdot$시간을 지시하는 언어 Personal-, Lokal-, Temporaldeixis는 언어 시스템을 형성하게 되는데, 활자와 청자는 이러한 표현을 인칭$\cdot$장소$\cdot$시간으로 형상화하면서 의사소통을 한다. 따라서 자연어의 처리과정에 나타나는 다양한 표현들에 대한 심리학 및 언어학의 강력한 연구가 요구된다.에 기대어 텍스트, 문장, 어휘영역 등이 투입되어 적용되었으며, 이에 상응되게 구체적인 몇몇 방안들이 제시되었다. 학습자들이 텍스트를 읽고 중심내용을 찾아내며, 단락을 구획하고 또한 체계를 파악하는데 있어서 어휘연습은 외국어 교수법 측면에서도 매우 관여적이며 시의적절한 과제라 생각된다. Sd 2) PL - Sn - pS: (1) PL[VPL - Sa] - Sn - pS (2) PL[VPL - pS] - Sn - pS (3) PL(VPL - Sa - pS) - Sn - pS 3) PL[VPL - pS) - Sn -Sa $\cdot$ 3가 동사 관용구: (1) PL[VPL - pS] - Sn - Sd - Sa (2) PL[VPL - pS] - Sn - Sa - pS (3) PL[VPL - Sa] - Sn - Sd - pS 이러한 분류가 보여주듯이, 독일어에는 1가, 2가, 3가의 관용구가 있으며, 구조 외적으로 동일한 통사적 결합가를 갖는다 하더라도 구조 내적 성분구조가 다르다는 것을 알 수 있다. 우리는 이 글이 외국어로서의 독일어를 배우는 이들에게 독일어의 관용구를 보다 올바르게 이해할 수 있는 방법론적인 토대를 제공함은 물론, (관용어) 사전에서 외국인 학습자를 고려하여 관용구를 알기 쉽게 기술하는 데 도움을 줄 수 있기를 바란다.되기 시작하면서 남황해 분지는 구조역전의 현상이 일어났으며, 동시에 발해 분지는 인리형 분지로 발달하게 되었다. 따라서, 올리고세 동안 발해 분지에서는 퇴적작용이, 남황해 분지에서는 심한 구조역전에 의한 분지변형이 동시에 일어났다 올리고세 이후 현재까지, 남황해 분지와 발해 분지들은 간헐적인 해침과 함께 광역적 침강을 유지하면서 안정된 대륙 및 대륙붕 지역으로 전이되었다.

  • PDF

English-Korean Machine Translation based-on Bilingual Relation of Idiomatic Expressions (관용적 표현의 대응 관계에 기반한 영어-한국어 기계 번역)

  • Yoon, Sung-Hee;Kim, Yung-Taek
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.571-580
    • /
    • 1993
  • 영어 문장을 한국어 문장으로 기계 번역하는 과정에는 분석 규칙이나 변환 규칙만으로는 해결하기 어려운 표현의 대응 관계들이 많이 나타난다. 본 논문은 영어-한국어 기계 번역에서 질적으로 향상된 한국어 문장을 얻기 위하여 두 언어 표현들 사이의 관용적 대응 관계에 기반하는 번역 방식을 논한다. 두 언어 표현들 사이의 다양한 직접 대응 관계를 제공하는 번역 사전을 이용하며, 입력 영어 문장으로부터 이와 같은 표현들을 인식하고 한국어 표현으로 직접적으로 대응시키는 번역 방식이다. 이러한 번역 방식은 기존의 변환 규칙 기반의 번역 방식보다 자연스러운 한국어 문장을 생성할 뿐만 아니라, 많은 구조적-의미적 모호성을 해결함으로써 시간적-공간적 처리효율을 크게 높일 수 있다.

  • PDF

[$\"{U}berlegungen$] zur lexikographischen Darstellung eines phraseologischen $W\"{o}rterbuchs\;{\lceil}Duden\;Band\;11{\rfloor}$

  • Kim Soo-Nam
    • Koreanishche Zeitschrift fur Deutsche Sprachwissenschaft
    • /
    • v.2
    • /
    • pp.49-73
    • /
    • 2000
  • 우리는 이 글에서 독일어 관용어들을 가장 광범위하게 수록하고 있으며, 가장 신뢰받는 $\lceil$DUDEN(1992)-관용어 사전$\rfloor$을 대상으로 특히 동사 관용구의 사전적 표제어(lexikographische Nennform) 및 결합가 진술(Valenzangabe)과 관련한 문제를 논의해 보았다. 이러한 지적은 주로 학술지의 서평(Rezension)을 통해 언급되고 있다. 따라서 이 글에서는 J. Korhonen(1993), D. Steffens(1994), J. Mohring/I. Bar2 (1994)의 서평을 근거로 하여 이 사전의 문제점을 살펴보았다. 특히 이 사전을 사용하는 외국인 학습자들의 입장에서 몇 가지 문제점을 제기하고 그에 대한 대안을 모색해 보았다. 우리는 이 글이 독일어 관용어 사전을 보다 잘 이용할 수 있는 배경지식이 되길 바라며, 아울러 독일어 학습에서 어려운 어휘에 속하는 vPL의 내용 및 표현구조를 보다 잘 이해하는데 도움이 되길 기대한다.

  • PDF

A Study on the Need For Standardization of Generic Color Name for Utilization of Dye Plant Resource and Cultural Succession (염료식물 자원활용 및 문화계승을 위한 관용색명의 표준화 필요성 연구)

  • Youngju Kim;Min-Im Cho;Seulgi Lee;Chunghee Lee
    • Proceedings of the Plant Resources Society of Korea Conference
    • /
    • 2023.04a
    • /
    • pp.48-48
    • /
    • 2023
  • 지역의 역사성을 지니고 발전한 전통색은 지역 문화와 자연환경에 영향을 받는다. 전통색은 일반적으로 관용색명으로 표현하는데, 이는 세계인의 공용어가 아니므로 우리의 천연염색을 국내외 일반인과 공유하기 위해서는 표준화된 색명(KS-계열색, RGB, CMYK)을 사용하는 것이 필요하다. 우리나라에서 염료재로 활용된 염료식물은 393종으로 알려져 있다. 본 연구에서는 염료식물의 자원 활용과 그 보전적 가치를 알리고자 염료식물을 언급한 고문서 및 현대자료를 바탕으로 사용 부위, 매염제의 종류, 염색 시 발현 색상의 관용색명을 조사하였고, 이를 국가표준색상환에 대입하여 표준화에 대한 방향성을 제시하고자 한다. 연구 결과에 따르면, 염료식물 393종 중 관용색명을 가진 염료식물은 312종이었고, 관용색명의 정보가 없는 식물은 81종으로 나타났다. 염료식물의 사용 부위 정보를 가진 식물은 187종이었고, 이용부위는 식물체 전체(전초), 뿌리, 줄기(껍질), 줄기(심재), 나뭇가지, 잎, 열매(껍질), 꽃이었다. 염료식물에 활용되는 매염재는 15가지(천연 6종, 화학 9종)로 나타났다. 관용색명을 가진 염료식물 312종에서 조사된 540개 관용색명을 표준화 시키기 위하여 국가표준색상환에 대입한 결과, 표준화된 색명(KS계통색명, RGB, CMYK)을 갖는 식물은 127종, 관용색명은 있지만 표준화된 색명을 확인할 수 없는 식물은 185종인 것으로 나타났다. 향후 염료식물을 연구하는데 있어서 관용색명의 정보가 없는 염료식물에 대한 표준화된 색명을 찾아내는 연구가 이루어져야 할 것이다.

  • PDF