• 제목/요약/키워드: 한국어 숙어

검색결과 10건 처리시간 0.032초

한국어 숙어의 유형과 처리 방법: 제약기반이론적 접근 (Processing Idiomatic Expressions in Korean)

  • 정찬;김종복
    • 인지과학
    • /
    • 제18권4호
    • /
    • pp.417-444
    • /
    • 2007
  • 일반 숙어들의 구성요소들은 통사적 현상에 적용을 받지 않을 뿐만 아니라, 의미적 합성성원리를 지키지 않는다. 그러나 이러한 숙어들과는 달리 숙어의 구성 소들이 형태, 통사적 현상에 의해 영향을 받거나 의미적 합성 과정을 거치는 숙어들도 존재한다. 본 논문은 한국어에서 이러한 두 가지 유형의 숙어들을 파악하고, 이들의 속성을 살펴본다. 이러한 경험적 연구를 바탕으로, 이들 구문들을 처리할 수 있는 제약기반이론적 분석을 제공한다.

  • PDF

은유적 표현과 의미의 범위확장 (A Dynamic Comprehension Syseem with Extended Semotaction Codes)

  • 이창인;김상하
    • 인지과학
    • /
    • 제4권2호
    • /
    • pp.263-278
    • /
    • 1994
  • 본 논문에서는 영어의 은유적효현을 분석하여 한국어로 번역하는 과정을 제안한다.기존의 영어 분석기나 번역기들은 주어진 범위나 상황내에서의 분석,번역을 시도하였고,은우적 표현에 대한 시도는 기피해 왔다. 제안된 과정은 복합어나 숙어를 처리하는 과정과는 다르게 다루어진다.(Lee(1985)[5],Yoon & Kim(1993)[8]참조). 숙어나 복합어는 그 구(phrase)전체를 하나의 단위(unit)로 처리하는 반면에,은유적표현의 처리과정은 주어진 술어나 논항의 기존범의를 확장(extension of smantic property)시켜 '은유사전'(metaphor dictionary)에서 별개로 처리된다.은유적 표현으로 사용된 어휘는 은유사전에'M'로 표시된다.

현대 국어 관용구의 결합 관계 고찰 (A Study of different Combination of contemporary Korean Idiomatic Phrase)

  • 이희자
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.333-352
    • /
    • 1994
  • 이 글은 그 동안 '숙어' 또는 '관용어'라는 이름 하에 별 다른 구별 없이 일괄적으로 다루어져 왔던 현대 국어 관용구를 그의 형태적 통사적 의미론적 결합 관계의 특성에 따라 재분류하여 그들의 특성과 하위 분류 등을 밝혀 보았다. 즉, 관용구를 그 내적구조의 특성, 구성요소들 사이의 의미상의 관련성의 긴밀도, 어휘와의 정도에 따라, 어휘화된 정도가 가장 높고 긴밀도에 있어서도 가장 높고 내적구성에 있어서도 여러 가지 특성을 보이는 것을 '숙어'라 하고, 그 이외의 것을 '연어'라 했다. '연어'가 생겨난 요인에 따라 '형태적 연어'와 '통사적 연어', '의미적 연어'로 나누었다. 이러한 분류는 국어 관용구의 특성을 밝혀 줄 수 있을 뿐만 아니라, 이에 더 나아가 각 관용구의 특성에 따른 올바른 기술을 통해 국어의 특수한 어휘 결합에 대한 보다 나은 이해를 꾀할 수 있다고 본다.

  • PDF

사전기반의 한국어 상품 리뷰 의견표현 자질 추출 및 분류시스템 (Dictionary-Based Opinion Features Extraction and Classification of Korean Product Reviews)

  • 육상근
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.631-634
    • /
    • 2008
  • 인터넷을 이용한 사람들의 사회 참여가 확대되면서 다양한 의견(Opinion)들이 급속도로 증가하고 있으며 이러한 의견을 분석하여 유용한 정보로 활용하기 위한 연구가 활발히 진행되고 있다. 그 중에서도 상품리뷰는 기업에서 연구, 개발, 마케팅의 주요 자료로 사용되고 있으며 사용자가 상품의 구매를 결정하는 중요한 요인 중 하나로 작용하고 있다. 본 논문에서는 한국어로 이루어진 상품 리뷰를 분석하여 의견 자질(Feature)을 추출하고 분류(Classification)하는 시스템을 설계하고 구현하였다. 한글 의견 자질 추출을 위하여 먼저 한글 상품 리뷰를 분석하여 의견 사전을 구축하였다. 의견 사전으로는 의견 자질과 의견 어휘, 독립의견어휘, 의견 숙어, 부정어 등의 각기 다른 세부 사전을 구축하여 리뷰 분석 시 단계적으로 적용하여 정확도를 높일 수 있도록 설계하였다. 이렇게 구현된 시스템을 평가하기 위하여 각기 다른 3개의 도메인에서 실제 한국어 리뷰를 수집하여 실험을 수행하였으며 자질 추출에서는 평균 78.86% 정확률, 61.41% 재현율을, 극성 분류에서는 평균 69.46% 정확률, 42.26% 재현율을 나타냈다.

프랑스어 단어 속에 담긴 문화연구 (A Study on the Culture of the French Language)

  • 곽노경
    • 비교문화연구
    • /
    • 제48권
    • /
    • pp.135-191
    • /
    • 2017
  • 본 연구는 프랑스 고유의 문화가 담긴 '공유문화 적재어'들을 선별하여 그 단어 속에 숨겨진 문화 콘텐츠들을 연구하고 이 단어들이 한국어에 차용되면서 새롭게 탄생한 문화 현상들을 탐구함으로써 프랑스와 한국 간의 상호문화교육을 위한 기초 자료를 형성하고자 하였다. 이를 위해 선별된 '공유문화 적재어'들을 프랑스 문화 내부적 관점과 상호문화적 관점이라는 두 가지 관점에서 연구하였다. 우선 프랑스 문화 내부적 관점에서 어휘문화적 접근으로 프랑스어 단어들 가운데 한국어에 차용된 단어들 중에서 의 식 주에 해당하는 프랑스어 '공유문화 적재어' 들을 선별하여 그 단어 속에 담긴 프랑스 고유의 문화를 사전적 의미, 문화적 현상, 숙어나 관용어 표현 속에 나타난 특별한 문화 현상에 대해 탐구함으로써 그 단어의 사전적 정의를 뛰어넘는 특별한 공시를 밝혀주었다. 나아가 상호문화적 접근으로 프랑스 문화와 한국 문화의 접촉으로 동일한 프랑스어 단어가 새로운 의미로 탄생하게 되는 과정들을 차용어의 변용 양상과 문화적 현상을 중심으로 탐구함으로써 두 문화 속에 작용하는 언어적 문화적 요소들의 유사성과 차별성을 살펴보았다. 그 결과 다음과 같은 현상들을 탐구할 수 있었다. 프랑스 '공유문화 적재어' 속에 다양한 문화와 역사가 담겨 있어 개별 단어들에 대한 탐구가 프랑스 문화를 깊이 있게 탐구하도록 할뿐 아니라 이들 단어가 사용된 숙어나 관용어 표현들을 통해 개별 단어 속에서 발견하지 못한 새로운 문화 현상들이 담화 속에 존재함을 알 수 있었다. 나아가 한국어로 차용된 프랑스어 단어들은 대부분 문화 간 교류에 의해 이루어지기 때문에 부정적인 이미지를 지닌 경우보다 긍정적인 의미로 사용되는데 의미의 왜곡이 일어나는 경우가 상당수 있었다.

영한 기계번역에서의 복합어구 인식 (Complex Phrase Recognition in English-to-Korean Machine Translation : MATES/EK)

  • 장두성;김덕봉;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.503-510
    • /
    • 1992
  • 복합어는 여러개의 단어가 하나의 의미론 나타내는 단어를 말한다. 이 논문에서는 번역시 구성단어들의 의미의 합이 아닌 다른 또 하나의 의미를 나타내는 단어를 대상으로 한다. 이러한 복합어는 구문해석 단계에서 많은 애매성의 원인이 되며, 유형에 따라 숙어 처럼 새로운 의미로 항상 같이 쓰이는 복합어와 복합어의 형성이 복잡하여 규칙으로서 단어를 이해할 필요가 있는 단어로 구분할 수 있다. 첫번째 유형은 단어의 형성이 단순하여 하나의 사전 엔트리로 등록될 수 있다. 이때 이들 복합어가 가지는 개별 어휘 규칙을 같이 사전에 등록하여 사전을 효과적 이용할 수 있다. 두번째 유형은 규칙에 의한 처리를 하여야 한다. 이러한 복합어에 대한 인식을 구문분석이전에 행함으로서 적은 노력으로 복합어로 인한 전체 문장의 애매성을 감소시키고, 문장내 단어의 수를 감소시킴으로서 전채 번역시스템의 효율을 증대하며, 복합어의 처리는 번역문을 자연스럽게 생성하는 데 큰 효과를 나타낸다.

  • PDF

영한기계번역에서의 전처리에 관한 연구 (A Study on Preprocessing in English-Korean Machine Translation)

  • 김성동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.249-253
    • /
    • 2010
  • 영한기계번역은 영어와 한국어 사이에 많은 언어적인 차이가 존재하며 이를 효과적으로 해결해야 한다. 규칙기반의 영한기계번역에서는 언어간의 차이를 어휘, 구문, 변환 등의 규칙을 이용하고 숙어 등의 사전정보를 활용하는 방법이 적용되고 있으나 한계가 있다. 본 논문에서는 두 언어간의 차이를 해소하는 방안으로 전처리를 적용하였으며 규칙기반의 영한기계번역에서 요구되는 전처리작업에 대해서 연구하였다. 전처리작업은 전처리문제와 해결방안으로 구성되는데, 언어간의 차이해소에 필요한 전처리문제를 조사하여 전처리문제가 영한기계번역의 어떤 단계에서 다루어져야 할지에 의해 문제들을 구분하였으며 이를 해결하기 위한 방안을 고안하여 본 논문에서 제시하였다.

  • PDF

어절별 중의성 해소 규칙을 이용한 혼합형 한국어 품사 태깅 시스템 (Korean Part-of-Speech Tagging System Using Resolution Rules for Individual Ambiguous Word)

  • 박희근;안영민;서영훈
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제13권6호
    • /
    • pp.427-431
    • /
    • 2007
  • 본 논문에서는 어절별 중의성 해소 규칙과 trigram 통계 정보를 이용하는 혼합형 한국어 품사 태깅 시스템에 대하여 기술한다. 어절별 중의성 해소 규칙은 중의성을 가지는 어절들 각각에 대해 정의된 중의성 해소 규칙으로, 현재 중의성을 가지는 어절의 50%에 대해 작성되어 있다. 본 논문의 태깅 시스템은 먼저 보조용언, 숙어, 관용적 표현 등에 해당하는 공통규칙을 적용하고, 그 후에 어절별 중의성 해소 규칙을 적용한다. 마지막으로 중의성이 해소되지 않은 어절은 각 어절을 중심으로 하는 trigram 통계 정보를 이용하여 중의성을 해소한다. 실험 결과는 본 논문에서 제안하는 어절별 중의성 해소 규칙과 trigram 통계 정보를 혼합하여 중의성을 해소 시키는 방법이 높은 정확률과 넓은 처리 범위를 가지고 있다는 것을 보여준다.

어절별 중의성 해소 정보를 이용한 품사 태깅의 성능 향상 (Improving Part-of-speech Tagging by using Resolution Information for Individual Ambiguous Word)

  • 박희근;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.134-139
    • /
    • 2007
  • 품사 태깅 시스템에서 규칙 정보와 통계 정보는 상호보완적으로 사용되어 품사 태깅의 성능을 향상시킨다. 하지만, 두 가지 정보로는 품사 태깅의 성능을 향상시키기에는 한계가 있다. 이에 본 논문에서는 어절별 중의성 해소 정보를 이용하여 품사 태깅 시스템의 정확률을 향상시키는 방법에 대해서 기술한다. 통계 정보는 21세기 세종계획의 천만 어절 균형 말뭉치와 태그 부착 말뭉치에서 추출한 trigram 형태의 중의성 어절 및 품사 태그열 출현 빈도 정보를 이용하여 구축하였고, 규칙 정보는 보조용언, 숙어, 관용적 표현 등을 이용하여 구축하였다. 어절별 중의성 해소 정보는 세종 천만 어절 균형 말뭉치의 중의성 어절에서 고빈도 상위 50%에 해당하는 어절을 대상으로 해당 어절의 의미정보와 문맥정보를 고려하여 구축되었고, 이것은 통계 정보를 이용한 품사 태깅 전에 적용되어 분석 후보를 줄여준다. 또한, 학습을 통하여 어절별 중의성 해소 정보를 수정 및 보강하여 잘못된 품사 태깅 결과를 보정해준다. 이와 같이 통계 정보와 규칙 정보를 이용한 품사 태깅 시스템에 고빈도 중의성 어절에 대한 어절별 중의성 해소 정보를 이용함으로써 품사 태깅의 성능을 향상시킬 수 있었다.

  • PDF

성구어의 대비연구 - 독일어와 한국어 성구어의 공통성과 상이성을 중심으로 - (Kontrastive Untersuchung zu deutschen und koreanischen Phraseologismen - unter besonderer Berucksichtigung ihrer Gemeinsamkeiten und Verschiedenheiten -)

  • 김원식
    • 한국독어학회지:독어학
    • /
    • 제9집
    • /
    • pp.129-151
    • /
    • 2004
  • In der vorliegenden Arbeit wird versucht, sowohl die Gemeinsamkeiten bzw. $\"{A}hnlichkeiten$ als auch Verschiedenheiten der deutschen und koreanischen Phrasologismen festzustellen, wobei die interkultuellen Unterschiede der beiden Sprachgemeinschaften besonders $ber\"{u}cksichtigt$ werden sollen. Dabei wird von den deutschen Phraseologismen ausgegengen und es werden die Entspechungen in den koreanischen gesucht. Die $Entsprechungsm\"{o}glickeiten$ lassen sich wie folgl feststellen: 1) Gemeinsamkeiten von deutschen und koreanischen Phraseologismen (Auge um Auge, Zahn um Zahn; Augen zudrucken) 2) Entspechung von deutschen Phrasologismen und koreanischen Einzellexemen (Grund und Boden; Knall und Fall) 3) Interpretation deutscher Phraseologismen in koreanische Sprache (in Fleisch un Blut $\"{u}bergehen$; eine $H\"{a}nde$ $w\"{a}scht$ die andere) $\"{A}hnlichkeiten$ bzw. Gemeinsamkeiten bestehen vor allem in den Phraseologismen, deren gemeinsame Quelle auf die $\"{U}bernahme$ desselben Kulturgut wie die Antike, die Bibel und die Weltliteratur $zur\"{u}ckzuf\"{u}hren$ ist. Die $\"{A}hnlichkeiten$ zeigen sich auch bei den vielen somatischen Phraseologismen der beiden Sprachen, da manche somatischen Bezeichnungen die gleichen Symbolwerte haben. Hingegen beruhen Verschiedenheiten vorwiegend auf den interkulturellen Unterschieden der beiden Sprachgemeinschaften, die sich historisch­gesellschaftlich unterschiedlich entwickeln und keine Gemeinsamkeiten in Sitten und $Volksbr\"{a}uchen$ haben. Insbesonders bei den phraseologischen Vergleichen kommen viele Tierbezeichnungen als Einheit der Phraseologismen vor, die sich einander stark unterscheiden (dt. arbeiten wie ein Pferd $\to$ kr. arbeiten wie ein Rind; dt. wie Hund und Katze leben $\to$ kr. wie Hund und Affe leben). Die Zwillingsformeln der deutschen Phraseolgismen sind im Koreanischen als Einzellexem oder durch die Redupulikation $auszudr\"{u}cken$(Haus und Hof; klipp und klar; mit $H\"{a}ngen$ und $W\"{u}rgen$). Einige Redewendungen und $Sprichw\"{o}rter$ im Deutschen entsprechen den aus 4-Buchstaben bestehenden Redewendungen im Koreanischen, die aus der chinesischen Kultur stammen(viele Hunde sind des Hasen rod; Gelegenheit macht Diebe). Es sind naturlich manche Redewendungen bzw. $Sprichw\"{o}rter$, deren unterschiedliche Ausdrucksweisen auf die interkulturellen Verschiedenheiten $zur\"{u}ckzuf\"{u}hren$ sind (die $W\"{a}nde$ haben Ohren; der Apfel $f\"{a}llt$ nicht weit vom Stamm)

  • PDF