• Title/Summary/Keyword: 고유 어휘

Search Result 49, Processing Time 0.024 seconds

A Treebank-Based Approach to Preferred Nominal Words in Grammatical Relations and their Semantic Types (구문분석 말뭉치를 이용한 문법 관계의 선호 체언 어휘와 의미 유형 연구)

  • Hong, Jungha
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.35-41
    • /
    • 2008
  • 이 논문은 각 문법 관계(grammatical relation)에서 선호되는 체언 어휘를 파악하고, 이 어휘들의 의미적 유형 및 그 위계를 파악하는 것이 목적이다. 이를 위해 80만 어절의 21세기 세종계획 구문분석 말뭉치에서 그 분포를 추출하고, 통계적 검증을 통해 각 문법 관계에서 선호되는 체언 어휘를 선별한다. 이 연구에서 관찰하는 문법 관계는 주어, 목적어, 용언수식어로 하며, 이들 문법 관계에서 선호되는 어휘 추출 대상 품사는 대명사, 고유명사, 일반명사로 한다. 한정성의 강도에 따라 주어 분포 경향이 나타나며, 이에 따라 대명사 > 고유명사 > 일반명사 순으로 주어 분포 경향이 나타난다. 그러나 일반적 예측과 다르게 한정성의 강도가 더 강한 것으로 알려진 대명사가 고유명사보다 목적어와 용언수식어에서 분포 경향이 더 강하여, 일반명사 > 대명사 > 고유명사의 순으로 분포 경향이 나타난다. 대명사, 고유명사, 일반명사는 공통적으로 주어에서는 사람 지시어, 목적어에서는 사물과 장소 지시어, 그리고 용언수식어에서는 시공간 표현이 선호되어 분포한다. 특히 대명사는 각 문법기능에서 인칭대명사의 경우 인칭에 따라, 그리고 지시대명사의 경우 원근칭에 따라 선호도의 차이를 보인다. 이러한 체언 어휘의 의미적 분포 특성은 문법 관계에 통사적 기능 외에도 의미적 경향이 반영된 것으로 고려될 수 있다.

  • PDF

Wortschatzarbeit in der Wortbildung und ihre didaktische $Vorschl\"{a}ge$ (조어론에 있어서의 어휘연습과 교수법 제언)

  • Jang Ki-Sung;Jung Hyun-Sook
    • Koreanishche Zeitschrift fur Deutsche Sprachwissenschaft
    • /
    • v.3
    • /
    • pp.233-252
    • /
    • 2001
  • 1970년이래 외국어학습 및 교수법에 있어서 어휘에 관련된 문제들에 많은 관심과 그 중요성이 인식되고있다. 특히 Fleischer/Buz (1992)등에 의한 당해 영역의 연구물 뿐 아니라, 전문서적 및 어학 자료(교재)등에서도 이러한 중요성이 강조되어 왔음을 알 수 있다. Fleischer등은 조어규칙의 개념과 조어모델을 규정하는 근거들로 생산성 Produktivitat, 용인성 Akzeptabilitat, 조어참여성 Aktivitat등 중요한 매개요인으로 간주하고 있으며 $G\"{o}tze/ Hess-Luttich$ (1999)등의 학자들은 어휘체계에서 두 개 이상의 구성성분들이 결합하여 당해 시대의 시대정신이나 시대상에 부합되는 신조 어휘들을 생성하며, 또한 그 사회의 정보화와 기술화에 이바지하며, 이를 통해서 전문어의 생산력을 한층 높혀 주는 통로로 작용함을 주장한바 있다. 본고에서는 조어론의 이러한 기본원리나 개념들에 입각하여 독일어 수업에서 목표어의 습득에 관여적인 역할을 수행하는 조어모델, 즉 합성어와 파생어를 형용사와 명사의 층위에서 구체적으로 분석하고 기술했다. 예컨데, 합성어에 있어서 접두사와 접미사, 조어의 유형 가운데 축약어, 그리고 외래어 기저와 고유어 접미사 및 접두사, 고유어기저와 외래어접미사(접두사) 뿐만 아니라, 의미론적 관점에서 본 합성어의 형태, 합성 연결소의 형태와 기호의 사용, 명사적 파생어에서 고유어접미사(접두사), 축약조어와 축약어 단어형성, 형용사조어의 특성, 명시적파생 가운데 고유어(외래어) 접미사(접두사) 등이 어휘생성과 어휘신장의 관점에서 교수법의 적용가능성이 논의되었다. 결론부에서는 외국어를 습득하고자하는 학습자에게 일방적이고 획일적인 암기식 위주의 어휘학습방법에서 벗어나, 목표어가 요구하는 새로운 어휘를 획득하는데 비교적 용이하며 또한 체계적으로 습득 할 수 있도록 인지론에 기대어 텍스트, 문장, 어휘영역 등이 투입되어 적용되었으며, 이에 상응되게 구체적인 몇몇 방안들이 제시되었다. 학습자들이 텍스트를 읽고 중심내용을 찾아내며, 단락을 구획하고 또한 체계를 파악하는데 있어서 어휘연습은 외국어 교수법 측면에서도 매우 관여적이며 시의적절한 과제라 생각된다.

  • PDF

Automatic Classification of Blog Posts Considering Category-specific Information (범주별 고유 정보를 고려한 블로그 포스트의 자동 분류)

  • Kim, Suah;Oh, Sungtak;Lee, Jee-Hyong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2015.01a
    • /
    • pp.11-14
    • /
    • 2015
  • 많은 블로그 제공 사이트는 블로그 포스트 작성자에게 미리 정의된 범주 (category)에 따라 포스트의 주제에 대하여 범주를 선택할 수 있는 환경을 제공한다. 그러나 블로거들은 작성한 포스트의 범주를 매번 수동으로 선택해야 하는 불편함이 있다. 이러한 불편함의 해결을 위해 블로그 포스트를 자동으로 분류해주는 기능을 제공한다면 블로그의 활용성이 증가할 것이다. 기존의 블로그 문서 분류의 연구는 각 범주의 고유 정보를 반영하는 것에 한계가 있었다. 이러한 문제를 해결하기 위해, 본 논문에서는 범주별 고유 정보를 반영한 어휘 가중치를 제안한다. 어휘 가중치의 분석을 위하여 범주별로 블로그 문서를 수집하고, 수집한 문서에서 어휘의 빈도와 문서의 빈도, 범주별 어휘빈도 등을 고려하여 새로운 지표인 CTF, CDF, IECDF를 개발하였다. 이러한 지표를 기반으로 기존의 Naive Bayes 알고리즘으로 학습하여, 블로그 포스트를 자동으로 분류하였다. 실험에서는 본 논문에서 제안한 가중치 방법인 TF-CTF-CDF-IECDF를 사용한 분류가 가장 높은 성능을 보였다.

  • PDF

Hanja word processing on Hangul disyllabic characteristics (한글의 음절특성에 따른 한자어 정보처리)

  • 이재욱;남기춘
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2002.05a
    • /
    • pp.125-130
    • /
    • 2002
  • 우리의 언어생활을 비추어 볼 때 한자어 정보처리는 많은 연구가 이루어야 함에도 불구하고 고유어 언구에 비해 소흘해 다루어져 왔다. 본 연구는 단일 한자어를 구성하는 각 음절이 단어의 재인에 어떤 영향을 미치는지 점화과제를 통하여 알아보았다. 본 실험은 기존의 한자어 연구에 빈도특성과 고유어와 외래어의 글자특성까지 고려하여 종합적으로 살펴보았다. 먼저 실험1의 어휘판단관제에서는 고유어와 한자어의 양상이 비슷하며 외래어는 다른 처리를 하는 것으로 드러났다. 고유어와 한자어는 빈도에 따라 영향을 받지만 외래어는 빈도의 영향에 변함없이 일정하게 나타났다. 이런 결과는 한국인은 고유어와 한자어를 동일한 양상으로 처리하며 이런 이유는 외래어의 한국어와는 다른 음운규칙이나 음절규칙의 영향으로 해석할 수 있겠다. 실험 2에서는 한자어 형태소와 의미적으로 유사한 조건(강도-강력)과 철자적 유사 조건(강도-강변), 고유어 유사 조건(강도-강정)조건을 점화과제를 이용하여 어휘판단을 하게 하였다. 실험 결과 모든 조건이 통제조건에 비하여 빠르게 나왔다. 그리고 의미적 유사 조건이 촉진적 점화효과를 일으키고, 철자적 유사조건은 억제 효과를 일으켰으며 고유어는 특이하게도 판단시간이 빠르게 나와 한자어와는 다른 처리과정이 있음을 보여주고 있다. 이런 결과는 지연조건에서도 동일하게 일어나고 있다. 이런 결과는 한자어는 어휘접근 이후에도 실험의 과제 특성상 한자어 형태소는 단어 수준 아래 위치하기는 힘든 반면, 고유어는 단어 수준 아래에 존재한다고 할 수 있다. 결국 한자어와 고유어는 기본적으로 외래어와 다른 처리를 보이면 한자어와 고유어 내에서도 한자어는 단어접근 전에 의미접근의 단계를 거쳐야 하지만 고유어는 각 음절이 형태소가 아니기 때문에 바로 어휘에 접근하는 것이라고 할 수 있겠다.ulic geometry and sediment transport has been applied to: (1) gravel-bed transport measurements in a cobble-bed stream at Little Granite Creek, Wyoming; (2) sand and gravel transport by size fraction in the sharp meander bends of Fall River, Colorado; (3) changes in sand dune geometry and resistance to flow during major floods of the Rhine River in the Netherlands; (4) changes in hydraulic geometry of the Rio Grande downstream of Cochiti Dam, New Mexico; and (5) analysis of the influence of water temperature and the Coriolis force on flow velocity and sediment transport of the Lower Mississippi River in Louisiana. Recent developments also include two textbooks on "Erosion and Sedimentation" and "River Mechanics" by the author and state-of-the-art papers in the ASCE Journal of Hydraulic Engineering.rk on is diversified, the importance of skills are diversified in each field of jobs.

  • PDF

Korean Electronic Dictionary of Encyclopedic Nouns I. - Nouns related to Human Names - (검색 엔진을 위한 '백과 명사' 전자 사전의 구축 (I) <인명 관련 백과 명사의 연구>)

  • Nam, Jee-Sun;Lee, Ju-Ho;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 1998.10c
    • /
    • pp.304-315
    • /
    • 1998
  • 정보 검색 시스템에서 가장 문제가 되는 어휘 클라스는 소위 '고유 명사'와 '합성 명사'로 분류되는 명사 유형이다. 이들 클라스는, 기존 대사전 및 전자 사전 (MRD)류에서, 그 어휘 목록을 체계적으로 제공하지 못하는 가장 대표적인 부류들인데, 실제 검색 시스템에서는 많은 경우 정보의 핵심어 (Key Word)가 된다. 본 연구에서는 신문, 잡지등 시사 문서류에서 가장 빈번히 발견되는 명사 유형의 하나인, '인명 관련 고유 명사' 유형에 대한 문제에 그 논의의 촛점을 두고, 이들 명사들의 체계적인 처리를 위해서 어떠한 형태로 사전을 구성해야 하는지를 검토할 것이다. '고유 명사'라는 개념 자체가 지니고 있는 외연적 정의상의 문제점을 극복하기 위해서 우리는 '백과 명사 (Encyclopedic Noun)'라는 용어를 사용하기로 하며, 이는 좁은 의미의 고유 명사 및, 전문어, 고유 명사 관련 파생-복합어류 등을 포함하는, 보다 확장된 개념으로 이해되어야 한다. <인명> 관련 백과 명사류의 하위 유형 분류 및 그 특징적 결합어 형태(Appropriate Particle)에 대한 연구 결과들이 소개된다.

  • PDF

Proper Noun Extraction Using Pattern Learning (패턴 학습을 이용한 고유명사 추출)

  • 김현준;김정화;강승식;우종우;윤보현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.184-186
    • /
    • 2001
  • 본 논문은 고유명사를 활용하여 특정 정보를 좀더 효율적으로 추출하기 위한 연구이며, Named Entity의 한 범주인 사람 이름에 대하여 어휘 사전이나 실마리 사전의 사용 없이 초기에 주어지는 몇 개의 인칭 명사들을 태그가 부착되지 않은 코퍼스에 적용시켜 고유명사 추출을 위한 패턴을 학습하고, 그 패턴을 적용하여 새로운 고유명사를 생성해 내는 작업을 통해 인칭 명사들을 효율적으로 추출할 수 있는 방법을 제안한다.

  • PDF

Conditional Random Fields based Named Entity Recognition Using Korean Lexical Semantic Network (한국어 어휘의미망을 활용한 Conditional Random Fields 기반 한국어 개체명 인식)

  • Park, Seo-Yeon;Ock, Cheol-Young;Shin, Joon-Choul
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.343-346
    • /
    • 2020
  • 개체명 인식은 주어진 문장 내에서 OOV(Out of Vocaburary)로 자주 등장하는 고유한 의미가 있는 단어들을 미리 정의된 개체의 범주로 분류하는 작업이다. 최근 개체명이 문장 내에서 OOV로 등장하는 문제를 해결하기 위해 외부 리소스를 활용하는 연구들이 많이 진행되었다. 본 논문은 의미역, 의존관계 분석에 한국어 어휘지도를 이용한 자질을 추가하여 성능 향상을 보인 연구들을 바탕으로 이를 한국어 개체명 인식에 적용하고 평가하였다. 실험 결과, 한국어 어휘지도를 활용한 자질을 추가로 학습한 모델이 기존 모델에 비해 평균 1.83% 포인트 향상하였다. 또한, CRF 단일 모델만을 사용했음에도 87.25% 포인트라는 높은 성능을 보였다.

  • PDF

Extraction of the Evaluation Construct Models from each article (제품별 색채감성 평가구조모델 추출)

  • 이진숙;신은영;임오연
    • Proceedings of the Korean Society for Emotion and Sensibility Conference
    • /
    • 1999.11a
    • /
    • pp.454-459
    • /
    • 1999
  • 본 연구는 메이크업, 자동차, 패션, 건축내장, 건축외장의 색채에 대한 소비자들의 감성 평가구조를 제시하는데 그 목적이 있다. 본 연구에서는 5개 제품별 색채감성 평가구조모델을 레퍼토리 그리드 발전수법을 사용하여 추출한 다음, 제품별 평가구조를 비교ㆍ분석하였다. 이렇게 추출된 5개의 구조모델은 다음과 같은 특성을 가지고 있다. 1) 소비자들의 전반적인 제품별 평가어휘를 추출하였으며, 이러한 평가어휘와색채특성간의 상관관계를 정성적으로 분석할 수 있다. 2) 제품별 고유 평가구조 및 제품들이 공통적으로 가지고 있는 기본적인 구조 특성을 파악할 수 있다.

  • PDF

Development of Evaluatin Techniques of Personal Image and its Application (대인(Personal) 감성 이미지 평가 기법의 개발과 적용)

  • 황상민
    • Science of Emotion and Sensibility
    • /
    • v.2 no.2
    • /
    • pp.105-113
    • /
    • 1999
  • 특정 사람에 대해 느끼는 이미지 또는 특정 사람이 가지는 이미지를 어떻게 평가하고 나타낼 수 있을까\ulcorner 본 연구에서는 사람에 대해 가지는 이미지를 표준적인 감성 어휘 척도를 활용하여 모델이 가지는 감성이미지가 무엇인지를 비교평가 할 수 있는 방법을 제시한다. 연구 대상으로는 국내 화장품 회사의 모델을 활용하였다. 4명의 모델을 전체와 부분 모습의 두 가지 형태로 제시하면서 각 인물이 가진 이미지를 평가하게 하였다. Personal 감성이미지를 평가하기 위해서 사람의 특성이나 이미지를 묘사하는 형용사 쌍 103개를 이용하였다. 모델 이미지에 대한 평가 반응은 요인분석을 통해 7개의 감성어휘 요인으로 나타났다. 우아한-천박한, 신선감-답답함, 편안함-불편함, 순수함-가식적인, 세련미-촌스러운, 진취성-보수성, 여성성-남성성, 4명의 모델들은 이 7가지 감성 이미지 요인에 따라 상호 차별적으로 나타났다. 인물 감성이미지는 감성적 어휘로 표현됨과 동시에 각 인물이 가진 고유하고 대표적인 personal image로 나타낼 수 있는가를 보여줄 수 있엇다. 본 연구에서는 개발된 감성이미지척도는 사람의 이미지를 평가하는 대표적인 감성척도로 이용될 수 있을 뿐 아니라, 특정 제품을 나타내는 모델이 일반인들에 어떤 이미지를 전달하는지 그리고 모델의 이미지와 제품이 지향하는 이미지와 얼마나 일치하는지를 평가할 수 있었다.

  • PDF

The difference in the representation of Korean Noun Eojeol in the mental lexicon based on its etymology (한국어 명사어절의 어원에 따른 심성어휘집 표상 양식의 차이)

  • Yoon, Ji Min;Nam, Ki Chun
    • Annual Conference on Human and Language Technology
    • /
    • 2009.10a
    • /
    • pp.258-261
    • /
    • 2009
  • 한국어에서 어절은 띄어쓰기 단위이며 한국어의 두드러진 특징 가운데 하나이다. 본 연구에서는 명사에 조사가 결합된 명사어절의 처리 과정에 대해서 밝히고자 이 과정에 관여하는 빈도효과를 측정하였다. 즉, 명사의 빈도와 어절의 빈도를 조작하여 어절의 의미를 판단하는데 걸리는 반응시간을 측정하였다. 실험 결과, 자극을 제시한 방법에 차별을 둔 실험 1과 실험 2의 결과에서 모두 어절빈도의 주효과가 유의미한 것으로 관찰되었다. 그러나 명사빈도의 주효과는 실험 2에서만 관찰되었고, 상호작용효과는 실험1과 실험2 모두 관찰되지 않았다. 또한, 한국어의 어원에 따른 즉 다시 말해, 한국어 명사를 한자어, 고유어, 외래어로 분류하여 어원에 따른 심성어휘집 표상 양식의 차이를 구별하여 보고 이를 토대로 더욱 세부적인 한국어 명사어절의 처리 과정을 규명하여 보고자 한다.

  • PDF