• 제목/요약/키워드: 명사구

검색결과 150건 처리시간 0.017초

규칙과 어휘정보를 이용한 한국어 문장의 구묶음(Chunking) (Text Chunking by Rule and Lexical Information)

  • 김미영;강신재;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.103-109
    • /
    • 2000
  • 본 논문은 효율적인 한국어 구문분석을 위해 먼저 구묶음 분석(Chunking) 과정을 적용할 것을 제안한다. 한국어는 어순이 자유롭지만 명사구와 동사구에서는 규칙적인 어순을 발견할 수 있으므로, 규칙을 이용한 구묶음(Chunking) 과정의 적용이 가능하다 하지만, 규칙만으로는 명사구와 동사구의 묶음에 한계가 있으므로 실험 말뭉치에서 어휘 정보를 찾아내어 구묶음 과정(Chunking)에 적용한다. 기존의 구문분석 방법은 구구조문법과 의존문법에 기반한 것이 대부분인데, 이러한 구문분석은 다양한 결과들이 분석되는 동안 많은 시간이 소요되며 이 중 잘못된 분석 결과를 가려서 삭제하기(pruning)도 어렵다. 따라서 본 논문에서 제시한 구묶음(Chunking) 과정을 적용함으로써, 잘못된 구문분석 결과를 미연에 방지하고 의존문법을 적용한 구문분석에 있어서 의존관계의 설정 범위(scope)도 제한할 수 있다.

  • PDF

조사 유형 및 복합명사 인식에 의한 용어 가중치 부여 기법 (Term Weighting Method by Postposition and Compound Noun Recognition)

  • 강승식;이하규;손소현;홍기채;문병주
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.196-198
    • /
    • 2001
  • 문서의 내용을 대표하는 용어를 추출하기 위해 일반적으로 영어에서는 명사구를 색인하는 기법을 사용하지만 주제어 추출의 관점에서 영어의 명사구가 한국어의 복합명사에 해당하기 때문에 한국어에서는 복합명사 색인 기법을 중요시하고 있다. 본 논문에서는 한글 문서에서 추출된 용어의 가중치를 결정하기 위하여 경험적인 방법에 따라 가중치를 계산하는 방법을 제안한다. 구체적인 가중치 계산 방법으로 용어 자체의 특성에 의한 가중치를 부여한 후에, 복합명사의 경계를 인식하여 띄어쓴 복합명사의 가중치를 조절하고, 다시 용어의 조사 유형에 따라 가중치를 재계산하는 방법을 제안한다. 신문기사에 대한 실험결과에 의하면 제안한 방법이 단순 출현빈도에 의한 주제어 추출 기법보다 정확도가 더 높았다.

  • PDF

복합명사의 의미적 구조분석에 관한 연구 (A study on the Semantic Structure Analysis of Korean Compound Nouns)

  • 남궁황;이태영
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2001년도 제8회 학술대회 논문집
    • /
    • pp.177-180
    • /
    • 2001
  • 복합명사의 효율적인 분석은 정보검색 시스템의 성능 향상에 중요한 영향을 미친다. 한국어에서는 복합명사가 다양한 구문적 유형으로 표현된다. 표면적으로 동일하게 표현된 복합명사일지라도 의미적으로는 서로 다르게 나타내거나 여러 개의 단위명사로 분리될 수가 있다. 이러한 문제를 해결하기 위해서는 복합명사를 구성하는 단위명사간의 의미적 결합관계를 올바르게 파악하는 것이 무엇보다도 중요하다. 본 논문에서는 의미적 구문관점에서 복합명사의 표층구조와 심층구조간의 의미관계를 기반으로 복합명사 분석시 적용할 수 있는 의미규칙을 도출하는데 있다.

  • PDF

문장의 복합명사와 명사구의 유사정도에 대한 고찰 (A Study on the Similarity of Compound Nouns and Noun Phrases in Sentences)

  • 이태영
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1999년도 제6회 학술대회 논문집
    • /
    • pp.43-46
    • /
    • 1999
  • 문장간의 유사정도와 명사구나 복합어간에서 유사한 그룹을 식별하는 연구를 수행하였다. 명사 어구는 형태소의 대체나 생략 등으로, 문장은 절간의 전체적 일치와 부분적 일치로 유사도를 측정하였다. 유사도가 50%이상되는 경우들에 유사성을 인정하였다.

  • PDF

구 단위 패턴 기반 한영 기계 번역에서의 기능동사 구문의 중심어 선택 모델 (Selecting Model of Head in Support Verb Constructions for Phrase-Pattern-based Korean-to-English Machine Translation)

  • 김혜경;채영숙;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.203-208
    • /
    • 1999
  • 한국어는 잉여성과 중의성의 범 언어적인 특징과 함께 다른 언어에 비해 주어의 생략이 두드러지며 어순이 자유롭기 때문에 구문 형식의 지배를 덜 받는다는 개별적인 특성을 지닌다. 이러한 특성으로 인해 기계번역의 패턴을 추출할 때 서로 유사 가능성이 있는 패턴에 대한 고려가 없이는 같은 의미의 서로 다른 여러 개의 패턴을 모두 하나의 패턴으로 처리하는 오류를 범할 위험이 있다. 본 연구에서 사용되는 구 단위 패턴은 동사구, 명사구, 형용사구 그리고 부사구를 중심으로 한국어 패턴, 패턴 대표 카테고리, 한국어 패턴의 중심어 및 제약조건 대역영어패턴 의미코드로 나뉜다. 범 언어적인 특성의 한국어와 영어간 격차를 해소하기 위해 각각의 명사에 의미코드를 사용하여 다중 언어기반 체계를 구축하였으며. 한국어의 개별적인 특성으로 인해 발생하는 문제를 해소하기 위해 중심어 부과 자질을 사용하였다. 중심어 부과 자질에 있어서, 특히 술어기능명사를 중심어로 하는 기능동사 '하-' 구문은 다른 동사 구문의 형식과는 달리 논항의 수와 형태를 동사가 아닌 명사가 수행하게 된다. 이러한 특징에 대한 변별적인 자질 부여는 구문의 형태-통사적 특징 뿐만이 아니라 의미적인 고유의 특성까지도 잘 뒷받침하면서 패턴 추출에 월등한 효율성을 제시할 수 있다. 향후 이에 대한 연구는 전반적인 기능동사 구문뿐만이 아니라 개별적인 특징을 보이는 모든 구문에 대한 연구로 확대되어 패턴 기반 기계번역의 패턴 추출에 기본적인 정보의 역할을 담당해야 할 것이다.

  • PDF

독일어 '임시복합명사'의 생성과정과 해석 (Die Aktualgenese von Nominalkomposita im Deutschen)

  • 오영훈
    • 한국독어학회지:독어학
    • /
    • 제6집
    • /
    • pp.1-21
    • /
    • 2002
  • '임시복합명사'는 명사 하나 하나의 의미가 개인의 머릿속에 저장되어 있지만, 이들이 결합해서 생긴 단어가 일반적인 언어사전에 등록되어 있지 않고 문맥에 따라 새로운 의미가 형성되어서 결합된 명사를 의미한다. 따라서 이 논문에서는 사전의 목록에 등록되어 있지 않아서 의미적으로 애매한 복합명사들을 '임시복합명사' ad-hoc Nominal-komposita 라고 지칭하였다. 이때 이러한 '임시복합명사'를 생성하는데 있어서 '임시복합명사'를 구성하는 각 요소들은 새로운 복합명사를 만드는데 필요한 '입력'의 역할을 담당한다. 이 논문에서는 '임시복합명사'를 구성하는데 필요한 일종의 다양한 원칙들을 다루어 보았다. 그러한 원칙들은 순수 언어학적인 논거를 바탕으로 '임시복합명사'를 생산하고 해석해 나가는 과정에 대한 타당성을 입증해 주었다. 그러나 일반적인 지식 Weltwissen과 텍스트 문맥에 맞는 구조를 편입함으로써 그 형태와 해석이 가능한 다른 형태의 복합어는 이 논문에서 자세히 다루지 않았다. 이 논문에서 제시된 복합명사의 생성과 해석과정은 대부분의 경우 복합어 고유의 현상만을 설명한 것이 아니라, 일반적으로 복합어를 생산하고 해석하는 과정을 다룬 것이다. 마찬가지로 이 점은 텍스트 문맥과 상관없이 해석이 가능한 복합어 내지는 텍스트 문맥에 따라 해석이 가능한 복합어에서도 똑같이 적용된다. 텍스트의 문맥을 통해서 자체적으로 해석이 가능하지 않은 복합어를 명확하게 의미를 부여하고 해석하는 과정, 예를 들어 의사소통상에서 일반적인 지식을 이용하여 '임시복합어'를 해석하는 과정은 이후의 연구에 다양하게 다루어 질 테마가 될 것임이 분명하다. 또한 '임시복합명사'를 생산하기 위해 이 논문에서 다룬 전제조건들은 또 다른 새로운 복합어를 생산하는데, 예를 들어 명사로부터 파생된 동사들의 복합어를 연구하는데 밑거름이 될 것이다.학의 강력한 연구가 요구된다.에 기대어 텍스트, 문장, 어휘영역 등이 투입되어 적용되었으며, 이에 상응되게 구체적인 몇몇 방안들이 제시되었다. 학습자들이 텍스트를 읽고 중심내용을 찾아내며, 단락을 구획하고 또한 체계를 파악하는데 있어서 어휘연습은 외국어 교수법 측면에서도 매우 관여적이며 시의적절한 과제라 생각된다. Sd 2) PL - Sn - pS: (1) PL[VPL - Sa] - Sn - pS (2) PL[VPL - pS] - Sn - pS (3) PL(VPL - Sa - pS) - Sn - pS 3) PL[VPL - pS) - Sn -Sa $\cdot$ 3가 동사 관용구: (1) PL[VPL - pS] - Sn - Sd - Sa (2) PL[VPL - pS] - Sn - Sa - pS (3) PL[VPL - Sa] - Sn - Sd - pS 이러한 분류가 보여주듯이, 독일어에는 1가, 2가, 3가의 관용구가 있으며, 구조 외적으로 동일한 통사적 결합가를 갖는다 하더라도 구조 내적 성분구조가 다르다는 것을 알 수 있다. 우리는 이 글이 외국어로서의 독일어를 배우는 이들에게 독일어의 관용구를 보다 올바르게 이해할 수 있는 방법론적인 토대를 제공함은 물론, (관용어) 사전에서 외국인 학습자를 고려하여 관용구를 알기 쉽게 기술하는 데 도움을 줄 수 있기를 바란다.되기 시작하면서 남황해 분지는 구조역전의 현상이 일어났으며, 동시에 발해 분지는 인리형 분지로 발달하게 되었다. 따라서, 올리고세 동안 발해 분지에서는 퇴적작용이, 남황해 분지에서는 심한 구조역전에 의한 분지변형이 동시에 일어났다 올리고세 이후 현재까지, 남황해 분지와 발해 분지들은 간헐적인 해침과 함께 광역적 침강을 유지하면서 안정된 대륙 및 대륙붕 지역으로 전이되었다.

  • PDF

한국어 동사와 명사 관용구 인식 알고리즘 (A recognition algorithm of Korean verb and noun idiomatic phrases)

  • 이호석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.170-175
    • /
    • 2009
  • 본 논문은 한국어 관용구 인식 알고리즘에 대하여 논의한다. 다음(daum) 전자 사전에는 관용구의 의미를, "두 개 이상의 단어로 이루어져 있으면서, 그 단어들의 의미만으로는 전체 의미를 알 수 없는, 특수한 의미를 나타내는 어구" 라고 설명되어 있다. 한국어 관용구의 길이는 2글자 ~ 4글자인 경우가 많으며 그 이상인 경우도 있다. 대부분의 관용구는 일반 사전에 동사와 명사를 기준으로 분류되어 있으며, 품사 표시나 구절 표시 없이 어절의 문자열 형태로만 표현되어 나타난다. 본 논문에서는 전자 사전에 품사 표시나 구절 표시 없이 어절 문자열 형태로 저장되어 있는 한국어 관용구를 입력 문장에서 인식하는 관용구 인식 알고리즘에 대하여 논의한다. 그리고 연어 인식과 명사의 의미 속성 처리에 대하여서도 논의한다.

  • PDF

명사의 의미 정보를 이용한 복합명사 분석의 중의성 해소 (Analysis Disambiguation of Compound Nouns by Using the Semantic Information of Nouns in Korean)

  • 강유환;정천영;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2002년도 제14회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.171-175
    • /
    • 2002
  • 접사 처리는 복합명사 분석에서 중요한 문제인데 접사가 복합명사에 포함되어 있을 경우 여러 중의적 형태로의 분석이 가능하고 또한 미등록어 문제를 발생시킬 수 있기 때문이다. 단순한 접사 사전 정보만으로는 효율적인 분석을 수행할 수 없으므로 추가적인 정보가 필요하다. 본 논문에서는 접사로 인한 복합명사의 분석 중의성을 해소하기 위하여 명사의 의미 정보를 이용하는 방법에 대해 제안한다. 명사 의미 정보는 시소러스의 의미계층 정보로 최상위 계층 정보와 하위 4계층의 정보로 구성된다. 명사+접미사 형태의 의미 결합 정보를 구한 추, 접미사를 포함하는 복합명사의 단위 명사들 간의 의미 결합 정보를 구한다. 이렇게 구해진 명사들 간의 의미 결합 정보는 사전 정보에 추가되며 접사로 인한 중의적 분석 문제가 발생할 경우 명사들 간의 결합 정보를 이용하여 올바른 분석 후보를 선택한다.

  • PDF

한국인 영어학습자의 명사구 발화에서 영어 능숙도에 따른 관사와 단음절 명사 모음 길이 비교 (Comparison of vowel lengths of articles and monosyllabic nouns in Korean EFL learners' noun phrase production in relation to their English proficiency)

  • 박우지;모란;이석재
    • 말소리와 음성과학
    • /
    • 제12권3호
    • /
    • pp.33-40
    • /
    • 2020
  • 본 연구는 기능어인 관사 및 1음절 내용어 명사로 구성된 명사구 내 두 단어의 모음 길이 비율과 영어 능숙도 사이의 상관관계를 밝히는 데 목적이 있다. 영어와 한국어 발음에 있어서 대표적 차이 중 하나는 발음상의 리듬이라는 특정적인 요소가 규칙적으로 나타나는지 여부이다. 특히 영어 발화시 내용어는 기능어 대비 상대적으로 더 두드러진(prominent) 소리를 가지게 되는데 이는 영어에서 내용어의 경우 강세를 갖게 되나 기능어의 경우 그 강세가 미비하거나 강세를 갖지 않기 때문이다. 따라서 영어의 내용어 단어 내 모음은 기능어 단어의 모음보다 길게 발음되며, 더 큰 소리로 발화되며, 더 높은 소리를 가지고 리듬을 만들어 내게 된다. 이를 근거로 본 연구에서는 내용어 내 강세를 갖는 모음과 기능어 내 강세를 갖지 않는 모음의 길이 차이에 초점을 두고 유창성이 평가된 L2 영어 음성 코퍼스(Rated K-SEC) 중 한국인 초등학생이 발화한 879(원어민 발화 20개 포함)개의 문장 내 명사구 음성 파일을 연구자료로 사용하였다. 이 879개의 문장은 영어 유창성 평가에 따라 4개의 등급으로 각각 재분류되었으며 이들 문장안에 들어 있는 명사구 내의 관사의 모음 길이와 명사의 모음 길이를 확인하고 그 비율을 측정하였다. 분석 결과 관사 모음 대비 명사 모음 길이 비율은 영어 능숙도와 양의 상관관계를 갖는 것을 확인하였다[Advanced(2.453)>Intermediate High(1.26)>Intermediate Low(1.034)>Novice(0.857)]. 또한 각 능숙도 그룹 간 내용어-기능어 간 모음 길이의 차이 및 그 비율의 차이가 통계적으로 유의미한 것으로 나타났다(p< .001). 이는 한국인 화자의 경우 영어 유창성이 높아질수록 영어 단어 발화 시 명사구 내의 기능어인 관사 모음보다 내용어인 명사 모음을 통계적으로 유의하게 더 길게 발화한다는 것을 의미한다.

의존명사를 포함하는 보조용언의 구묶음 (Chunking of Auxiliary Verbs including Dependant Nouns)

  • 김태웅;조희영;서형원;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2006년도 제18회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.279-284
    • /
    • 2006
  • 한국어 부분 구문분석의 단위인 말덩이(chunk)는 하나의 의미적 중심어를 가지며, 그 구문구조가 선형인 구를 말하며, 말덩이를 분석하는 과정을 구묶음(chunking)이라고 한다. 한국어 말덩이에는 여러 종류가 있으며 보조용언도 말덩이의 한 종류이다. 이 논문은 (한국해양대학교, 2005)의 연구를 바탕으로 오류를 자주 발생시킨 의존명사를 포함하는 보조용언에 대한 명확한 기준을 제시하여 구축된 말뭉치의 신뢰성을 더욱 높이고자 한다. 이 논문에서는 모든 의존명사를 포함하는 보조용언을 다루기에는 더 많은 연구가 필요하므로 "것", "바", "때문", "데" 등의 의존명사를 포함하는 보조용언을 구성하는 말덩이를 중심으로 명확한 기준을 언어학적인 방법으로 제시하고 말뭉치 구축 오류를 방지할 수 있는 해결방안을 모색한다.

  • PDF