• 제목/요약/키워드: 기능어

검색결과 644건 처리시간 0.028초

기능어용 음소 모델을 적용한 한국어 연속음성 인식 (Korean Continuous Speech Recognition using Phone Models for Function words)

  • 명주현;정민화
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.354-356
    • /
    • 2000
  • 의사형태소를 디코딩 단위로 한국어 연속 음성 인식에서의 조사, 어미, 접사 및 짧은 용언의 어간등의 단어가 상당수의 인식 오류를 발생시킨다. 이러한 단어들은 발화 지속시간이 매우 짧고 생략이 빈번하며 결합되는 다른 형태소의 형태에 따라서 매우 심한 발음상의 변이를 보인다. 본 논문에서는 이러한 단어들은 한국어 기능어라 정의하고 실제 의사형태소 단위의 인식 실험을 통하여 기능어 집합 1, 2를 규정하였다. 그리고 한국어 기능어에 기능어용 음소를 독립적으로 적용하는 방법을 제안했다. 또한 기능어용 음소가 분리되어 생기는 음향학적 변이들을 처리하기 위해 Gaussian Mixture 수를 증가시켜 보다 견고한 학습을 수행했고, 기능어들의 음향 모델 스코어가 높아짐에 따른 인식에서의 삽입 오류 증가를 낮추기 위해 언어 모델에 fixed penalty를 부여하였다. 기능어 집합1에 대한 음소 모델을 적용한 경우 전체 문장 인식률은 0.8% 향상되었고 기능어 집합2에 대한 기능어 음소 모델을 적용하였을 때 전체 문장 인식률은 1.4% 증가하였다. 위의 실험 결과를 통하여 한국어 기능어에 대해 새로운 음소를 적용하여 독립적으로 학습하여 인식을 수행하는 것이 효과적임을 확인하였다.

  • PDF

한국어 확률 의존문법 학습 (Probabilistic Dependency Grammar Induction)

  • 최선화;박혁로
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.513-515
    • /
    • 2003
  • 본 논문에서는 코퍼스를 이용한 확률 의존문법 자동 생성 기술을 다룬다. 의존문법 생성을 위해 구성성분의 기능어들 간의 의존관계를 학습했던 기존 연구와는 달리. 한국어 구성성분은 내용어와 기능어의 결함 형태로 구성되고 임의 구성성룬 기능어와 임의 구성성분 내용어간의 의존관계가 의미가 있다는 사실을 반영한 의존문법 학습방법을 제안한다. KAIST의 트리 부착 코퍼스 31,086문장에서 추출한 30,600문장의 Tagged Corpus을 가지고 학습한 결과 초기문법을 64%까지 줄인 1.101 개의 의존문법을 획득했고. 실험문장 486문장을 Parsing한 결과 73.81%의 Parsing 정확도를 보였다.

  • PDF

영한 기계번역의 한국어 생성 시스템에서 조동사의 생성 (Generation of Auxiliary Verbs in a Korean Generation System of English-Korean Machine Translation)

  • 안동언;조정미;김길창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.533-544
    • /
    • 1993
  • 기계번역에서 기능어의 번역은 각 언어가 고유의 문법적 특성과 표현방법을 가지고 있기 때문에 기능어가 가지는 의미와 문법적 기능을 자질로 표현하고 이를 통하여 해석과 생성을 한다. 한국어는 첨가어로 기능어가 매우 발달되어 있으며, 특히 조동사가 많은 문법적 기능을 담당하고 화자의 양태적 관계를 나타낸다. 따라서, 기계번역의 한국어 생성에서 조동사가 번역의 질에 상당한 영향을 미친다. 본 논문에서는 중간언어방식을 이용한 기계번역시스템의 한국어 생성에서 문법적 기능이나 양태적 관계를 나타낸 중간언어로부터 어떠한 조동사가 생성이 되어야 하고, 또한 조동사들간의 결합순서는 어떠한지를 살펴본다. 이를 위하여 Corpus를 분석하여 각 조동사 분류에 대한 대표 표층어를 선정하고 조동사간의 결합순서를 밝힌다. 조동사 생성을 위해 필요한 처리 과정과 언어적 지식베이스를 제안하고 시스템을 구현한다.

  • PDF

단위 명사간 보-술 관계를 이용한 한국어 복합 명사의 문장 복원 (Restoring Functional Word and Noun-Verb Syntactic Relations for Korean Compound Noun Analysis)

  • 양성일;김영길;서영애;박은진;나동렬
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 춘계학술발표대회
    • /
    • pp.694-695
    • /
    • 2007
  • 한국어 문장의 구성은 명사, 동사와 같은 내용어와 조사, 어미와 같은 기능어로 크게 나눌 수있다. 문장의 핵심적인 의미 전달은 내용어에 의해 이루어지며, 한국어 명사구의 경우 잦은 기능어의 생략으로 명사 나열에 의한 복합 명사가 발생된다. 이렇게 발생되는 복합 명사를 구성하는 단위 명사들은 일부 문장 성분을 생략시켜 발생된 것으로, 생략 성분의 복원에 의해 본래의 문장 형태를 추정할 수 있다. 한국어 복합 명사의 경우, 생략되는 문장 성분은 대부분 접사, 조사와 같은 기능어로 국한되며, 기능어의 복원은 단위 명사 간의 격 관계와 의미 관계를 분석하여 이루어질 수 있다. 본 논문에서는 단위 명사간의 보-술 관계를 이용하여 복합 명사를 구성하는 단위 명사 간의 의존 관계를 추정하고, 추정된 의존 관계에 의해 생략된 격조사와 용언화 접사를 복원하는 방법을 제안한다. 구조 분석에서 사용되는 의미 격틀에 의해 결정되는 격 관계는 격조사와 용언화 접사의 복원을 결정하며, 올바른 본래의 문장 표현 복원을 위해 관형격 조사와 관형격 어미를 비롯한 특별한 형태의 복원은 통계 정보와 휴리스틱 규칙으로 결정한다.

  • PDF

FLOW-3D를 이용한 도류벽식 어도내의 흐름해석 (Flow Analysis in the Baffled Fishway using FLOW-3D)

  • 최수형;김서준;임윤성;윤병만
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.1837-1840
    • /
    • 2009
  • 최근 자연형하천 조성사업과 하천복원 등을 목적으로 하천의 치수, 이수적인 기능뿐만 아니라 생태적인 기능을 고려한 하천설계를 위하여 많은 노력들을 하고 있다. 이와 같은 목적으로 하천의 생태적 통로가 단절되는 것을 막기 위해 하천 횡단 구조물인 보와 낙차공에 어도를 설치하고 있다. 하지만 현재 어도 설계는 어도 내의 흐름특성을 정확히 고려하지 못하고 설계되어 어도 본래의 기능을 수행하지 못하는 경우가 많았다. 그 이유는 현장 상황에 따라 어도의 종류와 형태가 다양하게 설계되고 있는 것에 반해 이를 검토할 수 있는 방법이 수리실험으로 한정되어 있어서 어도내 흐름특성을 결정하기 어렵기 때문이다. 어도 설계를 위한 수리실험은 시간적, 공간적 및 경제적인 제약으로 인해 다양한 형태의 어도 조건과 수리조건을 검토하기에는 현실적으로 어려움이 있는 반면에 수치모의는 매개변수 결정에 어려움이 있지만 수리실험에 비해 다양한 형태와 수리조건에 대해 간편하게 흐름특성을 예측할 수 있는 장점이 있다. 따라서 본 연구에서는 어도 설계시 간편하게 어도내 흐름특성을 예측할 수 있도록 기존에 사용되고 있는 수리실험 결과와 수치모의 기법을 이용한 흐름해석 결과를 비교하여 보았다. 수치모의는 3차원 흐름모형인 FLOW-3D를 이용하였고, 어도 형태는 도류벽식 어도를 대상으로 수행하였다. 수행 결과 수리실험과 비교하여 수심별로 최대 13% 정도의 오차를 보이고 있으며, 최대유속 발생 지점을 비교한 결과 하폭의 6% 정도 오차를 보였다. 따라서 최종 설계 이전에 어도의 흐름특성을 예측하기 위한 방법으로 FLOW-3D를 사용한다면 충분히 활용 가능할 것으로 판단된다.

  • PDF

한국인 영어학습자의 명사구 발화에서 영어 능숙도에 따른 관사와 단음절 명사 모음 길이 비교 (Comparison of vowel lengths of articles and monosyllabic nouns in Korean EFL learners' noun phrase production in relation to their English proficiency)

  • 박우지;모란;이석재
    • 말소리와 음성과학
    • /
    • 제12권3호
    • /
    • pp.33-40
    • /
    • 2020
  • 본 연구는 기능어인 관사 및 1음절 내용어 명사로 구성된 명사구 내 두 단어의 모음 길이 비율과 영어 능숙도 사이의 상관관계를 밝히는 데 목적이 있다. 영어와 한국어 발음에 있어서 대표적 차이 중 하나는 발음상의 리듬이라는 특정적인 요소가 규칙적으로 나타나는지 여부이다. 특히 영어 발화시 내용어는 기능어 대비 상대적으로 더 두드러진(prominent) 소리를 가지게 되는데 이는 영어에서 내용어의 경우 강세를 갖게 되나 기능어의 경우 그 강세가 미비하거나 강세를 갖지 않기 때문이다. 따라서 영어의 내용어 단어 내 모음은 기능어 단어의 모음보다 길게 발음되며, 더 큰 소리로 발화되며, 더 높은 소리를 가지고 리듬을 만들어 내게 된다. 이를 근거로 본 연구에서는 내용어 내 강세를 갖는 모음과 기능어 내 강세를 갖지 않는 모음의 길이 차이에 초점을 두고 유창성이 평가된 L2 영어 음성 코퍼스(Rated K-SEC) 중 한국인 초등학생이 발화한 879(원어민 발화 20개 포함)개의 문장 내 명사구 음성 파일을 연구자료로 사용하였다. 이 879개의 문장은 영어 유창성 평가에 따라 4개의 등급으로 각각 재분류되었으며 이들 문장안에 들어 있는 명사구 내의 관사의 모음 길이와 명사의 모음 길이를 확인하고 그 비율을 측정하였다. 분석 결과 관사 모음 대비 명사 모음 길이 비율은 영어 능숙도와 양의 상관관계를 갖는 것을 확인하였다[Advanced(2.453)>Intermediate High(1.26)>Intermediate Low(1.034)>Novice(0.857)]. 또한 각 능숙도 그룹 간 내용어-기능어 간 모음 길이의 차이 및 그 비율의 차이가 통계적으로 유의미한 것으로 나타났다(p< .001). 이는 한국인 화자의 경우 영어 유창성이 높아질수록 영어 단어 발화 시 명사구 내의 기능어인 관사 모음보다 내용어인 명사 모음을 통계적으로 유의하게 더 길게 발화한다는 것을 의미한다.

주제어기반 분류의 분류론적 개념 정립 및 발전 방안 - 발전과정 및 기능 분석을 통하여 - (Subject Based Classification: Conceptualization and the Development Plan as a Classificatory System)

  • 백지원
    • 한국비블리아학회지
    • /
    • 제23권4호
    • /
    • pp.5-24
    • /
    • 2012
  • 본 연구는 주제어기반 분류의 발전 과정 및 현황을 종합적으로 분석하고 그 기능과 유형을 명확히 함으로써 주제어기반 분류의 분류론적 개념을 정립하고, 향후 분류체계로써의 정착 및 발전을 위한 제안을 하고자 하는 목적을 가지고 있다. 이를 위하여 본 연구는 1937년부터 현재에 이르기까지 발표된 주제어기반 분류의 필요성에 대한 논의를 수집하여 분석하고, 주제어기반 분류에 해당하는 다양한 사례를 수집하여 그 명칭과 유형을 분석하였다. 또한 분류로써의 주요 기능 수행력을 기존의 문헌분류와 비교하고, 분류와 주제명표목과의 비교 분석을 통해 지식조직체계로써의 기능과 특성을 밝히고자 하였다. 이러한 분석의 결과, 주제어기반 분류는 구체적인 기능 정의, 유형, 사용되는 정보환경, 지식조직체계간의 관계성 등을 면밀히 고려함으로써 그 분류론적 개념과 기능을 명확히 정의할 수 있음을 밝혔고, 향후 분류체계로써의 정착과 발전을 위한 발전방안을 제시하였다.

듀얼코어 임베디드 리눅스 시스템에서 코어간 세마포어 인터페이스 기능 설계 (Design for the Semaphore Interface Function of the Dual Core Embedded Linux System)

  • 정지성;이재기
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.97-100
    • /
    • 2018
  • 세마포어 처리문제는 프로세스간 메시지를 전송하거나 공유메모리를 통해 특정 데이터를 공유할 때 발생되는 문제로 공유된 자원에 여러 개의 프로세스가 동시에 접근하면 안되며, 단지 한번에 하나의 프로세서만 접근 가능하도록 하여야 한다. 세마포어 기본정책은 호출되는 코어에 생성되며, 다른 코어에서는 IPI를 통해 존재 여부를 확인한다. 동일 코어에서 접근 시 기존방식으로 사용한다. 본 논문에서는 서로 다른 코어 및 운영체제에서 다른 코어에서 접근할 때에는 IPI를 통해 존재 여부를 확인한 후 더미 세마포어 구조체를 생성하여 관련 정보를 유지하고 해당 요청을 처리해 주는 세마포어 인터페이스 기능 설계 방법을 제안한다. 제안하는 세마포어 인터페이스 기능 설계 방안은 멀티 태스킹 기술 구현으로 기존 코어가 가지고 있는 성능상의 문제를 해결해 준다.

슬라브어 담화 직시와 대용 (Discourse Deixis and Anaphora in Slavic Languages)

  • 정정원
    • 비교문화연구
    • /
    • 제45권
    • /
    • pp.381-431
    • /
    • 2016
  • 본고에서는 슬라브어, 특히 러시아어, 폴란드어, 체코어, 불가리아어 담화 직시의 전반적 특징을 살펴본다. 슬라브어에서는 무엇보다도 근칭지시사가 담화 직시사로 기능하는 경향이 강하다는 공통점이 있지만, 개별 슬라브어에서 담화 직시사의 구체적 사용 양상은 상이하다. 폴란드어와 체코어에서는 원칭지시대명사와 인칭대명사가 담화 직시사로 거의 기능하지 못하는 반면, 러시아어는 원칭지시대명사가 담화 직시사로 활발하게 사용되며, 인칭대명사도 사용 가능하다. 불가리아어에서는 원칭지시대명사가 담화 직시사로 거의 사용되지 않는 반면, 인칭대명사는 자주 사용된다. 이와 같이 슬라브어 담화 직시사는 개별 언어에서 상이하게 직시와 대용 기능을 수행하는데, 근칭, 원칭 지시대명사와 인칭대명사가 모두 담화 직시사로 기능하는 러시아어에서는 그것의 직시성이 다른 언어에 비해 두드러지며, 가장 분석적인 슬라브어인 불가리아어에서는 인칭대명사의 사용이 잦아 다른 슬라브어에 비해 담화 직시사의 대용 기능이 두드러진다.

구 단위 패턴 기반 한영 기계 번역에서의 기능동사 구문의 중심어 선택 모델 (Selecting Model of Head in Support Verb Constructions for Phrase-Pattern-based Korean-to-English Machine Translation)

  • 김혜경;채영숙;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.203-208
    • /
    • 1999
  • 한국어는 잉여성과 중의성의 범 언어적인 특징과 함께 다른 언어에 비해 주어의 생략이 두드러지며 어순이 자유롭기 때문에 구문 형식의 지배를 덜 받는다는 개별적인 특성을 지닌다. 이러한 특성으로 인해 기계번역의 패턴을 추출할 때 서로 유사 가능성이 있는 패턴에 대한 고려가 없이는 같은 의미의 서로 다른 여러 개의 패턴을 모두 하나의 패턴으로 처리하는 오류를 범할 위험이 있다. 본 연구에서 사용되는 구 단위 패턴은 동사구, 명사구, 형용사구 그리고 부사구를 중심으로 한국어 패턴, 패턴 대표 카테고리, 한국어 패턴의 중심어 및 제약조건 대역영어패턴 의미코드로 나뉜다. 범 언어적인 특성의 한국어와 영어간 격차를 해소하기 위해 각각의 명사에 의미코드를 사용하여 다중 언어기반 체계를 구축하였으며. 한국어의 개별적인 특성으로 인해 발생하는 문제를 해소하기 위해 중심어 부과 자질을 사용하였다. 중심어 부과 자질에 있어서, 특히 술어기능명사를 중심어로 하는 기능동사 '하-' 구문은 다른 동사 구문의 형식과는 달리 논항의 수와 형태를 동사가 아닌 명사가 수행하게 된다. 이러한 특징에 대한 변별적인 자질 부여는 구문의 형태-통사적 특징 뿐만이 아니라 의미적인 고유의 특성까지도 잘 뒷받침하면서 패턴 추출에 월등한 효율성을 제시할 수 있다. 향후 이에 대한 연구는 전반적인 기능동사 구문뿐만이 아니라 개별적인 특징을 보이는 모든 구문에 대한 연구로 확대되어 패턴 기반 기계번역의 패턴 추출에 기본적인 정보의 역할을 담당해야 할 것이다.

  • PDF