• 제목/요약/키워드: 하다 용언

검색결과 6건 처리시간 0.022초

한-일 기계번역에서 '하다'용언의 번역 방법 (Translation Method of '-hada' verb in a Korean-to-Japanese Machine Translation)

  • 문경희
    • 한국컴퓨터정보학회논문지
    • /
    • 제10권4호
    • /
    • pp.181-189
    • /
    • 2005
  • 한국어와 일본어는 문법 체계의 유사성으로 인하여, 양언어의 형태소들 간에 1대1 매핑만으로도 높은 번역 성능을 얻을 수 있다. 따라서, 대부분의 한-일 기계번역에서는 한국어와 일본어 형태소 사이에 1대1 매핑을 기본으로 하고 있다. 명사와 '하다'로 구성되는 한국어 '하다' 용언도 대부분 명사와 'する'로 구성되는 일본어 'する 용언에 대응되므로, 일반적으로 1대1 매핑을 관계를 적용한다. 그러나, 한국어 '하다' 용언이 일본어 'する'용언에 대응되지 않는 경우, 1대1 매핑만으로는 정확한 번역 결과를 얻지 못하는 경우도 자주 발생하게 된다. 이 경우 명사와 '하다'를 하나의 번역 단위로 다루어 주는 것이 필요하다. 따라서, 본 논문에서는 한국어 '하다' 용언의 특성을 조사하고. 명사와 '하다' 사이에 삽입된 어휘들에 의한 비연속성 문제, 피동화, 관형어 수식 등 입력 문장에서의 다양한 상황에 따른 '하다'용언의 변환 기법을 제안하였다. 실험 결과, 높은 번역 성능을 보임으로써 제안한 방법이 한일 기계번역에서 '하다'용언을 다루는데 효율적임을 볼 수 있었다.

  • PDF

한영 번역 시스템에서의 불특정 조사를 포함한 용언구 처리 (Predicative phrase processing including unexpectable JOSA in the Korean-English translation system)

  • 박홍원;심재석;이수진;석영민;오승훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.523-529
    • /
    • 2001
  • 한국어의 용언구 중에서 [명사]+[불특정 조사]+[용언]의 형태를 보이는 '공부를 하다' '잠이나 자다'와 같은 어구는 [명사]와 [동사]의 결합이 비교적 자유로워 기계번역 시스템에서 이들을 처리하고자 할 때 몇가지 애로점이 있다. 우선, 기계번역 시스템의 특성상 이와 같은 용언구를 하나의 어구로 인식해서 역문을 생성해야 하는데 이들을 일일이 사전에 수록하기 어렵다는 점을 지적할 수 있다. 또한 이들 어구에 포함된 [명사] 부분이 [한정사]의 수식을 받을 때 영어 역문에서는 해당 수식어를 원래의 수식어의 의미 그대로 생성할 수 없다는 것도 중요한 문제점이다. 이러한 문제점을 해결하기 위하여 본 연구에서는 [명사] 부분과 [용언] 부분을 각각의 품사 사전에서 탐색하여 품사별로 인식한 후에 다시 통사적으로 하나의 용언으로 인식시켜 해당 역문을 생성하는 처리 방법을 제안한다. 또한, [한정사]의 수식을 올바로 생성하기 위하여 이런 종류의 용언구들을 분류하여 그 분류에 따라 [한정사]를 변형 생성하는 방법을 제시한다.

  • PDF

한국어 형태소 분석기에서 '아/어'로 시작되는 어미의 분석 (The Analysis of Endings Which Begin with 'a/a in Korean Morphological Analyzer)

  • 강승식;김영택
    • 인지과학
    • /
    • 제3권1호
    • /
    • pp.25-39
    • /
    • 1991
  • 한국어 어미 중 '아/어'로 시작되는 어미는 용언의 어간과 결합할 때 '아/어'가 축약되거나 '아/어'의 'ㅇ' 이 탈락되기도 한다.특히'ㅎ'불규칙 용언과 결합할 때는 용언의 어간모음과 화합되어 '-ㅐ-','-ㅒ-'로 바뀌는 경우가 있고,'-하다-'로 끝나는 용언의 어간과 결합하면 '-여-'혹은'-ㅐ-'로 바뀌게 된다.본 논문에서는 한국어 형태소 분석기에서 '아/어'로 시작되는 어미의 변이체를 처리하기 위하여 문법형태소 사전을 어떻게 구성하여야하고, 문법형태소 사전이 주기억 장치에 적제될 때 2진트리를 어떻게 구성할 것인에 대한 방법론을 제시함으로써 '아/어' 로 시작되는 어미의 변이체를 형태소 분석할때 발생하기 쉬운 오류를 방지할수 있도록 한다.

고성능 비어휘정보 한국어 구문분석 (Accurate Unlexicalized Korean Parsing)

  • 오진영;차정원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.295-298
    • /
    • 2010
  • 본 논문에서는 어휘정보를 사용하는 한국어 구문분석 성능과 거의 비슷한 성능을 내는 비어휘정보 한국어 의존 구문분석에 대해서 설명한다. 본 논문에서는 어휘정보를 대신해서 품사정보와 어절 구문태그 정보를 사용하고 CRFs를 사용하여 레이블링 방법으로 구문분석 한다. 자질을 변경하여 어절 처음에 나타나는 용어 정보와 뒤 어절의 용언 정보를 추가하였다. 본 논문에서 제시하는 실험 결과(어절:85.73%, 문장:43.86%)는 현재 최고의 성능을 내는 어휘정보 사용 한국어 구문분석과 비슷하다. 본 논문에서 제안한 비어휘정보 구문분석 방법은 어휘정보 구문분석에 비해 모델 사이즈가 작고 처리방법이 간단하여 쉽게 다른 도메인에 적용이 가능할 것으로 기대한다.

  • PDF

한국어의 형태소해석 (Morphological Analysis of the Korean Language)

  • 이수현;;이주근
    • 대한전자공학회논문지
    • /
    • 제26권4호
    • /
    • pp.53-61
    • /
    • 1989
  • 한국어의 구문 및 의미해석등에 필요한 정보를 도출하기 위한 입력분의 형태해석에 대하여 기술한다. 명사구에서 명사와 조사를 분리하고, 복합명사의 분리점을 선택하는 조건을 규정하며, 변형된 복합명사를 처리하는 규칙을 표시한다. 그리고 규칙동사에서 어간과 어미를 분리하고, 변칙용언과 음운축약 등을 효과적으로 처리하기 위한 논리표현 형식을 제안한다. 이 논리표현은 해석규칙과 속성값으로 구성한다. 명사사전의 중복을 배제하기 위하여 "명사형 하다" 동사의 분리 처리와 Q parameter 도입에 의한 "이다"의 처리방법을 보이고, 또한 부정문의 처리형식도 유도하여 복합술부의 형태소와 기본형식을 제시한다.

  • PDF

한국어의 사.피동문 처리에 관한 연구:실어증 환자의 처리 양상을 바탕으로 (The Processing of Causative and Passive Verbs in Korean)

  • 문영선;김동휘;남기춘
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 춘계 학술대회
    • /
    • pp.267-272
    • /
    • 2000
  • 본 연구에서는 한국어의 사·피동문을 실어증 환자가 처리하는 양상에 대하여 살펴보았다. 한국어의 사·피동문은 용언에 파생접사가 붙어 이루어지는 경우와 '-게 하다'나 '-어 지다'와 같이 구문 변형으로 하여, 실어증 환자에게 실험을 하였다. 실험에 참여한 환자는 명칭성 실어증 환자, 이해성 실어증 환자, 표현성 실어증 환자, 전반성 실어증 환자로 구성되어 있다. 본 실험에서는 단어 채워 넣기 과제(word completion task)를 사용하였다. 명칭성 실어증 환자의 경우 피동에서는 처리 오류를 보이는 반면, 사동에는 아무런 문제도 보이지 않았다. 표현성 실어증 환자의 경우, <피동-비변형>에서 오류를 많이 보였다. 이를 통해 한국어의 사·피동은 영어와 달리 통사상의 문제가 아니라는 결론을 내릴 수 있다. 즉 이미 사·피동 접사에 의해 파생된 단어가 어휘부에 저장되어 있고, 각 단어의 논항 정보에 따라 문장이 생성되는 것이다. 표현성 실어증 환자가 피동의 비변형에서 지배적인 오류를 보이는 것은 피동의 비변형이 타동사로서 변형인 피동형에 비해 하나의 논항을 더 취하기 때문이다. 이해성 실어증 환자의 경우 사·피동 생성에 별 어려움을 보이지 않았다. 이는 이해성 실어증 환자가 개별 어휘의 논항 정보에 손실을 적게 입고 있음을 시사하는 결과이다. 본 연구에서는 서로 다른 유형을 보이는 환자들을 대상으로 한국어의 사·피동의 처리양상을 대조한 결과, 첫재 사·피동은 서로 다른 통사, 의미상의 처리 양상을 보이고 있고, 둘째 파생접사가 결합된 형태로 어휘부에 저장되어 있는 개별 사·피동사에 의해 형성되는 것임을 확인하였다.d CO2 quantity causes flame temperature to fall since at high strain retes diluent effect is prevailing and at low strain rates the products inhibits chain branching. It is also found that the contribution of NO production by N2O and NO2 mechanisms are negligible and that thermal mechanism is concentrate on only the reaction zone. As strain rate and CO2 quantity increase, NO production is remarkably augmented.our 10%를 대용한 것이 무첨가한 것보다 많이 단단해졌음을 알 수 있었다. 혼합중의 반죽의 조사형 전자현미경 관찰로 amarans flour로 대체한 gluten이 단단해졌음을 알수 있었다. 유화제 stearly 칼슘, 혹은 hemicellulase를 amarans 10% 대체한 밀가루에 첨가하면 확연히 비용적을 증대시킬 수 있다는 사실을 알 수 있었다. quinoa는 명아주과 Chenopodium에 속하고 페루, 볼리비아 등의 고산지에서 재배 되어지는 것을 시료로 사용하였다. quinoa 분말은 중량의 5-20%을 quinoa를 대체하고 더욱이 분말중량에 대하여 0-200ppm의 lipase를 lipid(밀가루의 2-3배)에 대하여 품질개량제로서 이용했다.

  • PDF