• 제목/요약/키워드: 문장 유형

검색결과 240건 처리시간 0.023초

중한 대화체 자동번역을 위한 중국어 긴축문 처리 (The Method of Chinese Ellipsis Component Restoration for Chinese Dialog Machine Translation)

  • 김운;오영순;권오욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.300-302
    • /
    • 2012
  • 긴축문은 형식 상 복문이지만 문장의 일부를 생략하여 단일문처럼 표현하기 때문에 의미상 논리적인 관계를 가지고 있는 비구문적인 복문으로서, 중국어 대화체 비정형 데이터의 대표적인 유형이다. 이는 비구문적인 문장에 취약한 대화체 자동번역 성능 향상의 걸림돌이 되고 있다. 이를 위해 본 논문에서는 패턴기반의 긴축문 추정과 긴축문 복원이라는 두 단계 처리 방법을 제안하며, 긴축문 처리의 필요성과 유효성을 자동번역 성능 향상 여부 실험을 통해 검증하였다. 실험 결과, 긴축문 추정은 95.5% 정확률을 보였으며, 전체 번역문의 번역성능은 2.21% 향상되는 결과를 보였다.

언어 유형학적 견지에서 본 독일어 관계 대명사와 한국어의 대응구조 (Relativpronomen im Deutschen und deren Entsprechung im Koreanischen - Aus der sprachtypologischen Perspektive -)

  • 박진길
    • 한국독어학회지:독어학
    • /
    • 제5집
    • /
    • pp.53-65
    • /
    • 2002
  • 독일어의 관계대명사는, 선행사의 반복과 그에 결부된 일치 규정을 철저하게 따름으로써 가능한 한, 언어의 모호성을 배제하려 한다. 이에 반해 한국어에서는 그런 것이 전혀 필요하지 않다. 독일어의 관계대명사에 해당하는 부가어 문장이 항상 그의 관계어/선행사 앞에 위치하기 때문이다. 이 때문에 양측의 (모국어)화자는 심각한 언어간섭 현상에 빠지기 마련이다 그들의 차이가 서로에게 너무 큰 까닭이다. 이러한 대립적인 어려운 문제들은, 일면에서는 전치성과 후치성이란 언어 특성을 익히고, 다른 일면에서는 한국인이 번역에서 독일어의 관계대명사에 결부된 구조를 완전히 생략함으로써 극복될 수 있다. 독일어나 한국어처럼 상호 대립적으로 발달한 언어를 정복하기 위해서, 가장 좋은 방법으로는 문장 자체를 한 단어처럼 익히는 것이다. 이것은 또한 서술을 위한 표현능력을 신장하는데도 효과적이다. 이에 따른 문법을 따로 배워야 한다는 생각은 전혀 필요하지 않다. 왜냐하면 언어습득장치는 모든 것을 언제나 문법적/체계적/분석적으로 수용하기 때문이다.

  • PDF

한국어 내포문을 단문으로 분리하는 시스템의 구현 (Implementation of the System Dividing Simple Sentences from Embedded Sentence in Korean)

  • 김광진;송영훈;이정현
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.25-34
    • /
    • 1993
  • 한국어의 내포문은 컴퓨터에 의한 자연어 이해 및 처리에 많은 어려운 문제점의 원인이 되고 있다. 이러한 문제점을 해결하기 위하여 본 논문에서는 한국어 내포문을 단문으로 분리하는 시스템을 설계 및 구현한다. 내포문에서 생략성분을 효율적으로 복원하기 위해 안긴문장의 생략된 부분을 통제할 수 있도록 용언을 유형별로 분류한다. 내포문을 단문으로 분리할 때 내포문에 비해 분리된 단문의 의미가 결여 될 수 있다. 이러한 문제점을 해결하기 위해 대용어를 첨가시키는 방법을 사용한다. 그리고 명사 의미표지로부터 용언의 하위범주의미역으로의 변환 테이블을 구성하여 문맥적으로 틀린 문장을 검색, 처리할 수 있는 방법을 제안한다.

  • PDF

지식유형과 인지양식이 글 요약과 이해에 미치는 영향 (The Effect of Types of Knowledge and Cognitive Styles on Summarizing and Understanding Text)

  • 정광희;이정모
    • 인지과학
    • /
    • 제16권4호
    • /
    • pp.271-285
    • /
    • 2005
  • 요약 글 작성 시, 세 가지 사전지식유형(영역관련지식, 요약글쓰기전략지식, 중립적 무관련 지식)과 두 가지 인지양식유형(분석형, 전체형기 요약 글의 질에 미치는 영향을 탐색하고자 실험이 실시되었다. 실험 결과, 영역관련지식은 주로 글 이해과정 촉진에 작용하고, 요약글쓰기전략지식은 요약 글 작성 시 계획하기과정과 문장생성하기과정 촉진에 주로 작용한다는 결과를 얻었다. 인지양식유형의 효과는 다소 제한적이지만, 요약 글 작성 시 계획하기과정에 주로 관련된다는 결과를 얻었다 그리고 요약 글 작성 과정에 따른 시간 경과자료의 특징들이 더 논의되었다.

  • PDF

학령 전 아이들의 사칙연산 문장제 해결 능력과 방법 분석 (An Analysis on the Competence and the Methods of Problem Solving of Children at the Before of School Age in Four Operations Word Problems)

  • 이대현
    • 한국학교수학회논문집
    • /
    • 제13권3호
    • /
    • pp.381-395
    • /
    • 2010
  • 학령 전 아이들은 형식적인 교육을 받지 않고서도 일상적인 경험이나 비형식적인 방법으로 수를 익히고, 계산을 한다. 따라서 학령 전 아이들의 수학적 능력에 대한 이해는 유치원 교육과 초등학교 저학년의 수학 학습 지도에 시사점을 줄 수 있다는 변에서 중요하다. 본 연구에서는 학령 전인 만 5세의 아이들이 사칙연산 문장제의 의미론적 측면의 문제 유형에 어느 정도의 해결 능력과 방법을 보이는가를 조사하였다. 연구 결과, 만 5세의 학령 전 아이들은 5보다 크고 10보다 작은 수로 구성된 사칙연산 문장제에 대하여 구체물을 이용한 비형식적 연산의 수행과 정신적 암산을 수행하는 방법을 통하여 문제를 해결할 수 있는 능력을 가지고 있음을 알 수 있었다. 이것은 학령 전 아이들의 수학적 경험을 위한 교육과정이나 프로그램을 체계적으로 구성하여 제시할 필요성을 제기한다.

  • PDF

구문 관계와 운율 특성을 이용한 한국어 운율구 경계 예측 (Prediction of Prosodic Break Using Syntactic Relations and Prosodic Features)

  • 정영임;조선호;윤애선;권혁철
    • 인지과학
    • /
    • 제19권1호
    • /
    • pp.89-105
    • /
    • 2008
  • 본 논문에서는 자연스러운 한국어 운율구 경계를 예측하기 위해 (1) 문장 성분을 하위범주화하고, (2) 세분화된 문장 성분 간 의존관계를 이용하여 통사구를 추출하며 (3) 추출한 통사구의 유형에 따른 운율구 경계 예측 규칙을 설정하였다. 또한, (4) 통사적 정보 외에도 통사구와 문장의 길이, 통사구의 문장 내 위치, 문맥의 의미 정보 등에 따라 가변적인 운율구 경계를 판단하여 보다 자연스러운 한국어 운율구 경계 예측 시스템을 개발하였다. 그 결과 통사구 경계와 상관관계가 높은 강한 운율구 경계 예측과 운율구 내부 비경계 예측에 있어 90% 이상의 높은 재현율과 정확도를 보였으며, 전체 운율구 경계 예측에 있어서도 87% 이상의 성능을 보였다.

  • PDF

해외인턴쉽의 영어능력 발전에 미치는 영향 (The Effects of Overseas Internships on Development of English Competence)

  • 차미양
    • 융합정보논문지
    • /
    • 제9권1호
    • /
    • pp.99-104
    • /
    • 2019
  • 본 연구는 해외인턴쉽의 외국어능력 발전에 미치는 영향을 고찰하기 위해 15주간 해외인턴쉽 프로그램에 참여한 10명의 한국대학생들이 작성한 영작문의 변화를 조사하였다. 자료수집을 위해 참여학생들은 인턴쉽 전후로 영작문 하나씩을 작성하였다. 수집된 자료를 이용해 두 영작문의 구성요소 및 어휘 사용면의 변화들을 분석하였고, 이어 통계분석도 실시하였다. 본 논문의 결과에 의하면, 참가자들이 인턴쉽 이후에 더 많은 수의 문장들을 사용하였고, 문장들이 더 길어졌으며, 아울러 더 복잡한 구조의 문장을 생성한 것을 알 수 있다. 또한 어휘의 유창성과 사용능력이 증가하였고 문장 내에 다음절의 다양한 유형의 단어들이 사용되었다는 것을 알 수 있다. 본 연구는 해외인턴쉽이 외국어능력 향상에 유용하다는 것을 나타낸다. 따라서 글로벌 경쟁력 제고를 꾀하는 중소기업들은 생산성, 품질 등 산업적 능력 제고뿐만 아니라 해외인턴쉽과 같은 훈련프로그램을 통해 인적자원의 글로벌 역량도 강화할 필요가 있겠다.

문장유사도 측정 기법을 통한 스팸 필터링 시스템 구현 (Implementation of a Spam Message Filtering System using Sentence Similarity Measurements)

  • 우수빈;이종우
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권1호
    • /
    • pp.57-64
    • /
    • 2017
  • 문자 메시지는 휴대폰을 사용하는 사람들에게 중요한 의사소통의 방법 중 하나이다. 또한 친구맺기 방식이 필요 없이 사용이 가능하기 때문에 이를 악용한 불법 광고 스팸메시지가 기승을 부리고 있다. 최근 스팸 필터링을 위해 기계 학습을 이용한 시스템들이 등장 하였지만 많은 계산을 필요로 하는 단점이 있다. 본 논문에서는 검색할 쿼리를 입력할 때 부정확한 쿼리를 입력하더라도 저장된 데이터베이스와 비교하여 가장 비슷한 단어를 차수 개념을 적용하여 유추하는 집합 기반 POI(Point of Interest) 검색 알고리즘을 이용하여 스팸 필터링 시스템을 구현하였다. 이 알고리즘을 적용하면 서버 컴퓨팅 없이 문자의 조합만을 이용해 쿼리를 유추할 수 있기 때문에 스팸 필터링에 적용하여 입력된 문자메시지가 교묘하게 변형되더라도 스팸이라고 필터링이 가능하다. 또한 문장 유사도 측정 기법을 활용하여 스팸 필터링 성능을 향상시켰으며, 스팸 필터링에 취약한 특정 유형도 걸러내기 위해 특정 전처리 과정을 지원함으로써 대부분의 스팸메세지를 필터링 가능하도록 하였다. 기존 집합기반 POI 검색 알고리즘과 이를 확장 시킨 문장 유사도 측정 기법, 특정 전처리 과정을 추가한 시스템으로 필터링 시스템의 성능평가를 진행하였다. 그 결과 본 논문에서 구현한 시스템이 기존 집합기반 POI 알고리즘과 비교하여 향상된 스팸 필터링 성능을 보여주는 것을 확인하였다. 또한 이동통신사 3사에서 필터링에 취약한 유형이 본 논문에서 구현한 시스템으로 높은 성능으로 필터링이 가능하다는 것을 확인하였다.

한.중 건축법규 비교분석을 통한 KBimCode의 확대 적용가능성 고찰 - 피난 및 방화와 관련된 법규항목을 중심으로 - (Reviewing the Expandability of KBimCode based on the Comparison between Korean and Chinese Building Act - Centered around the Egress and Fire Safety Related Regulations -)

  • 황금화;박서경;이진국
    • 디자인융복합연구
    • /
    • 제15권6호
    • /
    • pp.73-92
    • /
    • 2016
  • 건축물 설계품질 및 생산성을 향상시키기 위한 다양한 BIM기반 실증적 연구 개발이 진행중이며, 인허가단계 전후로 건축법규 자동검토에 관한 연구 및 개발도 그 중 하나이다. 해당 연구 개발의 성과물 중 하나로써, 건축물 설계 적법성 자동검토를 위해 자연어로 기술된 건축법을 컴퓨터에서 실행 가능한 룰셋(KBimCode)으로 변환하는 메커니즘(KBimLogic)이 개발되었다. KBimCode는 표준성 및 중립성을 지향하며, 한국 건축법뿐만 아니라 타 국가의 건축법규나 설계지침서, 제안 요청서 등 다양한 설계 요구사항으로의 확대 적용이 가능하도록 개발되었다. 본 연구는 KBimCode를 타 국가 건축 법규로 확대 적용하여 그 표준성과 중립성 및 응용가능성을 검증하는것을 목적으로 한다. 이를 위하여 중국의 피난방화에 관한 건축법규를 대상으로, KBimCode 생성 메커니즘의 핵심인 논리규칙체계화의 세 가지 구성요소(객체속성, 함수, 문장 내외 관계)에 따라 구체적인 분석을 진행하였다. 그 결과, 다양한 중국 건축법규 문장을 KBimCode로 변환할 수 있었으며, 변환의 과정 중 다음을 도출할 수 있었다: 1) 건물 객체 및 그에 따른 속성에 대한 정의는 각 국가마다 상이하므로, 이를 고려한 객체 정의 및 속성 처리 방법이 필요하며, 2) 일부 문장은 서술부 및 문장 관계를 처리하기 위하여 새로운 함수 및 관계 유형 정의가 필요하며, 이는 KBimCode의 표준화된 함수 및 관계 유형 도출 규칙 안에서 확장 가능하다. 본 연구를 통해 전혀 새로운 대상의 변환과정에서의 문제점 등을 해결하는 과정을 통해 KBimCode의 가능성을 일부 검증하였으며, 다양한 대상 확대를 통해 표준적이고 국제적인 응용이 기대된다.

한글 문서에서 형태적 중의 오류의 교정 (A method for morphological correction of ambiguous error)

  • 김민주;정준호;이현주;최재혁;김항준;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.41-48
    • /
    • 1998
  • 교정 시스템에 나타나는 오류 유형들 중에는 전체적인 교정률에 차지하는 비중은 적지만 출현할 때마다 틀릴 가능성이 아주 높은 오류들이 있다. 기존의 교정 시스템에서는 이러한 오류들에 대한 처리가 미흡한데, 철자 오류와 띄어쓰기 오류 중 형태가 비슷하거나 같은 형태가 다른 기능을 함으로써 발생하는 오류들이다. 이러한 오류는 일반 문서 작성자뿐만 아니라 한글 맞춤법에 대해 어느 정도 지식을 가진 사람의 경우에도 구분이 모호하다. 복합 명사와 미등록어를 제외한 오류 중 약 30%가 여기에 속한다. 따라서 본 논문에서는 이러한 오류 유형들을 분류하고, 이 중에서 빈번하게 출현하는 오류에 대한 교정을 시도하고, 오류 유형들이 문장 내에서 어떤 분포를 가지는지 알아본다. 약 617만 어절의 말뭉치를 이용하여 해당 형태와 다른 성분들과의 관련성을 조사하여 교정 방법을 제시하고, 형태소 분석을 하여 교정을 행한다. 코퍼스 655만 어절 대상으로 실험한 결과 84.6%의 교정률을 보였다. 본 논문에서 제시한 교정 방법은 기존의 교정 시스템에 추가되어 교정 시스템의 전체 교정률을 향상시킬 수 있다. 또한 이와 비슷한 유형의 다른 어휘 교정에 대한 기초 자료로 사용될 수 있을 것이다.

  • PDF