• 제목/요약/키워드: 기계어

검색결과 467건 처리시간 0.029초

기계번역에 있어서 언어학적인 문제점 -주제어와 초점어를 중심으로- (Linguistische Probleme in der maschinellen Ubersetzung - Topik und Fokus -)

  • 오영훈
    • 한국독어학회지:독어학
    • /
    • 제7집
    • /
    • pp.43-60
    • /
    • 2003
  • 오늘날 기계번역 Maschinelle Ubersetzung은 가속적인 발전선상에 놓여있다. 지난 10년 간 컴퓨터로 영어를 타국어로 번역하는 수준은 괄목할 만하다. 본 논문은 기계번역에 있어서 주제어 Topik 및 초점어 Fokus를 중심으로 발생하는 언어학적인 문제점, 특히 의미론적인 문제점을 다루었다 이를 위해 먼저 주제어와 초점어에 대한 언어학적인 개념을 다루어 보았다. 주제어란 한 문장에서 이미 알려진 사항, 즉 이미 주어진 단어이고, 초점어는 한 문장에서 새로운 사항, 즉 지금 전달하고자 하는 내용을 뜻한다 제 3장에서는 주제어와 초점어를 번역하기 위해 생성된 규칙들에 근거한 담화모델 Diskursmodell을 살펴보았다. 제 4장에서는 문장을 번역하는데 있어서 의미론상 발생하는 문제점들을 다루었다 그 문제점들은 다음과 같은 3가지로 요약될 수 있다: 첫째, 문장에서 부정형이 어디에 위치하느냐에 따라 문장의 의미가 달라진다. 둘째, 양화사 Quantor의 형태에 따라 문장의 의미가 달라진다. 셋째, 의문문과 화답문 Antwortsatz에 있어서 어느 내용을 강조하느냐에 따라 문장의 의미가 달라진다. 예를 들어 독일어는 단순히 단어의 위치만 변화시킬 수 있지만 다른 유럽어나 영어는 다른 방법들이 필요한 셈이다. 본 논문에서 제시되고 있는 기계번역의 규칙들은 주제어와 초점어에 관계되는 한 영어와 독일어에 한정되어 제시되었지만, 향후 한국어와 독일어의 기계번역을 위해 밑거름이 되리라 생각한다.

  • PDF

기계학습 기반 경쟁자 자동추출 방법 (Competitor Extraction based on Machine Learning Methods)

  • 이충희;김현진;류법모;김현기;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.107-112
    • /
    • 2012
  • 본 논문은 일반 텍스트에 나타나는 경쟁 관계에 있는 고유명사들을 경쟁자로 자동 추출하는 방법에 대한 것으로, 규칙 기반 방법과 기계 학습 기반 방법을 모두 제안하고 비교하였다. 제안한 시스템은 뉴스 기사를 대상으로 하였고, 문장에 경쟁관계를 나타내는 명확한 정보가 있는 경우에만 추출하는 것을 목표로 하였다. 규칙기반 경쟁어 추출 시스템은 2개의 고유명사가 경쟁관계임을 나타내는 단서단어에 기반해서 경쟁어를 추출하는 시스템이며, 경쟁표현 단서단어는 620개가 수집되어 사용됐다. 기계학습 기반 경쟁어 추출시스템은 경쟁어 추출을 경쟁어 후보에 대한 경쟁여부의 바이너리 분류 문제로 접근하였다. 분류 알고리즘은 Support Vector Machines을 사용하였고, 경쟁어 주변 문맥 정보를 대표할 수 있는 언어 독립적 5개 자질에 기반해서 모델을 학습하였다. 성능평가를 위해서 이슈화되고 있는 핫키워드 54개에 대해서 623개의 경쟁어를 뉴스 기사로부터 수집해서 평가셋을 구축하였다. 비교 평가를 위해서 기준시스템으로 연관어에 기반해서 경쟁어를 추출하는 시스템을 구현하였고, Recall/Precision/F1 성능으로 0.119/0.214/0.153을 얻었다. 제안 시스템의 실험 결과로 규칙기반 시스템은 0.793/0.207/0.328 성능을 보였고, 기계 학습기반 시스템은 0.578/0.730/0.645 성능을 보였다. Recall 성능은 규칙기반 시스템이 0.793으로 가장 좋았고, 기준시스템에 비해서 67.4%의 성능 향상이 있었다. Precision과 F1 성능은 기계학습기반 시스템이 0.730과 0.645로 가장 좋았고, 기준시스템에 비해서 각각 61.6%, 49.2%의 성능향상이 있었다. 기준시스템에 비해서 제안한 시스템이 Recall, Precision, F1 성능이 모두 대폭적으로 향상되었으므로 제안한 방법이 효과적임을 알 수 있다.

  • PDF

딥러닝 기반 한국어 방언 기계번역 연구 (Deep Learning based Korean Dialect Machine Translation Research)

  • 임상범;박찬준;조재춘;양영욱
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.490-495
    • /
    • 2021
  • 표준어와 방언사이에는 위계가 존재하지 않고 열등하지 않다는 사상을 기반으로 방언을 보존하기 위한 다양한 노력들이 이루어지고있다. 또한 동일한 국가내에서 표준어와 방언간의 의사소통이 잘 이루어져야한다. 본 논문은 방언 연구보존과 의사소통의 중요성을 바탕으로 한국어 방언 기계번역 연구를 진행하였다. 대표적인 방언 중 하나인 제주어와 더불어 강원어, 경상어, 전라어, 충청어 기반의 기계번역 연구를 진행하였다. 공개된 AI Hub 데이터를 바탕으로 Transformer기반 copy mechanism을 적용하여 방언 기계번역의 성능을 높이는 모델링 연구를 진행하였으며 모델배포의 효율성을 위하여 Many-to-one기반 universal한 방언 기계번역기를 개발하였고 이를 one-to-one 모델과의 성능비교를 진행하였다. 실험결과 copy mechanism이 방언 기계번역 모델에 매우 효과적인 요소임을 알 수 있었다.

  • PDF

적절한 동사 대역어 선택을 위한 한영 변환 사전 구성 (The Composition of Korean-English Transfer Dictionary for Proper Selection of Verb Translation)

  • 송정근
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.294-301
    • /
    • 2001
  • 기계번역이 인간의 언어 능력을 기계로 구현한다는 점에서 전산학적 성격이 강하다면, 변환 사전은 인간의 어휘부(lexicon) 정보를 그대로 기계에 표상한다는 점에서 언어학적 성격이 강하다. 여기서는 다양한 어휘부 정보 중에서 한영 기계번역에서 필요한 언어학적 정보를 추출하고 이러한 정보를 바탕으로 적절한 동사 대역어 선택을 위한 변환 사전의 모형을 만들어 보고자 하였다. 한영 기계번역에서 적절한 동사 대역어 선택의 어려움은 한국어 동형어 처리 문제와 한국어에서는 포착되지 않지만 영어로 번역하는 과정에서 발생하는 영어 표현의 특수성 때문에 기인한 것으로 볼 수 있다. 이 논문에서는 이러한 문제를 논항과 문법 형태소, 선택제약, 개별 어휘 등의 기초적인 언어학적 개념을 이용한 변환사전을 통해 해결한다. 또한 동사 대역어 선택에 영향을 미치는 이러한 개별적인 요인들은 실제 변환사전의 기술에 있어서는 복합적으로 적용됨을 동사 '먹다'의 기술을 통해 확인할 수 있다.

  • PDF

한일 기계변역에서 일본어 술부생성 (Japanese Predicate Generation in Korean-Japanese Machine Translation)

  • 곽종근;김은자;이종혁;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.173-176
    • /
    • 1994
  • 서로 다른 언어를 사용하는 사람들 사이에 언어의 장벽을 넘기 위한 수단으로 컴퓨터를 이용한 기계번역이 각광 받고 있다. 본 논문에서는 한일 기계번역 시스템에서 한국어로부터 일본어를 생성하는 과정에서 고려해야 할 사항에 관해 다룬다. 일본어는 한국어와 문법적 특성이 거의 유사하여 기계번역의 방법 가운데 직접 번역 방식이 선호되고 있다. 그러나 일본어의 한 술부내의 문법형태소들은 한국어와 비교해 볼 때, 상이한 점이 많아서 다른 부분에 비해 자연스러운 생성이 어렵다. 본 논문에서는 한일 기계번역에서 일본어의 생성시 발생하는 문제점들을 해결할 수 있는 방안을 제시한다.

  • PDF

영한 기계번역의 한국어 생성 시스템에서 조동사의 생성 (Generation of Auxiliary Verbs in a Korean Generation System of English-Korean Machine Translation)

  • 안동언;조정미;김길창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1993년도 제5회 한글 및 한국어정보처리 학술대회
    • /
    • pp.533-544
    • /
    • 1993
  • 기계번역에서 기능어의 번역은 각 언어가 고유의 문법적 특성과 표현방법을 가지고 있기 때문에 기능어가 가지는 의미와 문법적 기능을 자질로 표현하고 이를 통하여 해석과 생성을 한다. 한국어는 첨가어로 기능어가 매우 발달되어 있으며, 특히 조동사가 많은 문법적 기능을 담당하고 화자의 양태적 관계를 나타낸다. 따라서, 기계번역의 한국어 생성에서 조동사가 번역의 질에 상당한 영향을 미친다. 본 논문에서는 중간언어방식을 이용한 기계번역시스템의 한국어 생성에서 문법적 기능이나 양태적 관계를 나타낸 중간언어로부터 어떠한 조동사가 생성이 되어야 하고, 또한 조동사들간의 결합순서는 어떠한지를 살펴본다. 이를 위하여 Corpus를 분석하여 각 조동사 분류에 대한 대표 표층어를 선정하고 조동사간의 결합순서를 밝힌다. 조동사 생성을 위해 필요한 처리 과정과 언어적 지식베이스를 제안하고 시스템을 구현한다.

  • PDF

붐식 스피드 스프레이어 개발을 위한 기초연구 (I) - 붐식 스피드 스프레이어 개발을 위한 현황 조사 - (Study for Boom type speed sprayer Development (I) - Survey for Boom type speed sprayer development -)

  • 최훤;신창섭;김태한
    • 한국농업기계학회:학술대회논문집
    • /
    • 한국농업기계학회 2017년도 춘계공동학술대회
    • /
    • pp.5-5
    • /
    • 2017
  • 방제 작업은 병해충을 줄여 농산물의 품질과 생산량을 높이기 위한 필수 작업이다. 하지만 방제 작업은 고온 다습한 환경에서 작업하여 고된 작업 강도와 농민의 농약 중독 문제, 고령화 여성화로 인한 농가 일손 부족 문제로 농촌에서는 기피하고 있는 작업 중 하나이다. 이러한 점을 보완하기 위해 동력 살포기와 같은 기계를 이용하여 살포 작업을 실시하고 있으며, 스피드 스프레이어의 경우 2015년 기준 2,073 대가 농가에 공급되어졌다. 스피드 스프레이어를 사용하는 농가는 점차 증가하고 있으나, 현재 스피드 스프레이어의 살포 방식의 경우 농약을 다량 살포함으로써, 농약의 낭비, 환경오염의 문제점이 나타나고 있다. 이러한 점을 보완하기 위해 최근에는 방제 작업의 방식이 붐을 이용한 방제 작업으로 바뀌어가고 있는 추세이다. 붐 방제기의 경우 붐에 노즐을 배치하여 작물에 근접한 위치에서 농약을 정밀 살포하며, 스피드 스프레이어와 다르게 농약의 낭비를 줄일 수 있으며, 농약의 살포량을 제어하기 쉬운 장점이 있다. 본 연구에서는 기존의 트랙터 부착형 붐 방제기가 아닌 스피드 스프레이어를 개선한 붐식 스피드 스프레이어를 개발하기 위하여 현재 사용되고 있는 붐 방제기의 연구 동향 및 제품을 소개하고 개발에 필요한 기초 자료로 활용하고자 한다. 기존의 붐 방제기는 트랙터에 부착하는 형태로 개발되어졌으며 트랙터의 부착위치에 따라 전륜, 후륜형으로 나뉘고, 작물의 크기에 따라서 붐의 높이 및 붐의 각도를 조절하는 구조로 제작하여 사용되고 있다.

  • PDF

음성인식기술의 현황과 전망

  • 이종락
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1992년도 제4회 한글 및 한국어정보처리 학술대회
    • /
    • pp.689-707
    • /
    • 1992
  • 인간의 가장 익숙한 정보교환 수단인 음성을 기계가 인식하게 함으로써 모든 기계를 말로써 작동시키고자 하는 것은 인간의 오랜 꿈이었다. 최근 컴퓨터 기술과 음성처리 기술의 급속한 발달에 힘입어 그 꿈은 현실로 다가오고 있다. 현재 고립어 인식은 충분히 실용화될 수 있는 단계에 들어 섰으며 이제 연속어 인식 내지 연속어 이해에 연구가 집중되고 있다. 인간과 기계를 인터페이스하는 언어의 전위레벨로서 날로 그 중요성이 부각되고 있는 음성인식 기술의 현황을 살펴보고 그것의 미래를 전망해 본다.

  • PDF

한국어-몽골어 구 기반 번역시스템에 대한 연구 (A Study of Korean-Mongolian Phrase-based Machine Translation System)

  • 김영미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 춘계학술발표대회
    • /
    • pp.369-371
    • /
    • 2011
  • 한국어-몽골어 구 기반 기계번역시스템은 몽골어와 한국어간의 양방향 기계 번역시스템으로서 개발중인 시스템이다. 두 언어의 구조적 특성이 유사한 점에 기안하여 직접기계번역방식에 구단위 번역과 예제에 기반한 번역방식을 병행하여 문장단위의 번역이 가능하다.

효과 타입 시스템을 이용한 기계어 코드의 검증 (Verification of Machine Codes using an Effect Type System)

  • 정재윤;류석영;이광근
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권8호
    • /
    • pp.886-901
    • /
    • 2000
  • 네트웍을 이용한 분산 컴퓨팅 환경이나 소프트웨어의 안전성이 중요한 시스템 등에서, 외부로 부터 전달되는 코드의 안전성을 검증하는 일이 점점 더 중요한 문제가 되고 있다. 전자메일에 첨부되어 온 코드나 웹브라우저를 통해 외부로부터 전달된 코드를 수행하는 일이 일상생활에서 자주 발생하고 있다. 본 논문에서는 기계어 코드의 성질을 검증하는 방법을 제안한다. 코드제공자가 기계어를 만듦과 동시에 그 기계어 코드의 성질을 만들어내어 전달하면, 코드사용자는 전달받은 코드와 그 성질이 부합하는지를 검사하는 것이다. 소스언어의 안전성은 잘 정의된 컴파일러 시스템이 검증해 주지만, 중간언어나 기계어 코드의 성질을 검증하는 잘 정의된 방법은 아직 개발되어있지 않다. 중간언어로 etySECK을 설계하고 이 언어로 작성된 프로그램의 성질을 검증하는 방법을 제안한다. 그리고 타입과 효과분석방식을 사용하여 설계된 시스템의 안전성을 증명한다.

  • PDF