• 제목/요약/키워드: Machine Translation

검색결과 384건 처리시간 0.026초

RMI와 CORBA 환경하의 분산 액티브 객체의 설계 및 구현에 대한 비교 분석 (Comparison of Design and Implementation for Distributed Active Objects based on RMI and CORBA environment)

  • 이도학;김식;현무용
    • 한국정보처리학회논문지
    • /
    • 제4권11호
    • /
    • pp.2721-2731
    • /
    • 1997
  • 분산 프로그래밍은 분산 커뮤니케이션에 대한 언어적 지원을 기반으로 상당히 단순화 될 수 있다. 현재, 많은 웹 브라우저들은 다양한 형태의 액티브 객체들을 제공하고 있으며, 그 수와 유형은 빠른 속도의 증가 추세에 있다. 자바애플릿은 널리 알려진 웹 브라우저 관련 액티브 객체중의 하나이다. 이 논문은 인터넷 상에 분산되어 있으면서 서로 정보를 교환할 수 있는 분산 액티브 객체의 구현에 관하여 기술한다. 분산 액티브 객체를 구현함에 있어서, 접근방식이 다르고 상호 호환성이 결여된 주요한 두 프로그래밍 환경은 RMI와 CORBA IDL 방식이다. 분산 액티브 객체의 구현상 쟁점들을 명확하게 하기 위해서, RMI 메커니즘을 채택한 HORB와 CORBA를 채택한 OrbixWeb2.0.1 환경 하에서 하나의 어플리케이션 프로그램을 각각 구현하였다. 부산 객체 사이의 바인딩, 상속성. 다형성, 객체의 전달, 콜백은 구현상 중요한 쟁점들이었다. 실험결과는 분산 액티브 객체를 구현하는데 있어서 작은 차이가 분산 어플리케이션의 구성에 상당한 영향을 미칠 수 있음을 보여 주었다. 두 프로그래밍 환경 하에서 구현된 어플리케이션 간의 비교는 각각의 환경에서 구현된 어플리케이션 사이의 상호 변환 시스템을 구축하기 위한 기초 연구가 될 것이다.

  • PDF

머신비전검사를 위한 기하학적 특징 기반 지능 패턴 정합 (Intelligent Pattern Matching Based on Geometric Features for Machine Vision Inspection)

  • 문순환;김경범;김태훈
    • 한국콘텐츠학회논문지
    • /
    • 제6권6호
    • /
    • pp.1-8
    • /
    • 2006
  • 본 연구에서는 인쇄회로기판을 위한 자동 광학 검사시스템에서 핵심적인 기능인 보정 데이타 산출을 위한 기하학적 특징 기반 방법을 제안하였다. 현재 적용되고 있는 자동 광학 검사 시스템에서는 보정데이타 산출을 위해 작업자가 직접 수작업으로 모델을 설정하고 있고, 검사영상에 기하학적인 변화가 있는 경우 비검사영역이 생기는 등 문제가 발생되고 있다. 이는 검사 작업의 신뢰성에 영향을 미치게 됨은 물론 검사 처리 시간을 지연시키는 요인이 된다. 제안된 방법은 주어진 PCB 영상으로부터 기하학적인 모양이 적합한 모델을 자동으로 선정할 수 있고, 기하학적인 모델 매칭 기법을 통해 신뢰성 있는 보정데이타를 산출할 수 있다. 제안된 방법의 사용으로 검사 시스템을 보다 편리하게 사용할 수 있고, 수작업에 의한 모델설정으로 발생되는 불필요한 시간을 절약할 수 있다. 또한, 기하학적인 변화량에 관계없이 보정데이타 산출이 가능하고, 잘못된 모델 선정 등 부정확한 보정데이터의 사용시 발생되는 문제점을 해결할 수 있는 장점을 갖는다.

  • PDF

검색 기반의 질문생성에서 중복 방지를 위한 유사 응답 검출 (Detection of Similar Answers to Avoid Duplicate Question in Retrieval-based Automatic Question Generation)

  • 최용석;이공주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권1호
    • /
    • pp.27-36
    • /
    • 2019
  • 본 연구는 검색 기반의 질문 자동 생성 시스템에서 사용자가 이미 답변한 내용을 재질문하지 않도록 사용자의 응답과 유사도가 높은 응답을 질문-데이터베이스에서 찾는 방법을 제안한다. 유사도가 높게 검출된 응답의 질문은 이미 사용자가 아는 내용일 확률이 높기 때문에 질문 후보군에서 제거한다. 유사 응답 검출에는 두 응답간의 동일 단어, 바꿔쓰기 표현, 문장 내용을 모두 사용하였다. 바꿔쓰기 표현은 통계기반의 기계번역에서 사용하는 구절 테이블을 사용하여 구축하였다. 문장 내용은 두 문장을 주의-기반 컨볼루션 신경망으로 압축하여 유사도를 계산하였다. 평가를 위해 구축한 100개의 평가 응답에 질문-응답 데이터베이스로부터 가장 유사한 응답을 추출해서 얻은 결과는 MRR값 71%의 성능을 보였다.

비지니스 이메일 영작문에 나타난 오류분석: 사례연구 (An Error Analysis on Business E-mails in English : A Case-Study)

  • 황선유
    • 융합정보논문지
    • /
    • 제8권6호
    • /
    • pp.273-279
    • /
    • 2018
  • 본 연구는 번역기를 활용한 영작문 수업에서 대학생들이 작성한 비즈니스 이메일 영작문에 나타난 오류를 분석하고 설명하려는 연구이다. 연구는 취업실무영어 수업을 수강한 대학생들이 3가지 과제에 대해 작성한 21개 이메일을 분석하여 이에 나타난 문법오류를 분석 정리하였다. 이메일에 나타난 문법오류를 살펴보면, 동사의 용법을 제대로 알지 못해서 발생한 언어 내 오류가 가장 빈번했으며, 완료 시제를 사용해야 하는 문장에서 과거동사를 사용하는 시제에 관한 오류와 명사 앞에 정관사를 사용하지 않은 정관사 오류와 전치사 잘못 사용한 오류와 같은 언어 간 오류도 있었다. 문맥과 관련된 오류를 보면 지칭하는 명사에 맞게 단 복수대명사를 제대로 사용하지 못한 오류라던가, 문장을 연결하다가 생략할 수 없는 주어를 생략한 오류는 의미전달에 문제가 될 수 있는 심각한 오류이다. 이러한 오류분석을 통하여 영어를 학습하고 있는 학습자가 특정한 문법사항을 학습하는 데에 어려움을 겪고 있다는 것과 학생들의 영어능력 발달단계를 가늠해 주는 정보를 제공함으로 연구의 의미가 있다고 볼 수 있다.

문장에 포함된 외국어의 자연스러운 발음 표현을 위한 LSTM 방법 (An LSTM Method for Natural Pronunciation Expression of Foreign Words in Sentences)

  • 김성돈;정재희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권4호
    • /
    • pp.163-170
    • /
    • 2019
  • 한국어는 "을/를/이/가/와/과"와 같은 조사가 체언에 붙어 문장의 의미를 더해준다. 문장 중에 외국어 표기를 그대로 사용하는 경우나 외국어의 약자가 포함되어 있는 경우, 외국어의 발음에 따른 적절한 조사가 연결되지 않는 경우가 있다. 때로는 문장의 자연스러운 표현을 위하여 "을(를)"과 같이 괄호 형식으로 표현하여 조사를 두 개 다 수용 가능한 형태로 사용되어지기도 한다. 본 연구에서는 문장 내에 외국어가 포함되어 있는 경우, 조사가 부자연스럽게 연결되는 예를 찾고 체언의 종성 발음을 학습하여 자연스러운 조사 연결을 위한 방법을 알아보고자 한다. 제안하는 방법은 순환신경망 모델을 이용하여 외국어에 연결된 조사를 자연스럽게 표현하는 것이다. 제안된 모델로 학습 및 테스트하여 방법의 필요성을 입증함으로써, 향후 기계 번역에서 영문 약자나 새로운 외국어 삽입 시 자연스러운 조사 연결로 완전한 문장을 연결하는데 사용될 수 있을 것으로 기대한다.

An Artificial Intelligence Approach for Word Semantic Similarity Measure of Hindi Language

  • Younas, Farah;Nadir, Jumana;Usman, Muhammad;Khan, Muhammad Attique;Khan, Sajid Ali;Kadry, Seifedine;Nam, Yunyoung
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권6호
    • /
    • pp.2049-2068
    • /
    • 2021
  • AI combined with NLP techniques has promoted the use of Virtual Assistants and have made people rely on them for many diverse uses. Conversational Agents are the most promising technique that assists computer users through their operation. An important challenge in developing Conversational Agents globally is transferring the groundbreaking expertise obtained in English to other languages. AI is making it possible to transfer this learning. There is a dire need to develop systems that understand secular languages. One such difficult language is Hindi, which is the fourth most spoken language in the world. Semantic similarity is an important part of Natural Language Processing, which involves applications such as ontology learning and information extraction, for developing conversational agents. Most of the research is concentrated on English and other European languages. This paper presents a Corpus-based word semantic similarity measure for Hindi. An experiment involving the translation of the English benchmark dataset to Hindi is performed, investigating the incorporation of the corpus, with human and machine similarity ratings. A significant correlation to the human intuition and the algorithm ratings has been calculated for analyzing the accuracy of the proposed similarity measures. The method can be adapted in various applications of word semantic similarity or module for any other language.

Using Roots and Patterns to Detect Arabic Verbs without Affixes Removal

  • Abdulmonem Ahmed;Aybaba Hancrliogullari;Ali Riza Tosun
    • International Journal of Computer Science & Network Security
    • /
    • 제23권4호
    • /
    • pp.1-6
    • /
    • 2023
  • Morphological analysis is a branch of natural language processing, is now a rapidly growing field. The fundamental tenet of morphological analysis is that it can establish the roots or stems of words and enable comparison to the original term. Arabic is a highly inflected and derivational language and it has a strong structure. Each root or stem can have a large number of affixes attached to it due to the non-concatenative nature of Arabic morphology, increasing the number of possible inflected words that can be created. Accurate verb recognition and extraction are necessary nearly all issues in well-known study topics include Web Search, Information Retrieval, Machine Translation, Question Answering and so forth. in this work we have designed and implemented an algorithm to detect and recognize Arbic Verbs from Arabic text.The suggested technique was created with "Python" and the "pyqt5" visual package, allowing for quick modification and easy addition of new patterns. We employed 17 alternative patterns to represent all verbs in terms of singular, plural, masculine, and feminine pronouns as well as past, present, and imperative verb tenses. All of the verbs that matched these patterns were used when a verb has a root, and the outcomes were reliable. The approach is able to recognize all verbs with the same structure without requiring any alterations to the code or design. The verbs that are not recognized by our method have no antecedents in the Arabic roots. According to our work, the strategy can rapidly and precisely identify verbs with roots, but it cannot be used to identify verbs that are not in the Arabic language. We advise employing a hybrid approach that combines many principles as a result.

방사선치료 시 환자자세 검증을 위한 분석용 도구 개발 (Patients Setup Verification Tool for RT (PSVTS) : DRR, Simulation, Portal and Digital images)

  • 이석;성진실;권수일;추성실;이창걸;서창옥
    • Radiation Oncology Journal
    • /
    • 제21권1호
    • /
    • pp.100-106
    • /
    • 2003
  • 목적 : 네트워크를 이용해 영상수집을 하여 방사선치료를 수행하는데 요구되는 기계중심점과 종양중심점의 일치여부 및 환자자세의 재현성을 확인하는 기능 등을 수행할 수 있는 환자자세검증도구를 개발하고자 한다. 대상 및 방법 : 전산화단층촬영 영상으로부터 재구성한 디지털화재구성사진(digitally reconstructed radiography, DRR) 영상과 투과 영상인 모의치료영상, 상용전자포탈 영상장치에서 수집한 포탈영상 밑 CCD 카메라로부터 획득한 디지털영상 등을 네트워크를 통해 수집하였고, 이를 조작할 수 있는 분석용 프로그램을 프로그램 제작툴인 IDL(IDL 5.4, Research systems, USA)을 이용해 작성하였다. 이를 환자자세 검증도구(patients setup verification tool for RT, PSVTS)라 명명하였다. 기계중심점과 종양중심점의 일치여부 확인은 전산화단층촬영영상으로부터 재구성한 DRR 영상과 모의치료영상을 이용하여 위치변위를 분석함으로써 치료조준오차를 구하였다. 환자자세의 재현성 확인은 첫 치료 시에 얻은 포탈 영상과 매 치료 시마다 얻는 포탈영상을 비교, 분석하는 방법과 디지털영상을 이용하는 방법을 사용하였다. 결과 : 방사선치료 시 요구되는 기계 중심점과 종양중심점의 일치여부 및 환자자세의 재현성을 확인할 수 있는 사용자편의방식의 소프트웨어와 환자자세검증도구를 개발하였다. 종양중심점과 기계중심점의 일치여부 확인 결과 치료조준오차는 두경부에서 전후, 좌우 각각 0.8$\pm$0.2 mm, 1.0$\pm$0.3 mm이었고, 골반부에서 1.1$\pm$0.5 mm, 1.0$\pm$0.6mm이었다. 환자자세 재현성은 영상을 실시간으로 획득하여 환자 자세 위치 변화를 시각적으로 평가할 수 있어실용성 있음을 알 수 있었다. 결론 : 환자자세의 재현성 및 종양중심점과 기계중심점의 일치여부를 파악할 수 있는 환자자세검증도구를 개발하였고, DRR 영상의 질 증진, 사용자편의방식의 소프트웨어를 보완한다면 임상응용에 가능할 것으로 사료된다.

시소러스를 기반으로 하는 자동색인 시스템에 관한 연구 (The Development of an Automatic Indexing System based on a Thesaurus)

  • 임형묵;정상철
    • 인지과학
    • /
    • 제4권1호
    • /
    • pp.213-242
    • /
    • 1993
  • 그동안 자동색인 기법에 대해서는 단일어 색인,구색인,시소러스 기반 색인 등의 연구가 이루어져 왔는데,단일어 색인 기법이 단일어에 기초한 단순한 색인 방법 임에도 불구하고 다른 두가지 기법보다 일반적으로 우수하다고 알려져왔다. 시소러스 기반 색인은 이중에서도 검색효율이 낮은 것으로 알려져 왔는데,이는 일반적으로 시소러스가 포함하고 있는 색인용어들이 한정되어 있어 색인하려는 자료들이 이색인 용어에 부합(match)되지 않을 경우 색인 자체가 이루어 지지 않기 때문이다. 본 연구에서는 시소러스 기반 색인이 지금까지 기법으로는 검색효율이 좋지 않지만 실제 전문 색인들이 하는 색인과 매우 유사하다는 장범에 기초하여,입력 자료를 구문분석하고,분석된 자료들과 색인용어들을 정확부합(exact match)이 아닌 부분부합(partial match)을 통하여 색인 함으로써 검색효율이 우수한 시소러스기반 자동 색인 시스템을 개발하고자 한다. 본 연구에서 개발된 색인 시스템이 THINS는 우선 시소러스를 트리형태로 구성하고 입력자료들을 KAIST에서 개발한 언어번역기 MATES/EK를 통하여 구문분석한 후 명사구들만 뽑아낸다.그다음 명사구에 있는 용어들중 불용어를 제거하고 스테밍작업을 진행한후 생기는 형태를 색인 용어들과 부분부합 과정을 반복하여,유사한 색인 용어들과 가능하면 색인이 되도록 한다. 본 연구에서는 CACM 데이타 집합을 가지고 본 시소러스 기반 색인 시스템과 단일어 색인방식을 혼성지식기반 시스템인 HYKIS에서 성능을 평가하였다.이 성능평가에서 시소러스를 기반으로 하는 색인 시스템이 단일어 색인방식보다 회상도에서는 8-9%떨어지지만 정확도에서는 10%정도 높은 결과를 나타내었다.그러나 이는 기존의 시소러스 기반시스템이 단일어 색인 방식보다 정확도가 25%-30%정도 떨어진다는 것을 비추어 볼때 기존의 방식보다 우수한 것이라 평가된다.또한 CACM 에서 제공하는 시소러스인 CRCS 가 1000여개의 색인어밖에 포함하고 있어 매우 불완전한 것이라는 것을 고려하면,THINS가 최근에 개발되고 있는 시소러스와 접속된다면 매우 우수한 검색효율을 내리라 사료된다.

통사화용의 접합면에서 본 영어 헤지표현의 유형과 기능 (Types and Functions of English Hedges at a syntax-pragmatics Interface)

  • 홍성심
    • 문화기술의 융합
    • /
    • 제6권1호
    • /
    • pp.381-388
    • /
    • 2020
  • 본 논문의 목적은 주로 사회언어학과 화용론 분야에서 연구되어 온 영어 '헤지(Hedges)' 혹은 헤지표현을 형태통사적 관점과 화용적 관점을 연관지어 논의하는 것이다. 일반적으로, '헤지표현이 없는 자연언어는 없다'는 추론이 가능한데, 그것은 어떤 자연언어에나 공손성, 혹은 화자가 청자보다 낮은 자세로 말하고자 하는 문법기제가 있음이 널리 인정되고 있기 때문이다. 헤지에 대한 기존의 이론적 연구는 주로 화용적 관점에서 헤지의 유형 분류와 화용적 기능, 그리고 출현빈도 비교 등의 수준에 그치고 있다. 즉, 헤지표현을 형태통사적 개념인 자질로 나타내려는 시도는 거의 발견되지 않는다. 언어현상으로서의 헤지는 유무에 따라, 화용부와 통사부의 접합면에서 [+hedged]와 [-hedged]로 이분지화 가능하며, 이 화용자질은 형태통사부와 상호작용 하므로 협의의 통사부에서 분리될 수 없다. 본 논문에서, 헤지는 공손성이 표현되는 화용자질로서, 그 자질이 표시되는 접합면 영역이 구조적으로 있음을 지적하였다. 즉, CP+층위가 화용자질인 헤지자질이 인코딩되는 영역임을 제안하였다. 최근에는 범언어적 관점에서 혹은 영어교육의 학술적 EFL/ESL 글쓰기, 또는 담화분석 등에 헤지 표현의 식별 여부나 용례를 연구하는 경향이 있다. 본 논문은 그동안 간과되어온 동등접속문, 병렬종속문, 부분사 구문 등을 헤지에 포함시키고, 보다 구조적이고 이분지적(±)인 방식을 제안함으로서, 제2언어습득의 이해, 글로벌 커뮤니케이션 혹은 인공지능 자연언어 알고리즘에 화용 자질을 도입할 수 있는 구조적이고 이론적인 기반을 제공하는데 그 목적이 있다.