• Title/Summary/Keyword: 번역 단계

Search Result 127, Processing Time 0.021 seconds

Automatic Construction of Foreign Word Transliteration Dictionary from English-Korean Parallel Corpus (영-한 병렬 코퍼스로부터 외래어 표기 사전의 자동 구축)

  • Lee, Jae Sung
    • The Journal of Korean Association of Computer Education
    • /
    • v.6 no.2
    • /
    • pp.9-21
    • /
    • 2003
  • This paper proposes an automatic construction system for transliteration dictionary from English-Korean parallel corpus. The system works in 3 steps: it extracts all nouns from Korean documents as the first step, filters transliterated foreign word nouns out of them with the language identification method as the second step, and extracts the corresponding English words by using a probabilistic alignment method as the final step. Specially, the fact that there is a corresponding English word in most cases, is utilized to extract the purely transliterated part from a Koreans word phrase, which is usually used in combined forms with Korean endings(Eomi) or particles(Josa). Moreover, the direct phonetic comparison is done to the words in two different alphabet systems without converting them to the same alphabet system. The experiment showed that the performance was influenced by the first and the second preprocessing steps; the most efficient model among manually preprocessed ones showed 85.4% recall, 91.0% precision and the most efficient model among fully automated ones got 68.3% recall, 89.2% precision.

  • PDF

Design and Implementation of a Detranslator for Verification and Analysis in C++ Compiler (C++ 컴파일러에서 심벌 테이블의 검증과 분석을 위한 역번역기의 설계 및 구현)

  • Son Min-Sung;Kwon Hyeok-Ju;Lee Yang-Sun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.05a
    • /
    • pp.447-450
    • /
    • 2006
  • 본 논문에서는 C++ 컴파일러 구현과정에서 객체지향 언어의 속성을 처리하기 위한 역번역기(detranslator)를 설계하고 구현하였다. 구현된 역번역기는 C++ 컴파일러의 선언부 처리 과정에서 심벌 테이블에 입력된 속성들을 본래의 C++ 프로그램으로 역번역 한다. 따라서 C++ 컴파일러 개발 과정에서 설계된 심벌 테이블과 심벌테이블에 입력된 정보가 올바른지 쉽게 검증할 수 있다. 심벌 테이블은 C++ 컴파일러의 어휘 분석과 구문 분석 과정에서 인식되는 명칭(identifier)에 대하여 그 속성(attribute)들을 수집하여 저장하는 자료구조로, 심벌 테이블에 저장된 속성들은 의미분석(semantic analysis) 단계에서 참조된 명칭의 사용이 타당한지 검사하는데 사용 되어 코드 생성(code generation) 단계에서 올바른 코드가 생성 되도록 한다. 본 역번역기를 구현함으로써 심벌 테이블이 올바르게 설계 되었는지 검증할 수 있으며, 컴파일 할 때 심벌 테이블에 필요한 모든 속성이 저장되어 있는지 쉽게 확인 할 수 있게 되었다. 그리고 디버그 정보도 함께 출력되어 객체지향 언어를 위한 컴파일러 개발의 정확성을 기할 수 있다.

  • PDF

Validity Analysis of the Korean Version of the Moral Judgment Test (MJT) (도덕적 판단력 도구 MJT의 한국적 표준화 연구)

  • Park, Gyun-Yeol
    • Journal of Ethics
    • /
    • no.94
    • /
    • pp.249-275
    • /
    • 2014
  • This study aims to standardize Moral Judgment Test (MJT) for measure the level of moral judgment to apply to Korean society. The questionnaire of MJT was composed of two stories: Worker's Dilemma; Doctor's Dilemma. The procedure of this study was started with translation, making final questionnaire through several times pre-test, survey, then did analyze. The degree of reliability was .669. To verify validity, this study carried 3 kinds of tests as follows: the Order of Preferences, Quasi-simplex Structure, Cognitive-Affective Parallelism. Through these tests, this study showed that Korean-translated version questionnaire of MJT is significant and good base to measure moral judgment.

Design of Translator for generating Secure Java Bytecode from Thread code of Multithreaded Models (다중스레드 모델의 스레드 코드를 안전한 자바 바이트코드로 변환하기 위한 번역기 설계)

  • 김기태;유원희
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2002.06a
    • /
    • pp.148-155
    • /
    • 2002
  • Multithreaded models improve the efficiency of parallel systems by combining inner parallelism, asynchronous data availability and the locality of von Neumann model. This model executes thread code which is generated by compiler and of which quality is given by the method of generation. But multithreaded models have the demerit that execution model is restricted to a specific platform. On the contrary, Java has the platform independency, so if we can translate from threads code to Java bytecode, we can use the advantages of multithreaded models in many platforms. Java executes Java bytecode which is intermediate language format for Java virtual machine. Java bytecode plays a role of an intermediate language in translator and Java virtual machine work as back-end in translator. But, Java bytecode which is translated from multithreaded models have the demerit that it is not secure. This paper, multhithread code whose feature of platform independent can execute in java virtual machine. We design and implement translator which translate from thread code of multithreaded code to Java bytecode and which check secure problems from Java bytecode.

  • PDF

Automatic Foreign Word Transliteration Model for Information Retrieval (정보검색을 위한 외래어 자동표기 모델)

  • 이재성;최기선
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1997.08a
    • /
    • pp.17-24
    • /
    • 1997
  • 조사에 따르면 한글 문서에서 사용되는 단어 중 외래어 또는 영어가 포함된 단어가 약 26%정도를 차지하고 있으며, 이는 정보검색의 중요 색인어로 사용된다(권윤형 1996). 그러나 이들 단어들은 서로 같은 단어인데도 영어로 표기되기도 하고 이형의 외래어들로 표기되기도 하여, 정보검색의 효율을 떨어뜨리고 있다. 본 논문에서는 영어 단어와 그에 대응되어 표기되는 외래어들을 찾기 위한 한 단계로서, 영어를 한글로 음차(transliteration)하여 자동표기하는 통계적 모델을 제안하고 실험한다. 제안된 모델은 통계적 기계번역 방식과 그의 한 방법인 문서 정렬(text alignment) 방식에 근거하고 있다. 특히 이 모델에서는 효과적으로 발음의 단위를 분리한 다음 정렬을 하여. 전체적인 계산량을 줄이고 성능도 향상시켰다. 음차표기는 피봇방식과 직접방식의 두가지로 구현하였다. 피봇방식은 영어에서 발음을 생성한 후, 그 발음을 다시 한글로 표기하는 방식이고, 직접방식은 직접 영어 단어에서 한글 표기로 포기하는 방식이다. 두 방식을 제안된 모델을 이용하여 비교 테스트한 결과 직접방식이 보다 정확하게 표준 외래어로 표기하였다.

  • PDF

신관리기법으로서의 PERT.CPM

  • 이승영
    • Cement
    • /
    • s.37
    • /
    • pp.4-11
    • /
    • 1970
  • 최근 급속히 팽창된 산업 구조와 이에 따른 업무량의 증가는 종래의 관리기술로서는 이를 성공적으로 처리할 수 없게 되었으며 아울러 인간의 미래조작능력의 증대와 기업구상력의 개발, 사회변동에 대비한 예측적인 계획의 수립 등 관리기능의 신장은 새로운 관리기법을 요구하게 되었으므로 PERT/CPM 수법이 신관리기법의 하나로 등장하게 되었다. PERT/CPM 이란 Program Evaluation Review and Technique, Critical Path Method 의 약자로서 우리말로는 계획수립 집행 및 평가로 번역되는데 이의 직역은 종속 및 총합 $\ulcorner$시스템$\lrcorner$ 과업의 동시진행 및 집중관리라 할 수 있는 것으로 시간과 비용을 절감하려는 기법인 것이다. 또한 PERT 기법은 복잡한 작업형태를 상호관련성있는 Network로 구성하고 제종속작업을 하나의 통일된 목표로 진행시키는 것을 의미한다. 이와 같은 PERT/CPM 기법은 제한된 자원의 효율적인 투자 및 관리와 불필요한 시간과 비용을 제거하여 준다. 현재 정부(경제기획원)는 PERT/CPM 제도를 도입하여 건설공사에 대한 예산관리제도를 설정중에 있으며 민간 및 정부투자기관으로서 현대건설주식회사와 한국전력주식회사와 이미 PERT/CPM 제도화방책을 연구기관에 위촉하여 제2단계적용을 시도하고 있는 것은 시대적 당위성에 따른 타당한 전망이라 하겠다. 거금 한국양회공업협회가 본제도의 도입 적용을 추진하기 위한 일련의 조사활동을 시작한 것은 시멘트 공업계의 새로운 경영관리체제를 모색하고 업계를 선도하는 중요한 전환점이 되리라 믿는다.

  • PDF

A Study of Korean State Adverb ordering Using Clusters (클러스터 분석을 통한 한국어 양태부사 어순에 관한 연구)

  • 이신원;황호전;김법균;안동언;정성종;두길수
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.04c
    • /
    • pp.540-542
    • /
    • 2003
  • 본 연구에서는 영한 기계 번역 시스템의 생성단계에서 자연스러운 어순의 연속된 부사를 생성하기 위하여 클러스터링 기법을 이용하여 부사의 어순을 결정해 보고자 한다. 먼저 국문학자가 분류해 놓은 부사의 자질 정보를 살펴보고 그 자질 정보에 대한 부사의 어순을 살펴본다. 그 중에서 양태부사에 대한 어순 정보가 부사 어순 결정에 중요한 요인이 됨으로 양태부사에 대해서만 어순을 다루기로 한다. 통합 국어정보베이스에 수록된 한국어 구문구조 부착 망뭉치를 사용하여 연속 부사를 추출하고 그 빈도수를 추출하여 부사의 자질 정보를 부여한다. 부여된 부사의 자질 정보를 가지고 부사-부사 유사도를 계산하고 이 유사도에 기반하여 양태부사들을 재분류한다. 그리고, 양태부사의 어순 비율과 클러스터링을 통해서 세분류한 어순의 비율을 제시한다.

  • PDF

Recognition and Evaluation of Efficient Language Analysis Unit for Korean (한국어에서 실용적 언어분석 단위의 인식과 평가)

  • 박인철
    • Journal of the Korea Computer Industry Society
    • /
    • v.5 no.1
    • /
    • pp.65-76
    • /
    • 2004
  • In this paper, we observe the differences between linguistic and computational aspect in the automatic processing of languages which are dominant representation method for information in the Internet. For efficient information retrieval, information extraction and machine translation from the massive documents, we investigate analysis units for morphology analysis, syntactic analysis and semantic analysis. and propose the syntactic longest analysis unit rather than morphological unit based on linguistics. Also, by evaluating with massive documents, we show that the proposed analysis units can be used for the constraint which can reduce the ambiguity occurring in the language processing.

  • PDF

기계의 진동상태감시를 위한 순서

  • Yang, Bo-Seok
    • Journal of KSNVE
    • /
    • v.6 no.4
    • /
    • pp.394-409
    • /
    • 1996
  • 본 고는 ISO(International Organization for Standardization)의 TC 108 (Vibration 및 Shock) 기술위원회 SC2와 SC5가 공동으로 작성중인 기계의 상태감시에 관한 4차 Working Draft를 번역한 것이다. ISO는 현재 상태감시 및 진단에 관한 규격을 처음으로 제정중에 있고, 그중에서 본 고의 내용은 거의 마무리 단계에 있다. 국내에는 발전 및 석유화학플랜트를 비롯한 다양한 설비들이 가동중에 있고, 설비 운용적인 측면에서 최근 상태감시시스템을 도입하고 있다. 그러나 이에 관련하여 기계의 상태를 정확하고 확실하게 평가할 수 있는 통일적이고도 객관적인 삼시순서가 설정되어 있지 않고, 관련시스템 제작사의 기준에 의존하고 있는 실정이다. 따라서 본 고는 현장의 설비 운용 및 보전담당자에게 통일적인 지침을 제공할 수 있는 최선의 객관적인 자료로서 관련 기술자들에게 도움이 되었으면 한다.

  • PDF

영한자동번역에서의 두단계 영어 전산문법

  • 최승권
    • Language and Information
    • /
    • v.4 no.1
    • /
    • pp.97-109
    • /
    • 2000
  • Application systems of natural language processing such as machine translation system must deal with actual texts including the full range of linguistic phenomena. But it seems to be impossible that the existing grammar covers completely such actual texts because they include disruptive factors such as long sentences, unexpected sentence patterns and erroneous input to obstruct well-formed analysis of a sentence. In order to solve analysis failure due to the disruptive factors or incorrect selection of correct parse tree among forest parse trees, this paper proposes two-level computational grammar which consists of a constraint-based grammar and an error-tolerant grammar. The constraint-based computational grammar is the grammar that gives us the well-formed analysis of English texts. The error-tolerant computational grammar is the grammar that reconstructs a comprehensible whole sentence structure with partially successful parse trees within failed parsing results.

  • PDF