• Title/Summary/Keyword: 번역어

Search Result 263, Processing Time 0.029 seconds

Pivot-based Bilingual Lexicon Extraction Using Word2Vec and CCA (중간언어 기반의 Word2Vec와 CCA를 이용한 이중언어 사전 추출)

  • Kim, Jeong-Tae;Kim, Chang-Hyun;Cheon, Min-Ah;Kim, Jae-Hoon;Kim, Jae-Hwan
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.307-309
    • /
    • 2016
  • 이중언어 사전은 자연어처리 분야에서 매우 유용한 자원으로 사용되고 있다. 그러나 초기사전이나 병렬말뭉치 등 자원이 부족한 언어 쌍에 대해서 이중언어 사전을 추출하는 것은 쉽지 않다. 이러한 문제를 해결하기 위해 본 논문에서는 중간 언어 기반으로 Word2Vec와 CCA를 이용하여 이중언어 사전을 추출하는 방법을 제안한다. 본 논문에서 제안하는 방법의 성능을 평가하기 위해서 중간언어로 영어를 사용하여 스페인어-한국어에 대한 이중언어 사전을 추출하는 실험을 하였다. 무작위로 뽑은 200개의 단어에 대한 번역 정확도를 구하였다. 그 결과 최상위에서 37.5%, 상위 10위에서 63%, 그리고 상위 20위에서는 69.5%의 정확도를 얻을 수 있었다.

  • PDF

Evaluation of Call Overheads Between Java Ahead-of-Time Compiler and Interpreter (자바 Ahead-of-Time 컴파일러와 해석기 간의 호출 오버헤드 평가)

  • Kim, Ik-Hyun;Jung, Dong-Heon;Oh, Hyung-Sk;Moon, Soo-Mook
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06c
    • /
    • pp.521-526
    • /
    • 2007
  • 내장형 자바의 성능 향상을 위해 바이트코드를 기계어 코드로 미리 번역하여 내장형 시스템에 설치하는 Ahead-of-Time Compile(AOTC)가 많이 사용되고 있으나 수행 중에 동적으로 다운로드 되는 바이트코드를 수행하기 위해서는 기존의 해석기도 함께 사용되어야 한다. 이 경우 일부 자바 메소드는 AOTC에 의해 처리되고 일부 메소드는 해석기에 의해 수행되는 하이브리드 수행 환경이 된다. 이러한 환경에서 해석기 메소드가 AOTC 메소드를 호출하거나 AOTC 메소드가 해석기 메소드를 호출하는 경우 호출 오버헤드가 커서 성능을 저하시킬 수 가 있다. 본 연구에서는 AOTC에서 사용 가능한 두 가지 호출 인터페이스인 Java Native Interface(JNI)와 Compiled Native Interface(CNI)에 대해 하이브리드 수행 환경에서의 호출 오버헤드와 성능을 평가하고 각각의 장단점에 대해 논의한다.

  • PDF

A Design of Japanese Analyzer for Japanese to Korean Translation System (일반 번역시스탬을 위한 일본어 해석기 설계)

  • 강석훈;최병욱
    • Journal of the Korean Institute of Telematics and Electronics B
    • /
    • v.32B no.1
    • /
    • pp.136-146
    • /
    • 1995
  • In this paper, a Japanese morphological analyzer for Japanese to Korean Machine Translation System is designed. The analyzer reconstructs the Japanese input sentence into word phrases that include grammatical and dictionary informations. Thus we propose the algorithm to separate morphemes and then connect them by reference to a corresponding Korean word phrases. And we define the connector to control Japanese word phrases It is used in controlling the start and the end point of the word phrase in the Japanese sentence which is without a space. The proposed analyzer uses the analysis dictionary to perform more efficient analysis than the existing analyzer. And we can decrease the number of its dictionary searches. Since the analyzer, proposed in this paper, for Japanese to Korean Machine Translation System processes each word phrase in consideration of the corresponding Korean word phrase, it can generate more accurate Korean expressions than the existing one which places great importance on the generation of the entire sentence structure.

  • PDF

Computational Processing of Honorifics in Korean with Combinatory Categorial Grammar (결합범주문법을 이용한 한국어 경어 체계의 이해와 처리)

  • Kwon, O-Shik;Park, Jong-C.
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.365-372
    • /
    • 2001
  • 한국어나 일본어는 영어 등 서구의 언어와 비교하여 매우 발달된 경어 체계를 가지고 있다. 그러나 이러한 경어 체계는 이들 언어를 모국어로 사용하지 않는 사람들을 포함하여 모국어로 사용하는 많은 사람들까지도 정확하게 구사하기는 어려워 하는 것이 현실이다. 그럼에도 불구하고 경어 체계의 정확한 구사 능력은 적절한 어휘 선택 능력과 함께 자연스러운 의사 소통을 위한 중요한 언어 능력으로 간주되고 있다. 특히 기계번역기나 문법검사기를 구현하고자 할 때 이러한 경어 체계를 정확하게 이해하는 시스템의 구현은 한 차원 높은 자연스러운 표현을 제공하기 위하여 필수적이라고 할 수 있다. 본 논문에서는 한국어의 경어 체계를 조사하고 결합범주문법을 통하여 이를 검증하는 시스템을 소개한 뒤 사극 대본을 대상으로 하여 이 시스템의 성능을 확인한다.

  • PDF

Korean Lexical Knowledge Base Construction System (한국어 어휘 지식 베이스 구축 시스템)

  • Lee, Hae-Joong;Cho, Jeong-Mi;Mun, Jun-Hyeok;Seo, Jung-Yun
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.397-403
    • /
    • 1999
  • 어휘 지식은 자연어 처리에서 매우 중요한 요소이다. 그러나 대규모의 어휘 지식 베이스를 구축하는 것은 많은 시간과 비용을 필요로하는 일이다. 본 논문에서는 온라인 국어 사전을 이용하여 범용의 대규모 한국어 어휘 지식 베이스를 자동으로 구축하는 방법을 제안하고 실제로 시스템을 구현한다. 제안하는 방법론은 비교적 적은 비용으로 단시일내에 대규모의 어휘 지식 베이스를 구축하는 것을 가능하게 한다. 또한 지식 구축 과정이 자동화되어 만들어진 지식 베이스의 유지, 보수 및 확장이 용이하다. 구현된 시스템으로 구축한 어휘 지식 베이스는 기계번역에서의 대역어 선정이나 한국어 조사의 의미 분별 등 자연어 처리 과정에서 발생하는 각종 어휘 의미 모호성 해소에 응용될 수 있다.

  • PDF

Pivot-based Bilingual Lexicon Extraction Using Word2Vec and CCA (중간언어 기반의 Word2Vec와 CCA를 이용한 이중언어 사전 추출)

  • Kim, Jeong-Tae;Kim, Chang-Hyun;Cheon, Min-Ah;Kim, Jae-Hoon;Kim, Jae-Hwan
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.307-309
    • /
    • 2016
  • 이중언어 사전은 자연어처리 분야에서 매우 유용한 자원으로 사용되고 있다. 그러나 초기사전이나 병렬말뭉치 등 자원이 부족한 언어 쌍에 대해서 이중언어 사전을 추출하는 것은 쉽지 않다. 이러한 문제를 해결하기 위해 본 논문에서는 중간 언어 기반으로 Word2Vec와 CCA를 이용하여 이중언어 사전을 추출하는 방법을 제안한다. 본 논문에서 제안하는 방법의 성능을 평가하기 위해서 중간언어로 영어를 사용하여 스페인어-한국어에 대한 이중언어 사전을 추출하는 실험을 하였다. 무작위로 뽑은 200개의 단어에 대한 번역 정확도를 구하였다. 그 결과 최상위에서 37.5%, 상위 10위에서 63%, 그리고 상위 20위에서는 69.5%의 정확도를 얻을 수 있었다.

  • PDF

Construct ion of Metaphor Ontology Using HowNet : Based on the Concept, 'Culture' (HowNet 기반 은유 온톨로지 구축: 추상개념 '문화'를 중심으로)

  • An, Dong-Gun;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2006.10e
    • /
    • pp.205-212
    • /
    • 2006
  • 본 연구에서는 추상적 사고를 가능하게 해주는 개념은유 표현의 서술어를 분석하여, 추상개념의 근원영역을 찾는 알고리즘을 HowNet 지식 시스템을 이용하여 제안하고자 한다. 실제로 추상개념 '문화' 가 쓰인 242개의 은유 표현 용례 문장을 가지고 제안된 알고리즘으로 근원영역을 찾고. 이를 토대로. 목표영역 '문화' 의 근원영역이 추론기에 의하여 자동적으로 추론되는 HowNet 기반 은유 온톨로지의 구축 방안을 제시하고자 한다. 또한, 한국어 '문화' 와 영어표현 'Culture'의 근원영역 비교를 통하여 구축된 온톨로지를 영어 번역 및 작문에 어떻게 활용할 수 있는지 보이고자 한다.

  • PDF

An Alignment method for Extracting English-Korean translations of term constituents (정렬기법을 이용한 전문분야 조어단위 대역쌍 추출)

  • 오종훈;황금하;최기선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.529-531
    • /
    • 2003
  • 전문용어는 전문분야의 개념을 표현하는 언어적 표현이다. 전문용어의 조어단위는 전문용어를 구성하는 최소의 형태적 단위이다. 이러한 조어단위는 전문용어의 의미를 파악하는데 중요할 뿐만 아니라 전문분야 문서에 대한 기계번역과 같은 작업에 중요한 언어자원으로 사용될 수 있다. 하지만‘조어단위와 개념단위의 불일치 문제’, 조어 단위의‘동형이의어’,‘동의이형어’문제 등으로 인하여, 하나의 전문분야 개념을 나타내는 조어단위들의 덩어리를 파악할 필요가 있다. 본 논문에서는 이러한 문제점을 조어분석 된 한영 대역 전문용어사전에 대한 한국어-영어 조어단위 정렬문제로 해결하고자 한다. 본 논문의 기법은 97%의 정확률로 조어단위 간의 정렬을 수행하였다.

  • PDF

Analysis of Tourist Attractions and Tour Agency for Overseas Tourists (해외 여행자를 위한 여행사와 관광지 추천 분석)

  • Yunji Jo;Sinrock Chae;Eun Ki Hong;Yoo Jin Moon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.01a
    • /
    • pp.477-478
    • /
    • 2023
  • 본 연구는 코로나-19 이후로 다시 활성화된 해외여행과 관련된 정보를 데이터베이스화해 정리하고, 폭발적으로 늘어난 여행객들을 위한 여행지 추천을 제시하였다. 또한 여행객들만이 아닌 여행사들을 위해 여행객들의 정보 역시 데이터베이스화하여 여행지 상품 수요조사 등에 사용할 수 있도록 하였다. 코로나-19로 인해 각국의 입국 정책은 다양해졌고, 해외여행이 단절된 기간 동안 소비자들은 여행에 대한 최신 정보를 계속해서 접하지 못했다. 그래서 이 데이터를 통해 소비자들의 수요에 맞는 여행지를 추천하고, 여행사들은 소비자들의 필요를 확인할 수 있을 것으로 사료된다.

  • PDF

Re-validation of the Revised Systems Thinking Measuring Instrument for Vietnamese High School Students and Comparison of Latent Means between Korean and Vietnamese High School Students (베트남 고등학생을 대상으로 한 개정 시스템 사고 검사 도구 재타당화 및 한국과 베트남 고등학생의 잠재 평균 비교)

  • Hyonyong Lee;Nguyen Thi Thuy;Byung-Yeol Park;Jaedon Jeon;Hyundong Lee
    • Journal of the Korean earth science society
    • /
    • v.45 no.2
    • /
    • pp.157-171
    • /
    • 2024
  • The purposes of this study were: (1) to revalidate the revised Systems Thinking Measuring Instrument (Re_STMI) reported by Lee et al. (2024) among Vietnamese high school students and (2) to investigate the differences in systems thinking abilities between Korean and Vietnamese high school students. To achieve this, data from 234 Vietnamese high school students who responded to translated Re_STMI consisting of 20 items and an Scale consisting of 20 items were used. Validity analysis was conducted through item response analysis (Item Reliability, Item Map, Infit and Outfit MNSQ, DIF between male and female) and exploratory factor analysis (principal axis factor analysis using Promax). Furthermore, structural equation modeling was employed with data from 475 Korean high school students to verify the latent mean analysis. The results were as follows: First, in the item response analysis of the 20 translated Re_STMI items in Vietnamese, the Item Reliability was .97, and the Infit MNSQ ranged from .67 to 1.38. The results from the Item Map and DIF analysis align with previous findings. In the exploratory factor analysis, all items were loaded onto intended sub-factors, with sub-factor reliabilities ranging from .662 to .833 and total reliability at .876. Confirmatory factor analysis for latent mean analysis between Korean and Vietnamese students yielded acceptable model fit indices (χ2/df: 2.830, CFI: .931, TLI: .918, SRMR: .043, RMSEA: .051). Lastly, the latent mean analysis between Korean and Vietnamese students revealed a small effect size in systems analysis, mental models, team learning, and shared vision factors, whereas a medium effect size was observed in personal mastery factors, with Vietnamese high school students showing significantly higher results in systems thinking. This study confirmed the reliability and validity of the Re_STMI items. Furthermore, international comparative studies on systems thinking using Re_STMI translated into Vietnamese, English, and other languages are warranted in the context of students' systems thinking analysis.