• 제목/요약/키워드: Pivot language

검색결과 18건 처리시간 0.021초

말뭉치 자동 확장을 통한 SMT 성능 향상에 대한 연구 (Research about SMT Performance Improvement Through Automatic Corpus Expansion)

  • 최규현;신종훈;김영길
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.296-299
    • /
    • 2016
  • 현재 자동번역에는 통계적 방법에 속하는 통계기반 자동번역 시스템(SMT)이 많이 사용되고 있지만, 학습 데이터로 사용되는 대용량의 병렬 말뭉치를 수동으로 구축하는데 어려움이 있다. 본 연구의 목적은 통계기반 자동번역의 성능을 향상시키기 위해 기존 다른 언어쌍의 말뭉치와 SMT 자동번역 기술을 이용하여 대상이 되는 언어쌍의 SMT 병렬 말뭉치를 자동으로 확장하는 방법을 제안한다. 제안 방법은 서로 다른언어 B와 C의 병렬 말뭉치를 얻기 위해, A와 B의 SMT 자동번역 시스템을 구축하고 기존의 A-C 말뭉치의 A를 SMT를 통해 B로 번역하여 B와 C의 말뭉치를 자동으로 확장한다. 실험을 통해 확장한 병렬 말뭉치가 통계기반 자동번역 시스템의 성능을 향상시킬 수 있음을 확인한다.

  • PDF

중간언어 기반의 Word2Vec와 CCA를 이용한 이중언어 사전 추출 (Pivot-based Bilingual Lexicon Extraction Using Word2Vec and CCA)

  • 김정태;김창현;천민아;김재훈;김재환
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.307-309
    • /
    • 2016
  • 이중언어 사전은 자연어처리 분야에서 매우 유용한 자원으로 사용되고 있다. 그러나 초기사전이나 병렬말뭉치 등 자원이 부족한 언어 쌍에 대해서 이중언어 사전을 추출하는 것은 쉽지 않다. 이러한 문제를 해결하기 위해 본 논문에서는 중간 언어 기반으로 Word2Vec와 CCA를 이용하여 이중언어 사전을 추출하는 방법을 제안한다. 본 논문에서 제안하는 방법의 성능을 평가하기 위해서 중간언어로 영어를 사용하여 스페인어-한국어에 대한 이중언어 사전을 추출하는 실험을 하였다. 무작위로 뽑은 200개의 단어에 대한 번역 정확도를 구하였다. 그 결과 최상위에서 37.5%, 상위 10위에서 63%, 그리고 상위 20위에서는 69.5%의 정확도를 얻을 수 있었다.

  • PDF

피봇 기계번역시스템에서의 한국어생성을 위한 문제선정 (Style Selection for Korean Generation under the Pivot MT System)

  • 이종혁
    • 인지과학
    • /
    • 제1권2호
    • /
    • pp.279-291
    • /
    • 1989
  • 피봇 기계번역 시스템하에서 자연스런 출력문 생성을 위한 문체선정 문제는 표층 구문정보를 배제한 언어에 의존하지 않는 중간표현의 특성과 언어마다 문화적 차이에서 기인한 사고.발상의 차이로 인해 큰 어려움을 갖는다.본논문은 이들 문제점들을 해결하기 위한 시도로 첫째,출력문의 자연스런 문장구조를 크게 좌우하는 태의 화용적.문체적 결정과 한국어의 심한 피동 제약 가운데서의 태의 생성,둘째,한국어 특유의 표현양식을 위한 문장구조 변경,마지막으로 출력문에서 기능어의 의미 애매성을 제거하기 위한 실질어를 이용한 의미보완 등을 논한다.

Bilingual Multiword Expression Alignment by Constituent-Based Similarity Score

  • Seo, Hyeong-Won;Kwon, Hongseok;Cheon, Min-Ah;Kim, Jae-Hoon
    • Journal of Information Processing Systems
    • /
    • 제12권3호
    • /
    • pp.455-467
    • /
    • 2016
  • This paper presents the constituent-based approach for aligning bilingual multiword expressions, such as noun phrases, by considering the relationship not only between source expressions and their target translation equivalents but also between the expressions and constituents of the target equivalents. We only considered the compositional preferences of multiword expressions and not their idiomatic usages because our multiword identification method focuses on their collocational or compositional preferences. In our experimental results, the constituent-based approach showed much better performances than the general method for extracting bilingual multiword expressions. For our future work, we will examine the scoring method of the constituent-based approach in regards to having the best performance. Moreover, we will extend target entries in the evaluation dictionaries by considering their synonyms.

이국어 병렬말뭉치와 중간언어를 활용한 이국어 사전 자동구축 (Automatic bilingual lexicon construction via bilingual parallel corpus and pivot language)

  • 서형원;권홍석;김재훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.307-310
    • /
    • 2013
  • 본 논문은 한국어-스페인어와 한국어-불어 간의 양방향 이국어 사전(Bi-directional bilingual lexicon)을 자동으로 구축하기 위한 새로운 방법을 제안한다. 일반적으로 한국어와 스페인어/불어 간의 병렬 말뭉치를 직접적으로 구축하기에는 어려움에 따르기 때문에, 영어를 중심언어로 하는 영어(EN)-한국어(KR)/스페인어(ES)/불어(FR) 병렬 말뭉치를 이용하여 문맥 벡터를 만들고 그들 간의 유사도를 계산하는 변형된 문맥 벡터 방법을 제안한다. 영어는 다른 언어와의 이국어 병렬 말뭉치가 비교적 많이 공개되어 있기 때문에 이 방법을 이용하면 비교적 쉽게 KR-ES와 KR-FR 양방향 이국어 사전을 구축할 수 있다. 본 논문에서 제안한 방법으로 실험해본 결과 최고 85%(ES${\rightarrow}$KR)의 정확도를 얻을 수 있었다.

Fasting of the Mind and Quieting of the Mind: A Comparative Analysis of Apophatic Tendencies in Zhuangzi and Cataphatic Tendencies in Daesoon Thought

  • ZHANG Rongkun;Jason GREENBERGER
    • 대순사상과 동아시아종교
    • /
    • 제2권2호
    • /
    • pp.33-50
    • /
    • 2023
  • 'Fasting of the Mind (心齋, ch. xīn zhāi)' is arguably the most important concept within the practical approach to the spiritual cultivation formulated by the Daoist philosopher, Zhuangzi (莊子). Most scholars have interpreted 'Fasting of the Mind' as an apophatic practice centered around the aim of the 'Dissolution of the Self (喪我, ch. sàng wŎ).' The Korean new religious movement, Daesoon Jinrihoe (大巡眞理會), can be shown to instead consistently utilize cataphatic descriptions of spiritual cultivation based on the 'quieting of the mind (安心, kr. anshim)' and 'quieting of the body (安身, kr. anshin)' with the highest attainable state referred to as the 'Perfected State of Unification with the Dao (道通眞境, kr. Dotong-jingyeong).' While the language used by Zhuangzi and Daesoon Jinrihoe appears quite different on a superficial level, a deeper examination shows that these rhetorical framings are likely negativistic and positivistic descriptions of the same, or at least reasonably similar, phenomena. Zhuangzi, who focused primarily on the body, mind, and internal energy, cautioned practitioners that 'mere listening stops with the ears (聽止於耳, ch. tīng zhǐ yú ěr)' and 'mere recognition stops with the mind (心止於符, ch. xīn zhǐ yú fú).' He therefore encouraged cultivators of the Dao to 'listen with the spirit (聽之以氣 ch. tīng zhī yǐ qì).' The main scripture of Daesoon Jinrihoe states that "The mind is a pivot, gate, and gateway for gods; They, who turn the pivot, open, and close the gate, and go back and forth through the gateway, can be either good or evil (心也者, 鬼神之樞機也, 門戶也,道路也)," and the Supreme God of the Ninth Heaven (九天上帝, kr. Gucheon Sangje) even promises to visit anyone who possesses a 'singularly-focused mind (一心, kr. il-shim).' In both these approaches, there is a sense of what must be kept out of the mind (e.g., external disturbances, strong emotions, malevolent entities) and what the mind should connect with to attain spiritual progress (e.g., spirit, singular focus, the Supreme God). The observations above serve as the main basis for a comparison between the apophatic descriptions of cultivation found in Zhuangzi and their cataphatic counterparts in Daesoon Thought. However, the culmination of this nuanced comparative exploration reveals that while the leanings of Zhuangzi and Daesoon Thought generally hold true, ultimately, both systems of cultivation transcend the categories of apophatic and cataphatic.

한국 아동의 부정사 획득 (The Acquisition of Negatives in Five Korean Children)

  • 이순형
    • 아동학회지
    • /
    • 제6권1호
    • /
    • pp.17-40
    • /
    • 1985
  • This study investigated Korean children's early acquisition of negatives and focused on four research questions: 1) processing of negative variations; 2) the nature of negatives when negatives are completely acquired in Korean (in which meaning and form are matched in one to one mapping); 3) the validity of Bellugi's negative acquisition model in Korean; and 4) the cause of child's erroneous sentence production: limited ability or regularity in children's cognition. The language data of the five subjects (age span; 1.1 - 3.11) were collected by their parents in the natural setting of the home. The results showed that 1) the pivot form, was processed in many ways from a simple to a complicated form, such as <(X+X')+N> <(x+x')+N,Y> <(x+x') N,(y+y')>. It appeared that the children used a simple negative format to reach a one-step advanced negative format. 2) Korean negatives are divided into range of negation in the negative sentence (part or whole), strength of negation (absolute or general), functions of meaning (negation, absences, refusal, prohibition, impossibility). All five children acquired negative sentences in all functions and the complete range after 3 years of age. 3) In spite of the differences in age level, Bellugi's four stage model was in evidence; that is, Korean children's negative acquisition was almost identical with Bellugi's tour stage model in deep structure. 4) Analyses of children's error sentences showed that the sentences with errors were made not because of the children's limitation in cognitive ability but because of the strict application of regularity of rules from the original grammars. Consequently, the children produced negative sentences using two rules: the rule of additive complexity (from simple to complex) and the rule of division (from one to several).

  • PDF

허영만의 작품에서 나타난 효과태의 상징어적 특징과 활용 (A Symbolic Characteristic of Mimetic Words in Published Cartoon: Focusing on Works of Heo, Young Man)

  • 오율석;윤기헌
    • 만화애니메이션 연구
    • /
    • 통권30호
    • /
    • pp.169-199
    • /
    • 2013
  • 만화에서의 다양한 연출은 웹툰의 대중화와 함께 세로 스크롤 연출이 기존의 출판만화의 페이지 연출과 대립하는 양상을 보이며 새로운 장르를 구축해냈다. 많은 출판만화의 연구가 페이지를 위시한 컷 연출에 초점을 두고 있지만, 웹툰에는 페이지의 개념이 없다. 대중 지향의 만화는 시대의 변화에 따라 구심점이 지면에서 컴퓨터 모니터로 옮겨가며 매체의 특성 또한 달라졌으며, 매체는 점점 다원화되고 있다. 스마트폰의 유행으로 인한 모바일의 강세, 공교육에서의 태블릿 PC의 보급화 전망과 같이, 만화는 급변하는 매체환경에 속해있다. 이러한 상황에서도 만화의 변하지 않는 중요한 정체성중의 하나를 꼽자면 그림과 텍스트의 조합이 만들어 내는 연출이다. 이 논문에서는 허영만의 작품을 중심으로 만화 의태어인 효과태가 가진 상징어적인 특성과 효용가치를 분석하였다. 효과태는 단지 소리뿐만이 아니라 모양, 느낌, 상태 등을 전달하며 문학적 상상구조를 발동시킴으로써 함축적 특성을 가진다. 현대국어의 장점인 다양한 언어 표현과 자모체계는 미세한 어감과 정서의 차이점을 느끼게 해주며 직접 경험과 간접 경험을 통한 기억을 떠올려서 뉘앙스화하기 때문이다. 이러한 특징들로 인해서 허영만의 대표작들은 상업성과 작가성을 동시에 지니고 오랜 세월동안 대중과의 소통을 해왔으며 한국적인 만화의 소양을 풍부하게 가지고 있다. 허영만의 만화에 나타난 효과태의 특징은 만화의 표현과 전달에 있어서 일반적인 기대 이상으로 효과태가 미치는 영향이 크다는 것을 알 수가 있다. 피수용자인 독자는 그림과 글 사이에서 적극적으로 지적인 추리를 하면서 그 과정 자체를 즐기며, 그러한 과정에 대사 텍스트 이상으로 상상력을 자극하는 장치가 효과태이며, 효과태는 상징적 구조를 장점으로 하는 독자의 능동적 참여 장치이다.