• Title/Summary/Keyword: 표기 방식

Search Result 155, Processing Time 0.033 seconds

Automatic Foreign Word Transliteration Model for Information Retrieval (정보검색을 위한 외래어 자동표기 모델)

  • 이재성;최기선
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1997.08a
    • /
    • pp.17-24
    • /
    • 1997
  • 조사에 따르면 한글 문서에서 사용되는 단어 중 외래어 또는 영어가 포함된 단어가 약 26%정도를 차지하고 있으며, 이는 정보검색의 중요 색인어로 사용된다(권윤형 1996). 그러나 이들 단어들은 서로 같은 단어인데도 영어로 표기되기도 하고 이형의 외래어들로 표기되기도 하여, 정보검색의 효율을 떨어뜨리고 있다. 본 논문에서는 영어 단어와 그에 대응되어 표기되는 외래어들을 찾기 위한 한 단계로서, 영어를 한글로 음차(transliteration)하여 자동표기하는 통계적 모델을 제안하고 실험한다. 제안된 모델은 통계적 기계번역 방식과 그의 한 방법인 문서 정렬(text alignment) 방식에 근거하고 있다. 특히 이 모델에서는 효과적으로 발음의 단위를 분리한 다음 정렬을 하여. 전체적인 계산량을 줄이고 성능도 향상시켰다. 음차표기는 피봇방식과 직접방식의 두가지로 구현하였다. 피봇방식은 영어에서 발음을 생성한 후, 그 발음을 다시 한글로 표기하는 방식이고, 직접방식은 직접 영어 단어에서 한글 표기로 포기하는 방식이다. 두 방식을 제안된 모델을 이용하여 비교 테스트한 결과 직접방식이 보다 정확하게 표준 외래어로 표기하였다.

  • PDF

An English-to-Korean Transliteration Model based on Character and Pronunciation (글자 및 발음 기반 영-한 음차표기 모델)

  • 오종훈;배선미;최기선
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.04b
    • /
    • pp.925-927
    • /
    • 2004
  • 음차표기란 외국어의 발음을 자국어로 표기하는 것으로 정의된다. 영-한 자동 음차표기 방법에는 직접방식, 피봇방식, 혼합방식이 있다. 기존의 영-한 음차표기 연구들은 직접방식에 기반한 연구들이 대부분이었다. 하지만, 음차표기는 직접방식에서 사용하는 단순한 자소 대 자소변환 작업이라기보다는 자소의 음성적 변환 작업이라고 할 수 있다. 따라서 자소뿐만 아니라 음소 등 음성적 정보가 매우 중요하다. 본 논문에서는 이러한 특성을 이용하여 자소 정보뿐만 아니라 음소 정보를 이용한 음차표기 기법을 제안한다. 주어진 자소와 음소 및 자소와 음소의 문맥정보를 이용하여 한국어 음차표기를 생성하는 본 논문의 기법은 약 60%의 단어정확도를 나타내었다.

  • PDF

A Study on the Korean Romanization Systems and Cataloging Korean Information Resources (한글의 로마자표기법과 한글 정보자원 목록업무에 관한 연구)

  • Oh Kyung-Mook
    • Journal of Korean Library and Information Science Society
    • /
    • v.36 no.4
    • /
    • pp.27-44
    • /
    • 2005
  • Over sixty Korean romanization systems have introduced in the course of history since 1800, but not most of them have experienced the test of proper duration. At present two major systems are introduced and focused in the bibliographic fields : Mccune-Reischauer system and Ministry of Culture & Tourism system(2000). Few libraries nay be driven to the new romanization schemes, however library users require a practical and easy-to-use Korean romanization system for searching the Korean items. From the view of bibliographic control for Korean information resources, the advantage and disadvantages for converting romanization systems have been shown as the result of the research.

  • PDF

Research on Principles to Transcribe Geographical Names in English for English Version Electronic Map Service (영문판 전자지도서비스를 위한 지명 영문표기의 세부기준과 원칙에 관한 연구)

  • Yi, Mi Sook;Ahn, Jong Wook
    • Spatial Information Research
    • /
    • v.21 no.5
    • /
    • pp.53-61
    • /
    • 2013
  • This study has a research objective to suggest detailed rules and principles to transcribe geographical names in English for English version electronic map service. For this, guidelines which are used in English transcription of local geographical names in Korea and English transcription situations of Korea geographical names in foreign electronic map service were examined. Examining results of current situations showed the English transcription method of home and abroad geographical names caused the chaos because it is not homogenized. In order to identify easy and preferred transcription method for foreigners among English transcription methods about the geographical names which are used together like this, the preference of English transcription methods of the geographical names was examined targeting foreigners. Survey results showed that foreigners prefer to transcribe in Roman character (Romanization) with its semantic word together than just to transcribe the Roman character. Reflecting this preference research results, our country's geographical names were classified as Natural features, Cultural features and man-made structures, and Administrative units and the detailed English transcription rules and principles of each geographical names were suggested.

Developing standardized model for detailed address writing of apartment housing : A case of Jung-gu, Daegu (공동주택의 상세주소 표기 표준화 모형 개발 : 대구시 중구를 사례로)

  • Jeon, Woo-Jin;Kim, Jun-Hyun
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2010.09a
    • /
    • pp.379-383
    • /
    • 2010
  • 본 논문은 현재 공동주택에서는 주소를 표기할 때 지번 뒤에 상세주소를 표기하여 단지 내에서 개별적으로 일관성 없는 세부주소로 사용하고 있는 문제점을 보완하기 위해 상세주소 표기 표준화 모형을 제시하였다. 공동주택별로 그 표기방식이 다양해 같은 동을 가동, 101동, 1동, A동, 에이동 등으로 사용하고 있었으며, 같은 층, 호를 지하1층, 지1호, 비01호, B01호,B1호, 1호, F02호 등과 같이 다양하게 표기하는 등, 비정형화로 인한 문제점이 제기 되고 있다. 비정형화로 인한 위치검색 및 위치파악 등의 애로사항으로 행정업무의 자료호환 등의 문제점이 발생하고 있어 표준화된 모형개발이 현실적으로 요구됨에 따라 본 연구에서는 공동주택인 아파트, 연립주택, 다세대주택을 중심으로 상세주소 표기 건축물에 대한 전문가 설문조사를 실시하여 상세주소의 표기방식에 대한 표준화 모형을 개발하였다.

  • PDF

Processing of Orthography and Phonology in Reading Sino-Korean Words (한자어의 표기정보와 음운정보 처리)

  • Yi, Kwang-Oh;Bae, Sung-Bong;Nam, Ki-Chun
    • Annual Conference on Human and Language Technology
    • /
    • 2005.10a
    • /
    • pp.63-72
    • /
    • 2005
  • 한자어의 처리에서 나타나는 표기중복의 효과가 표기 처리에 기인한 것인지 음운 처리에 기인한 것인지를 결정하기 위하여 두 개의 실험을 실시하였다. 실험 1에서는, 점화어-표적어의 관계를 표기불일치(음운일치), 음운불일치(표기일치), 음운-표기일치, 무 관련의 네 가지로 조작하였다 또한, 음운규칙에 따른 차이를 알아보기 위해서 유음화, 비음화, 연음화의 세 가지 규칙이 자극의 구성에 이용되었다. 점화어의 제시방식은 차폐점화와 SOA 200ms의 두 가지가 사용되었다. 음변화의 종류 및 점화어 제시방식에 관계없이, 음운불일치조건에서의 반응 양상이 음운-표기일치조건에서의 반응 양상과 유사하게 나타났다. 이것은 선행연구에서 나타난 표기중복의 효과가 음운처리에 의한 것이 아님을 시사하는 것으로 해석되었다. 실험 1에서는 표적어에 음변화 규칙이 적용되었으나 실험 2에서는 점화어에 음변화 규칙이 적용되었다. 실험 2의 결과, 음운 불일치의 효과는 나타나지 않았으나, 표기불일치의 효과는 유의하게 나타났다 실험 1과 2의 결과는 한자어 처리에서 음운정보가 아니라 표기정보의 우선성을 지지하였다.

  • PDF

An English-to-Korean Transliteration Model based on Grapheme and Phoneme (자소 및 음소 정보를 이용한 영어-한국어 음차표기 모델)

  • Oh Jong-Hoon;Choi Key-Sun
    • Journal of KIISE:Software and Applications
    • /
    • v.32 no.4
    • /
    • pp.312-326
    • /
    • 2005
  • There has been increasing interest in English-to-Korean transliteration recently. Previous ,works are related to a direct method like $\rightarrow$Korean graphemes> and a pivot method like $\rightarrow$English phoneme$\rightarrow$Korean graphemes>. Though most of the previous works focus on the direct method, transliteration, however, is a phonetic process rather than an orthographic one. In this point of view, we present an English-Korean transliteration model using grapheme and phoneme information. Unlike the previous works, our method uses phonetic information such as phonemes and their context. Moreover, we also use graphemes corresponding to phonemes. Our method shows about $60\%$ word accuracy.

Verification of Transliteration Pairs Using Distance LSTM-CNN with Layer Normalization (Distance LSTM-CNN with Layer Normalization을 이용한 음차 표기 대역 쌍 판별)

  • Lee, Changsu;Cheon, Juryong;Kim, Joogeun;Kim, Taeil;Kang, Inho
    • 한국어정보학회:학술대회논문집
    • /
    • 2017.10a
    • /
    • pp.76-81
    • /
    • 2017
  • 외국어로 구성된 용어를 발음에 기반하여 자국의 언어로 표기하는 것을 음차 표기라 한다. 국가 간의 경계가 허물어짐에 따라, 외국어에 기원을 두는 용어를 설명하기 위해 뉴스 등 다양한 웹 문서에서는 동일한 발음을 가지는 외국어 표기와 한국어 표기를 혼용하여 사용하고 있다. 이에 좋은 검색 결과를 가져오기 위해서는 외국어 표기와 더불어 사람들이 많이 사용하는 다양한 음차 표기를 함께 검색에 활용하는 것이 중요하다. 음차 표기 모델과 음차 표기 대역 쌍 추출을 통해 음차 표현을 생성하는 기존 방법 대신, 본 논문에서는 신뢰할 수 있는 다양한 음차 표현을 찾기 위해 문서에서 음차 표기 후보를 찾고, 이 음차 표기 후보가 정확한 표기인지 판별하는 방식을 제안한다. 다양한 딥러닝 모델을 비교, 검토하여 최종적으로 음차 표기 대역 쌍 판별에 특화된 모델인 Distance LSTM-CNN 모델을 제안하며, 제안하는 모델의 Batch Size 영향을 줄이고 학습 시 수렴 속도 개선을 위해 Layer Normalization을 적용하는 방법을 보인다.

  • PDF

A Study on Marking the Carrying Number of Multiplication Algorithm with regrouping (올림이 있는 자연수 곱셈 알고리즘의 올림하는 수 표기에 관한 고찰)

  • Choi, Kyoung A;Lee, Jeong Eun
    • Journal of Elementary Mathematics Education in Korea
    • /
    • v.21 no.1
    • /
    • pp.195-214
    • /
    • 2017
  • The standardized algorithm of natural number multiplication simplify the procedure of arithmetic. In the case of multiplication algorithm with regrouping, we write small the carrying number on the multiplicand. But, teachers and students have to make their own way about the case of two digits multipliers, because Korean elementary mathematics textbooks just deal with the case of the one digit multipliers. In this study, we investigated Korean current elementary mathematics textbooks related to multiplication algorithm with regrouping, and analyzed the result of research on the real condition about marking the carrying number. Besides, we reviewed the guidance contents of algorithm of natural number multiplication in Finland's math textbook and literature. By conclusions, we suggest several implications as followed; First, we need some examples of the way to mark the carrying number in teacher's guidance books and textbooks. Second, teachers try for students to feel the good points of the systematic ways to mark the carrying number. Third, teachers understand algorithm of natural number multiplication and the alternative ways about marking the carrying number.

  • PDF