• Title/Summary/Keyword: 표기(標氣)

Search Result 1,210, Processing Time 0.033 seconds

Transliteration Correction Method using Korean Alphabet Viable Prefix (한국어 자모 Viable Prefix를 이용한 외래어 표기 교정 기법)

  • Kwon, Soon-Ho;Kwon, Hyuk-Chul
    • The KIPS Transactions:PartB
    • /
    • v.18B no.2
    • /
    • pp.87-92
    • /
    • 2011
  • In Korean documents, there are diverse spellings of transliterated foreign loanwords. This fact diminishes the performance of information retrieval systems in that a foreign word can be recognized differently, which is to say, as two or several different words. Thus, information retrieval systems require preprocessing to correct nonstandard loanword spellings prior to searching and recognizing corresponding equivalent words. This paper proposes a method that improves precision and processing efficiency using the Korean alphabet's viable prefix, which prunes a virtual tree from which candidate loanwords are created.

A Research on the Format for Romanization of Korean Personal Name (한국인명의 로마자표기 형식에 대한 연구)

  • Kim, Sung-Won;Kim, Jeong-Woo
    • Journal of Information Management
    • /
    • v.43 no.2
    • /
    • pp.199-222
    • /
    • 2012
  • Due to the increase of international business and activities, Koreans nowadays have higher needs to present their personal identity to the foreigners. In this process, the first requirement is to exchange personal names with foreigners. Therefore, the phonetic translation of Korean names into Roman alphabetic notation is frequently required, in order to deliver Korean personal names to the people who do not understand Korean alphabet. However, some confusions have been witnessed in the way of transforming Korean names into Roman (English) alphabet notation, due to the fact that there are many different ways to put Korean pronunciation into Roman (English) alphabet. This study examines different formats of Romanization of Korean personal names to find and suggest an optimal one. It first examines structures of and differences between Korean and Western personal names and usage patterns, reviews the issues surrounding Romanization of Korean personal names, and patternizes diverse Romanization formats currently used. Based on these examinations and consequent findings, I would like to suggest a format for the Romanization of Korean personal names which is considered to be the best.

문화속의 과학 - 간편하고 능률적인 표기법은 국제정보통신용 로마자를

  • Lee, Hyeon-Bok
    • The Science & Technology
    • /
    • v.32 no.4 s.359
    • /
    • pp.12-12
    • /
    • 1999
  • 로마자 표기법은 우리말을 한글이 아닌 로마자로 적는 법을 말한다. 현재 우리가 쓰고 있는 로마자 표기법은 발음 위주의 표기를 하고 부호가 잡다하여 컴퓨터로 쉽게 입력할 수 없는 단점을 갖고 있다. 그래서 필자는 간편하고 능률적인 국제 정보통신용 로마자 표기법을 제안한다.

  • PDF

Research on Principles to Transcribe Geographical Names in English for English Version Electronic Map Service (영문판 전자지도서비스를 위한 지명 영문표기의 세부기준과 원칙에 관한 연구)

  • Yi, Mi Sook;Ahn, Jong Wook
    • Spatial Information Research
    • /
    • v.21 no.5
    • /
    • pp.53-61
    • /
    • 2013
  • This study has a research objective to suggest detailed rules and principles to transcribe geographical names in English for English version electronic map service. For this, guidelines which are used in English transcription of local geographical names in Korea and English transcription situations of Korea geographical names in foreign electronic map service were examined. Examining results of current situations showed the English transcription method of home and abroad geographical names caused the chaos because it is not homogenized. In order to identify easy and preferred transcription method for foreigners among English transcription methods about the geographical names which are used together like this, the preference of English transcription methods of the geographical names was examined targeting foreigners. Survey results showed that foreigners prefer to transcribe in Roman character (Romanization) with its semantic word together than just to transcribe the Roman character. Reflecting this preference research results, our country's geographical names were classified as Natural features, Cultural features and man-made structures, and Administrative units and the detailed English transcription rules and principles of each geographical names were suggested.

Processing of Orthography and Phonology in Reading Sino-Korean Words (한자어의 표기정보와 음운정보 처리)

  • Yi, Kwang-Oh;Bae, Sung-Bong;Nam, Ki-Chun
    • Annual Conference on Human and Language Technology
    • /
    • 2005.10a
    • /
    • pp.63-72
    • /
    • 2005
  • 한자어의 처리에서 나타나는 표기중복의 효과가 표기 처리에 기인한 것인지 음운 처리에 기인한 것인지를 결정하기 위하여 두 개의 실험을 실시하였다. 실험 1에서는, 점화어-표적어의 관계를 표기불일치(음운일치), 음운불일치(표기일치), 음운-표기일치, 무 관련의 네 가지로 조작하였다 또한, 음운규칙에 따른 차이를 알아보기 위해서 유음화, 비음화, 연음화의 세 가지 규칙이 자극의 구성에 이용되었다. 점화어의 제시방식은 차폐점화와 SOA 200ms의 두 가지가 사용되었다. 음변화의 종류 및 점화어 제시방식에 관계없이, 음운불일치조건에서의 반응 양상이 음운-표기일치조건에서의 반응 양상과 유사하게 나타났다. 이것은 선행연구에서 나타난 표기중복의 효과가 음운처리에 의한 것이 아님을 시사하는 것으로 해석되었다. 실험 1에서는 표적어에 음변화 규칙이 적용되었으나 실험 2에서는 점화어에 음변화 규칙이 적용되었다. 실험 2의 결과, 음운 불일치의 효과는 나타나지 않았으나, 표기불일치의 효과는 유의하게 나타났다 실험 1과 2의 결과는 한자어 처리에서 음운정보가 아니라 표기정보의 우선성을 지지하였다.

  • PDF

Korean Named Entity Recognition Using BIT Representation (BIT 표기법을 활용한 한국어 개체명 인식)

  • Yoon, Ho;Kim, Chang-Hyun;Cheon, Min-Ah;Park, Ho-Min;Namgoong, Young;Choi, Min-Seok;Kim, Jae-Kyun;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.190-194
    • /
    • 2019
  • 개체명 인식이란 주어진 문서에서 개체명의 범위를 찾고 개체명을 분류하는 것이다. 최근 많은 연구는 신경망 모델을 이용하며 하나 이상의 단어로 구성된 개체명을 BIO 표기법으로 표현한다. BIO 표기법은 개체명이 시작되는 단어의 표지에 B(Beginning)-를 붙이고, 개체명에 포함된 그 외의 단어의 표지에는 I(Inside)-를 붙이며, 개체명과 개체명 사이의 모든 단어의 표지를 O로 간주하는 방법이다. BIO 표기법으로 표현된 말뭉치는 O 표지가 90% 이상을 차지하므로 O 표지에 대한 혼잡도가 높아지는 문제와 불균형 학습 문제가 발생된다. 본 논문에서는 BIO 표기법 대신에 BIT 표기법을 제안한다. BIT 표기법이란 BIO 표기법에서 O 표지를 T(Tag) 표지로 변환하는 방법이며 본 논문에서 T 표지는 품사 표지를 나타낸다. 실험을 통해서 BIT 표기법이 거의 모든 경우에 성능이 향상됨을 확인할 수 있었다.

  • PDF

Developing standardized model for detailed address writing of apartment housing : A case of Jung-gu, Daegu (공동주택의 상세주소 표기 표준화 모형 개발 : 대구시 중구를 사례로)

  • Jeon, Woo-Jin;Kim, Jun-Hyun
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2010.09a
    • /
    • pp.379-383
    • /
    • 2010
  • 본 논문은 현재 공동주택에서는 주소를 표기할 때 지번 뒤에 상세주소를 표기하여 단지 내에서 개별적으로 일관성 없는 세부주소로 사용하고 있는 문제점을 보완하기 위해 상세주소 표기 표준화 모형을 제시하였다. 공동주택별로 그 표기방식이 다양해 같은 동을 가동, 101동, 1동, A동, 에이동 등으로 사용하고 있었으며, 같은 층, 호를 지하1층, 지1호, 비01호, B01호,B1호, 1호, F02호 등과 같이 다양하게 표기하는 등, 비정형화로 인한 문제점이 제기 되고 있다. 비정형화로 인한 위치검색 및 위치파악 등의 애로사항으로 행정업무의 자료호환 등의 문제점이 발생하고 있어 표준화된 모형개발이 현실적으로 요구됨에 따라 본 연구에서는 공동주택인 아파트, 연립주택, 다세대주택을 중심으로 상세주소 표기 건축물에 대한 전문가 설문조사를 실시하여 상세주소의 표기방식에 대한 표준화 모형을 개발하였다.

  • PDF

English-to-Korean Transliteration using Multiple Unbounded Overlapping Phonemes (복수 음운 정보를 이용한 영.한 음차 표기)

  • Kang, In-Ho;Kim, Gil-Chang
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10e
    • /
    • pp.50-54
    • /
    • 1999
  • 본 연구에서는 기존의 한정된 길이의 영어 또는 한글의 발음 단위를 이용하던 자동 음차 표기 방식과 달리, 학습 데이터에서 추출한 임의 길이의 음운 패턴을 사용하는 방법을 제안한다. 통계적 정보에 기반하여 추출한 음차 표기 패턴과 외래어 표기 규칙에 기반하여 기술한 음차 표기 패턴을 위치와 길이에 관계없이 사용하여 주어진 영어 단어의 한글 음차 표기를 얻어낸다. 제안하는 방법은 먼저 주어진 영어 단어의 가능한 모든 발음 단위를 기준으로 한글 표기 네트워크를 만든 후, 학습 데이터에서 추출한 음운 패턴을 교차 적용시켜 네트워크 각 노드의 가중치를 결정한다. 가중치가 결정된 네트워크에서 가중치의 합이 가장 좋은 경로를 찾아냄으로 해서 음차 표기를 수행한다. 본 연구에서 제안하는 방법으로 실험을 한 결과 자소 단위 86.5%, 단어 단위 55.3%의 정확률을 얻을 수 있었다.

  • PDF

Equivalent Writing of Loanwords Detection Method based on Korean Alphabet Confusion Matrix (한국어 자모 혼동행렬 기반 유사 외래어 표기 검출 기법)

  • Kwon, Soonho;Kwon, Hyuk-Chul
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.04a
    • /
    • pp.433-436
    • /
    • 2010
  • 최근 한국어 문서에는 한국어뿐만 아니라 외래어 표기 등이 혼합되어 사용되고 있다. 외래어 표기는 한 단어에 대해 한 개만 존재하는 것이 아니라 여러 개의 다른 표기로 사용되고 있다. 이러한 표기상 불일치는 하나의 단어가 다른 개념으로 인식되어 정보검색 시스템의 성능 저하의 원인이 된다. 따라서 정보검색 시스템의 성능 향상을 위해 여러 외래어 표기를 같은 개념으로 인식하는 시스템이 필요하다. 본 논문에서는 한국어 자모 혼동행렬을 기반으로 한 유사 외래어 표기 검출 기법을 제안한다. 제안한 기법에 따라 유사 외래어 표기를 검출해줌으로써 정보검색 시스템의 성능을 향상할 수 있다.

A Study on Creation of Hangeu-Romanization Conversion Table Using Petri-Nets (페트리넷을 이용한 한글-로마자 표기 변환표 생성에 관한 연구)

  • Kim, Kyung-Jing;Choi, Young-Kyoo;Rhee, Sang-Burm
    • The KIPS Transactions:PartB
    • /
    • v.9B no.6
    • /
    • pp.827-834
    • /
    • 2002
  • In this paper, we proposed the formation of Korean-Roman alphabet notation conversion table for the generation of Korean-Roman alphabet notation that also meets revised Roman alphabet notation. Introduced a mathematical analyzing method of the natural language which used a petrinet model so that a base of Roman alphabet notation analyzed standard pronunciation and Roman alphabet notation to work mathematically. It display the practical example through a petrinet modeling of a plan and Roman alphabet notation to create a Korean Roman alphabet notation conversion table with the method of the analysis that used a petrinet model, and present a mathematical modeling plan and application method of Korean. We developed application program based on window in order to verify a created Korean-Roman alphabet notation conversion table, and compared the result of an application program with Roman alphabet notation of an Roman alphabet notation example dictionary.