• 제목/요약/키워드: 표기 방식

검색결과 155건 처리시간 0.023초

정보검색을 위한 외래어 자동표기 모델 (Automatic Foreign Word Transliteration Model for Information Retrieval)

  • 이재성;최기선
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1997년도 제4회 학술대회 논문집
    • /
    • pp.17-24
    • /
    • 1997
  • 조사에 따르면 한글 문서에서 사용되는 단어 중 외래어 또는 영어가 포함된 단어가 약 26%정도를 차지하고 있으며, 이는 정보검색의 중요 색인어로 사용된다(권윤형 1996). 그러나 이들 단어들은 서로 같은 단어인데도 영어로 표기되기도 하고 이형의 외래어들로 표기되기도 하여, 정보검색의 효율을 떨어뜨리고 있다. 본 논문에서는 영어 단어와 그에 대응되어 표기되는 외래어들을 찾기 위한 한 단계로서, 영어를 한글로 음차(transliteration)하여 자동표기하는 통계적 모델을 제안하고 실험한다. 제안된 모델은 통계적 기계번역 방식과 그의 한 방법인 문서 정렬(text alignment) 방식에 근거하고 있다. 특히 이 모델에서는 효과적으로 발음의 단위를 분리한 다음 정렬을 하여. 전체적인 계산량을 줄이고 성능도 향상시켰다. 음차표기는 피봇방식과 직접방식의 두가지로 구현하였다. 피봇방식은 영어에서 발음을 생성한 후, 그 발음을 다시 한글로 표기하는 방식이고, 직접방식은 직접 영어 단어에서 한글 표기로 포기하는 방식이다. 두 방식을 제안된 모델을 이용하여 비교 테스트한 결과 직접방식이 보다 정확하게 표준 외래어로 표기하였다.

  • PDF

글자 및 발음 기반 영-한 음차표기 모델 (An English-to-Korean Transliteration Model based on Character and Pronunciation)

  • 오종훈;배선미;최기선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.925-927
    • /
    • 2004
  • 음차표기란 외국어의 발음을 자국어로 표기하는 것으로 정의된다. 영-한 자동 음차표기 방법에는 직접방식, 피봇방식, 혼합방식이 있다. 기존의 영-한 음차표기 연구들은 직접방식에 기반한 연구들이 대부분이었다. 하지만, 음차표기는 직접방식에서 사용하는 단순한 자소 대 자소변환 작업이라기보다는 자소의 음성적 변환 작업이라고 할 수 있다. 따라서 자소뿐만 아니라 음소 등 음성적 정보가 매우 중요하다. 본 논문에서는 이러한 특성을 이용하여 자소 정보뿐만 아니라 음소 정보를 이용한 음차표기 기법을 제안한다. 주어진 자소와 음소 및 자소와 음소의 문맥정보를 이용하여 한국어 음차표기를 생성하는 본 논문의 기법은 약 60%의 단어정확도를 나타내었다.

  • PDF

한글의 로마자표기법과 한글 정보자원 목록업무에 관한 연구 (A Study on the Korean Romanization Systems and Cataloging Korean Information Resources)

  • 오경묵
    • 한국도서관정보학회지
    • /
    • 제36권4호
    • /
    • pp.27-44
    • /
    • 2005
  • 현재 정부의 표준로마자 표기 방식인 문화관광부(2000)표기법은 도서관사회에서 대부분 이용자들은 아직 익숙치 못한 방식인 반면에, 국제적으로 학계 및 도서관이용자들에게 잘 알려져 있는 표기는 Mccune-Reischauer 표기방식이라고 할 수 있다. 한글로마자표준이 전환되는 것이 정부의 방침에도 불구하고 국내$\cdot$외 도서관계에 그동안 변환문제가 꾸준하게 제기되고 논의되었어도 이를 구체화시키기에는 실질적으로 여러 가지 난제가 있다. 새로운 표기방식이 학계 및 정보서비스 업계에 도입되기 위해서는 표기법의 변천과정과 각 표기법의 특징, 한국서지목록작성 상의 여러 가지 문제점 등에 대한 충분한 이해가 선행되어야 함으로 이러한 사항들을 중점적으로 연구하였다.

  • PDF

영문판 전자지도서비스를 위한 지명 영문표기의 세부기준과 원칙에 관한 연구 (Research on Principles to Transcribe Geographical Names in English for English Version Electronic Map Service)

  • 이미숙;안종욱
    • Spatial Information Research
    • /
    • 제21권5호
    • /
    • pp.53-61
    • /
    • 2013
  • 본 연구는 영문판 전자지도 서비스를 위한 지명 영문표기의 세부기준과 원칙을 제시하는데 연구목적이 있다. 이를 위하여 국내에서 지명의 영문표기를 위해 활용하고 있는 지침과 국외 전자지도서비스에서의 한국지명의 영문표기 현황을 살펴보았다. 현황조사 결과 국내 외에서 지명의 영문표기방식이 통일되어 있지 않아 혼란을 야기함을 알 수 있었다. 이렇게 혼용되고 있는 지명의 영문표기 방식 중에서 외국인이 이해하기 쉽고 선호하는 표기방식을 파악하기 위하여 외국인을 대상으로 지명의 영문표기방식의 선호도를 조사하였다. 조사결과 외국인은 로마자만 표기하는 것보다는 로마자와 의미역을 병기하는 것을 선호하는 것으로 나타났다. 이러한 선호도 조사 결과를 반영하여 본 연구에서는 우리나라 지명을 자연지명, 인공지명, 행정지명으로 구분하여 각 지명별로 영문표기의 기준과 원칙을 제시하였다.

공동주택의 상세주소 표기 표준화 모형 개발 : 대구시 중구를 사례로 (Developing standardized model for detailed address writing of apartment housing : A case of Jung-gu, Daegu)

  • 전우진;김준현
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2010년도 추계학술대회
    • /
    • pp.379-383
    • /
    • 2010
  • 본 논문은 현재 공동주택에서는 주소를 표기할 때 지번 뒤에 상세주소를 표기하여 단지 내에서 개별적으로 일관성 없는 세부주소로 사용하고 있는 문제점을 보완하기 위해 상세주소 표기 표준화 모형을 제시하였다. 공동주택별로 그 표기방식이 다양해 같은 동을 가동, 101동, 1동, A동, 에이동 등으로 사용하고 있었으며, 같은 층, 호를 지하1층, 지1호, 비01호, B01호,B1호, 1호, F02호 등과 같이 다양하게 표기하는 등, 비정형화로 인한 문제점이 제기 되고 있다. 비정형화로 인한 위치검색 및 위치파악 등의 애로사항으로 행정업무의 자료호환 등의 문제점이 발생하고 있어 표준화된 모형개발이 현실적으로 요구됨에 따라 본 연구에서는 공동주택인 아파트, 연립주택, 다세대주택을 중심으로 상세주소 표기 건축물에 대한 전문가 설문조사를 실시하여 상세주소의 표기방식에 대한 표준화 모형을 개발하였다.

  • PDF

한자어의 표기정보와 음운정보 처리 (Processing of Orthography and Phonology in Reading Sino-Korean Words)

  • 이광오;배성봉;남기춘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2005년도 제17회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.63-72
    • /
    • 2005
  • 한자어의 처리에서 나타나는 표기중복의 효과가 표기 처리에 기인한 것인지 음운 처리에 기인한 것인지를 결정하기 위하여 두 개의 실험을 실시하였다. 실험 1에서는, 점화어-표적어의 관계를 표기불일치(음운일치), 음운불일치(표기일치), 음운-표기일치, 무 관련의 네 가지로 조작하였다 또한, 음운규칙에 따른 차이를 알아보기 위해서 유음화, 비음화, 연음화의 세 가지 규칙이 자극의 구성에 이용되었다. 점화어의 제시방식은 차폐점화와 SOA 200ms의 두 가지가 사용되었다. 음변화의 종류 및 점화어 제시방식에 관계없이, 음운불일치조건에서의 반응 양상이 음운-표기일치조건에서의 반응 양상과 유사하게 나타났다. 이것은 선행연구에서 나타난 표기중복의 효과가 음운처리에 의한 것이 아님을 시사하는 것으로 해석되었다. 실험 1에서는 표적어에 음변화 규칙이 적용되었으나 실험 2에서는 점화어에 음변화 규칙이 적용되었다. 실험 2의 결과, 음운 불일치의 효과는 나타나지 않았으나, 표기불일치의 효과는 유의하게 나타났다 실험 1과 2의 결과는 한자어 처리에서 음운정보가 아니라 표기정보의 우선성을 지지하였다.

  • PDF

자소 및 음소 정보를 이용한 영어-한국어 음차표기 모델 (An English-to-Korean Transliteration Model based on Grapheme and Phoneme)

  • 오종훈;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제32권4호
    • /
    • pp.312-326
    • /
    • 2005
  • 최근 정보검색과 기계번역과 같은 자연언어응용에서 영-한 자동 음차표기에 대한 관심이 높아지고 있다. 지금까지의 영-한 자동 음차표기 연구에는 $<영어자소{\rightarrow}$한글자소>의 직접방식, <영어자소${\rightarrow$음소$\rightarrow$한글자소>의 피봇방식이 있다 기존의 영-한 음차표기 연구들은 주로 직접방식에 대한 연구가 활발히 진행되어 찼다. 하지만, 음차표기는 직접방식에서 사용하는 단순한 자소 대 자소변환 작업이라기보다는 자소의 음성적 변환 작업이라고 할 수 있다. 따라서 자소 뿐만 아니라 음소 등 음성적 정보가 매우 중요하다. 본 논문에서는 이러한 특성을 이용하여 자소 정보뿐만 아니라 음소 정보를 이용한 음차표기 기법을 제안한다. 주어진 자소와 음소 및 자소와 음소의 문맥정보를 이용하여 한국어 음차표기를 생성하는 본 논문의 기법은 약 $60\%$의 단어 정확도를 나타내었다.

Distance LSTM-CNN with Layer Normalization을 이용한 음차 표기 대역 쌍 판별 (Verification of Transliteration Pairs Using Distance LSTM-CNN with Layer Normalization)

  • 이창수;천주룡;김주근;김태일;강인호
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2017년도 제29회 한글및한국어정보처리학술대회
    • /
    • pp.76-81
    • /
    • 2017
  • 외국어로 구성된 용어를 발음에 기반하여 자국의 언어로 표기하는 것을 음차 표기라 한다. 국가 간의 경계가 허물어짐에 따라, 외국어에 기원을 두는 용어를 설명하기 위해 뉴스 등 다양한 웹 문서에서는 동일한 발음을 가지는 외국어 표기와 한국어 표기를 혼용하여 사용하고 있다. 이에 좋은 검색 결과를 가져오기 위해서는 외국어 표기와 더불어 사람들이 많이 사용하는 다양한 음차 표기를 함께 검색에 활용하는 것이 중요하다. 음차 표기 모델과 음차 표기 대역 쌍 추출을 통해 음차 표현을 생성하는 기존 방법 대신, 본 논문에서는 신뢰할 수 있는 다양한 음차 표현을 찾기 위해 문서에서 음차 표기 후보를 찾고, 이 음차 표기 후보가 정확한 표기인지 판별하는 방식을 제안한다. 다양한 딥러닝 모델을 비교, 검토하여 최종적으로 음차 표기 대역 쌍 판별에 특화된 모델인 Distance LSTM-CNN 모델을 제안하며, 제안하는 모델의 Batch Size 영향을 줄이고 학습 시 수렴 속도 개선을 위해 Layer Normalization을 적용하는 방법을 보인다.

  • PDF

올림이 있는 자연수 곱셈 알고리즘의 올림하는 수 표기에 관한 고찰 (A Study on Marking the Carrying Number of Multiplication Algorithm with regrouping)

  • 최경아;이정은
    • 한국초등수학교육학회지
    • /
    • 제21권1호
    • /
    • pp.195-214
    • /
    • 2017
  • 표준화된 자연수 곱셈 알고리즘3)은 곱셈의 계산 과정을 간략화한 것으로, 올림이 있는 자연수 곱셈의 경우 올림하는 수를 피승수의 위에 작게 표기하고 있다. 하지만 이러한 올림하는 수 표기 방식은 승수가 한 자리 수인 경우에만 교과서에 제시되고 있어, 승수가 두 자리 수인 경우에는 교사와 학생들이 자기 나름의 표기 방식을 선택하도록 요구하고 있다. 이에 본 연구는 현행 교과서에서의 올림이 있는 자연수 곱셈의 알고리즘 접근 방법을 살펴보고, 3, 4, 5, 6학년 학생들의 올림이 있는 자연수 곱셈 알고리즘에서 나타나는 올림하는 수 표기 방식을 분석하였다. 또한, 핀란드 수학 교과서와 선행 연구에 나타난 올림이 있는 자연수 곱셈 알고리즘 지도 내용을 분석함으로써 자연수 곱셈 알고리즘의 제시 방법에 대한 시사점을 추출하였다. 그 결과로 다음과 같이 제안한다. 첫째, 교사용 지도서나 교과서에 올림하는 수를 표기하는 방법에 대한 예시가 필요하다. 둘째, 올림하는 수를 체계적으로 표기하는 것의 좋음을 학생이 인식하도록 지도되어야 한다. 셋째, 대안적인 자연수 곱셈 알고리즘과 올림하는 수 표기 방법에 대한 교사의 이해가 요구된다.

  • PDF