• 제목/요약/키워드: 표기 방법

검색결과 384건 처리시간 0.028초

외국어 음차 표기의 음성적 유사도 비교 알고리즘 (Phonetic Similarity Meausre for the Korean Transliterations of Foreign Words)

  • 강병주;이재성;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제26권10호
    • /
    • pp.1237-1246
    • /
    • 1999
  • 최근 모든 분야에서 외국과의 교류가 증대됨에 따라서 한국어 문서에는 점점 더 많은 외국어 음차 표기가 사용되는 경향이 있다. 하지만 같은 외국어에 대한 음차 표기에 개인차가 심하여 이들 음차 표기를 포함한 문서들에 대한 검색을 어렵게 만드는 원인이 되고 있다. 한 가지 해결 방법은 색인 시에 같은 외국어에서 온 음차 표기들을 등가부류로 묶어서 색인해 놓았다가 질의 시에 확장하는 방법이다. 본 논문에서는 외국어 음차 표기들의 등가부류를 만드는데 필요한 음차 표기의 음성적 유사도 비교 알고리즘인 Kodex를 제안한다. Kodex 방법은 기존의 스트링 비교 방법인 비음성적 방법에 비해 음차 표기들을 등가부류로 클러스터링하는데 있어 더 나은 성능을 보이면서도, 계산이 간단하여 훨씬 효율적으로 구현될 수 있는 장점이 있다.Abstract With the advent of digital communication technologies, as Koreans communicate with foreigners more frequently, more foreign word transliterations are being used in Korean documents more than ever before. The transliterations of foreign words are very various among individuals. This makes text retrieval tasks about these documents very difficult. In this paper we propose a new method, called Kodex, of measuring the phonetic similarity among foreign word transliterations. Kodex can be used to generate the equivalence classes of the transliterations while indexing and conflate the equivalent transliterations at the querying stage. We show that Kodex gives higher precision at the similar recall level and is more efficient in computation than non-phonetic methods based on string similarity measure.

정보검색을 위한 외래어 자동표기 모델 (Automatic Foreign Word Transliteration Model for Information Retrieval)

  • 이재성;최기선
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1997년도 제4회 학술대회 논문집
    • /
    • pp.17-24
    • /
    • 1997
  • 조사에 따르면 한글 문서에서 사용되는 단어 중 외래어 또는 영어가 포함된 단어가 약 26%정도를 차지하고 있으며, 이는 정보검색의 중요 색인어로 사용된다(권윤형 1996). 그러나 이들 단어들은 서로 같은 단어인데도 영어로 표기되기도 하고 이형의 외래어들로 표기되기도 하여, 정보검색의 효율을 떨어뜨리고 있다. 본 논문에서는 영어 단어와 그에 대응되어 표기되는 외래어들을 찾기 위한 한 단계로서, 영어를 한글로 음차(transliteration)하여 자동표기하는 통계적 모델을 제안하고 실험한다. 제안된 모델은 통계적 기계번역 방식과 그의 한 방법인 문서 정렬(text alignment) 방식에 근거하고 있다. 특히 이 모델에서는 효과적으로 발음의 단위를 분리한 다음 정렬을 하여. 전체적인 계산량을 줄이고 성능도 향상시켰다. 음차표기는 피봇방식과 직접방식의 두가지로 구현하였다. 피봇방식은 영어에서 발음을 생성한 후, 그 발음을 다시 한글로 표기하는 방식이고, 직접방식은 직접 영어 단어에서 한글 표기로 포기하는 방식이다. 두 방식을 제안된 모델을 이용하여 비교 테스트한 결과 직접방식이 보다 정확하게 표준 외래어로 표기하였다.

  • PDF

노트와 스테레오타입을 이용한 UML 기반 웹 어플리케이션 설계 사례 (A Web Application Design based-on UML with Note and Stereotype)

  • 엄태훈;최윤석;정기원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (A)
    • /
    • pp.658-660
    • /
    • 2001
  • 본 논문에서는 사건흐름을 기능 별로 묶어 패턴화하는 방법을 통해 사건흐름 명세서를 표기하고, UML의 노트표기를 이용해 패턴 번호를 순차도에 적용하는 방법을 제시한다. 이와 더불어 설계 산출물 상에 표시되는 웹 페이지의 표현을 스테레오타입을 이용해 표기함으로써 시스템에 대한 이해도를 높이도록 하였고, 요구사항 명세서에 요구사항에 따른 사용사례와 사용자와의 관계를 표시하여 요구사항이 어떻게 반영되었는지를 쉽게 추적할 수 있게 하였다. 제안한 방법은 실제 영화 예매 시스템의 분석 및 설계 사례를 통해 그 사용 예를 보였다.

  • PDF

한글 문자의 로마문자 표기에 대한 제안 (A Proposal for Roman Representation of Hangul Characters)

  • 강주상
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
    • /
    • pp.10-14
    • /
    • 1989
  • 한글문자를 기계화하기 위하여 로마문자로 표기하는 방법에 대한 새로운 제안을 한다. 현재 남한안이나 북한안은 서로 이견을 보이고 있어서 국제적 합의에 이르지 못하고 있다. 본 제안에서는 남, 북한 안과는 달리 영문자의 대문자와 소문자를 모두 활용하며 다양한 모음의 구성에서 음성학적으로 표기한다. 이 표기법은 자체의 합리성, 국제표준과의 호환성 판독의 편리성, 음성인식에의 이용성등에서 기존 표기체계보다 유리하다.

  • PDF

아웃도어 재킷의 기능성표기 행택 유형에 대한 소비자의 이해도 및 선호도 연구 (A Study on Effectiveness of Hang-Tag Type and Preferred Method of Functional Information for Outdoor Jackets)

  • 방기성;유신정
    • 감성과학
    • /
    • 제19권4호
    • /
    • pp.83-94
    • /
    • 2016
  • 본 연구는 아웃도어 재킷에 대한 인식에 따라 분류된 소비자 그룹에 대하여 아웃도어 재킷의 행택 타입에 따른 정보 이해도와 기능성 의류제품 정보 표기의 대안적 방법에 대한 선호도의 차이를 고찰하였다. 행택타입에 따른 이해도를 알아보기 위해서 투습방수성능 표현한 네 종류의 행택('그림만으로', '그림+한국어 설명', '그림+외국어설명', '그래프')을 제시하여 행택을 통해 알 수 있는 성능을 답하게 하였다. 기능성 재킷의 인식에 따른 소비자 유형별 분석을 위해, 20-60대 472명의 남녀를 세 그룹('비전문적/브랜드 디자인 추구집단', '전문적/기능성 중시집단', '고가 제품 선호집단')으로 분류한 선행연구의 결과를 적용하여 행택 타입에 대한 이해도와 선호도를 분석하였다. 연구 결과 소비자 유형과 관계없이 '그림만으로' 표기하는 것을 가장 선호하였으며 '그래프' 표기 방법을 가장 선호하지 않았다. 그러나 정답률에 있어서는 '그래프' 표기 방법이 가장 높았으며 소비자 유형 중 특히 '전문적/기능성 중시 집단'에서 높은 것으로 나타나, 기능성 의류를 인식하는 유형에 따라 정보 표기에 대한 이해도와 선호도는 달라질 수 있다는 것을 알 수 있었다. 또한 '전문적/기능성 중시 집단'은 대안적 표기 방법에 있어서 '세탁 후의 성능변화' 등과 같이 현재 제공되고 있는 정보보다 더 많은 정보를 표기해 주기를 바라고 있는 것으로 나타났다. 이와 같이 기능성 의류를 인식하는 유형에 따라 행택(hang-tag)에 표현 된 성능정보의 표현방법에 따른 이해수준에 있어서 차이를 보였으므로 연령, 성별 등의 단순 인구통계학적 분류보다 타겟층의 특성, 정보를 활용하는 유형, 제품의 특성 등을 종합하여 적합한 표기 방법을 선택하는 것이 필요할 것이다.

한국어 자모 Viable Prefix를 이용한 외래어 표기 교정 기법 (Transliteration Correction Method using Korean Alphabet Viable Prefix)

  • 권순호;권혁철
    • 정보처리학회논문지B
    • /
    • 제18B권2호
    • /
    • pp.87-92
    • /
    • 2011
  • 한국어 문서에서 외래어 표기는 한 단어에 대해 한 개만 존재하는 것이 아니라 여러 개의 다른 표기로 사용되고 있다. 이러한 표기상 불일치는 하나의 단어가 다른 개념으로 인식되어 정보 검색 시스템의 성능 저하의 원인이 된다. 따라서 정보 검색 시스템에서는 다양한 외래어 표기에 대해 같은 개념으로 인식하여 검색할 수 있도록 외래어 표기법에 맞는 외래어 표기로 교정하는 전처리가 필요하다. 본 논문에서는 질의어로 외래어가 입력되면, 이를 근거로 외래어 표기법에 맞는 외래어 표기로 교정해주는 방법을 제안한다. 제안하는 기법은 한국어 자모의 viable prefix를 이용하여 후보 외래어 표기를 생성하는 가상 트리를 작성하고 불필요한 외래어를 가지치기함으로써 검색 정확도를 높이고 속도를 개선한다.

입말 표기를 이용한 영어 단어 검색 (Retrieving English Words with a Spoken Work Transliteration)

  • 김지승;김광현;이준호
    • 한국문헌정보학회지
    • /
    • 제39권3호
    • /
    • pp.93-103
    • /
    • 2005
  • 영어 사전 검색 서비스 이용자들은 원하는 영어 단어의 철자를 정확하게 기억하지 못하고, 발음만을 기억하는 경우가 있다. 이러한 이용자들에게 도움을 주기 위해 본 연구에서는 입말 표기, 즉 영어 단어 발음의 한글 표기를 이용하여 영어 단어를 효과적으로 검색할 수 있는 방법을 제안한다. 이를 위하여 코닉스(KONIX) 코드를 개발하며, 입말 표기와 영어 단어를 코닉스 코드들로 변환한다. 그리고 변환된 코닉스 코드들 사이의 음성적 유사도를 편집 거리 방법과 2-그램 방법을 이용하여 계산한다. 또한 제안한 방법이 입말 표기에 의한 영어 단어 검색에 매우 효과적임을 실험을 통하여 입증한다.

글자 및 발음 기반 영-한 음차표기 모델 (An English-to-Korean Transliteration Model based on Character and Pronunciation)

  • 오종훈;배선미;최기선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.925-927
    • /
    • 2004
  • 음차표기란 외국어의 발음을 자국어로 표기하는 것으로 정의된다. 영-한 자동 음차표기 방법에는 직접방식, 피봇방식, 혼합방식이 있다. 기존의 영-한 음차표기 연구들은 직접방식에 기반한 연구들이 대부분이었다. 하지만, 음차표기는 직접방식에서 사용하는 단순한 자소 대 자소변환 작업이라기보다는 자소의 음성적 변환 작업이라고 할 수 있다. 따라서 자소뿐만 아니라 음소 등 음성적 정보가 매우 중요하다. 본 논문에서는 이러한 특성을 이용하여 자소 정보뿐만 아니라 음소 정보를 이용한 음차표기 기법을 제안한다. 주어진 자소와 음소 및 자소와 음소의 문맥정보를 이용하여 한국어 음차표기를 생성하는 본 논문의 기법은 약 60%의 단어정확도를 나타내었다.

  • PDF

로마자 표기표준의 활용에 관한 연구 (A Study on the Utilization of Romanization)

  • 심효정
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2000년도 제7회 학술대회 논문집
    • /
    • pp.23-26
    • /
    • 2000
  • 많은 양의 정보가 실시간으로 생산되는 현재 다양한 정보검색방법이 더욱 필요하게 되었으며 이에 따라 다양한 언어로 된 정보를 신속하고 정확하게 검색해내기 위해서 로마자 표기도 더욱 중요하게 되었다. 이에 본 연구에서는 정보검색 분야에서의 로마자 표기표준의 활용을 중심으로 논하고자 한다.

  • PDF

패스워드 표기 방식이 패스워드 생성에 미치는 영향 (A Study of Interpretation Effect of Passwords to Password Generation)

  • 김승연;권태경
    • 정보보호학회논문지
    • /
    • 제25권5호
    • /
    • pp.1235-1243
    • /
    • 2015
  • 본 논문은 웹페이지의 로그인 또는 패스워드 변경 인터페이스에서 제공하는 패스워드 표기 방법이 국내 사용자의 패스워드 구성(composition)에 영향을 주는지 설문을 통해 살펴보고, 보안 향상을 위한 표기법을 제안한다. 특히 현재 혼용되고 있는 외국어 '패스워드' 표기와 이를 우리말로 번역한 '비밀번호' 표기는 의미적인 차이가 있다. 국내 S대학교 재학생 200명을 대상으로 설문조사를 통해 '비밀번호' 표기를 사용할 때 더 많은 학생들이 숫자 위주의 패스워드를 만드는 것을 확인하였다. 숫자 위주의 패스워드는 그렇지 않은 경우에 비해 가능한 조합의 수가 크게 감소하므로 이는 보안에 좋지 않은 영향을 줄 우려가 있다. 따라서 본 논문이 국내 사용자들의 패스워드 보안을 향상시킬 방법을 찾는 연구의 참고 자료로 활용될 수 있을 것이라 기대한다.