• 제목/요약/키워드: Typographical Error

검색결과 7건 처리시간 0.024초

철자오류에 기인한 가의미 오류의 검출 및 교정 방법 (A Method for Detection and Correction of Pseudo-Semantic Errors Due to Typographical Errors)

  • 김동주
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권10호
    • /
    • pp.173-182
    • /
    • 2013
  • 전자 문서의 초안 작성과정에서 추가되는 철자오류는 다른 유형의 오류보다 압도적으로 높은 비율을 차지한다. 입력 실수로 인한 이들 오류는 결과적으로 여전히 철자오류일 수도 있지만 상당수는 구문오류나 의미오류로 발전한다. 이러한 오류들 중 철자오류에서 발전된 가의미 오류는 순수 의미오류에 비해 문장 내에서 주변 단어의 의미에 대해 두드러진 상이성을 갖게된다. 따라서 이러한 의미 오류는 그것이 가지는 두드러진 문맥 상이성으로 인해 간단한 동시발생 빈도에 기초한 알고리즘으로 검출 및 교정이 가능하다. 본 논문에서는 이러한 오류들을 검출하고 교정하기 위한 동시발생 빈도에 기초한 알고리즘을 제안한다. 제안하는 방법에서 동시발생 빈도는 의존 구조상에서 직접 의존관계에 놓인 단어만을 대상으로 계산하며, 가의미 오류 여부를 판단하기 위해서 코사인 유사도 측정 방법을 사용한다. 제시하는 실험으로부터 제안한 방법은 전체 맞춤법 검사기 검출율을 약 2~3% 수준까지 향상 시킬 수 있을 것으로 예측하였다.

스마트 기기 사용자 적응형 가변 키보드 (User Adaptive Variable Keyboard for Smart Devices)

  • 정유선;최동민
    • 한국전자통신학회논문지
    • /
    • 제12권6호
    • /
    • pp.1167-1172
    • /
    • 2017
  • 인터넷 이용과 정보활동의 주요 수단이었던 데스크탑 컴퓨터는 모빌리티와 단순화를 강조하는 스마트 기기에 의해 그 자리에서 밀려났다. 최근의 정보생산 및 소비 활동은 스마트 기기를 통하여 이루어지고 있으나 전통적 인 입력 수단인 키보드를 대체할만한 스마트 기기용 입력 수단이 없다. 스마트 기기의 터치스크린을 이용한 가상 키보드는 작은 크기로 인해 입력 오타가 높은 비율로 발생한다. 이에 본 연구에서 우리는 기존의 가상 키보드의 입력 오류를 최소화 할 수 있는 가변 가상 키보드를 제안한다. 제안하는 기법은 기존의 가상 키보드와 키의 배열에 차이는 없으나 사용자의 입력 오류의 발생 위치와 압력 정도의 누적 데이터에 따라 판단하여 가상 키보드의 각 키의 크기를 조정함으로써 사용자의 입력 오류를 최소화시킨다.

Correction of the holotype citations of three vascular plants at the herbarium of the National Institute of Biological Resources, Korea

  • Jang, Hyun-Do;Oh, Hyun-Kyung;Hyun, Chang-Woo;Nam, Gi-Heum
    • Journal of Species Research
    • /
    • 제9권3호
    • /
    • pp.218-220
    • /
    • 2020
  • A holotype is an element to which the name of a taxon is permanently attached and is key material that facilitates taxonomic research. However, type citation or designation errors due to typographical errors or inadvertent mistakes often exist. When reviewing recently published literature for the type specimens of vascular plants in the herbarium of the National Institute of Biological Resources, we observed that three species, Isoetes laosiensis, Isoetes coreana, and Huperzia jejuensis, had errors, and the actual holotype information and the type descriptions of the protologues did not match. The name Isoetes laosiensis had a collecting number error, while Isoetes coreana and Huperzia jejuensis had collector errors. According to Article 9.2 of the International Code of Nomenclature for algae, fungi, and plants (Shenzhen code), if a holotype designation in the protologue of the name of a taxon is found to contain errors such as collector, collecting number, and illustration errors, the errors are to be corrected. We, therefore, corrected the errors in holotypes of three species, with no alterations made to the intents of the original authors.

문서내 단어간 비교를 통한 철자오류 검출 (Detecting Spelling Errors by Comparison of Words within a Document)

  • 김동주
    • 한국컴퓨터정보학회논문지
    • /
    • 제16권12호
    • /
    • pp.83-92
    • /
    • 2011
  • 일반 출판물과는 달리 문서 편집기를 사용하여 작성중에 있는 문서에는 사용자의 실수에 의한 오타 오류가 자주 발생한다. 이와 같은 온라인 문서에서 맞춤법 오류의 다수를 차지하는 사용자의 오타 오류는 대부분 자판을 입력할 때 주위 문자를 잘못 입력하는 경우이다. 통상적인 철자 검사기는 이러한 오류들을 형태소 분석기를 이용하여 검출하고 교정하게 된다. 즉, 입력된 어절에 대해 형태소 분석을 시도하고 분석되지 않은 어절을 철자 오류로 간주하게 된다. 그러나 오타 입력된 어절임에도 불구하고 형태소 분석에 성공한 경우에는 이와 같은 방법으로는 검출이 불가능하다. 본 논문에서는 기존 방법들이 검출하지 못했던 철자 오류들을 검출해 낼 수 있는 방법을 제시한다. 이 방법은 문서 작성자의 오타 입력은 반복하여 입력되지 않는 경향이 있으므로 저빈도로 발생한다는 특성에 기반하여 제안되었다. 저빈도의 어절의 자소 대치를 통해 문서의 특정 구간 내의 다른 단어와 비교하여 오타일 확률이 적은 단어인 자주 나오는 단어와 매칭이 된다면 일단 오류 후보로 가정하는 것이다. 여기에는 몇 가지 경험적인 제약이 추가되어야 한다. 이러한 단어간 비교에 의한 추정은 기존에 발견하지 못했던 구문오류뿐만 아니라 일부 의미오류까지 검출할 수 있으며, 교정 후보 선정시 가중치 적용에도 사용될 수 있다.

사용자 입력오류를 고려한 사전 검색 방법 (A Method of Dictionary Search for Typographical Error)

  • 정형일;선충녕;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2010년도 제22회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.183-185
    • /
    • 2010
  • 디지털 기기들의 발전은 사전 검색 수요의 증가와 함께 강건한 검색 기법의 필요성도 증가시키고 있다. 기존의 사전 검색 기법들은 사용자의 입력 오류를 고려하지 않고, 검색 최적화만을 위해 설계되었다. 본 논문에서는 언어 모델 키워드와 자소 범주 키워드를 이용하여 오타에 강건한 사전 검색 방법을 제안한다. 제안된 방법은 오류가 포함된 사용자의 입력 단어에 대하여 활용 가능한 수준의 높은 성능과 검색 속도를 보여주었다.

  • PDF

터치스크린 환경에서 쿼티 자판 오타 교정을 위한 n-gram 언어 모델 (N-gram based Language Model for the QWERTY Keyboard Input Errors in a Touch Screen Environment)

  • 옹윤지;강승식
    • 스마트미디어저널
    • /
    • 제7권2호
    • /
    • pp.54-59
    • /
    • 2018
  • 스마트폰과 태블릿PC 등 터치스크린을 활용한 휴대기기의 사용이 늘어나면서 데스크탑 컴퓨터나 노트북으로 수행하던 작업을 스마트폰과 태블릿PC를 이용하여 수행하는 일이 많아졌다. 그런데 휴대성을 갖춰야하는 스마트기기의 특성상, 쿼티 자판은 작은 화면 안에 조밀하게 배치된다. 그리고 이러한 점은 기계식 쿼티 자판을 사용할 때와는 다른 양상의 오타가 발생하는 원인으로 작용한다. 각 버튼이 차지하는 공간이 충분했던 기계식 쿼티 자판과 달리, 터치스크린에서의 쿼티 자판은 각 버튼에 할당되는 영역이 작아 사용자가 누르려고 의도했던 버튼이 아닌 주변의 버튼이 입력되는 경우가 자주 발생하게 된다. 본 논문에서는 어절 유니그램과 바이그램 확률을 이용한 n-gram 언어 모델 방법으로 터치스크린 환경에서 쿼티 자판으로 입력되는 문자 입력 오류를 자동으로 교정하는 방법을 제안하였다.

레드비트 분말을 첨가한 돈육소시지의 이화학적 특성 (The Physicochemical Properties of Pork Sausages with Red Beet Powder)

  • 하소라;최정석;진상근
    • 생명과학회지
    • /
    • 제25권8호
    • /
    • pp.896-902
    • /
    • 2015
  • 본 연구는 유화형 돈육소시지 제조에 첨가되는 아질산염을 대체할 목적으로 천연색소로 알려진 레드비트 분말을 첨가하여 돈육소시지의 이화학적 특성에 미치는 영향에 대해 알아보고자 실시하였다. 총 5개의 처리구로 제조를 하였으며, C (아질산염 0.01%), T1 (아질산염 0.005% + 레드비트 분말 0.5%), T2 (아질산염 0.005% + 레드비트 분말 0.25%), T3 (레드비트 분말 0.5%), T4 (레드비트 분말 0.25%)로 처리하여 10±1℃에서 6주간 저장하면서 실험을 실시하였다. 명도는 Control이 유의적으로 높았고, 적색도는 T1이 높았으며, 황색도는 T3와 T4가 높았다. pH는 T3와 T4가 유의적으로 낮은 경향을 보였다. VBN은 처리구간별 유의적 차이가 없었다. DPPH 결과는 0주차에서 T1과 T3가 유의적으로 높은 경향을 보였으며, 2주차에서 T1이 높았고, 4주와 6주차에서는 T3가 높았다. 또한, 잔존아질산이온 결과는 Control이 저장 6주 동안 유의적으로 높았고, T3와 T4는 낮은 결과를 나타내었다. 따라서, 본 실험 결과에 의하면 레드비트 분말의 첨가는 유화형 돈육소시지의 품질을 감소시키지 않으면서 아질산염의 첨가를 줄일 수 있을 것으로 판단되었으며 항산화활성에 효과를 나타내는 것으로 사료되었다.