• 제목/요약/키워드: 띄어쓰기 일관성

검색결과 4건 처리시간 0.02초

음절 및 형태소 정보를 이용한 띄어쓰기 일관성 검사 (Word Spacing Consistency Check using Syllable and Morpheme Information)

  • 이재성
    • 한국콘텐츠학회논문지
    • /
    • 제10권5호
    • /
    • pp.10-19
    • /
    • 2010
  • 한국어 띄어쓰기 규칙은 경우에 따라 예외 조항이 있어 띄어 쓰거나 붙여 쓰는 것을 모두 허용하는 경우가 있다. 이러한 이중적 규칙에도 불구하고 같은 문서 내의 같은 어절이나 어구들은 일관성 있게 띄어쓰거나 붙여 쓰는 것이 문서 교정상 올바르다. 본 논문에서는 음절 정보 및 형태소 정보를 이용하여 비일관적으로 쓰인 띄어쓰기를 효과적으로 검사하는 방법을 제안하고 실험하여 평가하였다.

CRM 위한 효율적인 주소 정제 시스템 개발 (Development of Efficient Address Cleaning System for CRM)

  • 박규진;송원문;김은주;김명원
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (C)
    • /
    • pp.313-318
    • /
    • 2007
  • 최근 기업들은 인터넷, 이벤트 등의 다양한 매체를 통해 방대한 양의 고객 주소 데이터를 수집하고 있다. 이렇게 수집된 고객 주소 데이터는 DM발송 등을 통한 마케팅 및 캠페인에 활용함으로써 서비스의 질을 향상시키고, 고객의 충성도를 높인다. 그러나 사용자가 입력한 주소의 일부는 띄어쓰기가 정확하지 않은 주소, 정보가 누락된 주소, 오타가 있는 주소, 구주소 등의 입력으로 주소의 표준 형태를 갖지 않거나 일관성이 없다. 또한 2007년 4월부터 부분시행예정인 신주소 체계를 위해 기존의 주소를 적절히 변환해야만 한다. 본 논문에서는 부정확하거나 불완전한 주소를 표준 형태의 정확한 주소로 변경하는 효율적인 주소 정제 시스템을 제안하고 개발한다. 본 시스템은 먼저 입력 주소의 유니코드 분석을 통한 한글 입력 오류 교정과 해쉬테이블을 이용한 건물명의 표준 형태 변환을 수행한다. 이 과정이 완료된 주소들은 주소 트리 모델 구축을 통해 띄어쓰기가 부정확한 주소의 처리, 역주소테이블(inverted address table)을 이용한 누락 주소의 처리(enrichment), 구주소에 대한 트리 모델을 생성한 신주소 변환 처리 등의 프로세스를 통해 정제하게 된다. 실험을 위해 오타와 띄어쓰기, 누락된 정보가 있는 주소를 생성하여 타 정제 시스템과 성능을 비교하였다. 생성된 데이터를 비교한 결과 기존 주소 정제 시스템의 오류율 7.5% 보다 제안된 방법으로 개발된 본 시스템의 오류율이 0.45%로 낮음을 확인하였다.

  • PDF

세종 형태분석 말뭉치의 오류 수정 도구 개발 (Developing an Error Correction Tool for Sejong POS Tagged Corpus)

  • 최명길;남유림;서형원;전길호;김재훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2011년도 제23회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.114-116
    • /
    • 2011
  • 한국어 정보처리에서 널리 사용되는 세종 형태분석 말뭉치는 품사정보와 문장정보 등 다양한 한국어 정보를 포함하고 있다. 이 말뭉치는 방대한 양의 정보들로 구축되었지만 많은 오류 또한 포함되어 있다. 예를 들면 철자 오류, 띄어쓰기 오류, 그리고 품사부착 오류 등이 있다. 하지만 세종말뭉치와 같이 대용량 말뭉치의 오류를 수정하는 것은 많은 인력과 시간이 필요하며 일관성 있게 오류를 수정하는 것은 쉽지 않다. 따라서 본 논문에서는 세종 형태분석 말뭉치에 포함된 오류를 빠르고 일관성 있게 수정하기 위한 오류 수정 도구를 구현하였다. 본 논문에서 수정 대상이 되는 오류는 어절과 형태소 분석 결과의 불일치에 관한 오류만 대상으로 한다. 이를 위해 세종 형태분석 말뭉치를 데이터베이스로 재구축하였으며, 본래의 어절과 품사가 부착된 형태소의 자모를 각각 분리하여 두 자모의 차이점을 분석하여 오류 후보를 선정한다. 오류 후보에서 동일한 오류 패턴을 갖는 모든 오류 후보에 대하여 동일한 방법으로 일관성 있고 빠르게 수정할 수 있다.

  • PDF

태블릿 PC 기반 한국형 하이테크 AAC 소프트웨어의 사용성 평가 (A Usability Testing on the Tablet PC-based Korean High-tech AAC Software)

  • 이희연;홍기형
    • 한국HCI학회논문지
    • /
    • 제7권2호
    • /
    • pp.35-42
    • /
    • 2012
  • 본 연구의 목적은 의사소통장애인을 위한 태블릿 PC기반 한국형 하이테크 보완대체의사소통(AAC) 소프트웨어의 사용성을 평가하는 것이다. 우리나라의 언어 및 문화적 상황과 의사소통장애인의 요구에 적합한 AAC 기기를 개발하기 위해서, 본 연구에서는 과제분석을 통해 선정된 시나리오 평가를 통해 한국형 하이테크 AAC 소프트웨어의 기능들(중도 지적장애인을 위한 의사소통판, 존대, 시제, 부정, 주부와 술부 연동, 자동문장생성)의 필요성과 용이성을 평가하였고, 반구조화된 질문들과 개방형 질문들을 통하여 전반적인 기능 및 사용자 인터페이스(UI)에 대한 잠재적인 사용자의 선호도, 만족도를 평가하고 추가 요구사항을 조사하였다. 본 사용성 평가에는 특수교사 9명, 언어치료사 6명, 의사소통장애를 가진 아동의 학부모 6명으로 구성된 총 21명의 잠재적인 AAC사용자가 참여하였다. 태블릿 PC기반의 한국형 하이테크 AAC의 사용성 평가 결과, 대부분으 응답들이 5점 척도에서 4이상의 긍정적인 반응을 나타냈으나, 시제와 부정 기능의 필요성과 실행 용이성은 상대적으로 낮게 나타났는데 이는 시제/부정 기능과 존대 기능간의 비일관적인 작동방식과 관련된 것으로 보인다. 각 기능들의 UI 측면에서는 시각적인 피드백 강화, 기능키들의 작동방식의 일관화, 자연스러운 어휘 연동, 상징 내 텍스트의 띄어쓰기 등과 같은 요구가 나타났다. 본 연구의 사용성 평가 결과 및 잠재적 사용자의 피드백은 기존 AAC의 기능 및 UI의 개선과 보완을 위한 지침이 될 것이다.

  • PDF