• 제목/요약/키워드: Contextual information

검색결과 509건 처리시간 0.026초

한글 문자 인식에서의 오인식 문자 교정을 위한 단어 학습과 오류 형태에 관한 연구 (A Study on Word Learning and Error Type for Character Correction in Hangul Character Recognition)

  • 이병희;김태균
    • 한국정보처리학회논문지
    • /
    • 제3권5호
    • /
    • pp.1273-1280
    • /
    • 1996
  • 본 논문에서는 문자 인식 과정을 거치고 난 후에 발생하게 되는 오인식된 문자들 을 언어적 지식을 이용하여 교정하는 문자 인식 후처리에 관하여 논한다. 문자 인식의 오인식 교정시스템의 경우 후보 단어가 많을 때 많은 후보 단어중에서 가장 적당한 단어를 후보 단어로 올려주기 위해서는 여러 가지 정보가 필요하다. 본 논문에서는 이러한 정보로 이용할 수 있는 것으로 단어들의 특성과, 문자 인식에 발생하는 오인식 형태, 단어 학습에 관하여 논한다. 이를 위한 실험으로 15 만여의 단어가 수록된 국어 사전을 이비력하고 초중고 국어교과서에 나타난 단어 들의 사용빈도를 조사하여 국어 사전에 등록된 단어 중에서 10.7%정도가 실제 초중고 국어교과서에 사용되고 있다는 것을 알 수 있었다. 또한 실제 문자 인식 시스템들을 가지고 여러 문서를 입력하고 인식하여 오인식이 자주 일어나는 글자들 의 형태를 분류하여 보았다. 그리고 한국어 처리 관련 서적이나 논문을 처리하고자 한국어에 관련된 책의 찾아보기에 나타난 단어 를 학습시켜 후보 단어들의 다른 인하여 정확한 단어를 예측하기 힘들던 문제를 해결 하고자 하였다.

  • PDF

듀이 십진분류법(DDC)의 기원론에 대한 연구 (A Study on the Dewey's 'Three Genetic Paper')

  • 남태우
    • 한국문헌정보학회지
    • /
    • 제42권1호
    • /
    • pp.335-358
    • /
    • 2008
  • Dewey가 1873년에 제안한 'Three Genetic Paper'은 '시스템(문헌분류법)의 이점(The Merits of the system)' '도서관 분류법시스템, 즉 구조와 사용법(Library Classification system)' 그리고 '우리 도서관에서의 특별적용(Its Special Adaptation to our Library)'이다. 3개의 기원논문은 전체가 1.800여개의 단어로 구성되어 있는데, 그중 절반이 '시스템(문헌분류법)의 이점'이며, 520개 단어가 '도서관 분류법시스템, 즉 구조와 사용법'이며, 그 다음으로 '우리 도서관에서의 특별적용(Its Special Adaptation to our Library)'에 관한 것이 가장 짧아서, 350개 정도로 정리되었다. 'Three Genetic Papers'의 내용은 1876년에 발행된 DDC초판의 서문을 형성하는데 그대로 반영되어 분류법 이론의 근간이 되었다.

신속한 범행현장 추적을 위한 M2M 기반의 상황인지 서비스 시스템 개발 (The context-aware service system development of the M2M base for the quick crime scene trace)

  • 이종성;전민호;오창헌
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2012년도 추계학술대회
    • /
    • pp.659-662
    • /
    • 2012
  • 본 논문에서는 위험지역이나 관리대상 지역의 긴급 상황을 시스템이 자율적으로 경찰 또는 경찰차로 알리며 상황정보를 전달 할 수 있는 상황인지 서비스 시스템을 제안한다. 제안하는 시스템은 gateway로부터 지속적으로 노드들의 위치를 확인하며 대기하다가 상황인지 시스템의 서버에서 이벤트가 발생할 경우 이벤트가 발생한 인근의 노드에게 이벤트 발생 메시지와 영상메시지를 전송시키는 시스템이다. 실험결과, 상황인지 서버에서 이벤트가 발생할 경우 서버에 저장된 경로대로 영상 메시지를 전송하는 것을 확인하였다.

  • PDF

HMM에 기반한 한국어 개체명 인식 (HMM-based Korean Named Entity Recognition)

  • 황이규;윤보현
    • 정보처리학회논문지B
    • /
    • 제10B권2호
    • /
    • pp.229-236
    • /
    • 2003
  • 개체명 인식은 질의응답 시스템이나 정보 추출 시스템에서 필수 불가결한 과정이다. 이 논문에서는 HMM 기반의 복합 명사 구성 원리를 이용한 한국어 개체명 인식 방법에 대해 설명한다. 한국어에서 많은 개체명들이 하나 이상의 단어로 구성되어 있다. 또한, 하나의 개체명을 구성하는 단어들 사이와 개체명과 개체명 주위의 단어 사이에도 문맥적 관계를 가지고 있다. 본 논문에서는 단어들을 개체명 독립 단어, 개체명 구성 단어, 개체명 인접 단어로 분류하고, 개체명 관련 단어 유형과 품사를 기반으로 HMM을 학습하였다. 본 논문에서 제안하는 개체명 인식 시스템은 가변길이의 개체명을 인식하기 위해 트라이그램 모델을 사용하였다. 트라이그램 모델을 이용한 HMM은 데이터 부족 문제를 가지고 있으며, 이를 해결하기 위해 다단계 백-오프를 이용하였다. 경제 분야 신문기사를 이용한 실험 결과 F-measure 97.6%의 결과를 얻었다.

한글인식 후처리용 단어사전의 기억구조 (A Word Dictionary Structure for the Postprocessing of Hangul Recognition)

  • 김상운
    • 한국통신학회논문지
    • /
    • 제19권9호
    • /
    • pp.1702-1709
    • /
    • 1994
  • 한글인식 후처리에서 문맥정보의 저장구조는 인식율 및 인식속도를 결정짓는 중요한 요소이다. 단어사전의 형태로 문맥정보를 표현하기 위해서는 트라이(trie)를 주로 이용하지만, 기억공간 이용효율이 저조하다는 단점이 있다. 따라서 이 논문에서는 트라이의 장점을 유지하면서 공간효율을 향상시키는 기억구조를 제안한다. 한글은 조합문자이기 때문에 자모나 문자별로 기억시킬 수 있다. 그런데 자모단위로 기억시키면(P-모드) 검색시간은 빠르지만 공간효율이 나쁘고, 또한 문자단위로 기억시키면(C-모드) 공간효율은 좋지만 검색시간이 길어진다. 따라서 노드이용율과 분산율로 최적레벨을 선정한 다음, 입력단어의 시작자모부터 최적레벨까지는 자모 단위의 트라이로 기억시키고, 그 이상은 문자단위의 순차연결구조로 저장시켰다. (H-모드). 6가지 단어집합에 대하여 실험한 결과, H-모드에서의 검색시간은 P-모드만큼 빠르면서, 공간효율은 C-모드와 같게 되어 그 효용성을 확인할 수 있었다.

  • PDF

ORMN: 참조 표현 이해를 위한 심층 신경망 모델 (ORMN: A Deep Neural Network Model for Referring Expression Comprehension)

  • 신동협;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권2호
    • /
    • pp.69-76
    • /
    • 2018
  • 참조 표현이란 장면 영상 내의 특정 물체를 가리키는 자연어 문장들을 의미한다. 본 논문에서는 참조 표현 이해를 위한 새로운 심층 신경망 모델을 제안한다. 본 논문에서 제안하는 모델은 장면 영상 내 대상 물체의 영역을 찾아내기 위해, 참조 표현에서 언급하는 대상 물체뿐만 아니라 보조 물체, 그리고 대상 물체와 보조 물체 사이의 관계까지 풍부한 정보를 활용한다. 또한 제안 모델에서는 영상 내 각 후보 영역의 적합도 계산을 위해 물체 적합도와 관계 적합도를 참조 표현의 문장 구조에 따라 결합한다. 따라서, 본 모델은 크게 총 네 가지 서브 네트워크들로 구성된다: 언어 표현 네트워크(LRN), 물체 정합 네트워크(OMN), 관계 정합 네트워크(RMN), 그리고 가중 결합 네트워크(WCN). 본 논문에서는 세 가지 서로 다른 참조 표현 데이터집합들을 이용한 실험을 통해, 제안 모델이 현존 최고 수준의 참조 표현 이해 성능을 보인다는 것을 입증하였다.

디지털 경영에서 고객관계 활성화를 위한 인터넷 쇼핑몰의 서비스 품질에 관한 연구 (A Study on the Customer Relationship Activation based on Service Quality of Internet Shopping Mall)

  • 김창수;김희정;고용기
    • 통상정보연구
    • /
    • 제6권1호
    • /
    • pp.25-50
    • /
    • 2004
  • This study attempts to find out what kind of service quality is considered important by customers in using the Internet shopping mall and suggests the way to activate the customer relationship. The findings based on empirical analysis are shown here. First, empirical analysis of the contextual factors such as gender, education, and experience levels, shows that what customers perceive as most important in the product purchase is security in terms of the payment and personal information service. The second important service quality factor perceived by customers is responsiveness, particularly the rapidity and accuracy of response to their needs and wants. The customers also considered price, quality and diversity of the product as being important. Furthermore, there is no big difference among other service quality factors. Second, in the different gender context, there is no significant difference between the genders. However, the male group shows an even distribution of factors valued in the service quality, whereas female respondents placed stronger emphases on particular aspects of service, such as security, response, reliability and product quality. Third, in the context of different education level, the payment method between graduates and non-graduates has a significant difference. That is, the non-graduates prefer the credit card and saving through ATM, while the graduates use dual payment method using credit card and another payment method together. Therefore, the various payment methods should be considered according to the customer type, namely graduates or non-graduates. Fourth, in the context of different experience level, the result of the empirical analysis of the factors of the service quality shows no great difference between experienced and inexperienced customers. Both types of customer perceive security as the most important. To sum up, the service quality perceived by the customers of Internet shopping malls is empirically analyzed in different contexts such as gender, education, and experience. Then, the device for the customer relationship activation is suggested. It can be utilized as a guideline for the continuing diffusion of the Internet shopping mall, giving it a competitive advantage against other companies.

  • PDF

관계형 데이터베이스에서의 시맨틱 기반 키워드 탐색 시스템 (Semantic-based Keyword Search System over Relational Database)

  • 양영휴
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권12호
    • /
    • pp.91-101
    • /
    • 2013
  • 키워드의 모호성은 효율적인 키워드 탐색에 있어서 일반적인 이슈가 되어왔는데, 이 모호성은 탐색결과의 신뢰성에 큰 영향을 줄 수 있으며, 기본적으로 질의에 사용된 용어 자체가 가지는 문맥상 의미의 모호함에 기인한다. 질의 자체의 모호함뿐만 아니라, 사용자들이 그 탐색 결과를 적절하게 해석하기 위해 결과에 나타나는 키워드간의 관계도 중요하므로 명확하게 명시 되어야 한다. 이 논문에서는 기존의 질의 용어와 스키마 용어/인스턴스간의 키워드 매핑기법을 적용하여 키워드 탐색의 모호성을 해결한다. 용어간의 매핑에서는 질의 키워드와 스키마 용어간의 구문적 유사성은 물론 시맨틱 유사성까지 고려하기 때문에 기존의 시스템에 비해 매핑과 정밀도가 50% 이상 상승하는 결과를 얻을 수 있다. 탐색결과에 나타나는 용어간의 불분명한 관계를 점 더 명확하게 나타내기 위하여 시맨틱 웹 기술을 적용하여 키워드간의 의미 있는 관계를 더 많이 지식베이스 내에서 찾을 수 있도록 하였다.

한국 문학 아카이브의 현황과 전망: 근대문학정보센터와 국립한국문학관 설립을 중심으로 (Status and Prospects of the Korean Literature Archive: Focus on Information Center of Korean Modern Literature and Establishment of the National Museum of Korean Literature)

  • 김민영
    • 한국기록관리학회지
    • /
    • 제19권4호
    • /
    • pp.211-219
    • /
    • 2019
  • 본 논문은 한국 문학 아카이브의 미래를 탐색하기 위하여, 국립중앙도서관의 근대문학 아카이브를 소개하고 국립한국문학관의 아카이브 추진 방향에 대하여 논의하는 글이다. 국립중앙도서관의 근대문학 아카이브는 근대문학자료 원문 디지털화 및 전문적인 해제 정보 제공, 근대작가 및 근대문학사 관련 콘텐츠 구축 등을 중심으로 운영되고 있다. 2022년 개관을 목표로 하는 국립한국문학관의 문학자료 아카이브는 국립중앙도서관의 사례를 참고하되 보다 전문적인 큐레이션을 도입할 필요가 있다. 즉 아카이브된 자료를 바탕으로 문학의 창조적인 재생산이 가능하도록 기록의 맥락(context)을 기록하는 아키비스트의 태도를 가지고, 자료의 활용성을 확대할 수 있는 적극적인 아카이브 정책을 펼쳐야 할 것이다.

트윗의 타임 시퀀스를 활용한 DTM 분석 : 2019 남북미정상회동 이벤트를 중심으로 (Tweets analysis using a Dynamic Topic Modeling : Focusing on the 2019 Koreas-US DMZ Summit)

  • 고은지;최선영
    • 한국정보통신학회논문지
    • /
    • 제25권2호
    • /
    • pp.308-313
    • /
    • 2021
  • 이 연구는 2019년 판문점 남북미 정상 회동 트윗을 타임 시퀀스와 함께 수집하여 시퀀셜 토픽모델링인 DTM으로 분석하였다. 트위터와 같은 마이크로 블로깅 서비스는 단일 이벤트에 뉴스와 오피니언이 혼재된 비정형 데이터가 대규모로 동시에 발생하고, 정보와 반응이 동일 메시지 형식으로 생산된다. 때문에 토픽 트렌드를 파악하려면 시퀀셜 데이터의 특성을 반영하여 패턴 분석을 해야 맥락적 의미를 알 수 있다. 토픽 일관성 점수를 구해 LDA를 평가한 후 DTM을 계산한 결과, 뉴스 보도와 오피니언 관련 토픽 30개가 도출되었고, 각 토픽과 키워드는 시간에 따라 발생 확률이 역동적으로 진화하고 있었다. 결론적으로 DTM은 특정 이벤트에 대한 사회 전반에 나타난 통합적 토픽 추이를 시간에 따라 분석하는데 적합한 모델임을 밝혔다.