• Title/Summary/Keyword: POS 시스템

Search Result 168, Processing Time 0.031 seconds

Detecting Errors in POS-Tagged Corpus on XGBoost and Cross Validation (XGBoost와 교차검증을 이용한 품사부착말뭉치에서의 오류 탐지)

  • Choi, Min-Seok;Kim, Chang-Hyun;Park, Ho-Min;Cheon, Min-Ah;Yoon, Ho;Namgoong, Young;Kim, Jae-Kyun;Kim, Jae-Hoon
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.9 no.7
    • /
    • pp.221-228
    • /
    • 2020
  • Part-of-Speech (POS) tagged corpus is a collection of electronic text in which each word is annotated with a tag as the corresponding POS and is widely used for various training data for natural language processing. The training data generally assumes that there are no errors, but in reality they include various types of errors, which cause performance degradation of systems trained using the data. To alleviate this problem, we propose a novel method for detecting errors in the existing POS tagged corpus using the classifier of XGBoost and cross-validation as evaluation techniques. We first train a classifier of a POS tagger using the POS-tagged corpus with some errors and then detect errors from the POS-tagged corpus using cross-validation, but the classifier cannot detect errors because there is no training data for detecting POS tagged errors. We thus detect errors by comparing the outputs (probabilities of POS) of the classifier, adjusting hyperparameters. The hyperparameters is estimated by a small scale error-tagged corpus, in which text is sampled from a POS-tagged corpus and which is marked up POS errors by experts. In this paper, we use recall and precision as evaluation metrics which are widely used in information retrieval. We have shown that the proposed method is valid by comparing two distributions of the sample (the error-tagged corpus) and the population (the POS-tagged corpus) because all detected errors cannot be checked. In the near future, we will apply the proposed method to a dependency tree-tagged corpus and a semantic role tagged corpus.

동태적 SCM을 통한 식품유통의 합리화

  • 탁승호;설봉식
    • Proceedings of the Korean DIstribution Association Conference
    • /
    • 2003.05a
    • /
    • pp.47-54
    • /
    • 2003
  • 그 동안 바코드와 POS 시스템은 SCM이나 ERP 및 CRM등 여러 가지 기법의 경영성과를 얻는 데 이바지해 왔다. 그러나 지금 널리 사용되고 있는 바코드에 상품의 제조연월일 등에 관한 정보를 포함한 새로운 개념의 타임 바코드(Time stamp barcode)를 도입한다면 보다 나은 경영성과를 얻을 수 있을 것이다. 이 논문은 이와 같은 동태적 SCM 즉, 타임 바코드를 이용하여 개선된 SCM에 관한 이론적 배경과 그 기법 및 적용범위 등에 관하여 논의하고 있다. POS 시스템에서 타임 바코드를 통하여 경과시간별 판매/재고정보를 실시간으로 제공하여 각 매장에서 판매되고 남아 있는 경과시간별 재고량을 토대로 생산량을 최적화하고 또 최적의 머천다이징도 가능하다. 그리고 유통기한 경과에 따른 폐기손실의 규모를 줄이고 재고처리 전략도 큰 성과를 기대할 수 있다.

  • PDF

Developing a STEP-NC Prototype based on ISO 14649 Paradigm (ISO14649 패러다임에 입각한 STEP-NC 프로토타입 시스템 개발)

  • Seo, Seok-Hwan;Jo, Jeong-Hun;Jeong, Dae-Hyeok;Lee, Byeong-Eon;Cheon, Sang-Uk
    • Journal of the Korean Society for Precision Engineering
    • /
    • v.19 no.7
    • /
    • pp.171-179
    • /
    • 2002
  • STEP-NC is the next generation CNC controller taking STEP-based data model as the interface scheme (or language) between CAM and CNC, and carrying out various intelligent functions. At the moment, efforts are being made worldwide to establish international standard for the new interface scheme formalized as ISO14649. As the new language is being established, increasing attention is being paid to the development of the new CNC. Korea STEP-NC is an integrated STEP-NC system taking ISO 14649 as an input, and carrying out various intelligent functions. It is composed of 5 modules: 1) Shop Floor Programming System (PosSFP), 2) Tool Path Generator (PosTPG), 3) Tool Path Viewer (PosTPV), 4) Man Machine Interface (PosMMI), and 5) CNC Kernel (PosCNC). Distinguished from other prototypes (of Europe and USA), the Korea STEP-NC is top-down designed, and bottom-up implemented comprehensively incorporating all the crucial components for realizing the full benefit of STEP-NC paradigm, without using any existing commercial CAD/CAM systems and CNC kernels. The Korea STEP-NC prototype was successfully demonstrated and evaluated in the ISO conventions Together with prototypes of Europe and USA, Korea STEP-NC will be used as a reference system fur the Triangular Conformance Test to be jointly carried out by ISO TC184 SC1, SC4, and IMS Project.

뉴스퍼레이드

  • Korean Associaton of Information & Telecommunication
    • 정보화사회
    • /
    • s.80
    • /
    • pp.60-74
    • /
    • 1994
  • PDF

Design for Penny earned systems in smart platform (스마트플랫폼 기반 잔돈적립 시스템 설계)

  • Yoon, Seon-Jeong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2015.01a
    • /
    • pp.99-100
    • /
    • 2015
  • 거래 시 발생하는 잔돈들로 인해 이용자들은 소지의 불편함이 있고 서랍속에서 잠자고 있는 동전들로 인해 연간 수억 원의 동전 발행 비용이 발생하고 있다. 본 시스템은 스마트 기기들을 이용한 사용자들을 대상으로 잔돈을 적립하여 기부하기, 선물하기, 구매하기 등의 시스템을 설계하고 이를 테스트하였다. 본 시스템은 기본적인 잔돈 적립 및 소비 기능 외에 가맹점이 확보되지 않은 상태에서 사용자 앱을 테스트할 수 있도록 설계한 부분과 SNS와 연계되어 커뮤니티를 활용할 수 있다는 것이 특이점이다. 본 시스템을 통해서 이용자들의 편의성과 만족, 동전 발행이라는 사회적 비용 절감, 기부문화의 확산 등을 기대하고 있다.

  • PDF

Measuring Reliability of POS Tagging Systems (품사 태깅 시스템의 신뢰도 측정)

  • Kim, Jae-Hun
    • The KIPS Transactions:PartB
    • /
    • v.8B no.4
    • /
    • pp.365-372
    • /
    • 2001
  • 본 논문에서는 품사 태깅 시스템에서 신뢰도 측정 방법에 대해서 기술한다. 품사 태깅 시스템의 신뢰도는 품사 태깅 결과에 오류가 포함되지 않을 확률이다. 일반적으로 신뢰도 측정은 오류확률에 기반한다. 정확한 오류확률을 추정하기 위해서는 일반적으로 품사 태깅 시스템에서 사용되는 말뭉치보다 훨씬 더 많은 양의 말뭉치가 필요하다. 이 문제를 다소 완화시키기 위해서, 본 논문에서는 좀더 정확한 오류확률 추정하기 위해 교차확인 방법을 이용한다. 본 논문에서 사용된 품사 태깅 시스템은 시험말뭉치에 대해서 61%의 신뢰도를 보였다. 이는 한국어 문장의 형태소 수가 평균 20개이고, 품사 태깅 시스템의 정확률이 97.5%일 때의 신뢰도에 해당한다. 본 논문에서 사용된 품사 태깅 시스템이 미등록어가 없을 경우에 97.68%의 정확률을 보이므로 제안된 신뢰도 측정 방법이 어느 정도 타당함을 알 수 있었다. 제안된 신뢰도 측정 방법은 구문분석, 정보검색 등 여러 분야에 응용이 가능할 것이며, 본 논문에서는 품사태깅의 오류검출에 적용해보았다.

  • PDF