• 제목/요약/키워드: POS

검색결과 506건 처리시간 0.028초

XGBoost와 교차검증을 이용한 품사부착말뭉치에서의 오류 탐지 (Detecting Errors in POS-Tagged Corpus on XGBoost and Cross Validation)

  • 최민석;김창현;박호민;천민아;윤호;남궁영;김재균;김재훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권7호
    • /
    • pp.221-228
    • /
    • 2020
  • 품사부착말뭉치는 품사정보를 부착한 말뭉치를 말하며 자연언어처리 분야에서 다양한 학습말뭉치로 사용된다. 학습말뭉치는 일반적으로 오류가 없다고 가정하지만, 실상은 다양한 오류를 포함하고 있으며, 이러한 오류들은 학습된 시스템의 성능을 저하시키는 요인이 된다. 이러한 문제를 다소 완화시키기 위해서 본 논문에서는 XGBoost와 교차 검증을 이용하여 이미 구축된 품사부착말뭉치로부터 오류를 탐지하는 방법을 제안한다. 제안된 방법은 먼저 오류가 포함된 품사부착말뭉치와 XGBoost를 사용해서 품사부착기를 학습하고, 교차검증을 이용해서 품사오류를 검출한다. 그러나 오류가 부착된 학습말뭉치가 존재하지 않으므로 일반적인 분류기로서 오류를 검출할 수 없다. 따라서 본 논문에서는 매개변수를 조절하면서 학습된 품사부착기의 출력을 비교함으로써 오류를 검출한다. 매개변수를 조절하기 위해서 본 논문에서는 작은 규모의 오류부착말뭉치를 이용한다. 이 말뭉치는 오류 검출 대상의 전체 말뭉치로부터 임의로 추출된 것을 전문가에 의해서 오류가 부착된 것이다. 본 논문에서는 성능 평가의 척도로 정보검색에서 널리 사용되는 정밀도와 재현율을 사용하였다. 또한 모집단의 모든 오류 후보를 수작업으로 확인할 수 없으므로 표본 집단과 모집단의 오류 분포를 비교하여 본 논문의 타당성을 보였다. 앞으로 의존구조부착 말뭉치와 의미역 부착말뭉치에서 적용할 계획이다.

국내 의류산업의 POS 시스템 사용 실태에 관한 연구 (A Study on the Layout of Master File of POS for Apparel Industry)

  • 조진숙;차주희
    • 한국의류학회지
    • /
    • 제24권4호
    • /
    • pp.451-462
    • /
    • 2000
  • This study is to investigate the current use of POS system in Korean clothing industry, so that we can make suggestions for better use of it. We interviewd companies using POS systems as well as EAN Korea which is in charge of POS data processing. As a results. we found out that standard KAN code has severe difficulties to cope with the diversity of the information which is necessary in clothing industry. Therefore we are making some suggestions to use KAN code as a recognizing code for more structured master data file for extremely diverse clothing items.

  • PDF

안전한 POS System의 구현 (Implementation of Secure POS SYSTEM)

  • 박동규;황유동
    • 한국컴퓨터정보학회논문지
    • /
    • 제6권2호
    • /
    • pp.70-77
    • /
    • 2001
  • 본 연구에서 통신상에서의 각종 보안 위협에 안전한 POS System을 설계, 구현하였다. 연구에 적용된 암호 알고리즘은 RSA, MD5, 3중DES가 있으며. RBAC를 모델로 한 역할기반 접근통제제어를 구현하였다. 클라이언트 프로그램과 서버 프로그램의 데이터 송수신이 이루어지기 전의 클라이언트 사용자 인증과 송수신 데이터의 기밀성과 무결성 유지에 암호 알고리즘이 적용되었다. 본 논문에서는 클라이언트 사용자의 데이터 접근을 통제하기 위하여 역할기반 접근 통제 제어모델이 적용되었다. 개발된 프로그램을 실제 업무에 적용하여 안정성을 입증하였다.

A Hidden Markov Model Imbedding Multiword Units for Part-of-Speech Tagging

  • Kim, Jae-Hoon;Jungyun Seo
    • Journal of Electrical Engineering and information Science
    • /
    • 제2권6호
    • /
    • pp.7-13
    • /
    • 1997
  • Morphological Analysis of Korean has known to be a very complicated problem. Especially, the degree of part-of-speech(POS) ambiguity is much higher than English. Many researchers have tried to use a hidden Markov model(HMM) to solve the POS tagging problem and showed arround 95% correctness ratio. However, the lack of lexical information involves a hidden Markov model for POS tagging in lots of difficulties in improving the performance. To alleviate the burden, this paper proposes a method for combining multiword units, which are types of lexical information, into a hidden Markov model for POS tagging. This paper also proposes a method for extracting multiword units from POS tagged corpus. In this paper, a multiword unit is defined as a unit which consists of more than one word. We found that these multiword units are the major source of POS tagging errors. Our experiment shows that the error reduction rate of the proposed method is about 13%.

  • PDF

소규모 유통점포의 정보시스템 활용 현황과 PDS 구축을 통한 경영 활성화 방안 고찰 (A Study on the Management Promotion of Small Retail Shops with Information System in Practical Use and Implementation of PDS)

  • 전대성;류윤규
    • 한국정보컨버전스학회논문지
    • /
    • 제5권2호
    • /
    • pp.91-99
    • /
    • 2012
  • 본 논문에서는 정부지원 소규모 유통점포인 나들가게를 대상으로 POS(point of sale) 등의 정보시스템 도입 및 활용현황을 살펴보고, 이에 따른 PDS(POS data service) 구축에 따른 기능 요구사항 및 경영성과에 대해 논의한다. 소매 점포의 POS와 연계되어 있는 공동정보시스템은 점포의 유통정보와 외부 연계정보를 수집하여 관리하고 분석정보를 제공한다. 본 연구에서는 나들가게의 POS 활용 현황을 실태조사 결과를 활용하여 분석한다. 또한, PDS의 기능 요구 사항을 살펴보고 소규모 유통점포에서 정보시스템의 활용 방안을 고찰한다. 결론적으로, 소규모 유통점포에 POS 도입이 직접적으로 성과로 나타나지는 않지만, POS의 원활한 활용과 점포 운영에 필요한 분석정보를 PDS 분석서비스를 통해 적극적으로 활용하는 경우에 고객에게 제공되는 서비스의 품질과 만족도 향상으로 나타나 경영성과에 미치는 영향이 어느 정도 관계가 있다고 할 수 있다.

  • PDF

임상간호사의 조직후원인식이 조직몰입과 경력몰입에 미치는 영향 (The Effects of Perceived Organizational Support on Organizational Commitment and Career Commitment of Clinical Nurses)

  • 김명숙
    • 간호행정학회지
    • /
    • 제14권4호
    • /
    • pp.458-466
    • /
    • 2008
  • Purpose: The purpose of this study was to identify the effects of perceived organizational support on organizational commitment and career commitment of nurses. Method: The subjects of this study were 336 nurses who were working in the 6 hospitals. The data were collected by structured questionnaire from Oct. 9 to Nov. 7 of 2006. Data were analyzed using descriptive statistics, t-test, ANOVA, Scheffe test, Pearson correlation coefficients, and multiple regression. Results: The mean score of POS was 2.87, organizational commitment was 3.30 and career commitment was 3.08. The POS was positively correlated with organizational commitment and career commitment. The POS and marital status explained 21.3% of the variance for affective commitment, 12.1% of the variance of continuous commitment. The POS and career explained 14.8% of the variance for career commitment. Conclusion: The findings showed that POS was important factor for enhancing organizational commitment and career commitment of clinical nurses. Therefore, the nurse manager must establish the strategies to improve the POS of the nurses in order to promote the organizational commitment and career commitment.

  • PDF

한국어 품사 부착 말뭉치의 오류 검출 및 수정 (Detecting and correcting errors in Korean POS-tagged corpora)

  • 최명길;서형원;권홍석;김재훈
    • Journal of Advanced Marine Engineering and Technology
    • /
    • 제37권2호
    • /
    • pp.227-235
    • /
    • 2013
  • 품사 부착 말뭉치의 품질은 품사 부착기를 개발하는데 있어서 매우 중요한 역할을 수행한다. 그러나 세종 말뭉치를 비롯하여 한국에서 구축된 많은 품사 부착 말뭉치들은 여전히 다양한 형태의 오류를 포함하고 있다. 이런 오류들을 살펴보면 품사 부착 오류는 물론이고 철자 오류, 문자의 삽입 및 삭제 등 매우 다양하다. 본 논문에서는 오류 패턴을 이용하여 품사 부착 오류를 검출하고 이를 효과적으로 수정하는 도구를 개발한다. 제안된 방법과 도구를 이용해서 오류를 수정할 경우 평균 9배 이상 빠르게 오류를 수정할 수 있어서 이 방법이 매우 효과적인 방법임을 확인할 수 있었다.

Improved Character-Based Neural Network for POS Tagging on Morphologically Rich Languages

  • Samat Ali;Alim Murat
    • Journal of Information Processing Systems
    • /
    • 제19권3호
    • /
    • pp.355-369
    • /
    • 2023
  • Since the widespread adoption of deep-learning and related distributed representation, there have been substantial advancements in part-of-speech (POS) tagging for many languages. When training word representations, morphology and shape are typically ignored, as these representations rely primarily on collecting syntactic and semantic aspects of words. However, for tasks like POS tagging, notably in morphologically rich and resource-limited language environments, the intra-word information is essential. In this study, we introduce a deep neural network (DNN) for POS tagging that learns character-level word representations and combines them with general word representations. Using the proposed approach and omitting hand-crafted features, we achieve 90.47%, 80.16%, and 79.32% accuracy on our own dataset for three morphologically rich languages: Uyghur, Uzbek, and Kyrgyz. The experimental results reveal that the presented character-based strategy greatly improves POS tagging performance for several morphologically rich languages (MRL) where character information is significant. Furthermore, when compared to the previously reported state-of-the-art POS tagging results for Turkish on the METU Turkish Treebank dataset, the proposed approach improved on the prior work slightly. As a result, the experimental results indicate that character-based representations outperform word-level representations for MRL performance. Our technique is also robust towards the-out-of-vocabulary issues and performs better on manually edited text.

식당정보시스템에 관한 연구 Point-of-sale System을 중심으로 (A Study on the Understanding of Restaurant Information System : Focus on Point-of-Sale System)

  • Yu, Jong-Seo
    • 한국조리학회지
    • /
    • 제5권2호
    • /
    • pp.303-323
    • /
    • 1999
  • 컴퓨터의 발전에 따라 식당운영 기법도 많은 영향을 받았다. 오늘날 이러한 많은 변화 중에서 여러 가지의 긍정적인 혜택을 찾아볼 수 있는데 그 중에는 영양분석, 회계, 구매등의 영역에서 여러 가지 발전이 그것이라 할 수 있다. 그러나 모든 컴퓨터 시스템(POS)이 동일한 기능과 잠재성을 가지고 혜택을 주는 것은 아니며 POS 시스템의 구조를 이해하고 발전가능성을 예견하는 것은 매우 중요한 사안이다. 최근의 컴퓨터 환경은 무척 빨리 발전하고 있는데 식당의 운영자에게 중요한 점은 올바른 POS 시스템을 구입하는 것이다. 우리는 이 연구를 통해서 식당의 POS 시스템에 관하여 이해를 하고 향후의 발전 방향을 예측할 수 있을 것이다.

  • PDF

Screening and isolation of antibacterial proteinaceous compounds from flower tissues: Alternatives for treatment of healthcare-associated infections

  • de Almeida, Renato Goulart;Silva, Osmar Nascimento;de Souza Candido, Elizabete;Moreira, Joao Suender;Jojoa, Dianny Elizabeth Jimenez;Gomes, Diego Garces;de Souza Freire, Mirna;de Miranda Burgel, Pedro Henrique;de Oliveira, Nelson Gomes Junior;Valencia, Jorge William Arboleda;Franco, Octavio Luiz;Dias, Simoni Campos
    • 셀메드
    • /
    • 제4권1호
    • /
    • pp.5.1-5.8
    • /
    • 2014
  • Healthcare-associated infection represents a frequent cause of mortality that increases hospital costs. Due to increasing microbial resistance to antibiotics, it is necessary to search for alternative therapies. Consequently, novel alternatives for the control of resistant microorganisms have been studied. Among them, plant antimicrobial protein presents enormous potential, with flowers being a new source of antimicrobial molecules. In this work, the antimicrobial activity of protein-rich fractions from flower tissues from 18 different species was evaluated against several human pathogenic bacteria. The results showed that protein-rich fractions of 12 species were able to control bacterial development. Due its broad inhibition spectrum and high antibacterial activity, the protein-rich fraction of Hibiscus rosa-sinensis was subjected to DEAE-Sepharose chromatography, yielding a retained fraction and a non-retained fraction. The retained fraction inhibits 29.5% of Klebsiella pneumoniae growth, and the non-retained fraction showed 31.5% of growth inhibition against the same bacteria. The protein profile of the chromatography fractions was analyzed by using SDS-PAGE, revealing the presence of two major protein bands in the retained fraction, of 20 and 15 kDa. The results indicate that medicinal plants have the biotechnological potential to increase knowledge about antimicrobial protein structure and action mechanisms, assisting in the rational design of antimicrobial compounds for the development of new antibiotic drugs.