• Title/Summary/Keyword: POS 시스템

Search Result 168, Processing Time 0.036 seconds

Korean Morphological Analyzer and POS Tagger Just Using Finite-State Transducers (유한상태변환기만을 이용한 한국어 형태소 분석 및 품사 태깅)

  • Park, Won-Byeong;Kim, Jae-Hoon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.165-168
    • /
    • 2006
  • 이 논문은 유한상태변환기만을 이용하여 한국어 형태소 분석 및 품사 태깅 시스템을 제안한다. 기존의 한국어 형태소 분석 시스템들은 규칙기반 형태소 분석기가 주를 이루고 한국어 품사 태깅 시스템은 은닉마르코프 모델 기반 품사 태깅이 주를 이루었다. 한국어 형태소 분석의 경우 유한상태변환기를 이용한 경우도 있었으나, 이 방법은 변환기를 작성하기 위한 규칙을 수작업으로 구축해야 하며, 그 규칙에 따라서 사전이 작성되어야 한다. 이 논문에서는 품사 태깅 말뭉치를 이용해서 유한상태변환기에서 필요한 모든 변환 규칙을 자동으로 추출한다. 이런 방법으로 네 종류의 변환기, 즉, 자소분리변환기, 단어분리변환기, 단어형성변환기, 품사결정변환기를 자동으로 구축한다. 구축된 변환기들은 결합연산(composition operation)을 이용하여 하나의 유한상태변환기를 구성하여 한국어 형태소 분석과 동시에 한국어 품사 태깅을 수행한다. 이 방법은 하나의 유한상태변환기만을 이용하기 때문에 복잡도는 선형시간(linear complexity)을 가지면, 형태소 분석기와 품사 태깅 시스템을 매우 짧은 시간 내에 개발 할 수 있었다.

  • PDF

Part-Of-Speech Tagging using multiple sources of statistical data (이종의 통계정보를 이용한 품사 부착 기법)

  • Cho, Seh-Yeong
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.18 no.4
    • /
    • pp.501-506
    • /
    • 2008
  • Statistical POS tagging is prone to error, because of the inherent limitations of statistical data, especially single source of data. Therefore it is widely agreed that the possibility of further enhancement lies in exploiting various knowledge sources. However these data sources are bound to be inconsistent to each other. This paper shows the possibility of using maximum entropy model to Korean language POS tagging. We use as the knowledge sources n-gram data and trigger pair data. We show how perplexity measure varies when two knowledge sources are combined using maximum entropy method. The experiment used a trigram model which produced 94.9% accuracy using Hidden Markov Model, and showed increase to 95.6% when combined with trigger pair data using Maximum Entropy method. This clearly shows possibility of further enhancement when various knowledge sources are developed and combined using ME method.

Syntactic and Semantic Disambiguation for Interpretation of Numerals in the Information Retrieval (정보 검색을 위한 숫자의 해석에 관한 구문적.의미적 판별 기법)

  • Moon, Yoo-Jin
    • Journal of the Korea Society of Computer and Information
    • /
    • v.14 no.8
    • /
    • pp.65-71
    • /
    • 2009
  • Natural language processing is necessary in order to efficiently perform filtering tremendous information produced in information retrieval of world wide web. This paper suggested an algorithm for meaning of numerals in the text. The algorithm for meaning of numerals utilized context-free grammars with the chart parsing technique, interpreted affixes connected with the numerals and was designed to disambiguate their meanings systematically supported by the n-gram based words. And the algorithm was designed to use POS (part-of-speech) taggers, to automatically recognize restriction conditions of trigram words, and to gradually disambiguate the meaning of the numerals. This research performed experiment for the suggested system of the numeral interpretation. The result showed that the frequency-proportional method recognized the numerals with 86.3% accuracy and the condition-proportional method with 82.8% accuracy.

A Study to analyze Management Perfomance Building BSC for Hotels (BSC시스템 구축을 위한 호텔기업의 전략적 탐색)

  • Chung, tae-woong
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2008.05a
    • /
    • pp.343-347
    • /
    • 2008
  • There are two kind of system in hotel for evaluating management. the first is infra system, for example Front management system - reservation system, C/I, C/O system, POS system , web system, call center management -, Back office system, interface system, and so on which manage direct control for hotel, and next is strategic system, for example BSC , CS . which is supporting hotel management. The purpose of this study was to find using the Balanced Scorecard to evaluate hotel management perfomance. Management performance is based on productivity, quality, time, effect, and responsiveness. Hotel economic value is not equal visual asset which is measured financial value. It is include hotel brand, image, customers who have good loyalty, employees who give customers special service, and systems which was affected by internal process. In conclusion, innovation, growth, internal system process, empioyee and customer have effect hotel performance. Therefore hotel has to know non-financial performance which has positively relate to financial performance.

  • PDF

Development of POS Tagging System Independent to Word Spacing (띄어쓰기 비종속 품사 태깅 시스템 개발)

  • Lee, Kyung-Il;Ahn, Tae-Sung
    • Annual Conference on Human and Language Technology
    • /
    • 2003.10d
    • /
    • pp.69-72
    • /
    • 2003
  • 본 논문에서는 입력된 한국어 문자열로부터 형태소를 분석하고, 품사를 태깅하는 방법에 있어 개선된 통계적 모델을 제안하고, 이에 기반한 띄어쓰기 비종속 형태소 분석 및 태깅 시스템의 개발과 성능 평가에 대한 결과를 소개하고 있다. 제안된 통계 기반품사 태깅 시스템은 입력된 문자열로부터 음절의 띄어쓰기 확률값을 계산하여 유사어절을 생성하고, 유사어절 단위로 사용자 띄어쓰기와 상관없이 형태소 후보 리스트를 생성하며, 인접한 후보 형태소들의 접속 확률 계산에 있어 어절 간 접속 확률과 어절 내 접속 확률을 모두 사용함으로, 최적의 형태소 리스트를 결정하는 모델을 사용하고 있다. 특히, 형태소들의 접속 확률 계산 시 어절 간 접속 확률과 어절 내 접속 확률의 결합 비율이 음절의 띄어쓰기 확률 값과 사용자의 띄어쓰기 여부에 따라 자동으로 조절되는 특징을 가지고 있으며, 이를 통해 극단적으로 띄어 쓰거나 붙여 쓴 문장에 대해서도 평균 90%수준의 품사 태깅 성능을 달성할 수 있었다.

  • PDF

A Study on Development of PC-based Wireless Data Access System (PC 기반 양방향 무선데이터 시스템 개발에 관한 연구)

  • Joo, Jong-Hyuk
    • Journal of Korean Society of Industrial and Systems Engineering
    • /
    • v.28 no.3
    • /
    • pp.115-120
    • /
    • 2005
  • In this paper, we propose a personal-computer-based wireless data access system, which use DS/SS(Direct Sequence Spread Spectrum) method and the ISM band of 2.44GHz radio frequency. By applying hi-directional transmission between wireless handy terminals and PCs or servers, it can be easily connected with any kinds of database systems such as Oracle, MS-SQL and MS-ACCESS. Therefore, it could be economically adopted as peripheral equipments for ERP or SCM systems.

CEPS 기반의 개방형 전자화폐 Teeni 시스템 개발

  • Oh, Gyung-Seok;Heo, Sin;Do, Gyung-Gu;Ryu, Jae-Chul;Kim, Woon;Kim, Hyung-Ju
    • The Magazine of the IEIE
    • /
    • v.29 no.11
    • /
    • pp.1333-1342
    • /
    • 2002
  • 최근 들어 컴퓨터 통신의 확산과 함께 인터넷의 사용이 전 세계적으로 급증함에 따라 인터넷의 용도는 지금까지의 학술 및 연구를 대상으로한 정보 공유의 목적에서 인터넷을 마케팅의 대상으로 보고 이를 상업적으로 이용하려는 시도가 증가하고 있다. 이미 선진 외국의 경우에는 Mon-dex, Visa cash, Proton 등의 다양한 전자화폐 상품이 개발되어 사용되고 있으나 국제 호환성의 측면에서는 아직 미미한 형편이며 국제간 통용이 가능한 개방형 전자화폐 시스템 개발은 매우 필요하다. 소액지불 시스템의 국제 표준규격으로 인정받고 있는 CEPS(Common Electronic Purse Specification) 기반의 개방형 전자화폐 teem 시스템은 EMV(Europay, Master, Visa) 규격을 준용하고, PKI 기반의 보안기능을 채택하여 지불거래시 반드시 확보되어야 할 거래 데이타의 비밀성, 무결성, 부인방지 기능과 PIN(Personal Identification Number)를 이용한 사용자 인증을 제공하며 구매거래시 IC카드와 가맹점의 구매 단말기(POS)와의 오프라인 동적데이타 인증 (Dynamic Data Authentication) 방식의 상호인증을 제공한다. 개방형 전자화폐 teem 시스템의 구성 모듈은 발급, 충전, 구매, 정산, 인증시스템으로 구성되어 있으며, 웹기반의 사용자 인터페이스를 제공하고 DES, 3-DES, SHA-1, RSA, SEED등 다양한 암호 모듈과 다양한 어플리케이션의 탐재가 가능한 Java Card를 기반으로 하고 있으며, VOP(Visa Open Platform) 2.0,1, Java Card API 2.1 지원하는 시스템이다.

  • PDF

A Using and Comparison of Bar Code and QR code (바코드와 QR 코드의 비교와 활용)

  • Joo, Heon-Sik
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2013.01a
    • /
    • pp.269-270
    • /
    • 2013
  • 본 논문에서는 바코드와 QR 코드에 대해서 비교 및 활용을 나타내었다. 최근 모바일기기 사용 확대와 휴대 편리성으로 휴대폰의 편리성이 증가하면서 QR 코드의 사용이 대두되고 있다. 바코드는 1차원 코드로서 물류 및 판매정보관리시스템(POS)에서 널리 사용되었지만 정보량의 한계성을 가지고 있다. 이에 QR는 다층형 코드로서 바코드에 비해서 정보량과 정보의 종류에서 다양하게 이용될 수 있다. 또한 최근 휴대폰의 앱 기능의 활발한 이용으로 결제시스템, 명함, 웹, 이메일, 홍보, 멀티미디어 등 다양한 영역에서 QR 코드의 활용이 상당히 빈번하게 이용 될 것으로 사료한다.

  • PDF

Comparison Thai Word Sense Disambiguation Method

  • Modhiran, Teerapong;Kruatrachue, Boontee;Supnithi, Thepchai
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 2004.08a
    • /
    • pp.1307-1312
    • /
    • 2004
  • Word sense disambiguation is one of the most important problems in natural language processing research topics such as information retrieval and machine translation. Many approaches can be employed to resolve word ambiguity with a reasonable degree of accuracy. These strategies are: knowledge-based, corpus-based, and hybrid-based. This paper pays attention to the corpus-based strategy. The purpose of this paper is to compare three famous machine learning techniques, Snow, SVM and Naive Bayes in Word-Sense Disambiguation on Thai language. 10 ambiguous words are selected to test with word and POS features. The results show that SVM algorithm gives the best results in solving of Thai WSD and the accuracy rate is approximately 83-96%.

  • PDF

Utilization of Database Information System in Daegu Fashion Brands (패션 업체의 DB 정보화 시스템 활용 실태 - 대구지역을 중심으로 -)

  • 권현주;구양숙
    • Journal of the Korean Home Economics Association
    • /
    • v.41 no.5
    • /
    • pp.109-118
    • /
    • 2003
  • The purpose of this study was to analyze the utilization of Database Information System of Fashion Brands in Daegu area. The interviews, reviews of previous studies and the empirical investigations were processed for this study. The questionnaire was administered to 27 fashion brands in Daegu, Korea, from September to October in 2002. Data were analyzed by using frequency, mean and percentage utilizing SPSS statistical package. There were no brand differentiation in brand characteristics, items, target age and company size in Daegu Fashion brands. Awareness of Information Network and Usages of Internet marketing were in relatively low level. The rate of the brands possessing Web-site, POS system and Customer ID card were less than one third. More than a half of the brands had Customer Database system.