• 제목/요약/키워드: POS 시스템

검색결과 168건 처리시간 0.039초

유한상태변환기만을 이용한 한국어 형태소 분석 및 품사 태깅 (Korean Morphological Analyzer and POS Tagger Just Using Finite-State Transducers)

  • 박원병;김재훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 추계학술발표대회
    • /
    • pp.165-168
    • /
    • 2006
  • 이 논문은 유한상태변환기만을 이용하여 한국어 형태소 분석 및 품사 태깅 시스템을 제안한다. 기존의 한국어 형태소 분석 시스템들은 규칙기반 형태소 분석기가 주를 이루고 한국어 품사 태깅 시스템은 은닉마르코프 모델 기반 품사 태깅이 주를 이루었다. 한국어 형태소 분석의 경우 유한상태변환기를 이용한 경우도 있었으나, 이 방법은 변환기를 작성하기 위한 규칙을 수작업으로 구축해야 하며, 그 규칙에 따라서 사전이 작성되어야 한다. 이 논문에서는 품사 태깅 말뭉치를 이용해서 유한상태변환기에서 필요한 모든 변환 규칙을 자동으로 추출한다. 이런 방법으로 네 종류의 변환기, 즉, 자소분리변환기, 단어분리변환기, 단어형성변환기, 품사결정변환기를 자동으로 구축한다. 구축된 변환기들은 결합연산(composition operation)을 이용하여 하나의 유한상태변환기를 구성하여 한국어 형태소 분석과 동시에 한국어 품사 태깅을 수행한다. 이 방법은 하나의 유한상태변환기만을 이용하기 때문에 복잡도는 선형시간(linear complexity)을 가지면, 형태소 분석기와 품사 태깅 시스템을 매우 짧은 시간 내에 개발 할 수 있었다.

  • PDF

이종의 통계정보를 이용한 품사 부착 기법 (Part-Of-Speech Tagging using multiple sources of statistical data)

  • 조세형
    • 한국지능시스템학회논문지
    • /
    • 제18권4호
    • /
    • pp.501-506
    • /
    • 2008
  • 통계적 방식의 품사부착 문제는 보통 N-그램과 같을 단일 통계정보를 활용하지만 단순한 통계 정보라는 원천적인 한계가 있어 많은 오류가 발생한다. 따라서 다양한 정보를 활용하는 것이 정확도를 높일 가능성이 있다는 데는 이론의 여지가 없다. 그러나 다른 종류의 통계 자료는 배타적 자료가 아닌 한 상충되는 정보를 가질 수밖에 없으므로 이러한 정보들로부터 어떻게 종합적인 결론을 내는가가 문제이다. 본 논문에서는 이러한 상이한 통계정보를 통합하는 방법으로 언어 모델의 구성에서 활용된 바 있는 최대엔트로피 모델의 한국어 품사 부착에의 사용 가능성을 제시한다. 여기서는 이종의 통계정보로서 N그램과, 트리거 쌍을 사용하게 된다. 이러한 트리거 쌍 통계정보를 N그램과 함께 최대엔트로피 모델링을 했을 경우 퍼플렉시티가 어떻게 변화하는지에 대한 실험결과를 관찰하게 될 것이다. 트리거 쌍은 또한 다양하게 문맥사이즈를 변화할 수 있으며, N그램의 확률 모델도 다양하기 때문에 여러 종류의 실험을 통한 많은 향상을 예상 할 수 있다. 본 실험에서는 단일 모델 사용시 94.9 %의 정확도를 가진 3-그램 모델에 트리거 쌍을 최대 엔트로피 방식으로 추가한 견우 95.6% 의 정확도를 보여 0.7% 포인트의 정확도 향상을 기록하였다. 따라서 향후 다양한 정보원을 개발하여 최대엔트로피 방식으로 통합할 경우 지속적인 정확도 향상을 가져 올 수 있는 가능성을 보여준다고 할 수 있다.

정보 검색을 위한 숫자의 해석에 관한 구문적.의미적 판별 기법 (Syntactic and Semantic Disambiguation for Interpretation of Numerals in the Information Retrieval)

  • 문유진
    • 한국컴퓨터정보학회논문지
    • /
    • 제14권8호
    • /
    • pp.65-71
    • /
    • 2009
  • 월드 와이드 웹의 정보 검색에서 산출되어지는 수많은 정보를 효율적으로 검색하기 위해서 자연어 정보처리가 필수적이다. 이 논문은 텍스트에서 숫자의 의미 파악을 위한 판별기법을 제안한 것이다. 숫자 의미 판별기법은 챠트 파싱 기법과 함께 문맥자유 문법을 활용하여 숫자 스트링과 연관된 접사를 해석하였으며, N-그램 기반의 단어에 의거하여 조직화된 의미 파악을 하도록 설계되었다. 그리고 POS 태거를 사용하여 트라이그램 단어의 제한조건이 자동 인식되도록 시스템을 구성하여, 점진적으로 효율적인 숫자의 의미 파악을 하도록 하였다. 이 논문에서 제안한 숫자 해석 시스템을 실험한 결과, 빈도수 비례 방법은 86.3%의 정확률을 나타냈고 조건수 비례 방법은 82.8%의 정확률을 나타냈다.

BSC시스템 구축을 위한 호텔기업의 전략적 탐색 (A Study to analyze Management Perfomance Building BSC for Hotels)

  • 정태웅
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2008년도 춘계 종합학술대회 논문집
    • /
    • pp.343-347
    • /
    • 2008
  • 기업으로서 호텔은 전략목표를 달성하는데 필요한 경쟁력 기반을 견고하게 하고, 업무활동을 지속적으로 개선하기 위해 노력하고 있으며, 이러한 노력은 IT의 급속한 발전에 힘입어 업무프로세스와 컴퓨터를 결합하여, 호텔업무의 상당부분을 전산화(Computing)함으로써 조직유효성과 생산성 향상을 도모하고 있다. 호텔업무의 전산화는 기존의 운영업무(Operating)를 근간으로 POS, ARS, WEB 등으로 점차 확대되어 가는 한편, 급변하는 시장환경에 적응하기 위한 전략적 시스템 구축에도 다가서고 있다. 호텔기업의 기존의 운영관리시스템은 지극히 정량적이며, 재무적 성과에 치우쳐, 단기적으로 기업을 평가하고 관리하는 수준에 그치고 있으나, 최근 전략적 관점의 6시그마, BSC 등의 시스템 도입추세에 있다. 따라서 본 연구는 호텔기업의 전략적 시스템 구축에 있어, 도입되고 있는 BSC(균형성과표)시스템과 관련하여 재무적 관점과 비재무적 관점에서 시스템화할 측정지표 발굴에 그 목적이 있다. 호텔기업의 경영성과를 측정함에 있어 재무적 측정과 더불어 비재무적 성과(고객관점, 내부프로세스, 학습과 성장)에 일선근무자 및 의사결정자들이 시스템에 반영하고자 하는 중요요소를 파악하여, 기업경영에 도움을 주자 한다. 본 연구는 호첼기업에 근무하고 있는 집단을 대상으로 델파이 기법과 전문가 인터뷰(팀장급이상)를 통해 각 관점별 중요순위를 판별하였다. 연구결과 재무적 관점에서는 객실매출액, 객실가동율, 매출성장율, 매출이익율, 매출액 증가율이 중요순위로 나타났으며, 고객관점에서는 고개만족, 서비스 품질, 고객차별화, 고객D/B화, 고객수익성 순으로, 내부프로세스관점에서는 전사적 품질관리, 업무메뉴얼적용, 종사원 만족도, 리더쉽, 경력개발 순으로, 학습과 성장 관점에서는 직원만족도, 자기계발 교육기회 부여, 종사원 생산성, 서비스교육, 보상시스템 순으로 중요하게 인식하고 있었다. 본 연구의 결과는 서비스를 주된 경쟁도구 삼고 있는 호텔기업의 재무적 성과외 비재무적 성과상의 중요지표를 발굴하여 호텔기업의 특성에 맞는 BSC(균형성과표/Balanced Scorecard)시스템 구축에 도움을 주고, 궁극적으로 호텔기업의 경영성과 개선에 활용되길 기대한다.

  • PDF

띄어쓰기 비종속 품사 태깅 시스템 개발 (Development of POS Tagging System Independent to Word Spacing)

  • 이경일;안태성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.69-72
    • /
    • 2003
  • 본 논문에서는 입력된 한국어 문자열로부터 형태소를 분석하고, 품사를 태깅하는 방법에 있어 개선된 통계적 모델을 제안하고, 이에 기반한 띄어쓰기 비종속 형태소 분석 및 태깅 시스템의 개발과 성능 평가에 대한 결과를 소개하고 있다. 제안된 통계 기반품사 태깅 시스템은 입력된 문자열로부터 음절의 띄어쓰기 확률값을 계산하여 유사어절을 생성하고, 유사어절 단위로 사용자 띄어쓰기와 상관없이 형태소 후보 리스트를 생성하며, 인접한 후보 형태소들의 접속 확률 계산에 있어 어절 간 접속 확률과 어절 내 접속 확률을 모두 사용함으로, 최적의 형태소 리스트를 결정하는 모델을 사용하고 있다. 특히, 형태소들의 접속 확률 계산 시 어절 간 접속 확률과 어절 내 접속 확률의 결합 비율이 음절의 띄어쓰기 확률 값과 사용자의 띄어쓰기 여부에 따라 자동으로 조절되는 특징을 가지고 있으며, 이를 통해 극단적으로 띄어 쓰거나 붙여 쓴 문장에 대해서도 평균 90%수준의 품사 태깅 성능을 달성할 수 있었다.

  • PDF

PC 기반 양방향 무선데이터 시스템 개발에 관한 연구 (A Study on Development of PC-based Wireless Data Access System)

  • 주종혁
    • 산업경영시스템학회지
    • /
    • 제28권3호
    • /
    • pp.115-120
    • /
    • 2005
  • In this paper, we propose a personal-computer-based wireless data access system, which use DS/SS(Direct Sequence Spread Spectrum) method and the ISM band of 2.44GHz radio frequency. By applying hi-directional transmission between wireless handy terminals and PCs or servers, it can be easily connected with any kinds of database systems such as Oracle, MS-SQL and MS-ACCESS. Therefore, it could be economically adopted as peripheral equipments for ERP or SCM systems.

CEPS 기반의 개방형 전자화폐 Teeni 시스템 개발

  • 오경석;허신;도경구;류재철;김운;김형주
    • 전자공학회지
    • /
    • 제29권11호
    • /
    • pp.1333-1342
    • /
    • 2002
  • 최근 들어 컴퓨터 통신의 확산과 함께 인터넷의 사용이 전 세계적으로 급증함에 따라 인터넷의 용도는 지금까지의 학술 및 연구를 대상으로한 정보 공유의 목적에서 인터넷을 마케팅의 대상으로 보고 이를 상업적으로 이용하려는 시도가 증가하고 있다. 이미 선진 외국의 경우에는 Mon-dex, Visa cash, Proton 등의 다양한 전자화폐 상품이 개발되어 사용되고 있으나 국제 호환성의 측면에서는 아직 미미한 형편이며 국제간 통용이 가능한 개방형 전자화폐 시스템 개발은 매우 필요하다. 소액지불 시스템의 국제 표준규격으로 인정받고 있는 CEPS(Common Electronic Purse Specification) 기반의 개방형 전자화폐 teem 시스템은 EMV(Europay, Master, Visa) 규격을 준용하고, PKI 기반의 보안기능을 채택하여 지불거래시 반드시 확보되어야 할 거래 데이타의 비밀성, 무결성, 부인방지 기능과 PIN(Personal Identification Number)를 이용한 사용자 인증을 제공하며 구매거래시 IC카드와 가맹점의 구매 단말기(POS)와의 오프라인 동적데이타 인증 (Dynamic Data Authentication) 방식의 상호인증을 제공한다. 개방형 전자화폐 teem 시스템의 구성 모듈은 발급, 충전, 구매, 정산, 인증시스템으로 구성되어 있으며, 웹기반의 사용자 인터페이스를 제공하고 DES, 3-DES, SHA-1, RSA, SEED등 다양한 암호 모듈과 다양한 어플리케이션의 탐재가 가능한 Java Card를 기반으로 하고 있으며, VOP(Visa Open Platform) 2.0,1, Java Card API 2.1 지원하는 시스템이다.

  • PDF

바코드와 QR 코드의 비교와 활용 (A Using and Comparison of Bar Code and QR code)

  • 주헌식
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2013년도 제47차 동계학술대회논문집 21권1호
    • /
    • pp.269-270
    • /
    • 2013
  • 본 논문에서는 바코드와 QR 코드에 대해서 비교 및 활용을 나타내었다. 최근 모바일기기 사용 확대와 휴대 편리성으로 휴대폰의 편리성이 증가하면서 QR 코드의 사용이 대두되고 있다. 바코드는 1차원 코드로서 물류 및 판매정보관리시스템(POS)에서 널리 사용되었지만 정보량의 한계성을 가지고 있다. 이에 QR는 다층형 코드로서 바코드에 비해서 정보량과 정보의 종류에서 다양하게 이용될 수 있다. 또한 최근 휴대폰의 앱 기능의 활발한 이용으로 결제시스템, 명함, 웹, 이메일, 홍보, 멀티미디어 등 다양한 영역에서 QR 코드의 활용이 상당히 빈번하게 이용 될 것으로 사료한다.

  • PDF

Comparison Thai Word Sense Disambiguation Method

  • Modhiran, Teerapong;Kruatrachue, Boontee;Supnithi, Thepchai
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2004년도 ICCAS
    • /
    • pp.1307-1312
    • /
    • 2004
  • Word sense disambiguation is one of the most important problems in natural language processing research topics such as information retrieval and machine translation. Many approaches can be employed to resolve word ambiguity with a reasonable degree of accuracy. These strategies are: knowledge-based, corpus-based, and hybrid-based. This paper pays attention to the corpus-based strategy. The purpose of this paper is to compare three famous machine learning techniques, Snow, SVM and Naive Bayes in Word-Sense Disambiguation on Thai language. 10 ambiguous words are selected to test with word and POS features. The results show that SVM algorithm gives the best results in solving of Thai WSD and the accuracy rate is approximately 83-96%.

  • PDF

패션 업체의 DB 정보화 시스템 활용 실태 - 대구지역을 중심으로 - (Utilization of Database Information System in Daegu Fashion Brands)

  • 권현주;구양숙
    • 대한가정학회지
    • /
    • 제41권5호
    • /
    • pp.109-118
    • /
    • 2003
  • The purpose of this study was to analyze the utilization of Database Information System of Fashion Brands in Daegu area. The interviews, reviews of previous studies and the empirical investigations were processed for this study. The questionnaire was administered to 27 fashion brands in Daegu, Korea, from September to October in 2002. Data were analyzed by using frequency, mean and percentage utilizing SPSS statistical package. There were no brand differentiation in brand characteristics, items, target age and company size in Daegu Fashion brands. Awareness of Information Network and Usages of Internet marketing were in relatively low level. The rate of the brands possessing Web-site, POS system and Customer ID card were less than one third. More than a half of the brands had Customer Database system.