• 제목/요약/키워드: POS 시스템

검색결과 169건 처리시간 0.026초

HMM을 이용한 한국어 품사 및 동형이의어 태깅 시스템 (Korean POS and Homonym Tagging System using HMM)

  • 김동명;배영준;옥철영;최호섭;김창환
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.12-16
    • /
    • 2008
  • 기존의 자연언어처리 연구 중 품사 태깅과 동형이의어 태깅은 별개의 문제로 취급되었다. 그로 인해 두 문제를 해결하기 위한 모델 역시 서로 다른 모델을 사용하였다. 이에 본 논문은 품사 태깅 문제와 동형이의어 태깅 문제는 모두 문맥의 정보에 의존함에 착안하여 은닉마르코프모델을 이용하여 두 가지 문제를 해결하는 시스템을 구현하였다. 제안한 시스템은 품사 및 동형이의어 태깅된 세종 말뭉치 1100만여 어절에 대해 unigram과 bigram을 추출 하였고, unigram을 이용하여 어절의 생성확률 사전을 구축하고 bigram을 이용하여 전이확률 사전을 구축하였다. 구현된 시스템의 성능 확인을 위해 비학습 말뭉치 261,360 어절에 대해 실험하였고, 실험결과 품사 태깅 99.74%, 동형이의어 태깅 97.41%, 품사 및 동형이의어 태깅 97.78%의 정확률을 보였다.

  • PDF

중한 기계 번역 시스템을 위한 형태소 분석기 (A Morph Analyzer For MATES/CK)

  • 강원석;김지현;송영미;송희정;황금하;채영숙;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.331-336
    • /
    • 2000
  • MATES/CK는 기계번역 시스템에서 전통적으로 사용하고 있는 세 단계(분석/변환/생성)에 의해서 중한 번역을 수행하는 시스템이다. MATES/CK는 시스템 성능을 높이기 위해 패턴 기반과 통계적 정보를 이용한다. 태거(Tagger)는 중국어 단어 분리를 최장일치법으로 수행하기 때문에 일부 단어에 대해 오류를 범하게 되고 품사(POS : Part Of Speech) 태깅 시 확률적 정보만 이용하여 특정 단어가 다 품사인 경우 그 단어에 대해 특정 품사만 태깅되는 문제점이 발생한다. 또한 중국어 및 외국어 인명 및 지명에 대한 미등록들에 대해서도 올바른 결과를 도출하지 못한다. 사전에 있어서 텍스트 기반으로 존재하여 이를 관리하기에 힘이 든다. 본 논문에서는 단어 분리 오류 및 품사 태깅 오류를 해결하기 위해 중국어 태깅 제약 규칙을 적용하는 방법을 제시하고 중국어 및 외국어 인명/지명에 대한 미등록어 처리방법을 제시한다. 또한 중국어 사전 관리에 대해 알아본다.

  • PDF

빅데이터(POS)를 활용한 백화점 방문수요 결정요인에 관한 연구 (A Study on the Determinants of Demand for Visiting Department Stores Using Big Data (POS))

  • 신성윤;박정아
    • 토지주택연구
    • /
    • 제13권4호
    • /
    • pp.55-71
    • /
    • 2022
  • 최근 국내 백화점 산업은 소비패턴의 변화에 의해 고급화와 차별화된 복합쇼핑문화공간으로 성장하고 있으며, 5개 대규모 회사를 중심으로 70개소가 운영되며 경쟁이 가속화되고 있다. 본 연구는 빅데이터 개념의 차량 자동입출차 시스템(pos)를 활용하여 백화점의 방문수요 결정요인을 분석하고, 백화점 산업의 경쟁력 강화를 위한 방안을 제시하고자 하였다. 분석방법은 2021년 신규개점으로 인하여 연간 매출액이 완전치 않은 지점 3곳을 제외한 67개의 지점을 대상으로 어떠한 사건이나 방문에 대한 빈도를 예측할 때 사용되는 음이항 회귀분석을 수행하였다. 분석결과 백화점 방문수요에 양(+)의 영향을 미치는 변수들은 공항·터미널·기차역 여부, 대지면적, 주차대수, VIP라운지수, 명품매장비율, F&B매장 수, 경기·인천지역인 것으로 나타났으며, 비상업지역 여부, 호텔은 음(-)의 영향을 미치는 것으로 분석되었다. 국내 백화점의 경쟁력 강화방안을 제시하면 다음과 같다. 첫째, 백화점 소비자들은 명품 브랜드에 대한 선호가 높다. 따라서 백화점은 자체적으로 해외 바이어팀을 구성하여 새로운 명품 브랜드를 발굴하여 유치하고, 고객들의 수요가 높은 명품 브랜드를 유치하는 전략이 필요하다. 또한, 구매력과 충성도 높은 소비자들을 유치하기 위해서는 기존 보다 더 차별화된 VIP 고객들을 위한 상품과 서비스를 제공할 필요성이 높다. 둘째, 신규 백화점 입점은 경기·인천 지역의 기차역, 공항, 터미널과 같은 교통거점 지역을 중심으로 추진하는 것이 바람직하다. 셋째, 백화점은 고급화된 쇼핑센터라는 측면에서 핵심임차인이 중요하므로 소비자의 수준과 선호에 부합하는 테넌트의 유치 전략이 필수적이다. 마지막으로 최고급 쇼핑센터인 백화점은 2021년 개점한 '더 현대'와 같이 차별화된 쇼핑, 문화, 외식과 여가서비스가 함께 제공되는 공간으로 개발되어야 향후 성장가능성이 담보될 수 있다.

CNN을 적용한 한국어 상품평 감성분석: 형태소 임베딩을 중심으로 (Sentiment Analysis of Korean Reviews Using CNN: Focusing on Morpheme Embedding)

  • 박현정;송민채;신경식
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.59-83
    • /
    • 2018
  • 고객과 대중의 니즈를 파악하기 위한 감성분석의 중요성이 커지면서 최근 영어 텍스트를 대상으로 다양한 딥러닝 모델들이 소개되고 있다. 본 연구는 영어와 한국어의 언어적인 차이에 주목하여 딥러닝 모델을 한국어 상품평 텍스트의 감성분석에 적용할 때 부딪히게 되는 기본적인 이슈들에 대하여 실증적으로 살펴본다. 즉, 딥러닝 모델의 입력으로 사용되는 단어 벡터(word vector)를 형태소 수준에서 도출하고, 여러 형태소 벡터(morpheme vector) 도출 대안에 따라 감성분석의 정확도가 어떻게 달라지는지를 비정태적(non-static) CNN(Convolutional Neural Network) 모델을 사용하여 검증한다. 형태소 벡터 도출 대안은 CBOW(Continuous Bag-Of-Words)를 기본적으로 적용하고, 입력 데이터의 종류, 문장 분리와 맞춤법 및 띄어쓰기 교정, 품사 선택, 품사 태그 부착, 고려 형태소의 최소 빈도수 등과 같은 기준에 따라 달라진다. 형태소 벡터 도출 시, 문법 준수도가 낮더라도 감성분석 대상과 같은 도메인의 텍스트를 사용하고, 문장 분리 외에 맞춤법 및 띄어쓰기 전처리를 하며, 분석불능 범주를 포함한 모든 품사를 고려할 때 감성분석의 분류 정확도가 향상되는 결과를 얻었다. 동음이의어 비율이 높은 한국어 특성 때문에 고려한 품사 태그 부착 방안과 포함할 형태소에 대한 최소 빈도수 기준은 뚜렷한 영향이 없는 것으로 나타났다.

효율적인 모니터 사용을 위한 화면 배치 시스템 구현 -와이드 모니터 사용자를 위한 화면 구성 시스템 SquareSpace- (Windows placement system development for efficient use monitor)

  • 조윤정;안동언
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.428-431
    • /
    • 2009
  • 최근 대형, 와이드 모니터 사용이 일반화되면서 모니터의 작업 공간을 효율적으로 사용하고자 하는 사용자들이 늘어나고 있다. 하나의 윈도우만을 띄워놓고 작업하던 일반적인 사용 패턴에서 여러 개의 창을 한꺼번에 놓고 작업하는 사용 패턴으로 변화하고 있다. 본 논문에서는 사용자가 모니터의 작업공간을 효율적으로 사용할 수 있도록 윈도우 배치를 돕는 시스템을 구현하였다. 일반 유틸리티와 달리 미리보기 화면을 통한 배치가 이루어지기 때문에 사용자가 쉽고 간편하게 작업환경의 구성과 변환할 수 있다. 앞으로 대형, 와이드 모니터의 수요에 발맞춰 윈도우를 효율적으로 이용하고자 하는 사용자의 욕구를 만족시키고 일일이 윈도우를 조절해야하는 불편함을 해소시켜 줄 것이다.

  • PDF

품사 표지 부착 말뭉치 검증 (Verification of POS tagged Corpus)

  • 이미경;정한민;성원경;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2005년도 제17회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.145-150
    • /
    • 2005
  • 본 논문에서는 자연어 처리 연구에서 이용되는 품사 표지 부착 말뭉치의 오류 검증 방안에 대해 제안한다. 현재까지의 품사 표지 부착 말뭉치들은 정제보다는 구축에 중점을 두고 있으며, 기존의 오류 검출과 정정 방안에 관련된 연구들은 기 구축된 말뭉치를 대상으로 한 것이 아니라, 품사 표지 부착 시스템의 후 처리에 집중하고 있다. 형태소 분석기나 품사 표지 부착 시스템의 학습에 이용되는 품사 표지 부착 말뭉치가 오류 검증 단계를 거친다면 이 시스템들은 좀 더 높은 신뢰성을 가지게 될 것이다. 본 논문에서는 품사 표지부착 말뭉치 검증을 위한 어절 분할 오류, 철자 오류, 표지 부착 오류, 형식 오류, 일관성 오류의 5가지 오류 유형과 검증 방안을 제안한다. 또한 제안한 방법에 따라 세종 계획의 형태소 분석 말뭉치의 오류를 검증해 보았으며, 그 결과 말뭉치 오류 정제가 말뭉치의 신뢰도를 향상시킬 수 있음을 보인다.

  • PDF

SVM 기반의 멘션 페어 모델을 이용한 한국어 상호참조해결 (Coreference Resolution for Korean using Mention Pair with SVM)

  • 최경호;박천음;이창기
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권4호
    • /
    • pp.333-337
    • /
    • 2015
  • 본 논문에서는 품사태그가 부착된 의존구문 트리와 개체명 정보가 자동 태깅된 말뭉치에서 멘션(Mention)을 추출하고, SVM을 기반으로 한 멘션 페어 모델(Mention Pair Model) 이용하는 한국어 상호참조해결 시스템을 제안한다. 시스템의 학습과 평가를 위해서 신문기사를 기반으로 하는 14개의 문서와, 위키피디아(Wikipedia)를 기반으로 하는 200개의 질의응답 문서를 분석하여 상호참조해결 정보가 담긴 말뭉치를 구축했다. 실험결과 본 논문에서 제안한 시스템의 성능은 MUC-F1 55.68%, B-cube-F1 57.19%, CEAFE-F1 61.75% 로 나타났다.

텍스트 문서 기반의 감성 인식 시스템 (An Emotion Scanning System on Text Documents)

  • 김명규;김정호;차명훈;채수환
    • 감성과학
    • /
    • 제12권4호
    • /
    • pp.433-442
    • /
    • 2009
  • 요즈음 인터넷을 통해 물건을 구매하는 경향이 증가하고 있다. 또한 물건을 구매한 소비자는 리뷰, 댓글, 비평 또는 블로그 등의 형식으로 온라인에 그들의 사용 후기를 작성한다. 또한 작성된 사용 후기부터 많은 구매자들은 물건을 구매하기 전에 자신이 구입하고자 하는 물건에 대한 정보를 얻는다. 따라서 회사나 공공기관은 대중이 다른 사람의 의견에 관심을 기울인다는 점 때문에 대중의 의견을 수집하고 분석할 필요성에 직면하였다. 그러나 온라인상에 댓글이 너무 많고, 중복적이면서 짧은 경향이 있다. 이러한 환경 속에서 텍스트 문서의 감성을 인식하는 시스템의 필요성이 대두되었다. 텍스트로부터 작성자의 의견이나 주관적인 생각을 추출할 수 있게 영어에서는 단어에 속성이 주어진 GI와 LKB가 있으나 한글은 아직 속성이 주어진 사전이 존재하지 않는다. 이 논문에서는 한글 품사 중 4개의 품사(명사, 동사, 형용사, 부사)에 속성을 주었다. 그리고 학습 군을 만들어서 감성 단어의 패턴을 구성하고, 문장에서 단어 사이의 공기관계를 구성하여 학습 시켰다. 이 학습을 바탕으로, SO-PMI을 이용하여 문서를 긍정과 부정 2가지 극성을 분류하고, 4개의 품사(명사, 동사, 형용사, 부사)를 각각 조합하여 최상의 조건을 구하였다. 마지막으로 사용자 인터페이스를 통해 새로운 감성 표현, 구성형식, 단어 연관성을 반자동적으로 삽입하고 교정할 수 있는 시스템을 설계하였다.

  • PDF

호텔경영 정보시스템(HMIS)에 대한 사용자 인식 (Recognition of the End User to Management Information System for Hotels)

  • 정태웅
    • 한국콘텐츠학회논문지
    • /
    • 제8권12호
    • /
    • pp.386-395
    • /
    • 2008
  • 호텔경영 정보시스템을 사용하고 있는 사용자의 인식수준을 통해 IT(system)의 업무기여 정도를 파악하고, Business와 정보기술의 연관관계를 규명하여 경영정보시스템의 향상을 도모코자 진행된 연구로, 연구결과 시스템을 통한 업무처리는 우수하나, 활용율 제고를 위한 개선이 필요한 것으로 조사되었다. 특히 숙박업의 형태에 있어 호텔과 리조트간의 인식에 차이가 있었으며, 개발방식에 있어서는 외국산 PKG보다 자체개발한 시스템이 화면조작이 용이한 것으로 조사되었다. 시스템 에러와 관련해서는 근무연수가 낮은 직원과 그렇지 않은 직원간의 차이가 있는 것으로 조사되었으며, 기능적인 측면에서 고객후불지원의 경우 프런트와 예약부서간의 차이가 있는 것으로 나타났다. 또한 대부분의 경우 시스템 이용에 있어 발생되는 문제에 대한 즉각적인 처리나, 시스템 지원체계의 구축 등에 낮게 인식하고 있었는데, 이는 최근 기업들의 IT S/M조직(시스템지원부서)을 outsourcing함으로써 자사직원이 아닌 외부용역업체이기 때문에 발생하는 것으로 사료된다. 호텔경영정보시스템을 구축함으로써 기업의 현재 실행하고 있는 업무의 지원수준은 상당이 높아진 것은 사실이나, 조사결과에서 처럼 사용자의 요구에 능동적인 대처와 현업의 업무를 끌어가며 선진적 업무의 방향성 제시가 필요하며, 이러한 정보시스템의 구축은 궁극적으로 기업의 가치창출을 지원하고, 현행업무의 효율성을 배가시키는 시스템이 되어야 한다.

다중-FACET 홀로곤을 이용한 레이저 주사시스템에 관한 연구 (A Study on Laser Scanning System Using Multi-Facet Hologon)

  • 신광용;김남;박한규
    • 대한전자공학회논문지
    • /
    • 제25권5호
    • /
    • pp.566-571
    • /
    • 1988
  • Laser scanning system using a hologram is simpler in optical system, lower in cost than using a polygon. In this paper, a thick hologram is fabricated for the underfilled transmission disk type with a merit of wabble insensitivity to vibration. High diffraction efficiency over 50% is obtained using silver halide recording material. The two-dimensional scan pattern with 13 scan-line is made by 7-facet hologon and mirror system. This system can be practically applied to POS(Point of Sale) bar-code symbol reader.

  • PDF