• Title/Summary/Keyword: tagging system

Search Result 196, Processing Time 0.022 seconds

Implementation of morphologica analyzer and spelling corrector for charcter recognition post-processing (문자 인식 후처리를 위한 형태소 분석기와 문자 교정기의 구현)

  • 이영화;김규성;김영훈;이상조
    • Journal of the Korean Institute of Telematics and Electronics C
    • /
    • v.34C no.5
    • /
    • pp.82-92
    • /
    • 1997
  • In this paper, we propose post-rpocessing method that corrects a misrecognized character by generated a characater recognizer using morphological analyzer and spelling corrector. The proposed post-processing consists of sthree phases : First, our method pass through morhological analyzer which only outputted necessary information for spelling correcting, doesn't analyze a bundle of phrases, and detects the location of misrecognized character. Second, tagging the generated candidate character using the information of character substitution table and grapheme substitution/separating table. Then we retry analysis after the misrecognition character has been substituted. Finally we select table, we investigate misrecognized charcters in CORPUS. Reliability analysis used to frequency of randomly selected about 100,000 words in CORPUS. A korean character recognizer demonstrates 93% correction rate without a post-processing. The entire recognition rate of our system with a post-processing exceeds 97% correction rate.

  • PDF

IF(interchange format) and IF tagging for the Multilingual Spoken Language Translation System (다국어 대화체 음성언어번역 시스템을 위한 IF(interchange format )와 IF 태깅)

  • 최운천
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.409-412
    • /
    • 1998
  • 미국의 카네기 메론 대학과 일본의 ATR 및 한국의 전자통신연구원 등이 가입한 CSTAR 에서는 99년 국제간 음성언어번역 시스템 데모를 위해 IF를 이용하여 데이터를 주고 받기로 합의하였다. IF는 크게는 인터넷을 통해 다른 나라의 음성언어번역 시스템과 연결하여 데이터를 주고 받는데 사용되고, 작게는 음성언어 번역 시스템 내의 해석 시스템과 생성 시스템 사이에 데이터를 주고 받는데 사용된다. IF는 중간언어 표현의 한 가지 방법으로 간단하면서도 단순한 표현으로 특정 영역 내에 나타나는 이미를 표현할 수 있도록 정의되었다. 대상으로 하는 영역은 여행 안내로 호텔 예약, 비행기 예약, 여행지 안내 및예약 등을 포함하고 있다. IF의 가장 큰 특징은 표현방법의 단순화에 있다. 즉, 의미를 가장 잘 나타낼 수 있는 표현을 골라, IF를 정의하여 언어 종속적인 요소를 가능한 배제하였다. IF 태깅은 발화에 대해 적절한 IF를 붙여 주는 일로 태깅을 수행하는 사람은 IF 태깅 요령에 따라 태깅을 수행하여야 한다. 현재 ETRI에서는 200대화 이상의 한국어 데이터에 대해 IF 태깅을 완료하였으며 해석 시스템과 생성 시스템 개발을 계속하고 있다.

  • PDF

Part-Of-Speech Tagging System Using Grammatical Function of Josa & Eomi (조사와 어미의 문법 기능을 활용한 품사 태깅 시스템)

  • An, Young-Min;Seo, Young-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2001.10d
    • /
    • pp.97-100
    • /
    • 2001
  • 본 논문은 규칙과 통계 정보를 모두 적용하는 혼합형 품사 태깅 시스템에서 통계 정보를 이용하여 품사 태깅을 수행할 때 조사와 어미를 문법 기능에 따라 구분하여 사용하는 품사 태깅 시스템을 기술한파. 품사 태깅은 주로 주변의 품사열을 이용하게 되는데 품사 정보를 추출할 때 조사와 어미의 문법 기능인 조사의 격 정보와 어미의 활용형 정보에 따라 몇 가지로 분류하고 정보를 추출하여 품사 태깅에 적용하면 조사와 어미를 분류하지 않은 품사열 만을 사용한 태깅 방법 보다 더 나은 성능을 얻을 수 있다.

  • PDF

KTS : A Korean Part-of-Speech Tagging System with Handling Unknown Words (KTS : 미등록어를 고려한 한국어 품사 태깅 시스템)

  • 이상호
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.195-199
    • /
    • 1995
  • 자연언어 처리 시스템의 전단부인 형태소 분석 모듈은 해결해야 할 두 가지 문제를 갖고 있다. 하나는 형태소 분석기가 여러 개의 분석 결과를 출력하여 생기는 품사 중의성이고, 다른 하나는 주어진 문장에 미등록어가 사용되어 형태소 분석이 실패되었을 때이다. 본 논문에서는 이 문제들을 해결하는 한국어 품사 태깅 시스템 KTS를 소개한다. KTS는 주어진 어절에 대해 모든 가능한 분석을 하는 형태소 분석기, 미등록어를 예측하는 미등록어 추정 모듈, 음절 정보와 단서 형태소를 이용하여 미등록어 후보의 수를 줄이는 미등록어 후보 여과기, 그리고 미등록어의 출현을 모델안에 포함한 품사 태깅 모듈로 구성되어 있다. KTS 의 품사태깅 모듈에는 두가지 태깅 방법인 경로 기반 태깅과 상태 기반 태깅의 유일 출력과 다중 출력 기능이 모두 구현되어 있으며, 실험에 의하면, 미등록어가 포함되지 않은 어절에 대해서 89.12%, 미등록어가 포함된 어절에 대해서 68.63%의 정확률을 각각 나타내었다.

  • PDF

High Throughput Proteomic Approaches for the Dissection of Light Signal Transduction Pathways in Photosynthetic Cyanobacterium Synechocystis sp.PCC 6803

  • Chung Young-Ho;Park Young Mok
    • Proceedings of the Microbiological Society of Korea Conference
    • /
    • 2002.10a
    • /
    • pp.203-205
    • /
    • 2002
  • Light is an environmental signal that regulates photomovement and main energy source of photosynthesis in the cyanobacterium Synechocystis sp. PCC 6803 (Syn6803). Syn6803 is a popular model system for study of plant functional genomics. In this report, we adopted 2D gel based proteomics study to investigate proteins related with the light absorption and photo-protection in Syn6803. More than 700 proteins were detected on the SDS-gels stained with silver nitrate. Several proteins showing different expression level under various light conditions were identified with MALDI-TOF Mass spectrometry. As a comparison, we also conducted ICAT-based proteome study using WT and cphl (cyanobacterial phytochrome 1) mutant. A cphl deletion led to changes in the expression of proteins involved in translation, photosynthesis including photosystem and CO2 fixation, and cellular regulation. We are currently involved in TAP-tagging method to study protein-protein interactions in search for the molecular component involved in the light signal transduction of Syn6803 photomovement.

  • PDF

Design and Implementation of Location-Aware Smart Bus Guide System using Social Tagging (위치 인식 기반 태깅 기술을 이용한 모바일 버스 안내 시스템 설계 및 구현)

  • Shin, Hyun-Jeong;Yun, Hye-Jin;Chang, Byung-Mo
    • 한국IT서비스학회:학술대회논문집
    • /
    • 2009.05a
    • /
    • pp.483-486
    • /
    • 2009
  • 본 연구의 목적은 사용자에 의한 정보를 이용하여 버스 정보 안내를 효율적으로 하는 시스템을 개발하는 것이다. 본 연구에서는 이를 위해 PDA를 사용하여 태깅 기술을 이용한 모바일 버스 안내 시스템을 개발하였다. 이 시스템은 관광객들에게 현재 위치를 기반으로 하여 버스 정류장을 안내하고 해당 정류장에 사용자 생산 정보를 태그로 등록하며, 등록된 정보를 이용하여 사용자에게 목적지까지의 경로를 안내한다. 사업자의 자세한 정보 등록이 가능하며, 사용자에게는 등록 정보 검색 시 간단한 키워드 만으로 해당 목적지에 대한 정보 안내 및 경로를 검색할 수 있도록 한다.

  • PDF

Predicting the Unemployment Rate Using Social Media Analysis

  • Ryu, Pum-Mo
    • Journal of Information Processing Systems
    • /
    • v.14 no.4
    • /
    • pp.904-915
    • /
    • 2018
  • We demonstrate how social media content can be used to predict the unemployment rate, a real-world indicator. We present a novel method for predicting the unemployment rate using social media analysis based on natural language processing and statistical modeling. The system collects social media contents including news articles, blogs, and tweets written in Korean, and then extracts data for modeling using part-of-speech tagging and sentiment analysis techniques. The autoregressive integrated moving average with exogenous variables (ARIMAX) and autoregressive with exogenous variables (ARX) models for unemployment rate prediction are fit using the analyzed data. The proposed method quantifies the social moods expressed in social media contents, whereas the existing methods simply present social tendencies. Our model derived a 27.9% improvement in error reduction compared to a Google Index-based model in the mean absolute percentage error metric.

Length Bitmap HASH Based POS Tagging System (길이 비트맵 해시 기반 형태소 분석 시스템)

  • Seon Choong-Nyoung;Min Kyungkoo;Seo Jungyun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.505-507
    • /
    • 2005
  • 인터넷의 확장에 따라 형태소 분석기에서 사용하는 사전의 규모도 커지고 있다. 이러한 상황은 사전의 증가를 가져옴으로써 기존 형태소 분석기의 자료 구조에 대한 새로운 요구를 발생시켰다. 기존의 트라이를 이용한 방법은 노드의 과다 생성과 데이터 부족문제로 발생하는 메모리 낭비의 문제를 가지고 있다. 효율적인 메모리 사용을 위해서는 해시 구조가 적절하다. 하지만 이 경우 트라이에 비해 검색 횟수의 복잡도가 비약적으로 증가되는 문제점을 안고 있다. 본 논문에서는 해시를 위한 길이 비트맵을 이용하여 검색 횟수를 제한할 수 있는 방법을 제안하였다. 실험을 통해 제안된 자료 구조와 해시와 트라이의 형태소 사전 검색 횟수를 비교하였으며 비문 사용이 많은 영역에서 효율적임을 입증하였다.

  • PDF

Part-of-Speech Tagging System Using Rules/Statistics Extracted by Unsupervised Learning (규칙과 비감독 학습 기반 통계정보를 이용한 품사 태깅 시스템)

  • Lee Donghun;Kang Mi-young;Hwang Myeong-jin;Hwon Hyuk-chul
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.07b
    • /
    • pp.445-447
    • /
    • 2005
  • 본 논문은 규칙 기반 방법과 통계 기반 방법을 동시에 사용함으로써 두 가지 방법의 장단점을 상호 보완한다. 한 문장에 대한 최적의 품사열은 HMM을 기반으로 Viterbi Algorithm을 사용하여 선택한다. 이때 파라미터 값은 규칙에 의한 가중치 값과 통계 정보를 사용한다. 최소한의 일반규칙을 사용하여 구축한 규칙의 적용에 따라 가중치 값을 구하며 규칙을 적용받지 못하는 경우는 비감독학습으로 추출한 통계정보에 기반을 둔 가중치 값을 이용하여 파라미터 값을 구한다. 이러한 기본 모델을 여러 회 반복하여 학습함으로써 최적의 통계기반 가중치를 구한다. 규칙과 비감독 학습으로 추출한 통계정보를 이용한 본 품사 태깅 시스템의 어절 기반 정확도는 $97.78\%$이다.

  • PDF

Smart Airport and Next Generation Security Screening Technology (스마트공항과 차세대 보안검색 기술)

  • Hong, J.W.;Oh, J.H.;Lee, H.K.
    • Electronics and Telecommunications Trends
    • /
    • v.34 no.2
    • /
    • pp.73-82
    • /
    • 2019
  • Airport is shifted airport 1.0 to airport 4.0 called smart airport and services paradigm is changed into direction to point the customer targeted benefits. Smart airports make use of integrated Internet of Things components to provide added-value services. By integrating smart components, airports are being exposed to a larger attack surface and new attack vectors. Self-services such as web or mobile check-in, self check-in/tagging/back drop/boarding, etc. should be strengthened to make airport processes smarter, and technologies such as automatic immigration, smart security search, and automatic AI-based baggage search should be applied. In this paper, we describe the necessity and importance of smart airports and next generation security screening technology. Further, we describe a walk through-type smart security screening system.