• Title/Summary/Keyword: Tagging

Search Result 564, Processing Time 0.032 seconds

An Efficient Korean Part-of-Speech Tagging (한국어에 적합한 효율적인 품사 태깅)

  • 김영훈
    • The Journal of the Korea Contents Association
    • /
    • v.2 no.2
    • /
    • pp.98-102
    • /
    • 2002
  • In this paper i offer a new part-of-speech tagging method for Korean, it can solve difficulty of statistical data acquisition and ambiguities due to same part-of-speech stream input and make good use of the Corpus. This method can solve that the corpus don't have huge. This method uses pattern information about part-of-speech among eojols and constraint-rules in order to perform part-of-speech tagging. The Constraint-rule is used to select appropriate part-of-speech pattern.

  • PDF

Isolation of the Arabidopsis Phosphoproteome Using a Biotin-tagging Approach

  • Kwon, Sun Jae;Choi, Eun Young;Seo, Jong Bok;Park, Ohkmae K.
    • Molecules and Cells
    • /
    • v.24 no.2
    • /
    • pp.268-275
    • /
    • 2007
  • Protein phosphorylation plays a key role in signal transduction in cells. Since phosphoproteins are present in low abundance, enrichment methods are required for their purification and analysis. Chemical derivatization strategies have been devised for enriching phosphoproteins and phosphopeptides. In this report, we employed a strategy that replaces the phosphate moieties on serine and threonine residues with a biotin-containing tag via a series of chemical reactions. Ribulose 1,5-bisphosphate carboxylase/oxygenase (RUBISCO)-depleted protein extracts prepared from Arabidopsis seedlings were chemically modified for 'biotin-tagging'. The biotinylated (previously phosphorylated) proteins were then selectively isolated by avidin-biotin affinity chromatography, followed by two-dimensional gel electrophoresis (2-DE) and matrix-assisted laser-desorption ionization time-of-flight mass spectrometry (MALDI-TOF MS). This led to the identification of 31 protein spots, representing 18 different proteins, which are implicated in a variety of cellular processes. Despite its current technical limitations, with further improvements in tools and techniques this strategy may be developed into a useful approach.

Discriminative Training of Sequence Taggers via Local Feature Matching

  • Kim, Minyoung
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • v.14 no.3
    • /
    • pp.209-215
    • /
    • 2014
  • Sequence tagging is the task of predicting frame-wise labels for a given input sequence and has important applications to diverse domains. Conventional methods such as maximum likelihood (ML) learning matches global features in empirical and model distributions, rather than local features, which directly translates into frame-wise prediction errors. Recent probabilistic sequence models such as conditional random fields (CRFs) have achieved great success in a variety of situations. In this paper, we introduce a novel discriminative CRF learning algorithm to minimize local feature mismatches. Unlike overall data fitting originating from global feature matching in ML learning, our approach reduces the total error over all frames in a sequence. We also provide an efficient gradient-based learning method via gradient forward-backward recursion, which requires the same computational complexity as ML learning. For several real-world sequence tagging problems, we empirically demonstrate that the proposed learning algorithm achieves significantly more accurate prediction performance than standard estimators.

A Korean POS Tagging System with Handling Corpus Errors (말뭉치 오류를 고려한 HMM 한국어 품사 태깅 시스템)

  • Seol, Yong-Soo;Kim, Dong-Joo;Kim, Kyu-Sang;Kim, Han-Woo
    • KSCI Review
    • /
    • v.15 no.1
    • /
    • pp.117-124
    • /
    • 2007
  • 통계 기반 접근 방법을 이용한 품사태깅에서 태깅 정확도는 훈련 데이터의 양에 좌우될 뿐 아니라, 말뭉치가 충분할지라도 수작업으로 구축한 말뭉치의 경우 항상 오류의 가능성을 내포하고 있으며 언어의 특성상 통계적으로 신뢰할만한 데이터의 수집에도 어려움이 따른다. 훈련 데이터로 사용되는 말뭉치는 많은 사람들이 수작업으로 구축하므로 작업자 중 일부가 언어에 대한 지식이 부족하다거나 주관적인 판단에 의한 태깅 실수를 포함할 수도 있기 때문에 단순한 저빈도와 관련된 잡음 외의 오류들이 포함될 수 있는데 이러한 오류들은 재추정이나 평탄화 기법으로 해결될 수 있는 문제가 아니다. 본 논문에서는 HMM(Hidden Markov Model)을 이용한 한국어 품사 태깅에서 재추정 후 여전히 존재하는 말뭉치의 잡음에 인한 태깅 오류 해결을 위해 비터비 알고리즘적용 단계에서 데이터 부족과 말뭉치의 오류로 인해 문제가 되는 부분을 찾아내고 규칙을 통해 수정을 하여 태깅 결과를 개선하는 방안을 제안한다. 실험결과는 오류가 존재하는 말뭉치를 사용하여 구현된 HMM과 비터비 알고리즘을 적용한 태깅 정확도에 비해 오류를 수정하는 과정을 거친 후 정확도가 향상됨을 보여준다.

  • PDF

A Design of Social Tagging Services for Prevention of Manipulation of Ranking (순위 조작 방지를 위한 소설 태깅 서비스 설계)

  • Jung, Han-Young;Choi, Okkyung;Yeh, Hongjin
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2012.07a
    • /
    • pp.101-104
    • /
    • 2012
  • 최근 소설 네트워크 서비스(Social Netwrok Services)를 활용한 소설 태깅 서비스에 대한 연구가 활발하게 진행 중이다. 특히 태그 기술을 이용한 협력적 태깅 시스템(collaborative tagging system)은 북마크, 문서, 사진, 동영상과 같은 웹 자원을 조직화하고 공유할 수 있는 수단으로 제공하고 있다. 그러나 광고 홍보 목적을 가진 스패머들은 콘텐츠와 관련 없는 태그를 달아 놓아 검색 키워드와 무관한 결과 값이 검색되어 웹 검색 서비스를 이용하는 사용자들에게 불편을 주고 있다. 따라서 본 연구에서는 콘텐츠와 태그의 연관성을 높이기 위해 태그에 일반 사용자가 유사도를 입력할 수 있는 추천 시스템을 적용하여 순위 조작 방지방법을 제안하였다.

  • PDF

Linkage Disequilibrium (LD) Mapping and Tagging SNP Selection of C-Fos Induced Growth Factor (Figf) Gene in Korean Population

  • Kim, Sook;Yoo, Yeon-Kyung;Jang, Hye-Yoon;Shin, Eun-Soon;Cho, Eun-Young;Kim, Eu-Gene;NamKung, Jung-Hyun;Yang, Jun-Mo;Lee, Jong-Eun
    • Molecular & Cellular Toxicology
    • /
    • v.2 no.1
    • /
    • pp.7-10
    • /
    • 2006
  • We performed comprehensive SNP validation and linkage disequilibrium (LD) analysis of the c-fos induced growth factor (Figf) gene in Korean population. Out of 32 SNPs, only 9 SNPs were polymorphic in Korean population. Validated SNPs formed a single extended haplotype block with strong LD through the entire length of the gene. Tagging SNP analysis picked only 2 SNPs to represent most of the genetic variation information of the Figf gene. Our results demonstrate the utility of LD block and tagging SNP analysis for an efficient way of performing a candidate gene based association study.

A Proposal of Agent based on Tagging and Process Behavior Inspection on the SmartPhone Environments (스마트폰 환경에서 Tagging 기반 프로세스 행위 감시 에이전트 제안)

  • Hong, Ji-Hoon;Kim, Nam-Uk;Chung, Tai-Myoung
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.04a
    • /
    • pp.434-437
    • /
    • 2015
  • 스마트폰 사용자가 급격하게 증가함에 따라 BYOD(Bring Your Own Device)정책을 펼치는 회사들이 많아졌지만 스마트폰 악성코드로 인해 회사 네트워크 전체가 위험한 상황에 직면해있다. 현재 다양한 스마트폰 악성코드 탐지 기법들이 연구되고 있지만 대부분 단일 어플리케이션을 대상으로 탐지를 수행하고 네트워크 환경과는 독립적으로 탐지한다는 단점이 존재한다. 따라서 본 논문에서는 네트워크 환경을 고려한 Tagging 기반의 프로세스 행위 감시 에이전트를 제안한다.

Classification of Advertising Spam Reviews (제품 리뷰문에서의 광고성 문구 분류 연구)

  • Park, Insuk;Kang, Hanhoon;Yoo, Seong Joon
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.186-190
    • /
    • 2010
  • 본 논문은 쇼핑몰의 이용 후기 중 광고성 리뷰를 분류해 내는 방법을 제안한다. 여기서 광고성 리뷰는 주로 업체에서 작성하는 것으로 리뷰 안에 광고 내용이 포함되어 있다. 국외 연구 중에는 드물게 오피니언 스팸 문서의 분류 연구가 진행되고 있지만 한국어 상품평으로부터 광고성 리뷰를 분류하는 연구는 아직 이루어지지 않고 있다. 본 논문에서는 Naive Bayes Classifier를 활용하여 광고성 리뷰를 분류하였다. 이때 확률 계산을 위해 사용된 특징 단어는 POS-Tagging+Bigram, POS-Tagging+Unigram, Bigram을 사용하여 추출하였다. 실험 결과는 POS-Tagging+Bigram 방법을 이용하였을 때 광고성 리뷰의 F-Measure가 80.35%로 정확도 높았다.

  • PDF

The Smart Electronic Tagging System for Sexual Offenses Prevention Context-Aware Services in Extreme Situations such as Location Unrecognized (위치인식 불가의 극한상황에서 성범죄 예방 상황인지 서비스를 위한 스마트 전자발찌 시스템)

  • Lee, Gil-Yong;Park, Soo-Hyun
    • Journal of the Institute of Electronics and Information Engineers
    • /
    • v.49 no.11
    • /
    • pp.118-131
    • /
    • 2012
  • The existing electronic tagging system traces the location of a sex offender through communicating with GPS satellites and mobile phone base stations in order to prevent repeated crimes. However, the GPS satellite communication method does not work well in the interiors of downtown buildings or on the subways where it is difficult to receive satellite signals. In such cases, the location can be traced through communication with mobile phone base stations. But the distance between mobile phone base stations is several hundred meters, and as a result the margin of error for location tracing can be maximum of 2km in accuracy reduction. Take for example, if a kindergarten is located on the 2nd floor and a coffee shop and the sex offender are located on the 3rd floor in a 5-story building that is downtown, the existing electronic tagging system cannot trace the location of the sex offender as the GPS satellite communication does not work in the interior of the building and the exact floor that the sex offender is located on cannot be recognized through communication with mobile phone base stations. This occurrence is a big problem for the existing electronic tagging system, which is based on position recognition. Therefore, this study suggests a smart electronic tagging system that can monitor sex offenders by using a Ubiquitous Sensor Network in such extreme situations where position recognition is not possible.

TSW Tagging Algorithm for Improving Fairness (공평성 향상을 위한 TSW Tagging 알고리즘)

  • 김성용;김영주;이기현
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10c
    • /
    • pp.670-672
    • /
    • 2003
  • 인터넷의 발전으로 인하여 여러 가지 서비스가 가능하게 되었고, 이러한 서비스들은 서로 다른 서비스 품질(QoS)이 요구된다. 따라서 이러한 QoS를 제공하기 위해 차별화 서비스(Differentiated Service)의 연구가 진행되고 있다. 이 논문에서는 차별화 서비스중 보장형 서비스에서 공평성에 관한 문제로 지적되고 있는 bandwidth skew problem의 문제를 최소화하기 위한 기법을 제시한다. 이 논문에서는 bandwidth skew problem의 현상을 확인하고 제안한 기법이 기존의 기법보다 공평성 측면에서 개선된 성능을 제공함을 보였다.

  • PDF