• 제목/요약/키워드: Tagging

검색결과 566건 처리시간 0.024초

공평성 향상을 위한 TSW Tagging 알고리즘 (TSW Tagging Algorithm for Improving Fairness)

  • 김성용;김영주;이기현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (3)
    • /
    • pp.670-672
    • /
    • 2003
  • 인터넷의 발전으로 인하여 여러 가지 서비스가 가능하게 되었고, 이러한 서비스들은 서로 다른 서비스 품질(QoS)이 요구된다. 따라서 이러한 QoS를 제공하기 위해 차별화 서비스(Differentiated Service)의 연구가 진행되고 있다. 이 논문에서는 차별화 서비스중 보장형 서비스에서 공평성에 관한 문제로 지적되고 있는 bandwidth skew problem의 문제를 최소화하기 위한 기법을 제시한다. 이 논문에서는 bandwidth skew problem의 현상을 확인하고 제안한 기법이 기존의 기법보다 공평성 측면에서 개선된 성능을 제공함을 보였다.

  • PDF

An Automatic Tagging System and Environments for Construction of Korean Text Database

  • Lee, Woon-Jae;Choi, Key-Sun;Lim, Yun-Ja;Lee, Yong-Ju;Kwon, Oh-Woog;Kim, Hiong-Geun;Park, Young-Chan
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 FIFTH WESTERN PACIFIC REGIONAL ACOUSTICS CONFERENCE SEOUL KOREA
    • /
    • pp.1082-1087
    • /
    • 1994
  • A set of text database is indispensable to the probabilistic models for speech recognition, linguistic model, and machine translation. We introduce an environment to canstruct text databases : an automatic tagging system and a set of tools for lexical knowledge acquisition, which provides the facilities of automatic part of speech recognition and guessing.

  • PDF

Sequence-to-sequence 기반 한국어 형태소 분석 및 품사 태깅 (Sequence-to-sequence based Morphological Analysis and Part-Of-Speech Tagging for Korean Language with Convolutional Features)

  • 이건일;이의현;이종혁
    • 정보과학회 논문지
    • /
    • 제44권1호
    • /
    • pp.57-62
    • /
    • 2017
  • 기존의 전통적인 한국어 형태소 분석 및 품사 태깅 방법론은 먼저 형태소 후보들을 생성한 뒤 수많은 조합에서 최적의 확률을 가지는 품사 태깅 결과를 구하는 두 단계를 거치며 추가적으로 형태소의 접속 사전, 기분석 사전 및 원형복원 사전 등을 필요로 한다. 본 연구는 기존의 두 단계 방법론에서 벗어나 심층학습 모델의 일종인 sequence-to-sequence 모델을 이용하여 한국어 형태소 분석 및 품사 태깅을 추가 언어자원에 의존하지 않는 end-to-end 방식으로 접근하였다. 또한 형태소 분석 및 품사 태깅 과정은 어순변화가 일어나지 않는 특수한 시퀀스 변환과정이라는 점을 반영하여 음성인식분야에서 주로 사용되는 합성곱 자질을 이용하였다. 세종말뭉치에 대한 실험결과 합성곱 자질을 사용하지 않을 경우 97.15%의 형태소 단위 f1-score, 95.33%의 어절단위 정확도, 60.62%의 문장단위 정확도를 보여주었고, 합성곱 자질을 사용할 경우 96.91%의 형태소 단위 f1-score, 95.40%의 어절단위 정확도, 60.62%의 문장단위 정확도를 보여주었다.

NB 모델을 이용한 형태소 복원 (Morpheme Recovery Based on Naïve Bayes Model)

  • 김재훈;전길호
    • 정보처리학회논문지B
    • /
    • 제19B권3호
    • /
    • pp.195-200
    • /
    • 2012
  • 한국어는 교착어이어서 형태소 분석 없이 품사 부착이 어려울 뿐 아니라 형태소를 분석할 때 다양한 어형 변화가 복원되어야 한다. 이것은 한국어 형태소 분석의 고질적인 문제 중 하나이며, 주로 규칙을 이용해서 해결한다. 규칙을 이용할 경우 주어진 문맥에 가장 적합한 복원을 어려워 여러 형태의 모호성을 생성하며, 이는 품사 부착에 의해서 해결된다. 본 논문에서는 이 문제를 기계학습 방법(Na$\ddot{i}$ve Bayes 모델)을 이용하여 해결한다. 기계학습 모델의 입력 자질은 어형 변화가 발생하는 주변 음절이며 출력 범주는 복원된 음절이다. ETRI 구문 말뭉치를 이용한 실험에서 제안된 형태소 복원 모델을 사용한 형태소 단위의 품사 부착 성능은 97.5%의 $F_1$점수를 보였으며 이 모델이 형태소 복원에 매우 유용함을 알 수 있었다.

어휘별 중의성 제거 규칙과 통계 정보를 이용한 한국어 품사 태깅 (Korean Part-of-Speech Tagging using Disambiguation Rules for Ambiguous Word and Statistical Information)

  • 안광모;한규열;서영훈
    • 한국콘텐츠학회논문지
    • /
    • 제9권2호
    • /
    • pp.18-26
    • /
    • 2009
  • 규칙 정보와 통계 정보를 이용하는 복합적 품사 태깅은 통계를 기반으로 하는 방법의 견고함과 확장성을 가지고, 통계 정보에 벗어나는 언어현상들을 규칙 정보를 이용하여 해결함으로서 높은 정확도를 가질 수 있다. 하지만 기존의 연구는 규칙 정보의 제한적인 적용범위 때문에 통계 정보에 벗어나는 언어 현상을 처리할 수 없는 경우가 발생하게 된다. 본 논문에서는 이를 해결하기 위하여 어휘의 사전적 의미와 문맥적 관계를 반영할 수 있는 "어휘별 중의성 제거 규칙"을 제안한다. 어휘별 중의성 제거 규칙은 세종 말뭉치로 부터 말뭉치 데이터를 형태소 분석하여 상위 50%의 중의성 어휘에 대한 사전적 의미와 문맥적 관계를 고려한 품사 태깅 정보를 추출하고 이것을 규칙으로 만든 것이며, 현재까지 총 1,815개로 구성되어 있다. 어휘별 중의성 제거 규칙을 기존의 복합적 품사 태깅 시스템에 적용하여 품사 태깅의 정확도를 높일 수 있었다.

A Gene-Tagging System for Monitoring of Xanthomonas Species

  • Song, Wan-Yeon;Steven W. Hutcheson;Efs;Norman W. Schaad
    • The Plant Pathology Journal
    • /
    • 제15권3호
    • /
    • pp.137-143
    • /
    • 1999
  • A novel chromosomal gene tagging technique using a specific fragment of the fatty acid desaturase-like open reading frame (des-like ORF) from the tox-argK gene cluster of Pseudomonas syringae pv. phaseolicola was developed to identify Xanthomonas spp.released into the environment as biocontrol agents. X. campestris pv. convolvuli FB-635, a pathogen of Convolvulus arvensis L., (bindweed), was chosen as the organism in which to develop and test the system. A 0.52 kb DES fragment amplified from P. syringae pv. phaseolicola C-199 was inserted into pGX15, a cosmid clone containing a 10.3 kb Eco RI-HindIII fragment derived from the xanthomonadin biosynthetic gene cluster contained in plasmid pIG102, to create a pigG::DES insertion. The 10.8 kb EcoRI-BamHI fragment carrying the pigG:: DES insertion was cloned into pLAFR3 to generate pLXP22. pLXP22 was then conjugated into X. campestris pv. convolvuli FB-635 and the pigG::DES insertion integrated into the bacterial chromosome by marker exchange. Rifampicin resistant, tetracycline sensitive, starch hydrolyzing, white colonies were used to differentiate the marked strain from yellow pigmented wild-type ones. PCR primers specific for the unique DES fragment were used for direct detection of the marked strain. Result showed the marked strain could be detected at very low levels even in the presence of high levels of other closely related or competitive bacteria. This PCR-based DES-tagging system provides a rapid and specific tool for directly monitoring the dispersal and persistence of Xanthomonas spp.released into the environment.

  • PDF

CNN을 이용한 소셜 이미지 자동 태깅 (Automatic Tagging for Social Images using Convolution Neural Networks)

  • 장현웅;조수선
    • 정보과학회 논문지
    • /
    • 제43권1호
    • /
    • pp.47-53
    • /
    • 2016
  • 인터넷이 급속히 발달하는 가운데 스마트폰, 디지털 카메라, 블랙박스 등의 기기에서 수집되는 방대한 영상 데이터가 소셜 미디어 사이트를 통해 빠르게 공유되고 있다. 소셜 미디어 공유 사이트에서는 일반적으로 이미지의 태그 정보를 사용하는데, 멀티미디어를 공유하는 방법이 쉬워지고 그 양이 폭발적으로 증가함에 따라 이미지에 태그를 붙여야 하는 일은 번거로움이 되고 있다. 또한 태그가 잘못 붙여지거나 안 붙은 경우에는 이미지 검색 정확도가 떨어질 가능성이 있다. 본 논문에서는 이미지의 내용정보를 이용하여 자동으로 이미지로부터 태그를 추출하는 방법을 제안한다. 제안하는 방법은 ImageNet에서 제공하는 대용량의 이미지 데이터와 라벨을 CNN(Convolutional Neural Network) 딥러닝 기법으로 학습시킨 후, 인스타그램 이미지로부터 라벨 정보를 추출하는 것이다. 추출된 라벨 정보를 이용하여 자동 태깅한 후, 검색에 활용했을 때 인스타그램의 기존 검색보다 높은 정확도를 가지고 있음을 알 수 있었다.

LHMM기반 영어 형태소 품사 태거의 도메인 적응 방법 (Domain Adaptation Method for LHMM-based English Part-of-Speech Tagger)

  • 권오욱;김영길
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권10호
    • /
    • pp.1000-1004
    • /
    • 2010
  • 형태소 품사 태거는 언어처리 시스템의 전처리기로 많이 활용되고 있다. 형태소 품사 태거의 성능 향상은 언어처리 시스템의 전체 성능 향상에 크게 기여할 수 있다. 자동번역과 같이 복잡도가 놓은 언어처리 시스템은 최근 특정 도메인에서 좋은 성능을 나타내는 시스템을 개발하고자 한다. 본 논문에서는 기존 일반도메인에서 학습된 LHMM이나 HMM 기반의 영어 형태소 품사 태거를 특정 도메인에 적응하여 높은 성능을 나타내는 방법을 제안한다. 제안하는 방법은 특정도메인에 대한 원시코퍼스를 이용하여 HMM이나 LHMM의 기학습된 전이확률과 출력확률을 도메인에 적합하게 반자동으로 변경하는 도메인 적응 방법이다. 특허도메인에 적응하는 실험을 통하여 단어단위 태깅 정확률 98.87%와 문장단위 태깅 정확률 78.5%의 성능을 보였으며, 도메인 적응하지 않은 형태소 태거보다 단어단위 태깅 정확률 2.24% 향상(ERR: 6.4%)고 문장단위 태깅 정확률 41.0% 향상(ERR: 65.6%)을 보였다.

넙치(Paralichthys olivaceus) 산소 소비율에 미치는 Pop-up Satellite Archival Tag (PSAT) 체외 부착과 수온의 영향 (External Attachment of Pop-up Satellite Archival Tag (PSAT) and Water Temperature Affect Oxygen Consumption Rate of the Olive Flounder Paralichthys olivaceus)

  • 이근수;강필준;박혜미;오승용
    • 한국수산과학회지
    • /
    • 제56권5호
    • /
    • pp.660-666
    • /
    • 2023
  • This study aimed to examine the effect of external pop-up satellite archival tags (PSATs) attachment and water temperature on the oxygen consumption rate (OCR) of the olive flounder (mean body weight 2281.7 g). The OCRs of fish were measured under conditions of three different water temperature conditions (15, 20, and 25℃) and two different tagging methods [non-tagging, control; bio-logger external attachment with a miniature PSAT (dummy mrPAT), BEA] using a closed flow-through respirometer. The OCRs of fish linearly increased with the increase in water temperature in both the control and BEA (P<0.001); however, the OCRs of BEA were approximately 1.8-1.9 times lower than those of the control at each water temperature (P<0.001). The Q10 values of the control and BEA were the highest in the water temperature range of 15 to 20℃, but sensitivity to water temperature changes was higher in BEA than in the control. The metabolic energy loss rate (MEL) of fish increased with increasing water temperature regardless of external tagging, but the MEL of the control was higher than that of BEA (P<0.001). These results demonstrate that OCR, thermal sensitivity, and energy expenditure are all affected in adult olive flounder with external PSAT attachment.

A Small Epitope Tagging on the C-Terminus of a Target Protein Requires Extra Amino Acids to Enhance the Immune Responses of the Corresponding Antibody

  • Kyungha Lee;Man-Ho Cho;Mi-Ju Kim;Seong-Hee Bhoo
    • Journal of Microbiology and Biotechnology
    • /
    • 제34권6호
    • /
    • pp.1222-1228
    • /
    • 2024
  • Protein-specific antibodies are essential for various aspects of protein research, including detection, purification, and characterization. When specific antibodies are unavailable, protein tagging is a useful alternative. Small epitope tags, typically less than 10 amino acids, are widely used in protein research due to the simple modification through PCR and reduced impact on the target protein's function compared to larger tags. The 2B8 epitope tag (RDPLPFFPP), reported by us in a previous study, has high specificity and sensitivity to the corresponding antibody. However, when attached to the C-terminus of the target protein in immunoprecipitation experiments, we observed a decrease in detection signal with reduced immunity and low protein recovery. This phenomenon was not unique to 2B8 and was also observed with the commercially available Myc tag. Our study revealed that C-terminal tagging of small epitope tags requires the addition of more than one extra amino acid to enhance (restore) antibody immunities. Moreover, among the amino acids we tested, serine was the best for the 2B8 tag. Our findings demonstrated that the interaction between a small epitope and a corresponding paratope of an antibody requires an extra amino acid at the C-terminus of the epitope. This result is important for researchers planning studies on target proteins using small epitope tags.