• Title/Summary/Keyword: CRFs

Search Result 68, Processing Time 0.022 seconds

RNAi Suppression of RPN12a Decreases the Expression of Type-A ARRs, Negative Regulators of Cytokinin Signaling Pathway, in Arabidopsis

  • Ryu, Moon Young;Cho, Seok Keun;Kim, Woo Taek
    • Molecules and Cells
    • /
    • v.28 no.4
    • /
    • pp.375-382
    • /
    • 2009
  • The 26S proteasome is a 2-MDa complex with a central role in protein turn over. The 26S proteasome is comprised of one 20S core particle and two 19S regulatory particles (RPs). The RPN12a protein, a non-ATPase subunit of the 19S RP, was previously shown to be involved in cytokinin signaling in Arabidopsis. To further investigate cellular roles of RPN12a, RNAi transgenic plants of RPN12a were constructed. As expected, the 35S:RNAi-RPN12a plants showed cytokinin signaling defective phenotypes, including abnormal formation of leaves and inflorescences. Furthermore, RNAi knock-down transgenic plants exhibited additional unique phenotypes, including concave and heart-shape cotyledons, triple cotyledons, irregular and clustered guard cells, and defects in phyllotaxy, all of which are typical for defective cytokinin signaling. We next examined the mRNA level of cytokinin signaling components, including type-A ARRs, type-B ARRs, and CRFs. The expression of type-A ARRs, encoding negative regulators of cytokinin signaling, was markedly reduced in 35S:RNAi-RPN12a transgenic plants relative to that in wild type plants, while type-B ARRs and CRFs were unaffected. Our results also indicate that in vivo stability of the ARR5 protein, a negative regulator of cytokinin signaling, is mediated by the 26S proteasome complex. These results suggest that RPN12a participates in feedback inhibitory mechanism of cytokinin signaling through modulation of the abundance of ARR5 protein in Arabidopsis.

Part-Of-Speech Tagging and the Recognition of the Korean Unknown-words Based on Machine Learning (기계학습에 기반한 한국어 미등록 형태소 인식 및 품사 태깅)

  • Choi, Maeng-Sik;Kim, Hark-Soo
    • The KIPS Transactions:PartB
    • /
    • v.18B no.1
    • /
    • pp.45-50
    • /
    • 2011
  • Unknown morpheme errors in Korean morphological analysis are divided into two types: The one is the errors that a morphological analyzer entirely fails to return any morpheme sequences, and the other is the errors that a morphological analyzer returns incorrect combinations of known morphemes. Most previous unknown morpheme estimation techniques have been focused on only the former errors. This paper proposes a unknown morpheme estimation method which can handle both of the unknown morpheme errors. The proposed method detects Eojeols (Korean spacing units) that may include unknown morpheme errors using SVM (Support Vector Machine). Then, using CRFs (Conditional Random Fields), it segments morphemes from the detected Eojeols and annotates the segmented morphemes with new POS tags. In the experiments, the proposed method outperformed the conventional method based on the longest matching of functional words. Based on the experimental results, we knew that the second type errors should be dealt with in order to increase the performance of Korean morphological analysis.

The Clinical Utilization of Hyungbangjihwang-tang (형방지황탕(荊防地黃湯)의 임상적 활용)

  • Hwang, Ji-Ho;Jang, Eun-Su;Yoo, Jong-Hyang;Kim, Ho-Seok;Lee, Si-Woo
    • Journal of Sasang Constitutional Medicine
    • /
    • v.20 no.3
    • /
    • pp.142-150
    • /
    • 2008
  • 1. Objective The purpose of this study is to examine the characteristics and the improvement in the symptoms of the patients who administrated Hyungbangjihwang-tang. 2. Methods We examined 793 case report forms(CRFs) from six oriental medical hospitals and three regional oriental medicine clinics. These CRFs are recorded from november 2007 to july 2008. All constitutions of cases were diagnosed not only by Sasang constitution experts but also through clinical experiences. The traits of the patients and the effects of their treatment were examined. 3. Results and Conclusion 1. The chief complaints in which the patients showed improvement were Headache, fatigue, lumbago, dyspepsia. 2. The ordinary symptoms in which the patients showed improvement were insomnia, fatigue, constipation, dyspepsia, headache. 3. The average food intake of the patients was normal(65.2%) and their feces had intermediate hardness (semi-soft). The color of their urine was either clear or yellow. 4. The amount of the patients' sweat was appropriate (39.1%) Their water intake was approximately normal, and they preferred drinking the cold water. 5. Among the diseases that the patients previously had chronic gastritis(19.6%) had the highest frequencies. 4. Conclusion: The above results show that Hyungbangjihwang-tang can be considered beneficial to headache, fatigue, lumbargo, insomnia, constipation, dyspepsia patients whose food intake is normal, whose sweat level is either appropriate, who prefer to drink cold water, and who are suffering from chronic gastritis.

  • PDF

Syllable-based Korean POS Tagging using POS Distribution and Bidirectional LSTM CRFs (품사 분포와 Bidirectional LSTM CRFs를 이용한 음절 단위 형태소 분석기)

  • Kim, Hyemin;Yoon, Jungmin;An, Jaehyun;Bae, Kyoungman;Ko, Youngjoong
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.3-8
    • /
    • 2016
  • 형태소 분석기는 많은 자연어 처리 영역에서 필수적인 언어 도구로 활용되기 때문에 형태소에 대한 품사를 결정하는 것은 매우 중요하다. 최근 음절 기반으로 형태소의 품사를 태깅하는 방법에 대한 연구들이 많이 진행되고 있다. 음절 단위 형태소 분석은 음절 단위로 분리된 형태소에 대해서 기계학습을 이용하여 분리된 음절 단위로 품사를 태깅하는 단계를 가진다. 본 논문에서는 기존의 CRF를 이용한 음절 단위 품사 태깅 방법을 개선하기 위해 bi-LSTM-CRFs를 이용한 방법을 제안한다. 또한, bi-LSTM-CRFs의 입력을 음절의 품사 분포 벡터를 이용해 확장함으로써 음절 단위 품사 태깅의 성능을 향상 시켰다.

  • PDF

Lexicon Feature Infused Character-Based LSTM CRFs for Korean Named Entity Recognition (문자 기반 LSTM-CRF 한국어 개체명 인식을 위한 사전 자질 활용)

  • Min, Jin-Woo;Na, Seung-Hoon
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.99-101
    • /
    • 2016
  • 문자 기반 LSTM CRF는 개체명 인식에서 높은 인식을 보여주고 있는 LSTM-CRF 방식에서 미등록어 문제를 해결하기 위해 단어 단위의 임베딩 뿐만 아니라 단어를 구성하는 문자로부터 단어 임베딩을 합성해 내는 방식으로 기존의 LSTM CRF에서의 성능 향상을 가져왔다. 한편, 개체명 인식에서 어휘 사전은 성능향상을 위한 외부 리소스원으로 활용하고 있는데 다양한 사전 매칭 방법이 파생될 수 있음에도 이들 자질들에 대한 비교 연구가 이루어지지 않았다. 본 논문에서는 개체명 인식을 위해 다양한 사전 매칭 자질들을 정의하고 이들을 LSTM-CRF의 입력 자질로 활용했을 때의 성능 비교 결과를 제시한다. 실험 결과 사전 자질이 추가된 LSTM-CRF는 ETRI 개체명 말뭉치의 학습데이터에서 F1 measure 기준 최대 89.34%의 성능까지 달성할 수 있었다.

  • PDF

Performance Comparison of Recurrent Neural Networks and Conditional Random Fields in Biomedical Named Entity Recognition (의생명 분야의 개체명 인식에서 순환형 신경망과 조건적 임의 필드의 성능 비교)

  • Jo, Byeong-Cheol;Kim, Yu-Seop
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.321-323
    • /
    • 2016
  • 최근 연구에서 기계학습 중 지도학습 방법으로 개체명 인식을 하고 있다. 그러나 지도 학습 방법은 데이터를 만드는 비용과 시간이 많이 필요로 한다. 본 연구에서는 주석 된 말뭉치를 사용하여 지도 학습 방법을 사용 한다. 의생명 개체명 인식은 Protein, RNA, DNA, Cell type, Cell line 등을 포함한 텍스트 처리에 중요한 기초 작업입니다. 그리고 의생명 지식 검색에서 가장 기본과 핵심 작업 중 하나이다. 본 연구에서는 순환형 신경망과 워드 임베딩을 자질로 사용한 조건적 임의 필드에 대한 성능을 비교한다. 조건적 임의 필드에 N_Gram만을 자질로 사용한 것을 기준점으로 설정 하였고, 기준점의 결과는 70.09% F1 Score이다. RNN의 jordan type은 60.75% F1 Score, elman type은 58.80% F1 Score의 성능을 보여준다. 조건적 임의 필드에 CCA, GLOVE, WORD2VEC을 사용 한 결과는 각각 72.73% F1 Score, 72.74% F1 Score, 72.82% F1 Score의 성능을 얻을 수 있다.

  • PDF

CRFs for Korean Morpheme Segmentation and POS Tagging (CRF에 기반한 한국어 형태소 분할 및 품사 태깅)

  • Na, Seung-Hoon;Yang, Seong-Il;Kim, Chang-Hyun;Kwon, Oh-Woog;Kim, Young-Kil
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.12-15
    • /
    • 2012
  • 본 논문은 한국어 형태소 분할 및 품사 태깅을 위해 조건부 랜덤 필드 (CRF: conditional random field)에 기반한 방식을 제안한다. 제안 방법은 1) 형태소 분할 단계 2) 품사 태깅 단계 3) 복합형태소 분할 및 태깅 단계의 세 단계로 이루어진다. 처음 두 단계는 CRF방법에 기반을 두고, 세 번째 단계에서는 일반화된 HMM (lattice-HMM)을 활용한다. 제안 방법은 세종 말뭉치 코퍼스에서 5-fold cross-validation로 평가한 결과, 약 96%의 품사 태깅 성능을 보여주었다.

  • PDF

Two Step Automatic Korean Word Spacing Model Based on Deep Neural Network (심층신경망 기반 2단계 한국어 자동 띄어쓰기 모델)

  • Choi, Gihyeon;Kim, Sihyung;Kim, Harksoo
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.593-595
    • /
    • 2018
  • 자동 띄어쓰기는 띄어쓰기가 되어있지 않은 문장에 대하여 띄어쓰기를 해주거나, 문장에 있는 잘못된 띄어쓰기를 교정하는 것을 말한다. 기존의 자동 띄어쓰기 연구는 주로 모든 음절을 붙인 후 새로 띄어쓰기 태그를 입력하는 방법을 사용하여 사용자가 입력한 올바른 띄어쓰기 정보를 활용하지 못하였다. 따라서 본 논문에서는 모두 붙여 쓴 문장에 공백을 넣어주는 띄어쓰기 삽입 모델과 사용자의 입력 정보를 이용하여 문장의 띄어쓰기 오류를 교정해주는 오류교정 모델이 결합된 통합모델을 제안한다. 제안된 모델은 에러율 10%일 때 F1-score가 98.85%까지 향상되었다.

  • PDF

Discriminative Training of Sequence Taggers via Local Feature Matching

  • Kim, Minyoung
    • International Journal of Fuzzy Logic and Intelligent Systems
    • /
    • v.14 no.3
    • /
    • pp.209-215
    • /
    • 2014
  • Sequence tagging is the task of predicting frame-wise labels for a given input sequence and has important applications to diverse domains. Conventional methods such as maximum likelihood (ML) learning matches global features in empirical and model distributions, rather than local features, which directly translates into frame-wise prediction errors. Recent probabilistic sequence models such as conditional random fields (CRFs) have achieved great success in a variety of situations. In this paper, we introduce a novel discriminative CRF learning algorithm to minimize local feature mismatches. Unlike overall data fitting originating from global feature matching in ML learning, our approach reduces the total error over all frames in a sequence. We also provide an efficient gradient-based learning method via gradient forward-backward recursion, which requires the same computational complexity as ML learning. For several real-world sequence tagging problems, we empirically demonstrate that the proposed learning algorithm achieves significantly more accurate prediction performance than standard estimators.

Labeling Dependency Structures using CRFs (CRFs를 이용한 의존구조 구문 레이블링)

  • Jeong, Seokwon;Choi, Maengsik;Kim, Harksoo
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.137-138
    • /
    • 2013
  • 본 논문에서는 의존구조 분석 결과로부터 구문 레이블을 생성하는 방법을 제안한다. 제안 시스템은 의존 구조 분석 결과의 의존소-지배소 쌍에 대해 자질을 생성하고, 문장 단위로 CRFs를 이용하여 구문 레이블을 부착한다. 실험을 통해 90.8%의 정확도를 보였고, 구문 레이블이 없는 의존구조 시스템의 후처리로 사용 가능하다.

  • PDF