• 제목/요약/키워드: vectors

검색결과 3,860건 처리시간 0.038초

한국어 음소 단위 LSTM 언어모델을 이용한 문장 생성 (Korean Sentence Generation Using Phoneme-Level LSTM Language Model)

  • 안성만;정여진;이재준;양지헌
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.71-88
    • /
    • 2017
  • 언어모델은 순차적으로 입력된 자료를 바탕으로 다음에 나올 단어나 문자를 예측하는 모델로 언어처리나 음성인식 분야에 활용된다. 최근 딥러닝 알고리즘이 발전되면서 입력 개체 간의 의존성을 효과적으로 반영할 수 있는 순환신경망 모델과 이를 발전시킨 Long short-term memory(LSTM) 모델이 언어모델에 사용되고 있다. 이러한 모형에 자료를 입력하기 위해서는 문장을 단어 혹은 형태소로 분해하는 과정을 거친 후 단어 레벨 혹은 형태소 레벨의 모형을 사용하는 것이 일반적이다. 하지만 이러한 모형은 텍스트가 포함하는 단어나 형태소의 수가 일반적으로 매우 많기 때문에 사전 크기가 커지게 되고 이에 따라 모형의 복잡도가 증가하는 문제가 있고 사전에 포함된 어휘 외에는 생성이 불가능하다는 등의 단점이 있다. 특히 한국어와 같이 형태소 활용이 다양한 언어의 경우 형태소 분석기를 통한 분해과정에서 오류가 더해질 수 있다. 이를 보완하기 위해 본 논문에서는 문장을 자음과 모음으로 이루어진 음소 단위로 분해한 뒤 입력 데이터로 사용하는 음소 레벨의 LSTM 언어모델을 제안한다. 본 논문에서는 LSTM layer를 3개 또는 4개 포함하는 모형을 사용한다. 모형의 최적화를 위해 Stochastic Gradient 알고리즘과 이를 개선시킨 다양한 알고리즘을 사용하고 그 성능을 비교한다. 구약성경 텍스트를 사용하여 실험을 진행하였고 모든 실험은 Theano를 기반으로 하는 Keras 패키지를 사용하여 수행되었다. 모형의 정량적 비교를 위해 validation loss와 test set에 대한 perplexity를 계산하였다. 그 결과 Stochastic Gradient 알고리즘이 상대적으로 큰 validation loss와 perplexity를 나타냈고 나머지 최적화 알고리즘들은 유사한 값들을 보이며 비슷한 수준의 모형 복잡도를 나타냈다. Layer 4개인 모형이 3개인 모형에 비해 학습시간이 평균적으로 69% 정도 길게 소요되었으나 정량지표는 크게 개선되지 않거나 특정 조건에서는 오히려 악화되는 것으로 나타났다. 하지만 layer 4개를 사용한 모형이 3개를 사용한 모형에 비해 완성도가 높은 문장을 생성했다. 본 논문에서 고려한 어떤 시뮬레이션 조건에서도 한글에서 사용되지 않는 문자조합이 생성되지 않았고 명사와 조사의 조합이나 동사의 활용, 주어 동사의 결합 면에서 상당히 완성도 높은 문장이 발생되었다. 본 연구결과는 현재 대두되고 있는 인공지능 시스템의 기초가 되는 언어처리나 음성인식 분야에서 한국어 처리를 위해 다양하게 활용될 수 있을 것으로 기대된다.

폐암세포주에서 PS-341에 의한 아포프토시스에서 JNK와 GSK-$3{\beta}$의 역할 및 상호관련성 (PS-341-Induced Apoptosis is Related to JNK-Dependent Caspase 3 Activation and It is Negatively Regulated by PI3K/Akt-Mediated Inactivation of Glycogen Synthase Kinase-$3{\beta}$ in Lung Cancer Cells)

  • 이경희;이춘택;김영환;한성구;심영수;유철규
    • Tuberculosis and Respiratory Diseases
    • /
    • 제57권5호
    • /
    • pp.449-460
    • /
    • 2004
  • 연구배경 : PS-341은 최근에 개발된 강력하고 특이적인 proteasome 억제제로서, 일부 암환자에 투여하여 좋은 성적이 보고되고 있다. Proteasome 억제제의 항암효과는 아포프토시스 유발 물질, 즉 p53, $p21^{WAF/CIP1}$, $p27^{KIP1}$, NF-${\kappa}B$, Bax, Bcl-2 등의 발현 증가와 관련이 있는 것으로 생각되고 있다. JNK와 GSK-$3{\beta}$도 아포프토시스에 관여하는 것으로 잘 알려져 있지만, PS-341에 의한 아포프토시스에서의 역할은 규명되지 못한 상태이다. 본 연구에서는 폐암세포주에서 PS-341에 의한 아포프토시스에서 JNK와 GSK-$3{\beta}$의 역할을 규명하고자 하였다. 방 법 : NCI-H157과 A549 폐암세포주를 실험에 사용하였다. 세포생존능은 MTT 방법으로 평가하였고, 아포프토시스는 PARP의 분해로 평가하였다. JNK의 활성도는 in vitro immuno complex kinase 방법과 내인성 c-Jun의 인산화로 측정하였다. 각종 단백의 발현은 Western 분석으로 평가하였다. JNK1과 GSK-$3{\beta}$의 과발현은 각각 plasmid vector와 adenovirus vector를 이용하였다. 결 과 : PS-341 처치로 아포프토시스에 의한 세포생존율의 감소가 관찰되었다. PS-341 처치로 JNK가 활성화되었고, c-Jun의 발현이 유도되었다. Dominant negative JNK1의 과발현 또는 SP600125 전치치로 JNK의 활성화를 차단하면 PS-341에 의한 아포프토시스가 억제되었다. PS-341 처리로 JNK 활성화에 의존적으로 caspase 3의 활성화가 유도되었다. Caspase 활성화의 차단으로도 PS-341에 의한 아포프토시스가 억제되었다. PS-341에 의해 Akt가 활성화되었고, Akt 활성화의 차단으로 PS-341에 의한 아포프토시스가 심화되었다. PS-341에 의한 Akt 활성화로 GSK-$3{\beta}$가 불활성화되었다. Constitutively active GSK-$3{\beta}$의 과발현으로 PS-341에 의한 아포프토시스가 심화되었고, dominant negative GSK-$3{\beta}$의 과발현으로 PS-341에 의한 아포프토시스가 감소되었다. Lithium chloride 전처치와 dominant negative GSK-$3{\beta}$의 과발현으로 PS-341에 의한 JNK의 활성화와 c-Jun의 발현 증가가 억제되었다. 결 론 : 폐암세포주에서 PS-341에 의한 아포프토시스는 JNK/caspase 경로가 관여하며, 이는 PI3K/Akt 경로를 통한 GSK-$3{\beta}$의 불활성화에 의해 억제되는 것으로 판단된다. 따라서 PS-341의 항암효과를 최대화하기 위해서는 PI3K/Akt 경로를 통한 GSK-$3{\beta}$의 불활성화를 차단하는 치료법이 병행되어야 할 것으로 판단된다.

사례기반추론과 텍스트마이닝 기법을 활용한 KTX 차량고장 지능형 조치지원시스템 연구 (An Intelligence Support System Research on KTX Rolling Stock Failure Using Case-based Reasoning and Text Mining)

  • 이형일;김종우
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.47-73
    • /
    • 2020
  • KTX 차량은 수많은 기계, 전기 장치 및 부품들로 구성되어 있는 하나의 시스템으로 차량의 유지보수에는 상당히 많은 전문성과 유지보수 작업자들의 경험을 필요로 한다. 차량 고장발생 시 유지보수자의 지식과 경험에 따라 문제 해결의 시간과 작업의 질적 차이가 발생하며 그에 따른 차량의 가용율이 달라진다. 일반적으로 문제해결은 고장 매뉴얼을 기반으로 하지만 경험이 많고 능숙한 전문가의 경우는 이와 더불어 개인의 노하우를 접목하여 신속하게 진단하고 조치를 취한다. 이러한 지식은 암묵지 형태로 존재하기 때문에 후임자에게 완전히 전수되기 어려우며, 이를 위해 사례기반의 철도차량 전문가시스템을 개발하여 데이터화된 지식으로 바꾸려고 하는 연구들이 있어왔다. 하지만, 간선에 가장 많이 투입되고 있는 KTX 차량에 대한 연구나 텍스트의 특징을 추출하여 유사사례를 검색하는 시스템 개발은 아직 미비하다. 따라서, 본 연구에서는 이러한 차량 유지보수 전문가들의 노하우를 통해 수행된 고장들에 대한 진단과 조치 이력을 문제 해결의 사례로 활용하여 새롭게 발생하는 고장에 대한 조치가이드를 제공하는 지능형 조치지원시스템을 제안하고자 한다. 이를 위하여, 2015년부터 2017년동안 생성된 차량고장 데이터를 수집하여 사례베이스를 구축하였고, 차원축소 기법인 비음수 행렬 인수분해(NMF), 잠재의미분석(LSA), Doc2Vec을 통해 고장의 특징을 추출하여 벡터 간의 코사인 거리를 측정하는 방식으로 유사 사례를 검색하였으며, 위의 알고리즘에 의해 제안된 조치내역들 간 성능을 비교하였다. 분석결과, 고장 내역의 키워드가 적은 경우의 유사 사례 검색과 조치 제안은 코사인 유사도를 직접 적용하는 경우에도 좋은 성능을 낸다는 것을 알 수 있었고 차원 축소 기법들의 성능 비교를 통해 문맥적 의미를 보존하는 차원 축소 방식 중 Doc2Vec을 적용하는 것이 가장 좋은 성능을 나타낸다는 것을 알 수 있었다. 텍스트 마이닝 기술은 여러 분야에서 활용을 위한 연구들이 이루어지고 있는 추세이나, 본 연구에서 활용하고자 하는 분야처럼 전문적인 용어들이 다수이고 데이터에 대한 접근이 제한적인 환경에서 이러한 텍스트 데이터를 활용한 연구는 아직 부족한 실정이다. 본 연구는 이러한 관점에서 키워드 기반의 사례 검색을 보완하고자 텍스트 마이닝 기법을 접목하여 고장의 특징을 추출하는 방식으로 사례를 검색해 조치를 제안하는 지능형 진단시스템을 제시하였다는 데에 의의가 있다. 이를 통해 현장에서 바로 사용 가능한 진단시스템을 단계적으로 개발하는데 기초자료로써 시사점을 제공할 수 있을 것으로 기대한다.

키워드 자동 생성에 대한 새로운 접근법: 역 벡터공간모델을 이용한 키워드 할당 방법 (A New Approach to Automatic Keyword Generation Using Inverse Vector Space Model)

  • 조원진;노상규;윤지영;박진수
    • Asia pacific journal of information systems
    • /
    • 제21권1호
    • /
    • pp.103-122
    • /
    • 2011
  • Recently, numerous documents have been made available electronically. Internet search engines and digital libraries commonly return query results containing hundreds or even thousands of documents. In this situation, it is virtually impossible for users to examine complete documents to determine whether they might be useful for them. For this reason, some on-line documents are accompanied by a list of keywords specified by the authors in an effort to guide the users by facilitating the filtering process. In this way, a set of keywords is often considered a condensed version of the whole document and therefore plays an important role for document retrieval, Web page retrieval, document clustering, summarization, text mining, and so on. Since many academic journals ask the authors to provide a list of five or six keywords on the first page of an article, keywords are most familiar in the context of journal articles. However, many other types of documents could not benefit from the use of keywords, including Web pages, email messages, news reports, magazine articles, and business papers. Although the potential benefit is large, the implementation itself is the obstacle; manually assigning keywords to all documents is a daunting task, or even impractical in that it is extremely tedious and time-consuming requiring a certain level of domain knowledge. Therefore, it is highly desirable to automate the keyword generation process. There are mainly two approaches to achieving this aim: keyword assignment approach and keyword extraction approach. Both approaches use machine learning methods and require, for training purposes, a set of documents with keywords already attached. In the former approach, there is a given set of vocabulary, and the aim is to match them to the texts. In other words, the keywords assignment approach seeks to select the words from a controlled vocabulary that best describes a document. Although this approach is domain dependent and is not easy to transfer and expand, it can generate implicit keywords that do not appear in a document. On the other hand, in the latter approach, the aim is to extract keywords with respect to their relevance in the text without prior vocabulary. In this approach, automatic keyword generation is treated as a classification task, and keywords are commonly extracted based on supervised learning techniques. Thus, keyword extraction algorithms classify candidate keywords in a document into positive or negative examples. Several systems such as Extractor and Kea were developed using keyword extraction approach. Most indicative words in a document are selected as keywords for that document and as a result, keywords extraction is limited to terms that appear in the document. Therefore, keywords extraction cannot generate implicit keywords that are not included in a document. According to the experiment results of Turney, about 64% to 90% of keywords assigned by the authors can be found in the full text of an article. Inversely, it also means that 10% to 36% of the keywords assigned by the authors do not appear in the article, which cannot be generated through keyword extraction algorithms. Our preliminary experiment result also shows that 37% of keywords assigned by the authors are not included in the full text. This is the reason why we have decided to adopt the keyword assignment approach. In this paper, we propose a new approach for automatic keyword assignment namely IVSM(Inverse Vector Space Model). The model is based on a vector space model. which is a conventional information retrieval model that represents documents and queries by vectors in a multidimensional space. IVSM generates an appropriate keyword set for a specific document by measuring the distance between the document and the keyword sets. The keyword assignment process of IVSM is as follows: (1) calculating the vector length of each keyword set based on each keyword weight; (2) preprocessing and parsing a target document that does not have keywords; (3) calculating the vector length of the target document based on the term frequency; (4) measuring the cosine similarity between each keyword set and the target document; and (5) generating keywords that have high similarity scores. Two keyword generation systems were implemented applying IVSM: IVSM system for Web-based community service and stand-alone IVSM system. Firstly, the IVSM system is implemented in a community service for sharing knowledge and opinions on current trends such as fashion, movies, social problems, and health information. The stand-alone IVSM system is dedicated to generating keywords for academic papers, and, indeed, it has been tested through a number of academic papers including those published by the Korean Association of Shipping and Logistics, the Korea Research Academy of Distribution Information, the Korea Logistics Society, the Korea Logistics Research Association, and the Korea Port Economic Association. We measured the performance of IVSM by the number of matches between the IVSM-generated keywords and the author-assigned keywords. According to our experiment, the precisions of IVSM applied to Web-based community service and academic journals were 0.75 and 0.71, respectively. The performance of both systems is much better than that of baseline systems that generate keywords based on simple probability. Also, IVSM shows comparable performance to Extractor that is a representative system of keyword extraction approach developed by Turney. As electronic documents increase, we expect that IVSM proposed in this paper can be applied to many electronic documents in Web-based community and digital library.

표식유전자를 이용한 담배와 감자의 원형질체 융합 (Protoplast Fusion of Nicotiana glauca and Solanum tuberosum Using Selectable Marker Genes)

  • 박태은;정해준
    • 자연과학논문집
    • /
    • 제4권
    • /
    • pp.103-142
    • /
    • 1991
  • 표식 유전자를 이용하여 체세포 잡종체를 선발하기 위한 연구의 일환으로 감자조직에는 T-DNA를 도입하여 식물호르몬 무첨가 배지에서도 생장가능한 형질전환체을 획득하고, 담배조직에는 NPT H gene을 도입하여 kanamycin에 대해서 저항성을 나타내는 형질전환체를 획득하여 각각의 특성구명과 원형질체를 유리하여 도입된 유전자 marker를 이용해서 융합을 시도한 바 그 결과는 다음과 같다. 1. 감자 괴경에서 Agrobacterium tumefaciens Ach5와 A. rhizogenes ATCC15834를 접종하여 crown gall tumor 및 hairy root를 유기하였으며 이러한 tumor조직은 식물 호르몬 무첨가 배지에서 생장이 가능하였다. 2. 감자에서 유기된 hairy root로부터 callus 형성은 2.4-D 2mg/1 첨가된 MS 배지에서 가장 양호하였으며 casein hydrolysate 1g/1가 첨가하면 유연 한 callus의 증식이 더욱 왕성하였다. 3. Activated charcoal이 0.5~2.0g/1 첨가된 배지에서는 crown gall tumor callus의 절단면이 갈변되는 것을 방지 할 수 있어 생존률을 높일 수 있었으나 hairy root에서는 갈변되어 고사되었다. 4. 2, 4-D 2mg/1와 casein hydrolysate 1g/1를 첨가한 배지에 hairy root callus를 현탁배의한 결과 양호한 많은 callus 덩어리들을 단시간에 얻을 수 있었다. 5. $Tri^-$parental mating으로 NPTII gene이 coding되어있는 binary vector인 pGA643을 wild type 및 disarmid된 Agrobacterium 내에 도입하여 Agrobacterium tumefaciens Ach5/pGA643, A.tumefaciens $A_4T$/pGA643, A. tumefaciens LBA4404/pGA643를 획득하였다. 이 세 개의 conjugant를 사용하여 0.7% agarose gel 상에서 pGA643을 확인하였다. 6. pGA643이 도입왼 Agrobacterium tumefaciens LBA4404와 담배 조직과 동시배양하여 kanamycin $100\mug$/ml 첨가된 배지에 생존하는 callus를 선발하였으며 동일배지에서 callus의 증식이 가능하였다. 7.형질전환된 담배 callus로부터 식물체 형성은 BA 2mg/1를 첨가한 배지에서 가능하였다. 8. 재분화된 담배의 엽조직은 kanamycin.이 $1000\mug$/ml 첨가된 MS 배지에서도 왕성히 callus가 유기되어, 이는 재분화체에서도 NPTII gene이 그대로 유지되고 있음을 확인할 수 있었다. 9. 담배의 정상 shoot와 형질전환된 shoot를 kanamycin이 $100\mug$/ml이 함유된 MS배지에 기내삽목한 결과, 정상 shoot는 발근이 되지 않고 황화 되었으나 형질전환된 shoot는 발근이되었으며 정상적으로 생장을 하였다. 10. 감자의 T-DNA가 도입된 현탁배양 callus는 cellulase 2%, macerozyme 2%, dricelase 1%에서 양호하게 유리되었다. 11. Osmoticum으로서 mannitol 농도 0.8M에서 담배와 감자의 두 조직 모두 원형질체유리가 가장 효과적이었다. 생존력은 T-DNA가 도입된 감자의 hairy root를 callus로 탈분화 시킨 후 현탁배양한 callus가 mannitol 0.5M에서 97%를 나타냈고, 그리고 NPTII gene이 도입된 담배의 엽조직은 mannitol 0.7M에서 94%로 최고를 타나냈다. 12. 원형질체 융합은 PEG solution 처리 15분 후부터 관찰되기 시작하여 20분에 완전히 융합되었고, 융합된 원형질체는 선발 marker인 호르몬 무첨가 및 kanamycin 첨가배지에서 배양 5일 후에 세포벽이 재생되었으며 4주일 후부터 colony들이 관찰되었다.

  • PDF

폐상피세포에서 Triptolide에 의한 NF-${\kappa}B$ 의존성 IL-8 유전자 전사활성 억제기전 (Triptolide-induced Transrepression of IL-8 NF-${\kappa}B$ in Lung Epithelial Cells)

  • 지영구;김윤섭;윤세영;김용호;최은경;박재석;김건열;채기남;곽상준;이계영
    • Tuberculosis and Respiratory Diseases
    • /
    • 제50권1호
    • /
    • pp.52-66
    • /
    • 2001
  • 연구배경 : 폐상피세포가 능동적으로 IL-8을 분비한다는 것은 주지의 사실이다. NF-${\kappa}B$는 IL-8 발현 조절에 있어서 가장 중요한 역할을 담당하는 전사인자이다. Triptolide는 최근 밝혀진 NF-${\kappa}B$ 억제제로서 중국한약제인 뇌공등 (Tripterygium Wilfordii)에서 추출된약제이다. 연자들은 새로운 NF-${\kappa}B$ 억제제인 triptolide가 폐상피세포에서 NF-${\kappa}B$ 의존성 IL-8 유전자의triptolide가 염증성 폐질환에서 새로운 치료제로서의 가능성을 확인하기 위하여 본 연구를 시행하였다. 방법 : 폐상피세포로서 A549 사용하였고 triptolide는 미국의 Pharamagenesis(Palo Alto, CA)사로부터 제공받았다. NF-${\kappa}B$ 활성유도물질로는 IL-$1{\beta}$(R&D)와 PMA(Sigma)를 이용하였다. IL-8 유전자의 발현은 RT-PCR과 ELISA를 이용하여 측정 하였다. NF-${\kappa}B$의존성 IL-8 유전자의 전사활성을 평가하기 위하여는 IL-8 NF-${\kappa}B$ luciferase construct를 안정적으로 유전자주입한 A549 IL-8 NF-${\kappa}B$ luciferase 세포주를 제조해 사용하였고 NF-${\kappa}B$ DNA 결합은 electromobility shift assay(EMSA)를 이용하였다. p65 전사활성을 assay하기 위해서는 Gal4-p65 fusion protein expression system을 유전자주입과 luciferase assay를 통하여 시행하였다. Transcriptional coactivator의 역할을 규명 하가 위하여서는 CBP(CREB-binding protein)와 SRC-1(steroid receptor coactivator-1) 발현 벡터를 유전자 주입하고 luciferase assay를 이용하여 확인하였다. 결과 : Luciferase assay로 triptolide가 PMA와 IL-$1{\beta}$자극에 의한 IL-8 NF-${\kappa}B$ 활성을 의미있게 감소시킴을 확인하였다. IL-8 ELISA와 RT-PCR로 triptolide가 PMA와 IL-$1{\beta}$ 자극에 의해 유도되는 IL-8 발현을 각각 단백질과 mRNA 수준에서 억제함을 관찰하였다. Triptolide가 PMA와 IL-$1{\beta}$에 의한 IL-8 NF-${\kappa}B$의 전사활성을 억제시킨 반면 EMSA와 $I{\kappa}B{\alpha}$ Western blot을 이용한 실험에서는 triptolide가 NF-${\kappa}B$ DNA 결합과 $I{\kappa}B{\alpha}$의 분해에 전혀 영향을 미치지 못함을 확인하였다. 이러한 전사활성 억제와 DNA 결합 간의 불일치의 원인으로서는 DNA 결합 이후에 발생하는 핵내 에서의 transactivation에 triptolide가 영향을 미치리라고 생각되어 p65 transactivation study를 Gal4-p65T A(p65의 transactivation domain) fusion protein 발현 시스템과 luciferase assay를 이용하여 시행한 결과 triptolide가 p65 transactivation을 억제함으로써 NF-${\kappa}B$를 억제함을 확인하였다. 그러나 CBP나 SRC-1과 같은 coactivator의 역할을 규명하기 위한 유전자주입 실험에서 triptolide에 의한 p65 transactivation 억제에 대해 CBP나 SRC-1의 과발현이 별다른 영향을 미치지 못하였다. 결론 : Triptolide는 폐상피세포에서 NF-${\kappa}B$ 의존성 IL-8 유전자의 전사활성을 억제하고 그 기전은 $I{\kappa}B{\alpha}$ 경로가 아닌 핵내에서의 p65 transactivation 억제에 의해 발생하며 이에는 CBP나 SRC-1과 같은 coactivator가 관여하지 않음을 확인하였다.

  • PDF

회사채 신용등급 예측을 위한 SVM 앙상블학습 (Ensemble Learning with Support Vector Machines for Bond Rating)

  • 김명종
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.29-45
    • /
    • 2012
  • 회사채 신용등급은 투자자의 입장에서는 수익률 결정의 중요한 요소이며 기업의 입장에서는 자본비용 및 기업 가치와 관련된 중요한 재무의사결정사항으로 정교한 신용등급 예측 모형의 개발은 재무 및 회계 분야에서 오랫동안 전통적인 연구 주제가 되어왔다. 그러나, 회사채 신용등급 예측 모형의 성과와 관련된 가장 중요한 문제는 등급별 데이터의 불균형 문제이다. 예측 문제에 있어서 데이터 불균형(Data imbalance) 은 사용되는 표본이 특정 범주에 편중되었을 때 나타난다. 데이터 불균형이 심화됨에 따라 범주 사이의 분류경계영역이 왜곡되므로 분류자의 학습성과가 저하되게 된다. 본 연구에서는 데이터 불균형 문제가 존재하는 다분류 문제를 효과적으로 해결하기 위한 다분류 기하평균 부스팅 기법 (Multiclass Geometric Mean-based Boosting MGM-Boost)을 제안하고자 한다. MGM-Boost 알고리즘은 부스팅 알고리즘에 기하평균 개념을 도입한 것으로 오분류된 표본에 대한 학습을 강화할 수 있으며 불균형 분포를 보이는 각 범주의 예측정확도를 동시에 고려한 학습이 가능하다는 장점이 있다. 회사채 신용등급 예측문제를 활용하여 MGM-Boost의 성과를 검증한 결과 SVM 및 AdaBoost 기법과 비교하여 통계적으로 유의적인 성과개선 효과를 보여주었으며 데이터 불균형 하에서도 벤치마킹 모형과 비교하여 견고한 학습성과를 나타냈다.

뉴럴 텐서 네트워크 기반 주식 개별종목 지식개체명 추출 방법에 관한 연구 (A Study on Knowledge Entity Extraction Method for Individual Stocks Based on Neural Tensor Network)

  • 양윤석;이현준;오경주
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.25-38
    • /
    • 2019
  • 정보화 시대의 넘쳐나는 콘텐츠들 속에서 사용자의 관심과 요구에 맞는 양질의 정보를 선별해내는 과정은 세대를 거듭할수록 더욱 중요해지고 있다. 정보의 홍수 속에서 사용자의 정보 요구를 단순한 문자열로 인식하지 않고, 의미적으로 파악하여 검색결과에 사용자 의도를 더 정확하게 반영하고자 하는 노력이 이루어지고 있다. 구글이나 마이크로소프트와 같은 대형 IT 기업들도 시멘틱 기술을 기반으로 사용자에게 만족도와 편의성을 제공하는 검색엔진 및 지식기반기술의 개발에 집중하고 있다. 특히 금융 분야는 끊임없이 방대한 새로운 정보가 발생하며 초기의 정보일수록 큰 가치를 지녀 텍스트 데이터 분석과 관련된 연구의 효용성과 발전 가능성이 기대되는 분야 중 하나이다. 따라서, 본 연구는 주식 관련 정보검색의 시멘틱 성능을 향상시키기 위해 주식 개별종목을 대상으로 뉴럴 텐서 네트워크를 활용한 지식 개체명 추출과 이에 대한 성능평가를 시도하고자 한다. 뉴럴 텐서 네트워크 관련 기존 주요 연구들이 추론을 통해 지식 개체명들 사이의 관계 탐색을 주로 목표로 하였다면, 본 연구는 주식 개별종목과 관련이 있는 지식 개체명 자체의 추출을 주목적으로 한다. 기존 관련 연구의 문제점들을 해결하고 모형의 실효성과 현실성을 높이기 위한 다양한 데이터 처리 방법이 모형설계 과정에서 적용되며, 객관적인 성능 평가를 위한 실증 분석 결과와 분석 내용을 제시한다. 2017년 5월 30일부터 2018년 5월 21일 사이에 발생한 전문가 리포트를 대상으로 실증 분석을 진행한 결과, 제시된 모형을 통해 추출된 개체명들은 개별종목이 이름을 약 69% 정확도로 예측하였다. 이러한 결과는 본 연구에서 제시하는 모형의 활용 가능성을 보여주고 있으며, 후속 연구와 모형 개선을 통한 성과의 제고가 가능하다는 것을 의미한다. 마지막으로 종목명 예측 테스트를 통해 본 연구에서 제시한 학습 방법이 새로운 텍스트 정보를 의미적으로 접근하여 관련주식 종목과 매칭시키는 목적으로 사용될 수 있는 가능성을 확인하였다.

체력단련(體力鍛練)이 심전도파고(心電圖波高)와 QRS벡타에 미치는 효과(效果) (Effect of Physical Training on Electrocardiographic Amplitudes and the QRS Vector)

  • 유완식;황수관;김형진;주영은
    • The Korean Journal of Physiology
    • /
    • 제18권1호
    • /
    • pp.51-65
    • /
    • 1984
  • 장기간(長期間) 체력단련(體力鍛鍊)이 심전도파고(心電圖波高) 및 심전도(心電圖) vector에 미치는 효과(效果)를 구명(究明)하고자 10명(名)의 운동선수군(運動選手群)과 13명(名)의 비운동선수군(非運動選手群)에서 rebounder운동전후(運動前後)의 심전도파고(心電圖波高)와 QRS vector의 길이를 측정(測定)하여 분절(分折)한 결과(結果)는 다음과 같다. 심전도파고(心電圖波高)에서 R파고(波高)는 선수군(選手群)이 $23.38{\pm}1.14\;mm$로서 비선수군(非選手群)의 $17.91{\pm}2.00$\;mm$에 비(比)해 유의(有意)하게 높았고, 운동후(運動後)에도 선수군(選手群)이 계속(繼續) 유의(有意)하게 높았다. S파고(波高)는 양군(兩群) 모두 운동후(運動後)는 안정시(安靜時)에 비(比)해 유의(有意)하게 높았으며, T파고(波高)는 운동후(運動後) 감소(減少)하였다. P파고(波高)는 양군(兩群) 모두 운동후(運動後) 증가(增加)하였으며 선수군(選手群)이 다소 낮았다. PQ분절(分節)의 파고(波高)는 선수군(選手群)은 0인데 비(比)해 비선수군(非選手群)은 negative를 나타냈으며 운동후(運動後)에 유의(有意)하게 감소(減少)하였다. J점(點)은 양군(兩群) 모두 안정시(安靜時) positive에서 운동후(運動後) 유의(有意)하게 감소(減少)하여 negative를 나타냈고, J+0.08초(秒)도 운동후(運動後) 양군(兩群) 모두 감소(減少)하였으며 선수군(選手群)이 다소 높았다. 그러므로 ST분절(分節)은 운동후(運動後) 감소(減少)함을 알 수 있다. $Rv_5$$Sv_1$의 합(合)은 선수군(選手群)이 $38.74{\pm}2.71\;mm$로서 비선수군(非選手群)의 $32.28{\pm}2.90\;mm$에 비(比)해 높았으며 운동후(運動後)에도 선수군(選手群)이 유의(有意)하게 높았다. QRS vector 각도(角度)에서 Frontal plane에서 선수군(選手群)이 $62.7{\pm}7.36^{\circ}$로서 비선수군(非選手群)과 별(別) 차이(差異)가 없었고, horizontalplane에서는 선수군(選手群)이 $-23.5{\pm}7.2^{\circ}$로서 비선수군(非選手群)의 $-38.8{\pm}8.2^{\circ}$에 비(比)해 유의(有意)하게 높았으며 운동후(運動後) 양군(兩群) 모두 유의(有意)하게 높았다. QRS vector 길이에서 Frontal plane에서 선수군(選手群)이 $13.86{\pm}1.44\;mm$로서 비선수군(非選手群)의 $9.62{\pm}0.97\;mm$에 비(比)해 유의(有意)하게 높았으며 운동후(運動後)에도 유의(有意)하게 높았다. Horizontal plane에서도 선수군(選手群)이 $19.82{\pm}2.10\;mm$로서 비선수군(非選手群)의 $16.90{\pm}1.39\;mm$에 비(比)해 유의(有意)하게 높았고 운동후(運動後)에도 선수군(選手群)이 유의(有意)하게 높았다. 이상(以上)을 종합(綜合)해 보면 선수군(選手群)의 R파고(波高)가 비선수군(非選手群)에 비(比)해 운동후(運動後) 계속(繼續) 유의(有意)하게 높았고, $Rv_5$$Sv_1$파고(波高)의 합(合)이 38.74mm정도(程度)로 좌심실(左心室)이 비대(肥大)함을 알 수 있으며, 선수군(選手群)의 PQ분절파고(分節波高)와 ST분절(分節) 파고(波高)가 비선수군(非選手群)에 비(比)해 높고 운동후(運動後)에 양군(兩群) 모두 감소(減少)한 점(點)은 주목(注目)할만한 사실(事實)이며, 특(特)히 선수군(選手群)의 QRS vector의 길이가 모두 비선수군(非選手群)에 비(比)해 유의(有意)하게 긴점등(點等)으로 좌심실기능(左心室機能)이 우수(優秀)한 스포츠심장(心臟)임을 알 수 있으며, 선수군(選手群)과 비선수군(非選手群)을 평가(評價)할 수 있는 중요(重要)한 지표(指標)가 될 것으로 사료(思料)되는 바이다.

  • PDF

한국에서의 벼 줄무늬잎마름병의 발생, 피해, 기주범위, 전염 및 방제에 관한 연구 (Studies on the Occurrence, Host Range, Transmission, and Control of Rice Stripe Disease in Korea)

  • 정봉조
    • 한국응용곤충학회지
    • /
    • 제13권4호
    • /
    • pp.181-204
    • /
    • 1974
  • 우리나라에서의 벼 줄무늬잎마름병의 발생, 피해, 기생범위, 전염 및 방제에 관하여 1965년부터, 1974년까지 실시한 연구결과를 다음과 같이 보고한다. 1. 발생 못자리에서 줄무늬잎마름병의 피해는 $1.3-8\%$였고 포장에서는 입도중의 발병주율보다 재생도에서의 발생율이 높았으며 보통기재배보다도 조기재배에서 발병이 많았다. 또 포장에서 발병주의 분포는 대체로 휴반가까이에 많은 경향이었다. 벼 엽기별 피해에서 라병성인 일본계 벼의 경우 못자리 때인 3엽기에서 7엽기까지는 감염되면 $100\%$ 고사하였으며 9엽기에서는 $50\%$, 11엽기는 $20\%$, 13엽기 이후에는 고사주를 볼 수 없었다. 참복기간은 3-7엽기에서는 7-15일이었고 9-15엽기에서는 15-30일이었다. 저항성인 통일벼의 경우 1.5-5엽기 접종구는 비교적 발병이 많았으나 9엽기 이후부터는 현저히 떨어져 15엽기 이후는 발병을 거의 볼 수 없었다. 그리고 감염된 것은 초장이 짧고 등숙율과 임실비율이 떨어지는 경향이었다. 2. 기주범위 기주범위를 구명하기 위하여 작물과 목초 및 잡초 36종을 공시하여 아래와 같이 21종의 기주를 밝혀 내었다. 작물: 벼, 보리, 밀 , 귀리, 라이맥, 조, 옥수수, 기장, 참피 목초: 티모시, 빗살대, 이타리안라이그라스, 패래니 알라이그라스, 죤슨그라스, 슈단그라스 잡초 : 들피, 겨피, 방울피, 잠자리피, 개미피, 바랭이, 민바랭이, 좀바랭이, 방동사니대가리, 강아지풀, 비노리, 참새, 포아풀, 독새풀, 우산대바랭이, 개보리, 겨풀, 쇠풀, 조개풀, 넓은 잎 개수염은 새로운 기주로 밝혀졌다. 3. 충매전염 우리나라의 애멸구화기는 5회였으며 수원에서의 제2회성충 최성기는 6월 20일 경이고 제3회성충 최성기는 7월 30일 경이었다. 진주는 수원보다 제2회성충 최성기가 5-7일 빨랐고 진주에서는 제3회성충 최성기의 발생량이 많은 것이 달랐다. 애멸구 세대별 보독충율은 월동약충이 $10-15\%$였고 제1세대유충은 $9\%$, 제2회성충은 $17\%$, 제2세대유충은 $8\%$, 나머지 화기에서는 약 $10\%$였는데 보독충율은 남부지방보다 높은 경향이었다. 1966년부터 1970년생 사이의 애멸구 보독충율은 해에 따라 다소 차가 있었으며 화기별로는 제2회성충과 제3회성충의 보독충율이 높았다. 분리한 애멸구보독충을 재분리하여 이를 교배하였더니 차대에서는 보독충율이 $90\%$인 애멸구를 얻을 수 있었으며 애멸구충령별로는 3, 4, 5령충의 감염능력이 높았고 애멸구 무독충의 바이러스 재획득율은 평균$7.9\%$였고 여기에서 얻어진 친화성계통이라 할지라고 3회접종시험결과 계속하여 3회까지 벼에 바이러스를 매개하지 않았다. 또 애멸구보독충의 감염최적온도는 $25-30^{\circ}C$였으며, $15^{\circ}C$이하에는 감염이 일어나지 않을때도 있었다. 그리고 애멸구기생봉의 기생율은 6월부터 8월말까지 $5-48\%$였으며 7월 10일경이 $32-48\%$로서 가장 높았다.

  • PDF