• Title/Summary/Keyword: 상호정보 추출

Search Result 769, Processing Time 0.029 seconds

Construction of the Aging Related Gene Database using Text-mining (서지분석을 통한 노화 관련 유전자 정보 데이터베이스 구축)

  • Yu, Seok Jong;Park, Junho;Yoo, Jaesoo
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2013.05a
    • /
    • pp.41-42
    • /
    • 2013
  • 최근 노령화가 급속히 진행되면서 노화에 대한 연구가 활발히 진행되고 있다. 하지만 노화현상은 광범위한 표현형을 지니고 있는 생명현상으로 이에 대한 체계적인 연구를 지원하기 위한 웹포털 사이트가 필요한 실정이다. 특히 노화에 따른 질병과의 연관성 및 관련 유전자에 대한 정보를 수집하고 이를 체계적으로 분석할 수 있는 통합정보시스템은 향후 노화연구를 지원하기 위한 가장 핵심적인 요소라고 할 수 있다. 본 연구에서는 기존 노화와 관련된 461개의 유전자를 기반으로 관련된 질병과의 연관성을 OMIM 데이터베이스를 활용하여 분석하였다. 또한 관련 단백질의 기능을 GO데이터베이스 분석을 통해 유전자의 기능을 분석하였다. Pubmed에서 제공하는 노화관련 논문들의 MeSH 정보 분석을 통해서 노화와 관련된 용어를 분석하였다. 노화와 관련된 64개의 유전자를 키워드로 NCBI의 pubmed 데이터베이스로부터 관련논문을 다운로드 받아 생물학적 상호작용 정보를 추출했다. 생물학적 상호작용은 NCBI에서 제공하는 Metamap 데이터베이스를 기반으로 각각의 생물학적 용어를 정의했다. 현재 노화 유전자 64개에 대해 128,729개의 생물학적 상호작용 정보를 추출했고, 8대 노인성만성질환에 대해 301,176개의 생물학적 상호작용 정보를 추출하였다.

  • PDF

Dialogue Relation Extraction using Dialogue Graph (상호참조 정보와 대화 그래프를 활용한 대화 관계추출 모델)

  • Jungwoo Lim;Junyoung Son;Jinsung Kim;Yuna Hur;Jaehyung Seo;Yoonna Jang;JeongBae Park;Heuiseok Lim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.385-390
    • /
    • 2022
  • 관계추출은 문서 혹은 문장에서 자동으로 엔티티들간의 관계를 추출하는 기술로, 비정형 데이터를 정형데이터로 변환하기에 자연어 처리 중에서도 중요한 분야중 하나이다. 그 중에서도 대화 관계추출은 기존의 문장 단위의 관계추출과는 다르게 긴 길이에 비해 적은 정보의 양, 빈번하게 등장하는 지시대명사 등의 특징을 가지고 있어 주어와 목적어 사이의 관계를 예측하기에 어려움이 있었다. 본 연구에서는 이러한 어려움을 극복하기 위해 대화의 특성을 고려한 대화 그래프를 구축하고 이를 이용한 모델을 제안한다. 제안하는 모델은 상호참조 정보와 문맥정보를 더 반영한 그래프를 통해 산발적으로 퍼져있는 정보를 효율적으로 수집하고, 지시대명사로 인해 어려워진 중요 발화 파악 능력을 증진시켰다. 또한 이를 실험적으로 보이기 위하여 대화 관계추출 데이터셋에 실험해본 결과, 기존 베이스라인 보다 약 10 % 이상의 높은 F1점수를 달성하였다.

  • PDF

Prediction of Protein Interactions using the Associative Feature Concept Space Mapping (연관속성개념공간으로의 사상을 이용한 단백질 상호작용 예측)

  • Eom Jae-Hong;Zhang Byoung-Tak
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06a
    • /
    • pp.73-75
    • /
    • 2006
  • 생물체 내에서 중요 생물학적 기능을 수행하는 기본 단위인 단백질 및 이들의 상호작용 대한 많은 연구가 이루어져 다양한 생물체에 대한 단백질 상호작용 데이터베이스가 구축되었다. 본 논문에서는 효모에 대해 공개되어있는 단백질 상호작용 데이터를 이용하여 새로운 단백질 상호작용을 예측하는 방법을 제안한다. 논문에서는 문헌에서 연관 정보를 효율적으로 찾아내기 위하여 제안된 연관개념공간 탐색 방법을 확장하여 단백질 상호작용 예측에 사용한다. 단백질들은 각각이 가지는 다양한 속성들의 벡터로 간주되며, 상호작용은 해당 단백질들의 연관성을 통해 이루어지는 것으로 표현된다. 상호작용하는 두 단백질들의 속성은 단어의 공동 출현과 같이 고려되어 단백질 상호작용은 두 단백질 벡터의 요소로 표현되고 벡터의 요소 속성들 간의 연관성을 표현하기 위해 연관속성개념공간으로 사상되어 공간상의 거리 기반으로 연관속성을 추출한다. 추출된 연관속성을 최대로 포함하는 단백질들 간의 상호작용을 예측하는 방식으로 단백질 상호작용을 예측한다. 논문에서 제안한 방법은 효모의 단백질 상호작용 예측에 대해 평균 약 91.8%의 예측 정확도를 보여, 연관속성개념공간을 이용한 방법이 단백질 상호작용을 예측하는 또 다른 대안으로 사용 될 수 있음을 확인하였다.

  • PDF

High performance Algorithm for extracting and redicting MAP Kinase signaling pathways based on S. cerevisiae rotein-Protein Interaction and Protein location Information (S. cerevisiae 단백질간 상호작용과 세포 내 위치 정보를 활용한 MAP Kinase 신호전달경로추출 및 예측을 위한 고성능 알고리즘 연구)

  • Jo, Mi-Kyung;Kim, Min-Kyung;Park, Hyun-Seok
    • Journal of the Korea Society of Computer and Information
    • /
    • v.14 no.3
    • /
    • pp.193-207
    • /
    • 2009
  • Intracellular signal transduction is achieved by protein-protein interaction. In this paper, we suggest high performance algorithm based on Yeast protein-protein interaction and protein location information. We compare if pathways predicted with high valued weights indicate similar tendency with pathways provided in KEGG. Furthermore, we suggest extracted results, which can imply a discovery of new signaling pathways that is yet proven through experiments. This will be a good basis for research to discover new protein signaling pathways and unknown functions of established proteins.

The Study on the Model of Extracting Collocations from Corpus in Korean Using the Statistical Tools (통계 기법을 이용한 연어 추출 모형 연구)

  • Ahn, Sung-Min
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.162-165
    • /
    • 2010
  • 공기하여 나타나는 구 정보 중에서 언어에 대한 연구는 응용 언어학에 발전에 기여할 수 있는 부분이 크다. 연어란 어휘들 간의 제한된 결합 관계를 갖는 공기 확률이 높은 구 구성이다. 이러한 연어 구성에 대한 연구는 특히 기계 번역이나 사전 편찬 등의 분야에서 관심이 높아지고 있다. 본 연구에서는 언어를 추출하기 위해 T-test와 상호 정보, 조건 확률 등의 여러 통계 기법의 사용을 제시한다. 각 기법을 적용하였을 때 연어 추출에 어떠한 변화를 보이는지 조사하였고, 가장 적절한 기법의 적용도 모색함으로써 향후 언어 추출의 방향을 제시하고자 한다.

  • PDF

Automatic Gene Ontology Extension and Terminology Analysis (유전자 온톨로지의 자동 확장과 용어 분석)

  • 이진복;박종철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.229-231
    • /
    • 2002
  • 생물학 분야의 방대한 지식을 효율적으로 다루기 위하여 생물정보학이 주요한 연구 분야가 되었다. 이중 특히 생물학 문헌에서 정보를 자동으로 추출하는 연구가 활발히 진행되고 있는데, 이러한 정보추출 결과를 이용하여 유전자 온톨로지와 같은 유용한 지식베이스를 자동으로 확장함으로써 폭발적으로 증가하는 생물학 분야의 연구 결과들을 지식베이스에 통합할 수 있다. 자동으로 확장된 온톨로지는 신뢰성을 보장하기 위한 검증 과정을 거쳐, 정보추출 시스템의 성능을 향상시키기 위한 지식베이스로 사용되게 된다. 본 연구에서는 단백질 간의 상호작용에서 나타나는 조건을 추출하는 시스템과 유전자 온톨로지를 이용하여 추출된 생물학 용어를 분석하는 시스템을 제안하고 유전자 온톨로지의 자동 확장 및 검증 시스템에 대하여 논의한다.

  • PDF

Gesture based MTPC Interface (제스처 기반의 HTPC 인터페이스)

  • 권경수;김상호;장재식;김항준
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.715-717
    • /
    • 2004
  • 본 논문에서는 HTPC를 제어하기 위한 제스처 기반의 인터페이스를 제안한다. 제안된 인터페이스를 이용하여 사용자는 HTPC와 떨어진 장소에서 쉽게 HTPC를 제어할 수 있다. 제스처를 인식하기 위해 인터페이스는 실시간 연속 영상으로부터 사용자의 손을 검출하고, 손의 움직임, 모양, 위치 정보를 추출한다. 사용자의 제스처를 인식하기 위해 추출된 정보와 HMMs 을 사용한다. 실험 결과는 제안한 인터페이스가 멀티미디어 응용프로그램뿐만 아니라 다른 종류의 컴퓨터 응용프로그램에서 사용자와 HTPC간에 상호작용하여 접근할 수 있음을 보인다.

  • PDF

A Visualization and Inference System for Protein-Protein Interaction (단백질 상호작용 추론 및 가시화 시스템)

  • Lee Mi-Kyung;Kim Ki-Bong
    • Journal of KIISE:Software and Applications
    • /
    • v.31 no.12
    • /
    • pp.1602-1610
    • /
    • 2004
  • As various genome projects have produced enormous amount of biosequence data, functional sequence analysis in terms of tile nucleic acid and protein becomes very significant. In functional genomics and proteomics, the functional analysis of each individual gene and protein remains a big challenge. Contrary to traditional studies, which regard proteins as not components of a whole protein interaction network but individual entities, recent studies have focused on examining functions and roles of each individual gene and protein in view of a whole life system. In this regard, it has been recognized as an appropriate method to analyze protein function on the basis of synthetic information of its interaction and domain modularity. In this context, this paper introduces the PIVS (Protein-protein interaction Inference & Visualization System), which predicts the interaction relationship of input proteins by taking advantage of information on homology degree, domain modules which input sequences contain, and protein interaction relationship. The information on domain modules can increase the accuracy of the function and interaction relationship analysis in terms of the specificity and sensitivity.

Ortholog protein finding System based on protein sequence and interaction information. (서열 및 상호작용 정보를 활용한 이종간 유사 기능 단백질 추출)

  • 설영주;김민경;유성준;박선희
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.274-276
    • /
    • 2004
  • 단백질 간 상호작용은 생물체 내에서 발생하는 모든 생명 현상을 이루는 기본 단위로써, 이를 종 수준에서 밝히고자 하는 시도가 yeast와 초파리, Worm 등에서 보고되었다. 대량으로 존재하는 상호작용 데이터들은 종래에 서열로 시도되던 유연관계 비교 및 기능 유추 등에 기본 정보로 활용되고 있다. 본 연구에서는 다른 종에 속하는 동일 기능 단백질 즉, ortholog를 찾음에 있어, 기존의 서열 접근 방식 이외에 상호작용 정보론 추가로 사용하는 시스템을 고안하여 서열방식만을 활용하던 이전의 방식이 지니는 문제점을 극복하고자 하였다.

  • PDF

Extracting Isolated Components from Legacy Object-Oriented Programs (기존 프로그램에서의 독립 컴포넌트의 추출)

  • 윤석진;신규상
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10a
    • /
    • pp.520-522
    • /
    • 2001
  • 본 논문은 기존의 객체지향 방식으로 작성된 프로그램에서 독립(isolated) 컴포넌트를 추출하기 위한 방법을 제안한다. 독립 컴포넌트는 별도의 컴포넌트가 필요 없이 독자적으로 이용 가능한 컴포넌트를 말한다. 기존 프로그램에서 추출되는 독립 컴포넌트는 다른 응용프로그램 개발에 쉽게 사용될 수 있다. 본 논문에서 제시하는 추출 방법은 기존의 객체지향 프로그램을 분석하여 클래스 정보를 추출하고, 클래스 간의 의존 관계를 검사하여 상호의존성이 낮고 범용성이 높은 글래스 모듈을 선택하는 것이다. 대상 모듈의 범용성은 프로그램내에서 얼마나 많이 사공되는 가로 정의된다. 본 논문에서 제시하는 방법을 사용하여 컴포넌트를 자동으로 추출하는 시스템을 구축하고자 한다.

  • PDF