• 제목/요약/키워드: 바이오 문서

검색결과 164건 처리시간 0.026초

바이오 이벤트 추출을 위한 피쳐 개발 (Developing Features for Bio Event Extraction)

  • 이석준;김영태;황민국;임수종;나동열
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.39-44
    • /
    • 2013
  • 본 논문은 바이오 문서에서의 정보추출 시스템 개발에 대한 것이다. 이 시스템의 목표는 바이오 관련 문서에서 바이오 이벤트의 발생을 탐지하고 이벤트의 타입 및 이벤트에 관여된 필수 논항을 채우는 구문요소를 인식하는 것이다. 우리는 두 개의 별도의 단계를 이용하는 시스템 구성을 사용한다. 첫 단계에서는 SVM을 사용하여 이벤트의 발생 및 이벤트의 타입을 결정한다. 두 번째 단계에서는 이벤트의 논항을 채우는 참여자를 인식하는 작업을 한다. 본 논문은 단계 1에서 사용되는 SVM의 피쳐 리스트의 개발에 대한 문제를 다룬다. 본 논문에서 제안하는 피쳐 리스트를 사용하여 좋은 성능을 가지는 첫 단계에 대한 모듈을 얻을 수 있음을 관찰하였다.

  • PDF

바이오메디컬 데이터베이스 및 텍스트마이닝 기술의 비교 분석 및 전망 (Comparative analysis of Biomedical Databases and Text mining Technologies)

  • 조태원;이규범;강재우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.189-192
    • /
    • 2010
  • 분자 생물학을 통한 연구가 심화되면서, 생물학 정보는 기하급수적으로 늘어나고 있다. 그에 따라 바이오메디컬(생물학, 의학) 관련 논문들의 출판 및 등록 건수도 해마다 증가하고 있다. 그러나 바이오메디컬 문서들에서 유용한 정보를 추출하는 기술은 이러한 분야의 전문가 큐레이터(curator)에 의존한 경우가 많아서, 그 작업의 속도와 양적인 면에서 한계를 가지고 있다. 이러한 이유 때문에 바이오메디컬 문서를 기계학습을 통하여 분석하는 기법이 도입되기 시작하였다. 아직까지는 기계학습을 이용하여 구축된 데이터베이스가 소수에 불과하지만, 점차 증가하는 추세에 있다. 이러한 현 추이를 분석하고 향후의 추세를 예측하고자 텍스트마이닝 기술이 생물학과 의학 분야에서 어떻게 사용되며, 그 정보들이 어떻게 관리되는지 연구, 조사 하게 되었다. 현재 바이오메디컬 관련 데이터베이스들이 여러 기관 및 단체에 의해 구축 및 관리되고 있으며, 국가적인 프로젝트로서 이러한 데이터베이스들을 통합하는 과정을 진행하고 있다. 이처럼 국가기관의 주도하에 데이터베이스를 통합하여 관리하고자 하는 노력들이 계속되고 있어, 앞으로는 바이오메디컬 자료들을 검색하기가 보다 용이해질 것으로 생각된다. 텍스트마이닝을 이용하여 바이오메디컬 정보들을 추출하는 기술은 초기에는 공동 발생(co-occurence)과 같이 단순한 통계적 방법을 이용하였지만, 최근에는 다른 문서에서 추출된 정보와 기존의 정보들을 연계하여 새로운 정보를 추출해 내는 기법이 확산되고 있음을 알 수 있었다.

객체 데이터베이스를 이용한 바이오 XML 저장시스템 (The Bio-XML Storage System Using Object Database Systems)

  • 김태경;이경희;임정곤;정태성;조완섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.235-237
    • /
    • 2004
  • 본 논문은 객체 데이터베이스 속성을 적용하여 데이터베이스 스키마를 생성하고 XML문서를 저장하는 기법을 제안한다 기존의 관계형 데이터베이스는 트리 기반의 XML 문서를 플랫한 테이블에 저장하므로 모델 불일치 문제가 발생한다. 또한, 문서를 검색할 때 고비용의 조인 연산이 필요하다. 하지만 객체 데이터베이스의 집합값 속성과 객체참조 속성은 트리 기반의 IDA 문서를 저장할 때 모델 측면에서 자연스럽다. 집합간 속성과 객체참조 속성은 Uを질의에 자주 사용되는 경로질의 및 순서를 이용하는 질의를 처리할 때게도 유리하다. 본 논문에서는 객체 데이터베이스의 집합값 속성과 객체참조 속성을 이용하여 XML 문서를 저장하기 위한 2가지의 DTD의존적 스키마 설계 기법인 i) 기본 규칙, ii) 인라인 규칙을 제시한다. 다양한 XML 문서에 대해 각각의 규칙에 따른 클래스 수, 저장 공간, 그리고 질의처리 시간을 비교 분석하였다.

  • PDF

품질보증 시스템 핵심$\cdot$경영의 요체

  • 오종화
    • Bio news
    • /
    • 2호
    • /
    • pp.37-37
    • /
    • 2003
  • Documentation이라면 문서화 또는 문서관리라고 번역하고 있는데 문서를 작성하고 보관하고 필요할 때 추적, 검색할 수 있도록 하는 일체의 행위를 말한다. ISO에서는 document and data control 이라는 항을 두고 있지만 EU 및 WHO GMP에서는 Documentation이라는 좀 더 포괄적인 의미의 용어로 한 항목을 설정하고 있다. 물론 current GMP에서도 여러 가지 문서에 관하여 언급하고 있지만 따로 항목을 두지는 않

  • PDF

SMS : SBML 문서관리기 (SMS : An SBML Document Manager)

  • 임정곤;김태경;정태성;조완섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.334-336
    • /
    • 2004
  • 최근 이슈가 되고 있는 시스템 생물학(Systems Biology)은 생물학적인 이론과 컴퓨터의 계산적인 모델링 그리고 실험의 상호 의존적인 통합으로써 특징 지워진다. 그 중 컴퓨터의 계산적인 모델링에 대한 연구가 무엇보다 중요한 비중을 차지하고 있다. 하지만 계산적인 모델링에서 여러 자원을 통합하기 위한 공통의 기반 구조나 표준에 대한 연구는 미흡한 실정이다. 이러한 문제점을 해결하기 위해 XML 기반의 형식을 갖춘 SBML(Systems Biology Markup Language)이 시스템 생물학의 표준으로 개발되어 연구 중에 있다. 현재 개발 중인 시뮬레이션과 데이터 분석을 위한 다양한 옹용 어플리케이션이 이미 SBML 문서를 지원하고 있다 본 연구에서는 시스템 생물학 분야에서 SBML 표준에 대한 중요성을 인식하여, 객체지향 바이오 데이터베이스로부터 질의의 결과를 SBML 문서로 변환하고, 반대로 SBML 문서를 객체지향 데이터베이스에 저장하는 변환기를 제안하고자 한다.

  • PDF

온톨로지 기반 웹 문서 분류 (Ontology-Based Document Classification)

  • 송무희;임수연;민도식;강동진;이상조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.535-537
    • /
    • 2003
  • 본 논문에서는 웹 문서들이 가지는 용어 정보들과 어휘들의 의미구조를 계층적 형태로 표현한 온틀로지 기반 자동 문서분류 방법을 제안한다. 문서 분류는 문서들을 가장 잘 표현할 수 있는 자질들을 점하고 이러한 자질들을 통해 미리 정의된 2개 이상의 카테고리에 문서의 내용을 파악하여 가장 관련이 있는 카테고리로 할당하는 것이다. 본 논문에서는 웹 문서에서 추출한 용어 정보들의 유사도와 온톨로지 카테고리의 유사도를 계산하여 웹 문서를 분류하며, 문서 분류를 위한 실험데이터나 학습과정 없이 바로 실시간으로 문서분류가 이루어지며, 결과적으로 문서들이 가지는 고유한 의미와 관계의 식별을 통하여 보다 더 정확하게 문서분류를 가능하게 해준다.

  • PDF

온톨로지의 개념구조에 의한 웹페이지의 의미적 분류 (Semantic Classification of Web Pages using Ontology Concept Structure)

  • 송무희;임수연;박승배;강동진;이상조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2005년도 한국컴퓨터종합학술대회 논문집 Vol.32 No.1 (B)
    • /
    • pp.487-489
    • /
    • 2005
  • 본 논문에서는 온톨로지의 개념구조를 이용한 웹페이지의 의미적 분류방법을 제안한다. 웹 문서들이 가지는 용어 정보들과 어휘들 간의 개념 구조를 파악하여 온톨로지를 확장시키면서 이를 문서분류에 적용하여 의미적 분류가 이루어지게 한다. 문서 분류는 문서들을 가장 잘 표현할 수 있는 자질들을 정하고 이러한 자질들을 통해 미리 정의된 2개 이상의 카테고리에 문서의 내용을 파악하여 가장 관련이 있는 카테고리로 할당하는 것이다. 본 논문에서는 웹 문서에서 추출한 용어 정보들의 유사도와 온톨로지 카테고리의 유사도를 계산하여 웹 문서를 분류하여 문서 분류를 위한 실험데이터나 학습과정 없이 바로 실시간으로 문서분류가 이루어지며, 결과적으로 온톨로지와 문서들이 가지는 고유한 의미와 관계의 식별을 통하여 보다 더 정확하게 문서분류를 가능하게 해준다.

  • PDF

합성 알고리즘을 이용한 안전한 문서화상 전송체계에 관한 연구 (A study on secure transmission system for document image using mixing algorithm)

  • 박일남;이대영
    • 한국통신학회논문지
    • /
    • 제22권11호
    • /
    • pp.2552-2562
    • /
    • 1997
  • 본 논문에서는 문서 화상에 대한 합성에 의한 안전한 전송 체계를 제안한다. 이를 위해 앞서 제안한 바 있는 DM 및 RDM 알고리즘을 적용한다. 문서화상의 보안 체계는 문서 자체의 보안 뿐 아니라 문서의 무결성과 사용자의 정당성을 인증하기 위한 디지털 서명 체계가 포함된다. 디지털 서명된 보안 문서는 비보안 문서에 합성되고, 이는 합성 여부의 시각적 구분이 어려워 제 3자에게는 통상의 문서 교환으로 인식될 것이다.

  • PDF

자동분류를 이용한 정답문서집합 구축 (Construction of Answer Sets using Automatic Categorization)

  • 장문수;오효정;장명길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.494-499
    • /
    • 2001
  • 최근의 인터넷 정보검색은 방대한 정보의 수용과 지능적이고 개인화된 검색 결과 요구라는 사뭇 상반된 요구를 만족시켜야 한다. 기계적으로 키워드를 매칭시켜 나오는 문서를 사용자에게 맡기는 식의 검색은 더 이상 환영을 받지 못한다. 우리는 이러한 추세에 맞추어 의미기반 정보검색에 필요한 개념망과 정답문서집합으로 구성된 지식베이스를 제안한 바 있다. 본 논문에서는 방대한 구조의 개념망과 연결되는 정답문서집합을 유동적인 인터넷 환경에 적용하기 위해 자동으로 구축하는 시스템을 제시한다. 자동구축은 문서분류(document categorization) 기술을 활용하여 개념어에 문서를 할당하는 방법과 속성에 문서를 할당하는 방법으로 나누어 이루어진다. 제시한 방법은 실험을 통하여 기본적인 속성 할당에는 상당한 효과가 있는 것으로 판단되었고, 일부 미할당 문서에 대해서는 클러스터링과 같은 다른 알고리즘이 필요하다.

  • PDF

능동문서: 서식설계자의 의도가 내장된 프로그램 (Active Documents: Another Kind of Program Implying Intention of Form Designers)

  • 남철기;배재학;유해영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (상)
    • /
    • pp.353-356
    • /
    • 2003
  • 인터넷 기반의 많은 응용이 문서중심의 컴퓨팅 모델로 전환되고 있다. 문서는 문서설계자의 의도를 함축하고 있으며 이는 업무처리 과정의 자동화에 적극적으로 활용될 수 있다. 이러한 무서의 본질 파악을 통해 본 논문에서는 문서를 실행 가능한 컴퓨터 프로그램의 시각으로 접근한다. 이를 위해 서식, 데이터, 규칙 그리고, 질의로 구성되는 능동문서 모델을 제시한다. 모델의 각 요소는 문서의 재사용성과 상호 운영성을 위해 XML로 일관되게 표현된다. 능동문서는 사용자 인터페이스를 제공하는 수동적인 역할뿐만 아니라 문서설계자가 의도하는 문서처리 절차와 업무규칙을 기계가 읽고 추론하여 처리할 수 있는 문서이다. 이를 통해 문서와 기계가 상호작용을 할 수 있으며 다른 응용 프로그램과 협력할 수도 있다. 이러한 능동문서의 적용 가능함을 보이기 위해 기업가거래(B2B) 시스템에서 구매주문 처리의 예를 보였다. 요컨대 본 논문에서 제시한 능동문서는 지식표현 및 처리기능이 내장되어 있는 바, 문서중심의 지능적인 응용프로그램 개발을 가속화하는 토대를 마련할 수 있을 것으로 기대한다.

  • PDF