• 제목/요약/키워드: 서열 관리

검색결과 129건 처리시간 0.022초

온톨로지를 이용한 서열정보분석 데이터베이스 구축 시스템 설계 (System Design for Building Sequence Information Analysis Databases using Ontology)

  • 이선아;전중남;이건명
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (상)
    • /
    • pp.385-388
    • /
    • 2002
  • 인터넷과 첨단 기술의 발달로 생물학적 정보에 대한 온라인 데이터베이스들이 급증하고 있으나, 데이터가 방대하고 형식이 다양하여 생물학자들이 정보를 얻는데 많은 어려움이 있다. 본 논문에서는 단백질과 핵산 정보를 제공하는 NCBI에서, 사용자가 질의에 따른 웹 문서로부터 정보를 추출하여 사용자의 특성에 따른 데이터베이스를 구축, 관리하여 주는 시스템을 제안한다. 온톨로지를 이용하여 질의의 모호성을 보완한다. 웹 문서로부터 추출된 데이터를 저장하는 단계에서도 데이터의 특징, 사용빈도에 따라 테이블을 분류하여 관리함으로써 검색과 관리의 효율성을 높인다. 본 논문은 서열정보 분석을 하는 생물학 연구자들에게 데이터베이스를 쉽게 구축하고 서열정보를 분석하기 좋은 인터페이스를 제공하는 것을 목적으로 한다.

  • PDF

시장위험관리와 감사품질의 융합을 통한 공정가치 서열체계의 자본비용에 미치는 영향에 대한 연구 (A Study on the Effect of Fair Value Hierarchy upon Cost of Capital Through the Convergence of Market Risk Management and Audit Quality)

  • 오현택
    • 한국융합학회논문지
    • /
    • 제6권5호
    • /
    • pp.1-8
    • /
    • 2015
  • 공정가치 서열체계 정보는 각 수준에 따라 측정오류의 발생가능성과 정보비대칭 정도, 그리고 내포된 정보 위험이 다를 것으로 예상된다. 따라서 본 연구에서는 수준별 공정가치 서열체계 정보가 기업의 자본비용에 어떤 차별적인 영향을 미치는지 살펴본다. 2011년부터 2014년까지 한국주식시장에 상장된 기업들을 대상으로 실증 분석한 결과, 수준 1과 수준 2의 공정가치 변수의 회귀계수 값은 자본비용 유형에 따라 크기의 순위가 바뀌었지만, 수준 3의 회귀계수는 모든 자본비용 변수에 대하여 가장 큰 회귀계수 값을 가지는 것으로 나타났다. 또한 기업의 시장위험 관리 수준과 감사품질에 따라 공정가치 서열체계에 따른 자본비용의 관련성이 어떻게 달라지는 가를 추가적으로 분석하였으나 일관성 있는 결과를 얻을 수 없었다. 그러나 시장위험관리와 감사품질 변수를 융합하여, 동시적인 상호작용 효과를 분석한 결과, 시장위험관리 수준이 높고 감사품질이 높은 경우 수준 3의 자본비용을 증가시키는 효과가 크게 완화되는 것으로 나타났다. 따라서 공정가치 서열체계 정보는 내포된 정보위험에 따라 자본비용에 미치는 영향이 달라지며, 경영자의 시장위험관리 수준이나 감사품질에 따라 정보위험은 감소될 수 있음을 보여주었다.

단백질 서열과 텍스트 정보 기반 오토마타 종 분류기 (Automata Species Classifier based on Protein Sequences and Text Information)

  • 박준형;이현정;양지훈;김선호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 한국컴퓨터종합학술대회논문집 Vol.34 No.1 (B)
    • /
    • pp.9-14
    • /
    • 2007
  • 단백질 분류는 현대 생물학의 큰 도전과제이다. 현재 여러 단체에 의해 잘 관리되는 상세한 주석이 달린 많은 양의 단백질 정보들이 존재한다. 이러한 데이터베이스의 덕분으로 다양한 물리 화학적 특성과 주석들에 기반하고 있는 분류 기법들이 연구되고 있다. 특히 아미노산들로 이루어진 단백질 서열이 해당 단백질의 분류에 중요한 역할을 하는 진화적 기록들의 단서가 되기 때문에 단백질 서열들에 대한 연구가 활성화되고 있다. 비록 단백질 서열이 단백질 분류 문제의 중요한 특징이 된다고 해도 단순한 단백질 서열만으론 해당 단백질에 대한 충분한 정보를 얻을 수 없으며, 타 종 간에도 기능상 유사성 때문에 서로 비슷하게 판별될 수 있다. 이러한 문제점에 착안해서 우리는 오토마타 종 분류기라고 부르는 새로운 시스템적인 종 분류 접근 방법을 제안한다. 이 시스템의 클러스터링과 종 분류 판별 성능에 대한 평가 실험을 수행해본 결과 상대적으로 좋은 성능을 얻을 수 있었다.

  • PDF

단백질 서열 연관 규칙 마이닝을 위한 효율적인 알고리즘 설계 (Efficient Sequence Association Rule Mining for Discovering Protein Relations)

  • 김현민;김지혜
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (하)
    • /
    • pp.1183-1186
    • /
    • 2002
  • DNA 의 염기서열 탐색을 위한 유전체학의 다음 세대인 구조유전체학은 유전체 사업으로 인한 인간 게놈지도의 완성과 축적된 생물정보를 이용한 생물정보학의 발달과 함께 급속한 성장을 계속하고 있다. 포스트 게놈 시대를 맞이하여 생명현상에 대한 궁극적인 이해를 위한 노력으로 단백질의 구조와 기능에 대한 연구가 주목을 받게 되었다. 다양한 구조 규명을 위한 도구들과 단백질 정보를 관리하기 위한 데이터베이스 구축에 따른 관련 기술의 발전은, 앞으로 다가올 생물정보의 방대함을 감안할 때, 가치 있는 지식정보를 얻기 위한 데이터 마이닝 기법들을 통해서만 가능하다. 본 논문은 데이터 마이닝의 근간 기술인 연관규칙 마이닝을 응용한 효율적인 서열 연관 규칙 알고리즘을 제안하며, 단백질 구조의 예측을 위한 단백질 서열 및 DNA 서열간의 패턴 비교 및 연관성을 목적으로 한다. 또한, 공간적 시간적 복잡성을 CMS-tree 라는 자료구조를 통해 알고리즘의 확장성 및 병렬화의 기본 알고리즘으로 사용하도록 개발하였다.

  • PDF

미생물 동정을 위한 프로브와 프라이머 고안 시스템의 개발 (Development of Primer and Probe Design System for Microbial Identification)

  • Park, Jun-Hyung;Kang, Byeong-Chul;Park, Hee-Kyung;Jang, Hyun-Jung;Song, Eun-Sil;Lee, Seung-Won;Kim, Hyun-Jin;Kim, Cheol-Min
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2004년도 The 3rd Annual Conference for The Korean Society for Bioinformatics Association of Asian Societies for Bioinformatics 2004 Symposium
    • /
    • pp.21-28
    • /
    • 2004
  • 모든 생명체의 genetic information에는 보존적 염기서열과 다형적 염기서열이 존재한다. 다형적 염기서열과 보존적 염기서열은 하나의 종(species)을 감별하거나, 여러 종류의 종을 동시에 감별할 수 있는 genotyping의 표지자로 각각 이용될 수 있다. 본 논문은 병원성 감염질환 세균, 식중독 유발 세균, 생물의약품 오염 유발 세균 및 환경오염 세균 등 세균의 존재 유무와 속과 종 감별을 위해 대부분 세균 종의 보존적 염기서열과 다형적인 염기서열을 포함하고 있는 23S rDNA 유전자의 표적 염기 서열로부터 고안된 세균 특이적(bacterial-specific), 속 특이적(genus-specific), 종 특이적(species-specific) 올리고 뉴클레오티드프로브와 프라이머를 디자인하는 시스템을 소개한다. 시스템을 통해서 얻어진 프로브와 프라이머들은 PCR을 통한 검증단계를 거쳐서 디자인 결과의 정확성을 확인하였다. 본 시스템의 이용으로 프로브와 프라이머를 디자인하는데 몇 주가 소요되는 시간을 몇 일 내로 줄일 수 있었으며, 체계적인 데이터의 관리로 결과의 정확성을 높일 수 있었다.

  • PDF

유전자 데이터베이스의 설계 및 구현: streptomyces data를 예로 (Design and Implementation of gene sequence database with streptomyces data)

  • 김진;김범준;김정미;김동회
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.160-162
    • /
    • 2001
  • 유전자의 서열 및 관련 정보가 폭발적으로 증가함에 따라, 사용자들에 대한 유전자정보 서비스, 온라인 상에서의 효율적이 서열정보 분석, 서열정보에 대한 효율적인 관리, 관련된 연구자들과의 정보공유 등이 필요하게 되었다. 본 논문에서는 인터넷 상에서 streptomyces 유전자 data를 효율적으로 관리하는 한편, 사용자들에게 유용한 서비스를 제공하는 시스템의 설계 및 구현에 관하여 논의하였다. 사용자는 본 시스템으로부터 원하는 유전자 정보를 다운로드 받을 수 있다. 또한 분석을 원하는 유전자를 streptomyces database내의 유전자들과 비교하여 유용한 정보를 추론할 수 있다.

  • PDF

GWB: 유전자 서열 데이터의 관리와 분석을 위한 통합 소프트웨어 시스템 (GWB: An integrated software system for Managing and Analyzing Genomic Sequences)

  • 김인철;진훈
    • 인터넷정보학회논문지
    • /
    • 제5권5호
    • /
    • pp.1-15
    • /
    • 2004
  • 본 논문에서는 효율적인 유전자 서열 데이터의 관리와 분석을 위한 웹 기반의 통합 시스템인 GWB(Gene WorkBench)의 설계와 구현에 대해 설명한다. 유전자 서열을 다루는 기존의 시스템들은 서열 데이터의 관리 기능과 분석 기능을 동시에 지원하는 경우가 드물고, 또한 분석 기능 역시 일부 혹은 단일 분석 기능만을 제공하는 단위 프로그램들이 대부분이다. 또 이러한 분석 프로그램들마저 서로 분산되어 있고 다른 수행환경을 필요로 한다. 따라서 이러한 프로그램들을 함께 이용하기 위해서는 많은 수작업과 변환작업을 필요로 하는 등 유전자 서열 데이터를 다루는 많은 생명과학 연구자들이 불편을 겪어왔다. 본 논문에서는 기존 시스템들의 단점을 보완하고 유전자 서열 연구에 효과적으로 도움을 줄 수 있는 보다 편리한 시스템을 구현하고자, 서열 데이터베이스 관리 기능과 다양한 분석 기능들을 하나의 시스템인 GWB로 동합하였다. GWB 시스템 설계의 가상 중요한 이슈는 서로 상이한 분석 프로그램들을 어떻게 하나의 시스템으로 통합할 것이며, 또 이들 프로그램들이 요구하는 서로 다른 서열 데이터 및 서열 데이터베이스 형태를 어떻게 제공할 수 있느냐는 것이다. GWB는 이 문제들을 해결하기 위해 공통의 입출력 인터페이스인 포장기를 이용하여 서로 다른 분석 프로그램들을 시스템에 통합시켰고, 공통 서열 데이터 형식인 KSF를 제안하였으며, 로컬 서열 데이터베이스를 관계형 데이터베이스부분과 색인 순차파일부분으로 나누어 구성하였고, 서로 상이한 서열 데이터 형식간의 변환 기능과 XML 파일로의 변환 기능을 제공하도록 하였다.유의하게 높았다 (P<0.01). 고형물질별 피복지수는 red clover는 V나 V+T(1 : 1)로 피복한 종자에서 높았으며 tall fescue는 T, V, V + T(1 : 1로 피복한 종자)에서 가장 높게 나타났다(P<0.01). 종자피복에 있어서 red clover와 tall fescue 공히 접착제는 CF나 PVA로 하고 고형물질은 V나 V+T(1:1)로 피복함으로서 가장 좋은 피복효과를 얻을 수 있었다.. 쟁점 및 과제들이 제시되었다. cells of these species contained considerable to large amount of neutral mucin, and small to considerable amount of acid mucin, Most of the medium sized and small mucous cells contained neutral mucin and sialomucin, but a few mucous cells contained neutral mucin and strongly sulfomucin or neutral combined with strongly sulfomucin and sialomucin. Most of the esophageal mucous cells pf Bryzoichthys lysimus contained small amount of neutral mucin, while on the other hand a feww mucous cells contained small amount of neutral mucin and minimal

  • PDF

그리드 컴퓨팅을 이용한 BLAST 성능개선 및 유전체 서열분석 시스템 구현 (Performance Improvement of BLAST using Grid Computing and Implementation of Genome Sequence Analysis System)

  • 김동욱;최한석
    • 한국콘텐츠학회논문지
    • /
    • 제10권7호
    • /
    • pp.81-87
    • /
    • 2010
  • 본 논문에서는 현재 생물정보학 연구에서 가장 많이 사용하고 있는 BLAST의 문제점을 분석하고 이에 따른 해결책을 제시하기 위하여 그리드 컴퓨팅을 이용한 G-BLAST(Grid Computing을 이용한 Basic Local Alignment Search Tool)를 제안한다. 본 연구에서 제안하고 있는 G-BLAST을 이용한 시스템은 이기종 분산 환경에서 수행이 가능한 서열분석 통합 소프트웨어 패키지이며 기존 서열분석 서비스의 취약점인 검색 성능을 개선하여 BLAST 검색 기능을 강화 하였다. 또한, BLAST 결과를 사용자가 관리 및 분석이 용이하도록 데이터베이스 및 유전체 서열분석 서비스 시스템을 구현하였다. 본 논문에서는 G-BLAST시스템의 성능확인을 위하여 병렬컴퓨팅 성능테스트 기법을 도입하여 구현된 시스템을 기존 BLAST와 속도 및 효율부분에서 비교하여 성능개선을 확인하였으며 서열결과 분석에 필요한 자료를 사용자관점에서 제공해주고 있다.

단백질 구조 예측을 위한 서열 연관 규칙 탐사 (Discovering Sequence Association Rules for Protein Structure Prediction)

  • 김정자;이도헌;백윤주
    • 정보처리학회논문지D
    • /
    • 제8D권5호
    • /
    • pp.553-560
    • /
    • 2001
  • 바이오정보학(bioinformatic)은 생물학 분야 특히 분자 수준의 유전체 연구에서 발생하는 데이터를 저장, 관리, 분석하여 실험 프로젝트를 지원함은 물론, 기능 예측 및 조절에 대한 실험 설계를 가능하게 하는 제반 컴퓨터 기술을 의미한다. 유전체 연구의 다양한 접근 방식 중 단백체학(proteomics)는 유전체의 최종 산물인 단백질을 직접적으로 다룬다는 측면에서 그 효용성에 대해 많은 기대를 모으고 있다. 본 논문에서는 단백질의 기능을 결정하는 가장 중요한 요소 중 하나인 단백질의 구조를 예측하기 위한 데이터 마이닝 기법을 제안한다. 단백질의 일차 구조인 아미노산 서열에 타나나는 부서열간의 연관성이 해당 단백질의 이차 혹은 삼차 구조를 결정하는 중요한 단서임을 설명하고, 아미노산 부서열간의 연관성을 표현하기 위한 모델로서 서열 연관 규직을 정의한다. 서열 연관 규칙의 유용성을 평가하기 위한 지지도와 신뢰도를 새롭게 정의하고, 주어진 단백질 집단으로부터 유용한 서열 연관 규칙을 발견하기 위한 기법을 제안한다. 아울러, SWISS-PROT 단백질 데이터베이스로부터 입수한 단백질 서열 데이터를 이용하여 제안한 기법의 성능을 평가한다.

  • PDF

산전 진단에서의 염기 서열 분석 방법의 의의 (Challenges of Genome Wide Sequencing Technologies in Prenatal Medicine)

  • 강지언
    • 한국콘텐츠학회논문지
    • /
    • 제22권2호
    • /
    • pp.762-769
    • /
    • 2022
  • 산전 진단에서 유전자 검사는 임상 관리 및 부모의 의사 결정에 중요한 정보를 제공하고 있다. 지난 여러 해 동안 G-banidng 핵형 분석, 형광성 제자리 교잡 방법, 염색체 마이크로어레이 및 유전자 패널과 같은 세포유전학적 검사 방법들이 일반적인 산전 진단의 검사의 일부가 되어 발전해 왔다. 그러나 이러한 각각의 방법은 한계를 가지고 있으며 각각의 진단 기술의 단점들을 보완할 수 있는 혁신적인 검사 방법의 도입의 필요성이 매우 필요한 시점이다. 최근 차세대 염기서열 분석에 기반한 유전체 분석 방법의 도입은 현재의 산전 진단에서의 관행에 많은 변화를 주고 있다. 이렇게 산전 진단에서의 유전체 단위의 염기서열 분석은 정교한 해상도와 높은 정확도를 통해 데이터를 빠르게 분석하고 비용을 감소시키는 기술의 혁신을 보여주고 있다. 따라서 본 논문에서는 시퀀싱 기반 산전 진단의 현재 상태와 관련 과제 및 미래 전망에 대하여 검토해 보았다.