• 제목/요약/키워드: 바이오 데이터

검색결과 1,364건 처리시간 0.029초

RNA-Seq 데이터를 이용한 전사체 분석 도구 (A Transcriptome Analysis Tool using RNA-Seq Data)

  • 공진화;신재문;원정임;이은주;윤지희
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.113-115
    • /
    • 2012
  • 전사체(transcriptome) 분석이란 주어진 조건 하에서 현재 세포 내에 발현된 모든 트랜스크립트의 종류와 양을 밝히는 것을 의미하며, 분석 결과는 질병 관련성/유전적 요인 규명 등의 연구에 직접 활용한다. 우리는 선행 연구에서 RNA-Seq 데이터를 이용하여 선택 스플라이싱 과정에 의하여 생성되는 모든 트랜스크립트의 유형을 분류/추출하는 새로운 방법론을 제안한 바 있다. 그 후속 연구로서 본 연구에서는 시간/공간 효율적인 알고리즘 구현을 위한 최적화 방법론을 제안하고, 실용화를 위한 전사체 분석 도구 개발에 대하여 논한다. 개발된 전사체 분석 도구에서는 기존의 분석 도구와 달리 RNA-Seq 데이터의 단계적 분석 결과를 시각적 뷰어를 통하여 검색 가능하며, 이들 기능은 복잡한 전사체 분석 결과의 이해와 타당성 검증에 활용한다.

최대 면적 차이 분할 방법을 이용한 선택률 추정 (Selectivity Estimation using Maximum Area Difference)

  • 이미란;황환규
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (1)
    • /
    • pp.109-111
    • /
    • 2001
  • 공간데이터베이스에서 공간 질의를 최적화하기 위해서는 질의 결과 크기를 계산하는 것이 필수적이다. 그러나 공간 데이터베이스의 크기는 매우 방대하여 질의 결과 크기를 계산하는데 비용이 많이 든다. 이러한 문제를 해결하기 위해서는 실제 공간 데이터의 분포와 특성에 근접하도록 공간 데이터의 분포를 요약하여 이를 토대로 질의 결과 크기를 추정하는 것이 효과적이라 할 수 있다. 공간 분할 방법에는 균등분할 방법과 비균등 분할 방법이 있으면, 본 논문에서 제안한 방법은 1차원 데이터에 대한 선택률 추정기법 중에서 그 성능이 가장 우수하다고 평가된 바 있는 최대 면적 차이 분말을 공간 데이터베이스에 적용하여 공간 분할하는 것이다. 공간 데이터베이스에서 선택을 추정 방법은 공간 분할 방법에 따라 성능상의 차이가 있으며 본 논문은 기존의 방법과 제안한 방법을 실험을 통하여 선택률 추정의 정확성을 비교, 평가하여 제안한 방법이 우수함을 보였다.

  • PDF

XML문서에서의 다중 스키마 추출에 관한 연구 (The Study on Multi-level Schema Extraction for XML documents)

  • 김성림;윤용익
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 춘계학술발표논문집 (상)
    • /
    • pp.11-14
    • /
    • 2001
  • XML이 인터넷상에서 데이터를 표현하고 교환하는 새로운 표준으로 등장하고 있다. XML은 미리 정의된 스키마가 없고, 문서 자체에 데이터와 데이터 구조를 갖고 있기 때문에 기존의 관계형 데이터베이스나 객체 지향 데이터베이스에서 사용되는 SQL이나 OQL을 바로 적용하기가 어렵다. 따라서 이러한 XML에 대해 새로운 질의어와 질의 처리를 위한 스키마 추출에 대한 많은 연구가 이루어지고 있다. 본 논문에서는 XML 문서에 대한 스키마 추출 방법과 그래프 프로젝션을 통한 질의 처리 방법을 제안하였다. 여러 단계의 스키마 추출을 가능하게 함으로써 사용자의 질의에 대해 보다 효율적인 질의 결과를 제공해 줄 수 있다.

  • PDF

이미지데이터 활용을 위한 지능형 인식 라이브러리 연구 개발 (R&D of Intelligent Document Recognition Library for utilizing image data)

  • 곽희규;김성헌;이정우;유지훈;이현주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.329-330
    • /
    • 2009
  • 본 연구는 공공기관이 소장한 이미지데이터 활용성을 높이기 위한 전문검색서비스 구현 시 필수적인 문서인식시스템의 고도화에 있으며, 주요한 연구방향은 공공기관이 소장하고 있는 데이터의 분석을 통해 이미지분석 기술 및 라이브러리를 개발하고 특화된 지식베이스를 구성하는 것이다. 또한, 향후 확장성을 고려하여 지식베이스를 지속적으로 관리할 수 있는 툴을 개발하는 것이다. 본 연구는 현재 지능형 인식 라이브러리를 결합한 프로토타입(prototype) 시스템 개발이 완료된 바, 방대한 국가기록원내 소장자료를 대상으로 다양한 성능평가를 위한 테스트베드 구축이 진행되고 있다.

기계학습 기반의 낙상 검출 (Machine Learning based Fall Detection)

  • 김인경;김대희;허성실;이재구
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.547-550
    • /
    • 2020
  • 노인인구의 급증에 따라 노인 건강에 대한 관심이 증가하였고 노인 낙상을 발견하는 방법에 대한 관심도 함께 대두되기 시작하였다. 낙상 사고의 경우 낙상을 일으킨 원인보다 낙상이 제때 감지되지 않아 발생하는 이후의 상황이 더욱 심각한 결과를 초래한다. 따라서 낙상이 발생했을 때, 바로 낙상을 감지할 수 있는 시스템 구축이 필요하다. 다양한 낙상 검출을 위한 방법이 존재하지만 그 중 착용이 쉽고 원격지에서 관찰 및 관리가 가능한 웨어러블(Wearable) 기기의 센서 데이터를 사용한 낙상 검출을 진행하였다. 본 논문에서는 머신 러닝 모델들을 사용해서 낙상 검출 성능 비교 및 적절한 모델을 제안한다. 기계 학습 기반의 모델인 결정 트리(Decision Tree), 랜덤 포래스트(Random Forest), SVM(Support Vector Machine)을 사용하여 실제 측정된 데이터에 낙상 검출 학습 능력을 정량화하였다. 또한, 모델의 입력 값에 적용한 데이터 분할, 전처리 및 특징 추출 방법을 통해서 효율적인 낙상 검출을 위한 기계학습 관점에서의 타당성을 판단하고자 한다.

SNS 여론과 주가지수의 상관관계 분석 (Correlation Analysis Between Online Public Opinion and Stock Price)

  • 김현지;오성주
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.394-395
    • /
    • 2023
  • "이성적이며 이상적인 합리적 인간"을 가정하는 기존 경제학의 이론이 항상 실제 상황과 일치하지는 않는 것으로 알려져 있다. 이의 대안으로 나온 행동경제학은, 인간의 경제적 의사결정에 심리, 인지, 감정, 사회문화적 배경 등이 영향을 미친다고 본다. 본 연구에서는 행동경제학에 의거하여, 개인의 감정과 경험이 경제적 의사결정에 영향을 미치는지 여부를 빅데이터 모델을 활용하여 분석하였다. SNS 여론으로는 Reddit, 주가지수로는 S&P 500 을 선정하였다. 수집한 텍스트 데이터를 전처리와 감정분석을 통해 독립변수 값으로 사용했고, 주가지수 등락의 방향성을 종속변수로 사용하여 로지스틱 모형을 구성했다. 모델을 활용하여 분석한 결과 Public sentiment 와 Market sentiment 간 양의 상관관계를 확인할 수 있었다. 또한, lag 를 설정하는 모델이 정확도가 더욱 높음을 확인해, 기존 경제학의 EMH 와 대립되는 바를 확인할 수 있었다. 하지만 최적의 lag 산정을 위해, 더 광범위한 데이터를 바탕으로 한 후속연구가 필요하다.

데이터 품질관리 평가 모델에 관한 연구 (A study on the data quality management evaluation model)

  • 김형섭
    • 한국융합학회논문지
    • /
    • 제11권7호
    • /
    • pp.217-222
    • /
    • 2020
  • 본 연구는 데이터 품질관리 평가 모델에 관한 연구이다. 정보통신기술이 고도화되고 저장 및 관리에 대한 중요성이 증가를 하기 시작하며서 데이터에 대한 괌심이 증가를 하고 있다. 특히 최근에는 4차산업혁명과 인공지능에 대해 관심이 증가를 하고 있다. 4차산업혁몽과 인공지능 시대에 중요한 것이 바로 데이터이다. 21세기는 데이터가 새로운 원유로서의 역할을 수행할 것으로 보인다. 이러한 데이터의 품질에 대한 관리가 매우 중요하다고 할 수 있다. 그러나 실무적인 차원에서의 연구는 진행이 되고 있으나 학문적 차원의 연구는 부족한 실정이다. 이에 본 연구에서는 전문가를 대상으로 데이터 품질관리에 영향을 미치는 요인에 대해 살펴보고 시사점을 제시하였다. 분석결과 데이터 품질관리의 중요도에는 차이가 있는 것으로 나타났다.

SBA 상호운용성 향상을 위한 데이터교환서식 설계 및 활용에 관한 연구 (Design and Application of Data Interchange Formats (DIFs) for Improving Interoperability in SBA)

  • 김황호;김문경;최진영;왕지남
    • 정보화연구
    • /
    • 제9권3호
    • /
    • pp.275-285
    • /
    • 2012
  • 모의기반획득 과정에서 물리적으로 분산되어 있는 기관들 간의 상호운용성을 향상 시키기 위해서는 데이터 교환 서식(DIF: Data Interchange Format)을 필요로 한다. 데이터 교환서식은 분산제품 기술서(DPD: Distributed Product Description)의 템플릿 역할을 하며, 분산제품 기술서의 각종 정보 및 M&S 자원을 입력 및 출력하게 함으로써 별도의 변환 과정 없이 정보를 바로 이용할 수 있게 하는 장점이 있다. 이러한 특징은 모의기반획득을 지원하는 통합협업환경이 상호운용성을 제공하기 위하여 반드시 필요하다. 본 논문에서는 모의기반획득의 제반 절차 단계 중에서 설계 및 제조와 관련된 형상 데이터를 대상으로 데이터 교환서식 개발을 위한 프레임워크 및 단계별 산출물을 제안하고, 이를 바탕으로 데이터 교환서식 모델 설계에 대한 연구를 수행하였다. 또한 제안된 데이터 교환서식 모델을 기반으로 XML 기반의 데이터 교환서식 모델을 구현하고, 사례를 통하여 데이터 교환서식을 이용한 데이터 변환을 시연함으로써 제안된 데이터 교환서식의 성능을 검증하였다.

Ethylene Glycol, 1,4-Cyclohexane Dimethanol, Isosorbide와 Terephthalic Acid로 제조되는 바이오기반 삼원공중합체의 미세구조 및 열적 특성 (Microstructure and Thermal Characteristics of Bio-based Terpolymer Made from Terephthalic Acid with Ethylene Glycol, 1,4-Cyclohexane Dimethanol, and Isosorbide)

  • 이상묵;김성기;홍인권
    • 폴리머
    • /
    • 제39권2호
    • /
    • pp.287-292
    • /
    • 2015
  • 다양한 함량의 테레프탈산, 에틸렌글리콜, 1,4-싸이클로헥산 디메탄올, 이소소바이드로 구성된 일련의 바이오 기반 삼원 공중합체들의 특성을 $^1H$ NMR과 $^{13}C$ NMR을 이용하여 연구하였다. NMR 분석 결과 모두 랜덤한 미세 구조를 가졌고 시퀀스 분포는 이소소바이드의 함량에 따라 영향을 받았다. 시차주사열량계(DSC) 데이터로부터 유리전이온도는 주로 이소소바이드 함량이 증가함에 따라 증가하는 것을 알 수 있었다. 또한 확장된 Fox 식을 이용하여 각 성분의 함량에 따른 삼원공중합체의 유리전이 온도를 예측하고자 하였다.

암진단시스템을 위한 Weighted Kernel 및 학습방법 (Weighted Kernel and it's Learning Method for Cancer Diagnosis System)

  • 최규석;박종진;전병찬;박인규;안인석;하남
    • 한국인터넷방송통신학회논문지
    • /
    • 제9권2호
    • /
    • pp.1-6
    • /
    • 2009
  • 많은 양의 데이터로부터 유용성있는 정보의 추출, 진단 및 예후에 대한 결정, 질병 치료의 응용 등은 바이오 인포머틱스(Bioinformatics)분야에서 매우 중요한 문제들이다. 본 논문에서는 암진단시스템에 적용하기위해 support vector machine을 위한 weogjted lernel fuction과 빠른 수렴성과 좋은 분류성능을 갖는 학습방법을 제안하였다. 제안된 kernel function에서 기본적인 kernel fuction의 weights는 암진단 학습단계에서 결정되고 분류단계에서 파리미터로 사용된다. 대장암 데이터와 같은 임상 데이터에 대한 실험결과에서 제안된 방법은 기존의 다른 kernel fuction들 보다 더 우수하고 안정적인 분류성능을 보여주었다.

  • PDF