• 제목/요약/키워드: 바이오 데이터

검색결과 1,361건 처리시간 0.032초

트랜잭션이 없는 시계열 데이터로 부터 가상 트랜잭션을 이용한 데이터 마이닝 (Mining Time Series Data With Virtual Transaction)

  • 김민수;이준섭;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2001년도 추계학술발표논문집 (상)
    • /
    • pp.31-34
    • /
    • 2001
  • 대용량의 데이터들로부터 사용자가 원하는 데이터를 찾기 위하여 많은 데이터 마이닝 기술들이 연구되어 실제 응용프로그램에서 많이 적용되고 있다. 이러한 데이터 마이닝의 기술 중 연관규칙은 항목들의 집합으로 표현되는 트랜잭션에서 각 항목간의 연관성을 찾는데 사용된다. 그러나 실세계에는 트랜잭션이 없이 일련의 이벤트만 시간에 따라서 발생하는 데이터들이 많이 존재한다. 이러한 시계열 이벤트 데이터들로부터 다양한 가상 트랜잭션을 생성하는 기법들을 제시한다. 이러한 가상 트랜잭션 데이터로 변환된 시계열 데이터에 연관규칙, 순차패턴, 주기패턴과 관련된 여러 가지 알고리즘을 바로 적용 함으로서 유용한 규칙들을 발견해 낼 수 있다.

  • PDF

능동 학습 기법을 활용한 한국어 금융 도메인 개체명 인식 데이터 구축 (Constructing Korean Named Recognition Dataset for Financial Domain Using Active Learning)

  • 정동호;허민강;김형철;박상원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.82-86
    • /
    • 2020
  • 딥러닝 모델의 성능은 데이터의 품질과 양에 의해 향상된다. 그러나 데이터 구축은 많은 비용과 시간을 요구한다. 특히 전문 도메인의 데이터를 구축할 경우 도메인 지식을 갖춘 작업자를 활용할 비용과 시간이 더욱 제약적이다. 능동 학습 기법은 최소한의 데이터 구축으로 모델의 성능을 효율적으로 상승시키기 위한 방법이다. 다양한 데이터셋이 능동 학습 기법으로 구축된 바 있으나, 아직 전문 도메인의 한국어 데이터를 구축하는 연구는 활발히 수행되지 못한 것이 현실이다. 본 논문에서는 능동학습기법을 통해 금융 도메인의 개체명 인식 코퍼스를 구축하였고, 이를 통해 다음의 기여가 있다: (1) 금융 도메인 개체명 인식 코퍼스 구축에 능동 학습 기법이 효과적임을 확인하였고, (2) 이를 통해 금융 도메인 개체명 인식기를 개발하였다. 본 논문이 제안하는 방법을 통해 8,043문장 데이터를 구축하였고, 개체명 인식기의 성능은 80.84%로 달성되었다. 또한 본 논문이 제안하는 방법을 통해 약 12~25%의 예산 절감 효과가 있음을 실험으로 보였다.

  • PDF

온톨로지 기반의 SBML 변환기 (Ontology based SBML Converter)

  • 임정곤;김태경;정태성;조완섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.259-261
    • /
    • 2004
  • 최근 이슈가 되고 있는 시스템 생물학(Systems Biology)은 생물학적인 이론과 컴퓨터의 계산적인 모델링 그리고 실험의 상호 의존적인 통합으로써 특징 지워진다. 그 중 컴퓨터의 계산적인 모델링에 대한 연구가 무엇보다 중요한 비중을 차지하고 있다. 하지만 계산적인 모델링에서 여러 자원을 통합하기 위한 공통의 기반 구조나 표준에 대한 연구는 미흡한 실정이다. 이러한 문제점을 해결하기 위해 KML 기반의 형식을 갖춘 SBML(Systems Biology Markup Language)이 시스템 생물학의 표준으로 개발되어 연구 중에 있다. 현재 시스템 생물학 분야에서 개발중인 시뮬레이션과 데이터 분석을 위한 다양한 응용 어플리케이션이 이미 SBML 문서를 지원하고 있다. 본 연구에서는 시스템 생물학 분야에서 SBML 표준에 대한 중요성을 인식하여, 객체지향 바이오 데이터베이스로부터 질의 결과를 SBML 문서로 변환하고, 반대로 외부의 SBML 문서를 객체지향 데이터베이스에 저장하는 변환기를 제안하며, 데이터를 검색하고 저장하는데 발생하는 중복이나 동의어 관계의 모호성을 줄이고 정확성을 높이기 위한 방안으로 온톨로지 기법을 적용한다.

  • PDF

Web기반 Bio Image 검색 시스템의 설계 및 구현 (Design and Implementation of Web-base Retrieval System using MPEG-7 for Bio Image)

  • 조탄웅;남재열;홍동권;고병철
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2005년도 추계종합학술대회
    • /
    • pp.1097-1100
    • /
    • 2005
  • 멀티미디어 데이터의 생성 및 분배가 폭발적으로 증가함에 따라 산재된 메타데이터에 대한 효율적인 검색이 필요하게 되었다. 내용기반의 효율적인 검색을 지원하기 위해 MPEG-7의 표준이 제정되면서 내용기반 영상의 검색의 관심이 높아지고 있다. 본 논문에서는 이 조건들을 해결하기 위해 MPEG-7 디스크립터와 자체 개발한 Compact 디스크립터를 이용하여 Web 기반으로 검색 시스템을 구현하고 바이오 이미지를 위한 디스크립터의 조합을 제공한다. 이미지의 feature 추출 인터페이스와 검색 인터페이스를 웹 어플리케이션으로 구현해 웹 브라우저만으로 이미지의 효율적인 저장, 검색 및 관리를 할 수 있고 XML 형태로 표현된 feature 를 다양한 용도로 확장 할 수 있다.

  • PDF

파운데이션 필드버스 통신모듈 설계 및 구현 (Design and Implementation of Foundation Fieldbus communication module)

  • 오준석;홍승호
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2007년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.72-73
    • /
    • 2007
  • 기존의 공정자동화 설비에서는 센서를 통하여 계측된 데이터들이 4-20mA의 아날로그 신호를 통하여 제어기와 컴퓨터들로 전송되었다. 이러한 아날로그 신호 전송 방식에서는 제어 시스템의 구조가 복잡해지고 설치에 많은 비용과 노력이 투입될 수밖에 없다. 이러한 문제점을 해소하기 위하여 기술 선진국에서는 필드 장비들 간에 고속의 직렬 통신을 통하여 제어 및 자동화 관련 디지털 데이터의 전송을 실시간으로 지원하는 필드버스 통신망을 개발하였으며, 1990년대 이후 공장 자동화, 공정 제어 및 발전 설비 등 각종 산업 설비에 필드버스를 매우 활발히 도입하고 있다. Foundation Fieldbus 모듈은 공정제어 시스템예서 사용되는 센서, 제어기, PLC, 밸브, 구동기, 스위치 등의 모든 필드 장비에 바로 탑재되어 Foundation Fieldbus의 통신 기능을 제공하는 통신 부품으로 첨단의 공정자동화 시스템을 구축하기 위하여 반드시 확보되어야 할 핵심기술이다. 본 연구를 통해 제작된 Foundation Fieldbus 모듈은 기존의 센서제품을 FF기반의 지능형 센서로 바로 전환할 수 있는 핵심부품이다.

  • PDF

전사체 시각화 프레임워크 개발 (Transcriptome visualization framework development)

  • 황혜련;김소라;조환규
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1340-1343
    • /
    • 2012
  • 정보의 시각화는 추상적 정보를 직관적으로 이해하기 쉽도록 시각적으로 명확하게 표현하는 방법을 말한다. 대용량의 바이오 데이터를 다루는 생물정보학(bioinformatics) 분야에서는 컴퓨터의 높은 성능을 활용하여 수많은 유전학적 데이터들을 분석하고 있다. 다양한 생물정보학 실험에서 전사체는 특정한 조건에서 발현된 RNA의 총합을 말한다. 분석된 전사체 정보는 텍스트형태로 제공이 되는데 이를 사용자가 수작업으로 비교하는 데에는 한계가 있다. 따라서 분석된 전사체 정보를 효과적으로 인지할 수 있도록 시각화하는 연구들이 진행되고 있다. 본 논문에서는 그래프 라이브러리인 yFile을 활용하여 추정된 전사체를 실시간으로 시각화하여 제공하는 방법을 제안한다. GTF파일을 입력받아서 데이터베이스에 저장하고 이 정보를 이용하여 그래프를 생성한다. 실험 결과는 전사체를 시각화 하는 방법을 통하여 다양한 전사체 정보를 알아 낼 수 있고, 최종적으로는 novel gene을 찾는 것이 가능할 것으로 기대한다.

의료 영상 바이오마커 추출을 위한 딥러닝 손실함수 성능 비교 (Comparison of Deep Learning Loss Function Performance for Medical Video Biomarker Extraction)

  • 서진범;조영복
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.72-74
    • /
    • 2021
  • 다양한 분야에서 현재 활용되고 있는 딥러닝 과정은 데이터 준비, 데이터 전처리, 모델 생성, 모델 학습, 모델 평가로 구성 된다. 이중 모델 학습 과정에서 손실함수는 모델이 학습하면서 출력한 값을 실제 값과 비교하여 그 차이를 출력하게 되고, 출력된 손실값을 기반으로 모델은 역전파 알고리즘을 통해 손실값이 감소하는 방향으로 가중치를 수정해가며 학습을 진행한다. 본 논문에서는 바이오마커 추출을 위한 딥러닝 모델에서 사용될 신경망 출력 값의 손실도를 측정하여 출력해주는 다양한 손실함수를 분석하고 실험을 통해 최적의 손실함수를 찾아내고자 한다.

  • PDF

클래스 구분력이 없는 특징 소거법 (Removing non-informative features weakening of class separability)

  • 이재성;김대원
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2007년도 추계학술대회 학술발표 논문집
    • /
    • pp.59-62
    • /
    • 2007
  • 본 논문에서는 불균형 및 Under-sampling된 바이오 데이터에 대하여 클래스 구분력이 없는 특징의 소거를 통해 이후 이어질 FLDA 둥 다양한 방법론올 적용할 수 있는 방법을 제안하고자 한다. 제안하는 알고리즘은 평균과 분산을 통해 클래스의 형태를 결정하는 기존 방법론의 문제점을 회피할 수 있는 방법을 제공하며, 클래스 구분력에 중점을 두어 특정을 선별하였을 경우 선별된 특정들의 상관 계수가 높은 문제를 극복할 수 있도록 한다. 이에 따라 알고리즘이 선택한 특정집합은 서로의 특징에 대해 상관계수가 낮으며, 클래스의 구분력이 높은 특정을 갖게 된다.

  • PDF

온라인 단기 부하예측

  • 김사현;황갑주
    • 전기의세계
    • /
    • 제34권5호
    • /
    • pp.272-280
    • /
    • 1985
  • 전력계통의 목표를 달성하기 위한 기본적인 요청은 시시각각으로 변동되는 전력부하를 확실하게 예측하는 일부터 시작된다. 그런데 전력부하는 온도, 습도, 광도 등 예측일의 기상요인은 물론 산업구조, 경기변동의 사회적인 요인에 의해 변화된다. 또한 온라인 예측시는 자동급전시스템의 여건이나 예측주기에 따라 각각 고려해야 할 사항이 다양하므로 정확도가 높으면서도 안정된 결정적인 예측기법을 찾기가 어렵다. 그러나 주어진 계통과 이용할 수 있는 여건을 바탕으로 했을때의 허용정도 및 자동화등 실제 적용면에서 보다 나은 예측기법은 생각될 수 있다. 필자들은 우리나라 계통을 대상으로 자동급전시스템(AGC/SCADA system)에 의해 온라인 리얼타임으로 취득해온 부하데이터를 이용하여 자유자재 (interactive)기능을 내포한 단기 부하예측 팩키지를 개발한 바 있으며 이에 소개하는 바이다.

  • PDF

매질에 따른 속도 차이를 보상한 테라헤르츠 단층 촬영 (Terahertz tomography with the velocity correction in different mediums)

  • 홍혜진;남궁찬;안창범
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2011년도 제42회 하계학술대회
    • /
    • pp.2043-2044
    • /
    • 2011
  • 본 논문에서는 테라헤르츠파의 시간 영역 데이터로 단층 촬영 방법을 제안하였다. 매질에 따른 테라헤르츠 전파의 속도 차이를 보상하는 알고리즘을 제시하여, 바이오 샘플인 멸치의 단층 영상을 얻었다.

  • PDF