• Title/Summary/Keyword: 바이오 데이터

Search Result 1,361, Processing Time 0.031 seconds

User Authentication and Secure Data Communication Based on Mobile Phone for Medical Sensor Network (의료 센서 네트워크에서 휴대폰을 이용한 사용자 인증 및 안전한 데이터 통신 방안)

  • Kim, Jee-Hyun;Doh, In-Shil;Park, Jung-Min;Chae, Ki-Joon
    • The KIPS Transactions:PartC
    • /
    • v.19C no.1
    • /
    • pp.19-28
    • /
    • 2012
  • Wireless sensor network provides services anytime and anywhere they are requested. Especially, medical sensor network based on biosensors is applied a lot to biotechnology and medical engineering. In medical sensor network, people can make their health checked at home free from temporal and spatial constraints. In ubiquitous healthcare environment, people can get instant help even in the emergency, and in hospital, patients can be taken care of efficiently. In this environment, health and life related data are delivered, and the privacy and security of personal data are very important. In this paper, we propose user authentication and data communication mechanism in two modes, normal and urgent situation using cellular phone. Through our proposal, data can be transferred in quick and secure manner.

A DNA Sequence Search Algorithm Using Integer Type Transformation (정수형 변환을 이용한 DNA 서열 검색 알고리즘)

  • Yoon, Kyong-Oh;Cho, Sung-Bae
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.357-359
    • /
    • 2012
  • 초 고성능 바이오 서열 분석 장비 기술의 발달로 대량의 바이오 정보가 쏟아져 나오고 있으며, 바이오산업의 발달로 개인별 유전체 정보에 의한 맞춤의학의 시대가 도래되고 있다. 수많은 서열에 대한 분석에는 많은 저장장치 및 주기억장치가 필요하므로 슈퍼컴퓨터 급의 서버와 대량의 데이터를 빠르게 처리할 수 있는 프로그램이 필요하다. 이러한 분석에는 염기서열 일치 검색과 이를 기반으로 하는 Alignment와 Assembly 분석이 있으며, 이를 수행하는 기존의 알고리즘 및 대부분의 프로그램들은 염기서열을 문자열로 취급하고, 해쉬 인덱스 테이블, Brujin 그래프의 사용, 버러우즈 휠러 변환(BWT) 등의 기법을 활용하여 효율적인 분석을 도모하였다. 본 논문에서는 염기서열을 문자열이 아닌 k-mer 묶음의 정수형 하나로 변환하여 검색함으로써 저장 공간의 크기를 약 28% 이상으로 줄이고 형 변환 상태에서의 검색을 수행할 수 있는 알고리즘을 제안한다. Assembly 분석 프로그램인 CalcGen 프로그램을 개발하여 본 알고리즘의 효용성 및 효율성을 실험을 통해 검증하였다. 이 연구의 결과는 향후 대량의 유전체 염기서열의 효율적 분석과 저장 및 처리에 또 하나의 새로운 접근 방법을 제안하는데에 그 의미를 둘 수 있다.

Controllable data augmentation framework based on multiple large-scale language models (복수 대규모 언어 모델에 기반한 제어 가능형 데이터 증강 프레임워크)

  • Hyeonseok Kang;Hyuk Namgoong;Jeesu Jung;Sangkeun Jung
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.3-8
    • /
    • 2023
  • 데이터 증강은 인공지능 모델의 학습에서 필요한 데이터의 양이 적거나 편향되어 있는 경우, 이를 보완하여 모델의 성능을 높이는 데 도움이 된다. 이미지와는 달리 자연어의 데이터 증강은 문맥이나 문법적 구조와 같은 특징을 고려해야 하기 때문에, 데이터 증강에 많은 인적자원이 소비된다. 본 연구에서는 복수의 대규모 언어 모델을 사용하여 입력 문장과 제어 조건으로 프롬프트를 구성하는 데 최소한의 인적 자원을 활용한 의미적으로 유사한 문장을 생성하는 방법을 제안한다. 또한, 대규모 언어 모델을 단독으로 사용하는 것만이 아닌 병렬 및 순차적 구조로 구성하여 데이터 증강의 효과를 높이는 방법을 제안한다. 대규모 언어 모델로 생성된 데이터의 유효성을 검증하기 위해 동일한 개수의 원본 훈련 데이터와 증강된 데이터를 한국어 모델인 KcBERT로 다중 클래스 분류를 수행하였을 때의 성능을 비교하였다. 다중 대규모 언어 모델을 사용하여 데이터 증강을 수행하였을 때, 모델의 구조와 관계없이 증강된 데이터는 원본 데이터만을 사용하였을 때보다 높거나 그에 준하는 정확도를 보였다. 병렬 구조의 다중 대규모 언어 모델을 사용하여 400개의 원본 데이터를 증강하였을 때에는, 원본 데이터의 최고 성능인 0.997과 0.017의 성능 차이를 보이며 거의 유사한 학습 효과를 낼 수 있음을 보였다.

  • PDF

Mapping with LiDAR Data and Google Earth Image (LiDAR 데이터와 Google Earth 영상의 매핑)

  • Lee, Hyo-Jong;Kim, Seong-Yak
    • Proceedings of the IEEK Conference
    • /
    • 2008.06a
    • /
    • pp.755-756
    • /
    • 2008
  • 지리정보시스템(GIS)은 경제발전, 환경보전, 도시계발 등에서 중요한 역할을 하고 있다. 지리정보시스템에서 빈도높게 측정되고 있는 것은 LiDAR(고정밀 항공 레이저 측량기술) 데이터로써 높은 위치정확도를 지니며, 데이터의 취득시 바로 지상좌표를 취득함으로써 좌표의 변환이 필요 없기 때문에 좀더 빠르게 데이터를 처리할 수 있는 장점을 가지고 있다. 본 연구에서는 이러한 LiDAR의 자료와 구글어스 등과 같이 2차원 영상을 획득한 경우, 3차원의 LiDAR 데이터를 2차원에 매핑시키는 방법을 연구하였다. 2차원 영상의 기준점을 정확하게 파악하는한 3차원의 LiDAR 데이터와 정확하게 일치하는 것으로 확인되었다.

  • PDF

A MOLAP Cube Storage Scheme for Fast Query Processing (고속 질의처리를 위한 MOLAP 큐브 저장구조)

  • Lim, Yoon-Sun;Yang, Hye-Yeong;Kim, Myung
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04b
    • /
    • pp.127-129
    • /
    • 2001
  • 데이터 웨어하우스의 데이터를 다차원적으로 분석하여 그 결과를 온라인으로 사용자에게 제공하는 것을 OLAP 이라고 하고, 이 때 데이터를 큐브라고 불리는 배열에 저장해 두고 데이터를 위치정보를 통해 엑세스하는 시스템을 MOLAP 시스템이라고 한다. OLAP 연산 도중에 디스크로부터 읽어야 하는 데이터의 양을 감소시키기 위해 큐브를 압축된 청크 단위로 저장하는 방안이 이미 제안되고 있으나, 큐브의 데이터 분포, 청크와 디스크 블록의 크기 관계 등을 고려하여 디스크 엑세스를 줄이는 방안에 관한 연구는 아직 소개된 바가 없다. 본 연구에서는 청크들을 밀도를 기준으로하여 군집화 하고, 큐브내의 인접 청크들을 가능한 한 동일한 디스크 블록에 속하게 함으로써, OLAP의 주요 연산인 슬라이스, 다이스와 같은 연산의 속도를 향상시키는 방안을 제시한다. 제안한 저장구조는 실험을 통해 그 효율성을 증명하였다.

  • PDF

A fast feature selection technique for microarray data (마이크로어레이 데이터 분석을 위한 선형 특징 선별 기법)

  • Lee, Jae-Seong;Kim, Dae-Won
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2008.04a
    • /
    • pp.188-189
    • /
    • 2008
  • 마이크로어레이 데이터는 대량의 유전자들을 짧은 시간에 테스트 하여 얻은 대량의 데이터로 구성되어 있다. 그러나 이렇게 얻은 대량의 데이터에서 특징으로 표현되는 유전자의 수가 매우 많고, 각각의 유전자는 서로에 대해 독립적이지 않기 때문에 전통적인 데이터 마이닝 기법을 적용하여 바이오마커를 찾아내는 작업이 용이하지 않다. 마이크로어레이 데이터에서 나타나는 이러한 특성과 여기에서 파생되는 문제점들을 극복하기 위해 다양한 특징 선별 방법론들이 등장하였으나 다소의 문제점을 가지고 있어 실제 세계의 문제에 적용하기 어렵다. 본 논문에서는 코사인 내적 행렬과 행렬식을 이용하여 직교하지 않는 특징들을 제거하는 방법에 대해 소개하고, 그 결과를 분석하였다.

  • PDF

Review of Fintech and Bigdata Technology (핀테크와 빅데이터 기술에 대한 리뷰)

  • Choi, Gi Woo
    • The Journal of Bigdata
    • /
    • v.1 no.1
    • /
    • pp.77-84
    • /
    • 2016
  • We investigate the types and characteristics of Fintech has become a major issue. Through this, we believe that the essence of Fintech are platform business and market occupancy. To success Fintech business, the price of Fintech services needs to be lower than that of traditional financial services. The solution is to take advantage of big data and big data analysis. Finally, we think only a win-win cooperation with Fintech startups and financial companies in the direction we need to go.

  • PDF

신(新)기술(빅데이터) 등장에 따른 경제적 파급효과 및 법(규제) 연구

  • Lee, Gyu-Cheol;Won, Hui-Seon
    • Information and Communications Magazine
    • /
    • v.29 no.11
    • /
    • pp.48-54
    • /
    • 2012
  • 정보통신 기술은 아날로그 산업에서 디지털 산업을 거쳐 현재는 스마트 산업으로 이어지는 수단으로 활용되어 왔다. 특히 산업 사회생활에서 문서로 직접 주고받던 환경에서 메일, 전자문서 교환 등으로 바뀌면서 편리성과 비용절감을 통해 산업 사회생활 발전에 기여하고 있다. 최근 빅데이터 기술은 대용량 정보를 분석하여 기상예측, 신약개발, 유전자 분석 등의 다양한 분야에 활용되고 있다. 그러나 대용량 정보 안에는 개인 식별을 할 수 있는 정보가 포함되어 있어, 빅데이터 기술을 바로 적용하기에는 개인정보보호법이 정하는 개인정보보호 이용에 관한 법률에 대한 준비가 미흡한 실정이다. 예를 들어 공공기관의 데이터를 활용하여 날씨 예측, 재난 방재 서비스 등을 통해 국민의 삶을 제고함과 동시에 경제적으로 많은 이익을 가져올 수 있다. 그러나 개인정보를 타인이 악의적으로 이용할 수 있어 개인에게 경제적, 정신적 피해를 줄 수 있다. 또한 개인정보의 노출은 과거와 달리 삭제되거나 잊혀지지 않고 영구적으로 재사용이 가능하기 때문에 이를 사전에 막을 수 있는 방법이 필요하다. 이에 본고는 빅데이터 등장에 따른 시장구조 변화 및 경제적 파급효과를 분석하고, 법리적 분석을 바탕으로 빅데이터 기술이 올바르게 시장에 정착할 수 있은 법(규제)방안을 제시하고자 한다.

A Method for Finding Accompany Group from Trajectory Stream Data (궤적 스트림 데이터로부터 동행 그룹 탐색 기법)

  • kang, Suhyun;Lee, Ki Yong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.05a
    • /
    • pp.363-366
    • /
    • 2019
  • 객체들의 움직임의 흐름을 나타내는 궤적 데이터에서 함께 움직이는 궤적을 찾아 움직임 패턴을 탐색하는 연구들이 많이 이루어져 왔다. 하지만, 궤적 스트림 데이터에서 궤적의 이동 패턴을 탐색하는 연구는 많이 이루어지지 않았다. 그래서 본 논문은 시간의 흐름에 따라 흘러 들어오는 궤적 스트림 데이터에서 궤적의 이동 패턴을 탐색하여 동행 그룹을 탐색하는 새로운 방법을 제안한다. 기존에도 궤적 스트림 데이터에서 궤적들이 주어졌을 때 궤적들의 이동 패턴을 찾는 연구들은 존재하였으나 발견된 궤적이 언제 생성되었고 언제 소멸되었는지에 대한 정보를 자동으로 출력해 주는 연구는 아직 이루어진 바가 없다. 본 논문에서는 서로 다른 시간에 나타나고 사라지는 모습을 가진 궤적 스트림 데이터에서 동일한 시간에 나타나는 궤적을 찾는 방법을 제안한다. 제안 방법은 객체들의 좌표를 점진적으로 클러스터링을 수행하여 사용자에게 입력받은 지속 시간 이상 클러스터를 유지한 동행 그룹의 객체들을 반환한다. 또한, 기존 연구와 달리 해당 객체들의 지속 시간인 시작과 끝 시간도 자동으로 출력해 준다.

Information Service Quality Management in Data Governance Perspective (in Public Information Sharing System) (데이터 거버넌스 관점의 정보서비스 품질관리 (행정정보공동이용시스템 중심으로))

  • Go, Woon-Hyuk;Min, Dae-Hong;Lee, Sung-Hyun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.1402-1405
    • /
    • 2012
  • 데이터 품질의 패러다임 변화에 따라 기업에서는 효과적인 의사결정지원을 위한 정보서비스의 품질 관리가 중요하다. 본 연구에서는 설문조사를 통해 데이터 거버넌스 관점에서 행정기관 간 정보연계를 통해 민본 녹색 행정을 위한 '행정정보공동이용시스템'의 데이터 품질관련 현황을 분석하였다. 이와 관련하여 향후 정확하고 안전한 행정정보의 공동이용을 위한 정보서비스 품질관리체계 구축을 위한 대안으로서 데이터 거버넌스 관점의 행정정보 공유 데이터 품질관리체계 구축을 제시하는 바이다.