• 제목/요약/키워드: 바이오 데이터

검색결과 1,361건 처리시간 0.04초

의료 센서 네트워크에서 휴대폰을 이용한 사용자 인증 및 안전한 데이터 통신 방안 (User Authentication and Secure Data Communication Based on Mobile Phone for Medical Sensor Network)

  • 김지현;도인실;박정민;채기준
    • 정보처리학회논문지C
    • /
    • 제19C권1호
    • /
    • pp.19-28
    • /
    • 2012
  • 무선 센서 네트워크는 언제, 어디에서든, 때와 장소를 가리지 않고 사용자가 원하는 서비스를 제공해주는 시스템이다. 특히, 바이오 센서를 이용한 의료센서네트워크는 생명공학, 의료공학 분야에서 활발하게 활용이 되고 있다. 의료센서네트워크에서는 사용자가 시간적이나 공간적 제약을 받지 않고 집에서 건강을 모니터링 할 수 있는 환경이다. U-healthcare환경에서 긴급 상황이 발생 했을 때 빠르게 환자를 도와줄 수 있으며, 병원에서도 손쉽게 환자를 관리 할 수 있다는 장점을 갖는다. 이 환경에서는 개인의 건강과 생명에 직결된 데이터가 송수신되므로 개인의 프라이버시 보장과 데이터의 보안이 가장 중요한 요소이다. 본 논문에서는 휴대폰을 이용한 사용자 인증 방안과 데이터의 종류에 따라 긴급모드와 일반모드의 구분을 두어 안전하면서도 빠르게 데이터를 전송하는 방안을 제안하였다.

정수형 변환을 이용한 DNA 서열 검색 알고리즘 (A DNA Sequence Search Algorithm Using Integer Type Transformation)

  • 윤경오;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(B)
    • /
    • pp.357-359
    • /
    • 2012
  • 초 고성능 바이오 서열 분석 장비 기술의 발달로 대량의 바이오 정보가 쏟아져 나오고 있으며, 바이오산업의 발달로 개인별 유전체 정보에 의한 맞춤의학의 시대가 도래되고 있다. 수많은 서열에 대한 분석에는 많은 저장장치 및 주기억장치가 필요하므로 슈퍼컴퓨터 급의 서버와 대량의 데이터를 빠르게 처리할 수 있는 프로그램이 필요하다. 이러한 분석에는 염기서열 일치 검색과 이를 기반으로 하는 Alignment와 Assembly 분석이 있으며, 이를 수행하는 기존의 알고리즘 및 대부분의 프로그램들은 염기서열을 문자열로 취급하고, 해쉬 인덱스 테이블, Brujin 그래프의 사용, 버러우즈 휠러 변환(BWT) 등의 기법을 활용하여 효율적인 분석을 도모하였다. 본 논문에서는 염기서열을 문자열이 아닌 k-mer 묶음의 정수형 하나로 변환하여 검색함으로써 저장 공간의 크기를 약 28% 이상으로 줄이고 형 변환 상태에서의 검색을 수행할 수 있는 알고리즘을 제안한다. Assembly 분석 프로그램인 CalcGen 프로그램을 개발하여 본 알고리즘의 효용성 및 효율성을 실험을 통해 검증하였다. 이 연구의 결과는 향후 대량의 유전체 염기서열의 효율적 분석과 저장 및 처리에 또 하나의 새로운 접근 방법을 제안하는데에 그 의미를 둘 수 있다.

복수 대규모 언어 모델에 기반한 제어 가능형 데이터 증강 프레임워크 (Controllable data augmentation framework based on multiple large-scale language models)

  • 강현석;남궁혁;정지수;정상근
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.3-8
    • /
    • 2023
  • 데이터 증강은 인공지능 모델의 학습에서 필요한 데이터의 양이 적거나 편향되어 있는 경우, 이를 보완하여 모델의 성능을 높이는 데 도움이 된다. 이미지와는 달리 자연어의 데이터 증강은 문맥이나 문법적 구조와 같은 특징을 고려해야 하기 때문에, 데이터 증강에 많은 인적자원이 소비된다. 본 연구에서는 복수의 대규모 언어 모델을 사용하여 입력 문장과 제어 조건으로 프롬프트를 구성하는 데 최소한의 인적 자원을 활용한 의미적으로 유사한 문장을 생성하는 방법을 제안한다. 또한, 대규모 언어 모델을 단독으로 사용하는 것만이 아닌 병렬 및 순차적 구조로 구성하여 데이터 증강의 효과를 높이는 방법을 제안한다. 대규모 언어 모델로 생성된 데이터의 유효성을 검증하기 위해 동일한 개수의 원본 훈련 데이터와 증강된 데이터를 한국어 모델인 KcBERT로 다중 클래스 분류를 수행하였을 때의 성능을 비교하였다. 다중 대규모 언어 모델을 사용하여 데이터 증강을 수행하였을 때, 모델의 구조와 관계없이 증강된 데이터는 원본 데이터만을 사용하였을 때보다 높거나 그에 준하는 정확도를 보였다. 병렬 구조의 다중 대규모 언어 모델을 사용하여 400개의 원본 데이터를 증강하였을 때에는, 원본 데이터의 최고 성능인 0.997과 0.017의 성능 차이를 보이며 거의 유사한 학습 효과를 낼 수 있음을 보였다.

  • PDF

LiDAR 데이터와 Google Earth 영상의 매핑 (Mapping with LiDAR Data and Google Earth Image)

  • 이효종;김성약
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2008년도 하계종합학술대회
    • /
    • pp.755-756
    • /
    • 2008
  • 지리정보시스템(GIS)은 경제발전, 환경보전, 도시계발 등에서 중요한 역할을 하고 있다. 지리정보시스템에서 빈도높게 측정되고 있는 것은 LiDAR(고정밀 항공 레이저 측량기술) 데이터로써 높은 위치정확도를 지니며, 데이터의 취득시 바로 지상좌표를 취득함으로써 좌표의 변환이 필요 없기 때문에 좀더 빠르게 데이터를 처리할 수 있는 장점을 가지고 있다. 본 연구에서는 이러한 LiDAR의 자료와 구글어스 등과 같이 2차원 영상을 획득한 경우, 3차원의 LiDAR 데이터를 2차원에 매핑시키는 방법을 연구하였다. 2차원 영상의 기준점을 정확하게 파악하는한 3차원의 LiDAR 데이터와 정확하게 일치하는 것으로 확인되었다.

  • PDF

고속 질의처리를 위한 MOLAP 큐브 저장구조 (A MOLAP Cube Storage Scheme for Fast Query Processing)

  • 임윤선;양혜영;김명
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 봄 학술발표논문집 Vol.28 No.1 (B)
    • /
    • pp.127-129
    • /
    • 2001
  • 데이터 웨어하우스의 데이터를 다차원적으로 분석하여 그 결과를 온라인으로 사용자에게 제공하는 것을 OLAP 이라고 하고, 이 때 데이터를 큐브라고 불리는 배열에 저장해 두고 데이터를 위치정보를 통해 엑세스하는 시스템을 MOLAP 시스템이라고 한다. OLAP 연산 도중에 디스크로부터 읽어야 하는 데이터의 양을 감소시키기 위해 큐브를 압축된 청크 단위로 저장하는 방안이 이미 제안되고 있으나, 큐브의 데이터 분포, 청크와 디스크 블록의 크기 관계 등을 고려하여 디스크 엑세스를 줄이는 방안에 관한 연구는 아직 소개된 바가 없다. 본 연구에서는 청크들을 밀도를 기준으로하여 군집화 하고, 큐브내의 인접 청크들을 가능한 한 동일한 디스크 블록에 속하게 함으로써, OLAP의 주요 연산인 슬라이스, 다이스와 같은 연산의 속도를 향상시키는 방안을 제시한다. 제안한 저장구조는 실험을 통해 그 효율성을 증명하였다.

  • PDF

마이크로어레이 데이터 분석을 위한 선형 특징 선별 기법 (A fast feature selection technique for microarray data)

  • 이재성;김대원
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국지능시스템학회 2008년도 춘계학술대회 학술발표회 논문집
    • /
    • pp.188-189
    • /
    • 2008
  • 마이크로어레이 데이터는 대량의 유전자들을 짧은 시간에 테스트 하여 얻은 대량의 데이터로 구성되어 있다. 그러나 이렇게 얻은 대량의 데이터에서 특징으로 표현되는 유전자의 수가 매우 많고, 각각의 유전자는 서로에 대해 독립적이지 않기 때문에 전통적인 데이터 마이닝 기법을 적용하여 바이오마커를 찾아내는 작업이 용이하지 않다. 마이크로어레이 데이터에서 나타나는 이러한 특성과 여기에서 파생되는 문제점들을 극복하기 위해 다양한 특징 선별 방법론들이 등장하였으나 다소의 문제점을 가지고 있어 실제 세계의 문제에 적용하기 어렵다. 본 논문에서는 코사인 내적 행렬과 행렬식을 이용하여 직교하지 않는 특징들을 제거하는 방법에 대해 소개하고, 그 결과를 분석하였다.

  • PDF

핀테크와 빅데이터 기술에 대한 리뷰 (Review of Fintech and Bigdata Technology)

  • 최기우
    • 한국빅데이터학회지
    • /
    • 제1권1호
    • /
    • pp.77-84
    • /
    • 2016
  • 최근 이슈가 되고 있는 핀테크 산업의 종류 및 특징에 대해 알아본다. 이를 통해 핀테크 산업의 본질은 플랫폼 사업이라는 것과 시장선점에 있다는 사실을 확인한다. 아울러 핀테크 산업이 성공하기 위해서는 기존 금융서비스보다 단가를 낮추기 위한 방안이 필요하고 이에 대한 해결책은 바로 빅데이터 활용 및 빅데이터 분석임을 인식 한다. 마지막으로 기존 금융권과 신생 핀테크 업체들 간의 상생을 위한 협력만이 우리나라 핀테크가 나아가야할 방향임을 제언한다.

  • PDF

신(新)기술(빅데이터) 등장에 따른 경제적 파급효과 및 법(규제) 연구

  • 이규철;원희선
    • 정보와 통신
    • /
    • 제29권11호
    • /
    • pp.48-54
    • /
    • 2012
  • 정보통신 기술은 아날로그 산업에서 디지털 산업을 거쳐 현재는 스마트 산업으로 이어지는 수단으로 활용되어 왔다. 특히 산업 사회생활에서 문서로 직접 주고받던 환경에서 메일, 전자문서 교환 등으로 바뀌면서 편리성과 비용절감을 통해 산업 사회생활 발전에 기여하고 있다. 최근 빅데이터 기술은 대용량 정보를 분석하여 기상예측, 신약개발, 유전자 분석 등의 다양한 분야에 활용되고 있다. 그러나 대용량 정보 안에는 개인 식별을 할 수 있는 정보가 포함되어 있어, 빅데이터 기술을 바로 적용하기에는 개인정보보호법이 정하는 개인정보보호 이용에 관한 법률에 대한 준비가 미흡한 실정이다. 예를 들어 공공기관의 데이터를 활용하여 날씨 예측, 재난 방재 서비스 등을 통해 국민의 삶을 제고함과 동시에 경제적으로 많은 이익을 가져올 수 있다. 그러나 개인정보를 타인이 악의적으로 이용할 수 있어 개인에게 경제적, 정신적 피해를 줄 수 있다. 또한 개인정보의 노출은 과거와 달리 삭제되거나 잊혀지지 않고 영구적으로 재사용이 가능하기 때문에 이를 사전에 막을 수 있는 방법이 필요하다. 이에 본고는 빅데이터 등장에 따른 시장구조 변화 및 경제적 파급효과를 분석하고, 법리적 분석을 바탕으로 빅데이터 기술이 올바르게 시장에 정착할 수 있은 법(규제)방안을 제시하고자 한다.

궤적 스트림 데이터로부터 동행 그룹 탐색 기법 (A Method for Finding Accompany Group from Trajectory Stream Data)

  • 강수현;이기용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.363-366
    • /
    • 2019
  • 객체들의 움직임의 흐름을 나타내는 궤적 데이터에서 함께 움직이는 궤적을 찾아 움직임 패턴을 탐색하는 연구들이 많이 이루어져 왔다. 하지만, 궤적 스트림 데이터에서 궤적의 이동 패턴을 탐색하는 연구는 많이 이루어지지 않았다. 그래서 본 논문은 시간의 흐름에 따라 흘러 들어오는 궤적 스트림 데이터에서 궤적의 이동 패턴을 탐색하여 동행 그룹을 탐색하는 새로운 방법을 제안한다. 기존에도 궤적 스트림 데이터에서 궤적들이 주어졌을 때 궤적들의 이동 패턴을 찾는 연구들은 존재하였으나 발견된 궤적이 언제 생성되었고 언제 소멸되었는지에 대한 정보를 자동으로 출력해 주는 연구는 아직 이루어진 바가 없다. 본 논문에서는 서로 다른 시간에 나타나고 사라지는 모습을 가진 궤적 스트림 데이터에서 동일한 시간에 나타나는 궤적을 찾는 방법을 제안한다. 제안 방법은 객체들의 좌표를 점진적으로 클러스터링을 수행하여 사용자에게 입력받은 지속 시간 이상 클러스터를 유지한 동행 그룹의 객체들을 반환한다. 또한, 기존 연구와 달리 해당 객체들의 지속 시간인 시작과 끝 시간도 자동으로 출력해 준다.

데이터 거버넌스 관점의 정보서비스 품질관리 (행정정보공동이용시스템 중심으로) (Information Service Quality Management in Data Governance Perspective (in Public Information Sharing System))

  • 고운혁;민대홍;이성현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.1402-1405
    • /
    • 2012
  • 데이터 품질의 패러다임 변화에 따라 기업에서는 효과적인 의사결정지원을 위한 정보서비스의 품질 관리가 중요하다. 본 연구에서는 설문조사를 통해 데이터 거버넌스 관점에서 행정기관 간 정보연계를 통해 민본 녹색 행정을 위한 '행정정보공동이용시스템'의 데이터 품질관련 현황을 분석하였다. 이와 관련하여 향후 정확하고 안전한 행정정보의 공동이용을 위한 정보서비스 품질관리체계 구축을 위한 대안으로서 데이터 거버넌스 관점의 행정정보 공유 데이터 품질관리체계 구축을 제시하는 바이다.