• 제목/요약/키워드: 바이오 데이터

검색결과 1,361건 처리시간 0.027초

Spark 프레임워크 기반 비정형 빅데이터 토픽 추출 시스템 설계 (A Design on Informal Big Data Topic Extraction System Based on Spark Framework)

  • 박기진
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권11호
    • /
    • pp.521-526
    • /
    • 2016
  • 온라인상에서 다루어지는 비정형 텍스트 데이터는 대용량이면서 비구조적 형태의 특성을 가지고 있기 때문에, 기존 관계형 데이터 모델의 저장 방식과 분석 방법만으로는 한계가 있다. 더군다나, 동적으로 발생하는 대량의 소셜 데이터를 활용하여 이용자의 반응을 실시간으로 분석하기란 어려운 상황이다. 이에 본 논문에서는 대용량 비정형 데이터(문서)의 의미를 빠르고, 용이하게 파악하기 위하여 데이터 셋에 대한 사전학습 없이, 문서 내 단어 비중에 따라 자동으로 토픽(주제)이 추출되는 시스템을 설계 및 구현하였다. 제안된 시스템의 토픽 모델링에 사용될 입력 단어는 N-gram 알고리즘에 의하여 도출되어 복수 개의 단어도 묶음 처리할 수 있게 했으며, 또한, 대용량 비정형 데이터 저장 및 연산을 위하여 Hadoop과 분산 인메모리 처리 프레임워크인 Spark 기반 클러스터를 구성하여, 토픽 모델 연산을 수행하였다. 성능 실험에서는 TB급의 소셜 댓글 데이터를 읽어 들여, 전체 데이터에 대한 전처리 과정과 특정 항목의 토픽 추출 작업을 수행하였으며, 대용량 데이터를 클러스터의 디스크가 아닌 메모리에 바로 적재 후, 처리함으로써 토픽 추출 성능의 우수성을 확인할 수 있었다.

BPR 실현을 위한 ERP 도입 : 회계관련모듈을 중심으로 (ERP Implementation for Realizing BPR : Focus on Accounting-related -Modules)

  • 남천현
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.477-486
    • /
    • 1999
  • 1990년대 중반에 한국기업에 도입된 ERP 시스템은 현재 많은 기업에서 현업에 활용되고 있거나 혹은 도입 의사결정을 하고 있는 상태이다. 특히 IMF 구제금융 이후 ERP 시스템은 단순한 효율성제고의 차원을 넘어 기업의 생존전략 및 경쟁력제고전략의 수단으로 활용되고 있는 추세이다. ERP시스템이 이렇게 전략적 차원의 수단으로 활용되고 있는 가장 중요한 요인은 ERP시스템이 기존의 수주개발시스템과 단위패키지시스템과 비교할 때, 시스템 통합에 기반한 양질의 비즈니스 프로세스를 제공하고 있다는 점과, 투자비용이 비교적 적고 개발기간이 비교적 짧다는 점을 들 수 있다. ERP의 발전과정은 기능별 시스템의 통합과정으로 이해할 수 있고, 또한 ERP시스템과 기존의 수주개발시스템 또는 단위패키지시스템의 가장 뚜렷한 차이가 바로 통합이라는 사실을 상기할 때, ERP시스템의 최대 가치는 통합에 있다. 한편 거대한 기업정보시스템의 통합을 가능하게 한 것은 바로 고급정보기술이다.(중략)

  • PDF

바이오 데이터 분석을 위한 웹 콘텐츠 개발에 관한 연구 (A Study on Web Contents Development for Bio Data Analysis)

  • 송영옥;최승권;신승수;조용환
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2003년도 춘계종합학술대회논문집
    • /
    • pp.399-402
    • /
    • 2003
  • 현재 많은 분야에서 IT 기반 기술의 급속한 발전을 이용하고 있다. 그 중 계속적인 발전을 보이고 있는 생명공학 분야의 기술과 정보기술의 한 형태로 바이오인포메틱스 분야에 많은 관심이 증가되고 있다. 본 논문에서는 이와 같은 바이오인포메틱스 의 분야에서 많은 사용자들이 이용해야하는 생명공학 기술과 데이터베이스 등을 이용하여 웹을 기반으로 하는 콘텐츠를 개발하는데 있어 핵심 기술들을 논하고자 한다. 이와 같은 BIT 관련된 콘텐츠 개발로 인해 현재 제한되어 있는 연구 환경을 개선하고 비용절감의 효과를 보일 수 있도록 한다.

  • PDF

단백질 상호작용 네트워크예서 상동성 기반 바이오 콤플렉스 예측 (A Homology-Based Prediction of Biological Complexes in a Protein-Protein Interaction Network)

  • 최재훈;박종민;박수준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.64-66
    • /
    • 2006
  • 본 논문에서는 생물학적 실험에 의해 추출된 이종의 단백질 콤플렉스를 통해 대상 종의 콤플렉스를 단백질 상호적용 네트워크에서 예측할 수 있는 방법을 제안한다. 이 예측은 먼저 이종사이에 단백질의 비교를 통해 상동성을 색인한 다음, 이 상동성을 이용하여 이종의 콤플렉스를 대상 종으로 변형하고 그 형태를 단백질 상호작용 네트워크에서 탐색하는 과정으로 수행된다. Swiss-Prot 데이터 베이스의 단백질들을 대상으로 상동성 색인을 색인하였으며, 콤플렉스 형태를 분석하기 위해 DIP의 단백질 상호작용 네트워크를 이용하였다.

  • PDF

USN 미들웨어 기반의 헬스 케어 모니터링 시스템에 대한 연구 (A Study on the Healthcare Monitoring System based USN Middleware)

  • 김의창;강해성
    • 한국IT서비스학회:학술대회논문집
    • /
    • 한국IT서비스학회 2009년도 추계학술대회
    • /
    • pp.467-472
    • /
    • 2009
  • USN은 하드웨어와 유 무선 통신기술이 서로 네트워크로 연결되어 사물이나 환경의 정보를 획득하고 가공해 유용한 정보로 창출하는 것을 목표로 하고 있으며, 그 중 u-Healthcare는 의료 서비스 질 향상이라는 필요성에 의해 이슈가 되고 있다. 본 논문에서는 이 기종 센서 네트워크에서 획득한 데이터를 추상화하고 상황에 맞는 서비스를 제공하는 지능형 미들웨어를 설계하였다. 설계된 미들웨어를 사회적 이슈가 되고 있는 IT의료 분야에 적용해서 헬스 케어 모니터링 시스템을 구현했다. 센서를 통해 온도, 습도, 조도, 심박 수, 체온을 측정해서 실시간으로 관리하고 모니터링 하는 기능을 지원한다. 또한, 실시간으로 전달되는 바이오 정보를 통합 관리하는 부분에 초점을 맞추어 연구를 진행했다.

  • PDF

데이터베이스와 디지털콘텐츠의 법률 문제

  • 김윤명
    • 디지털콘텐츠
    • /
    • 11호통권126호
    • /
    • pp.96-105
    • /
    • 2003
  • 디지털콘텐츠와 데이터베이스의 상호접근점을 찾을 수 있는 것은 디지털콘텐츠 자체가 여러 분야의 데이터의 집합임과 아울러 정보서비스를 통해 제공되는 내용물의 구성체가 바로 데이터베이스이기 때문이다. 그렇지만 이러한 보호의 기본적인 전제는 저작권법리가 구성될 수 있는 요건의 명확화라고 할 것이다. 또한 데이터베이스가 보호돼야하는 당위성에 대한 명확한 이해 없이는 데이터베이스에 대한 보호의 논의자체가 부정될 수 있을 것이다. 즉 쉽게 말해서 데이터베이스를 왜 보호하는가에 대한 논의라고 하겠다. 정보산업의 기간이 되고, 인터넷 등 네트웍을 통한 전자상거래가 활성화되면 자연 유통되는 정보자체가 디지털콘텐츠 형태의 데이터베이스가 될 것이다. 각국의 정보산업에 대한 구체적인 수치를 제시할 수는 없지만, 그 중에서 데이터베이스가 차지하는 부분은 상당할 것으로 예견되기 때문이다. 특히 디지털콘텐츠 내지 데이터베이스는 정보산업에서 문화산업으로의 범주가 확대되고 있는 상황 하에서, 문화적 종속을 제어할 수 있는 법제도적 장치로서의 역할도 기대된다고 할 것이다. 이러한 복합적인 요인이 바로 데이터베이스의 보호에 대한 문제 제기와 필요성이다. 더욱이 데이터베이스는 많은 경우 구성하는 콘텐츠의 선택과 결합하는 데 있어서 기술, 노력 및 경험 등이 요구되고, 기술 등의 발전으로 비용 등의 지불 없이 복제가 가능하기 때문에 법적인 보호 등이 요구된다.

  • PDF

클라우드 컴퓨팅 연구 동향과 보안 (The Research in Cloud Computing and Security)

  • 김만윤;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제49차 동계학술대회논문집 22권1호
    • /
    • pp.269-270
    • /
    • 2014
  • 정보통신 기술의 발전과 함께 우리는 현재 수많은 정보의 홍수 속에서 살고 있다. 이 수많은 정보를 저장하는 기술로 과거엔 플로피디스크가 있었다. 최근에는 기가바이트 이상의 데이터를 저장하면서 크기도 작은 USB와 하드디스크를 사용하고 있다. 하지만 이것도 이젠 과거의 일이 되어버렸다. 유형의 장비가 아닌 언제 어디서든 인터넷이 가능한 곳이라면 웹상에 원하는 정보를 저장하고 다운로드할 수 있게 되었기 때문이다. 이러한 대용량의 정보를 웹상에 저장하는 핵심기술의 집약체가 바로 클라우드 컴퓨팅 시스템(Cloud Computing System)이다. 기업과 국가의 경쟁력이 된 클라우드 컴퓨팅에도 취약점은 있다. 바로 보안이다. 본 논문에서는 클라우드 컴퓨팅 시스템을 소개하고, 클라우드 컴퓨팅의 보안 취약점에 대한 분석과 대응방안을 제시한다.

  • PDF

u-웰리스 환경을 위한 건강관리 전문가 키오스크 시스템 (A Health Management Expert Kiosk System for u-Wellness Environment)

  • 여현진;최학원;임광혁
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제50차 하계학술대회논문집 22권2호
    • /
    • pp.451-453
    • /
    • 2014
  • 본 논문은 공용부 기반 건강관리 Kiosk 개발을 통한 생체정보 및 건강 설문을 수집하여 Wellness Index 및 Expert 판정시스템을 통해 건강상태를 판정하고, 판정결과를 바탕을 개인 맞춤형 운동 및 영양정보 등을 추천하는 시스템 설계에 관한 연구이다. 본 시스템은 바이오 생체정보 측정 데이터를 기반으로 하고 있으며, 건강 설문모델 및 Framework 과 Expert 판정 모델 및 Framework을 키오스크 시스템으로 구현하여 사용자에게 건강관련 맞춤 정보를 제공하는 기능을 포함한다.

  • PDF

안전한 전자여권 사용을 위한 인증 기술 연구 (The authentication technology Research for using secure e-passports)

  • 전상엽;박정효;장승재;전문석
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2010년도 춘계학술발표논문집 1부
    • /
    • pp.183-186
    • /
    • 2010
  • 최근 전 세계적으로 전자여권을 도입하기 위한 연구가 미국을 중심으로 활발히 진행되고 있다. 또한 전자여권은 비접촉식 스마트카드 기능의 IC(Integrated Circuit) 칩에 사용자의 정보와 바이오정보 그리고 여러 보안 기능들을 포함함으로써 기존의 여권에서 발생하는 문제점들을 해결하고 있다. 그러나 기존의 RFID(Radio Frequency Identification) 기술에서 발생하는 데이터 위변조, 도청, 무단복제 및 바이오정보 노출 등의 문제점들을 아직 내재하고 있다. 따라서 본 논문에서는 현재 필수로 적용되는 BAC 메커니즘을 조금 더 안정적이고 효율적으로 개선한 EBAC 메커니즘을 제안한다.

  • PDF

SMS : SBML 문서관리기 (SMS : An SBML Document Manager)

  • 임정곤;김태경;정태성;조완섭
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.334-336
    • /
    • 2004
  • 최근 이슈가 되고 있는 시스템 생물학(Systems Biology)은 생물학적인 이론과 컴퓨터의 계산적인 모델링 그리고 실험의 상호 의존적인 통합으로써 특징 지워진다. 그 중 컴퓨터의 계산적인 모델링에 대한 연구가 무엇보다 중요한 비중을 차지하고 있다. 하지만 계산적인 모델링에서 여러 자원을 통합하기 위한 공통의 기반 구조나 표준에 대한 연구는 미흡한 실정이다. 이러한 문제점을 해결하기 위해 XML 기반의 형식을 갖춘 SBML(Systems Biology Markup Language)이 시스템 생물학의 표준으로 개발되어 연구 중에 있다. 현재 개발 중인 시뮬레이션과 데이터 분석을 위한 다양한 옹용 어플리케이션이 이미 SBML 문서를 지원하고 있다 본 연구에서는 시스템 생물학 분야에서 SBML 표준에 대한 중요성을 인식하여, 객체지향 바이오 데이터베이스로부터 질의의 결과를 SBML 문서로 변환하고, 반대로 SBML 문서를 객체지향 데이터베이스에 저장하는 변환기를 제안하고자 한다.

  • PDF