• 제목/요약/키워드: 바이오 데이터

검색결과 1,361건 처리시간 0.03초

CANVAS: A Cloud-based Research Data Analytics Environment and System

  • Kim, Seongchan;Song, Sa-kwang
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권10호
    • /
    • pp.117-124
    • /
    • 2021
  • 이 논문에서 우리는 국가연구데이터플랫폼 (DataON)의 분석서비스인 CANVAS (Creative ANalytics enVironment And System)를 제안한다. CANVAS는 연구데이터 분석 자원과 도구가 필요한 연구자들을 위한 개인화된 분석 클라우드 서비스이다. CANVAS는 마이크로서비스 아키텍쳐 기반으로 확장성을 고려하여 설계하였으며 전자정부프레임워크인 Spring 프레임워크, Kubernetes, JupyterLab 등의 오픈소스 소프트웨어를 이용하여 구축하였다. 구축된 시스템은 여러 사용자에게 개인화된 분석환경을 제공하며 고성능 클라우드 인프라 (CPU·GPU)를 활용하여 고속의 대용량 데이터 분석이 가능하다. 구체적으로 JupyterLab 이나 GUI 워크플로우 환경에서 데이터 모델링 및 처리가 가능하다. CANVAS는 DataON과 데이터가 공유되므로 사용자가 등록하거나 다운로드 받은 연구데이터는 CANVAS에서 바로 분석을 수행할 수 있다. 이로서 CANVAS는 DataON 사용자의 데이터 분석 편의성을 높이고 연구데이터 공유·활용 활성화에 기여한다.

딥러닝 기반 무역 수출 가격 예측 모델 (Predicting the Future Price of Export Items in Trade Using a Deep Regression Model)

  • 김지훈;이지항
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권10호
    • /
    • pp.427-436
    • /
    • 2022
  • 산업통상자원부에서 제공하는 KOTRA 무역 데이터는 해당 품목과 해당 국가에 대하여 GDP, 관세율, 비즈니스 점수, 과/차년도 수출금액 등을 제공한다. 그러나 무역 수출품목은 수없이 많을뿐더러 그에 따른 대량의 데이터를 매년 수작업 기반 분석을 통해 유의미한 결과를 이끌어내는 것은 상당히 큰 시간과 비용을 요구한다. 따라서 이번 연구에선 대량의 데이터를 학습하여 단기간에 저비용으로 결과 예측이 가능한 다층 퍼셉트론 모델을 구현하고 성능을 평가하였다. 먼저 딥러닝 기반 무역 수출 가격 예측 모델을 일반적 다변량 회귀 모델과 비교하였을 때, 예측 오류와 학습 시간 측면에서 통계적으로 우수한 성능을 보였다. 수출 가격 데이터는 시계열 속성이 있을 것으로 예상하는 바, 은닉 노드들이 모두 연결된 다층 퍼셉트론과 순환 신경망을 이용하여 수출 가격 데이터를 예측하였다. 그 결과 새로운 데이터에 대해 수출 가격 예측을 위한 일반화 능력은 순환 신경망이 우수한 성능을 보였으나, 다층 퍼셉트론이 무역 수출 가격 예측에서 더 뛰어난 성능을 보였다. 추후 장기간 데이터를 확보한다면, 순환 신경망 혹은 트랜스포머 기반 딥러닝 모델을 이용하여 더 뛰어난 수출 가격 예측이 가능할 것으로 사료된다.

VTS 데이터 공유를 위한 IVEF 데이터 및 프로토콜 개선방안

  • 이병길;김병두;조현숙;이신걸;서홍용
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2012년도 춘계학술대회
    • /
    • pp.487-489
    • /
    • 2012
  • 최근 해상교통관제시스템(VTS : Vessel Traffic Service)은 항행지원정보교류가 가능한 육상국으로서 선박 통항의 안전과 효율성을 증진시키고 환경을 보호하는 e-Navigation의 핵심적 시스템으로 역할이 기대되고 있다. 최근 IALA를 통하여 국제적으로 데이터 공유를 위한 구조에 대한 연구와 표준 포맷이 정해지고 있으며 IVEF(IVEF:Inter-VTS Data Exchange Format)는 이중의 한 중요한 요소이다. 이러한 실시간의 트래픽 정보는 국가적으로 보안에 민감한 요소이나 현 규격에 정해진 보안성에 대한 규정은 다소 정해진 바 없이, 연동하기 위한 보안 규격을 다시 설계하여 상호 추진하고 연동시험을 수행해야 될 수준이다. 또한 Radar에 대한 물표 자체의 전달은 현재 고려하고 있지 않기 때문에 Track되지 않은 물표는 불필요한 많은 속성들을 같이 전송해야 하며, 레이더 물표에 대한 별도의 정해진 속성은 없는 상태여서 기존의 선박의 길이를 기반으로 비율을 고려하여 다시 재 산출되어야 가능하다. 따라서, 본 연구에서는 이러한 데이터 공유를 위한 IVEF의 규격을 검토하고 이를 보완하는 내용을 고려하여 새로운 프로토콜 및 방안을 제시한다. 이러한 구조는 VTS 시스템에서 적용 가능한 방안인지를 확인하여, 실제 적용할 수 있는 기술개발로서 방향을 정립하고자 한다.

  • PDF

음소 기반의 유사율 알고리즘을 이용한 Home Network 환경에서의 음성 인식 (Voice Recognition using a Phoneme based Similarity Algorithm in Home Networks)

  • 이창섭;유재봉;박준석;양수호;김유섭;박찬영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.767-770
    • /
    • 2005
  • 네트워크상에서 전달되는 음성데이터는 전달되는 과정에서 잡음 등의 외부 요인으로 인하여 데이터에 손실이 생기는 문제가 발생한다. 이렇게 전달된 음성데이터가 음성 인식기를 통과하면 바로 음성 인식기를 통과했을 때 보다 인식률이 낮아진다. 본 연구에서는 홈 네트워크를 제어하는데 있어서 음성 인식률을 향상시키기 위해서 음성 데이터를 입력받아, 이를 음소단위 기반의 유사율 알고리즘을 적용시켜 이미 구축된 홈 네트워크 용어 관련 사전에 등록된 단어와의 유사성을 검토하여 추출된 결과로 홈 네트워크를 제어하는 방안을 제안한다. 음소단위 기반의 유사율 알고리즘과 다중발화를 이용했을 때 Threshold 값이 85% 일 경우 사전에 구축된 단어와 매칭된 인식률은 100%였으며, 사전에 없는 단어의 오인식률은 2%로 감소되었다.

  • PDF

제조 및 유통산업을 위한 RFID 기반 자동 검수 시스템의 설계 및 구현 (RFID-Based Automatic Inspection System Design and Implementation for Manufacturing and Retail Industry)

  • 김진석;박종권;신용태
    • 한국통신학회논문지
    • /
    • 제39C권1호
    • /
    • pp.97-105
    • /
    • 2014
  • 현재 제조, 유통산업에서는 입출고 운영결과를 수기 작성, 전산 입력 또는 엑셀파일에 의존하는 물류를 운영하고 있다. 이에 수기 입력 오류, 전산 입력 오류, 실시간 데이터 처리 불가, 수량 부족/초과 문제 발생과 같이 물류를 운영하는데 문제가 발생하고 있다. 이에 본 논문은 RFID 기술을 활용하여 입출고 데이터 처리를 통한 입고 자동 검수 시스템을 제안한다. 또한 실시간 데이터 처리 및 자동 검수를 통해 기존 물류 운영 대비 RFID를 적용한 시스템의 비용 절감효과를 제안한다. RFID 기술을 적용하여 입출고 데이터를 현장에서 실시간으로 처리할 수 있으며 수량 부족/초과 문제도 현장에서 바로 조치할 수 있게 된다. 그럼으로써 현재 운영 시스템 대비 RFID 시스템을 통해 물류비를 절감할 수 있다.

융합 인덱싱 방법에 의한 조인 쿼리 성능 최적화 (Join Query Performance Optimization Based on Convergence Indexing Method)

  • 짜오티엔이;이용주
    • 한국전자통신학회논문지
    • /
    • 제16권1호
    • /
    • pp.109-116
    • /
    • 2021
  • RDF(Resource Description Framework) 데이터 구조는 그래프로 모델링하기 때문에, 관계형 데이터베이스와 XML 기술의 기존 솔루션은 RDF 모델에 바로 적용하기 어렵다. 우리는 링크 데이터를 더욱 효과적으로 저장하고, 인덱스하고, 검색하기 위해 융합 인덱싱 방법을 제안한다. 이 방법은 HDD(Hard Disk Drive) 와 SSD(Solid State Drive) 디바이스에 기반한 하이브리드 스토리지 시스템을 사용하고, 불필요한 데이터를 필터하고 중간 결과를 정제하기 위해 분리된 필터 및 정제 인덱스 구조를 사용한다. 우리는 3개의 표준 조인 검색알고리즘에 대한 성능 비교를 수행했는데, 실험 결과 제안된 방법이 Quad와 Darq와 같은 다른 기존 방법들에 비해 뛰어난 성능을 보인다.

KoEPT: Transformer 기반 생성 모델을 사용한 한국어 수학 문장제 문제 자동 풀이 (KoEPT: Automatically Solving Korean Math Word Problems using Generative Transformer)

  • 임상규;기경서;김부근;권가진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.362-365
    • /
    • 2021
  • 이 논문에서는 자연어로 구성된 수학 문장제 문제를 자동으로 풀이하기 위한 Transformer 기반의 생성 모델인 KoEPT를 제안한다. 수학 문장제 문제는 일상 상황을 수학적 형식으로 표현한 자연어 문제로, 문장제 문제 풀이 기술은 실생활에 응용 가능성이 많아 국내외에서 다양하게 연구된 바 있다. 한국어의 경우 지금까지의 연구는 문제를 유형으로 분류하여 풀이하는 기법들이 주로 시도되었으나, 이러한 기법은 다양한 수식을 포괄하여 분류 난도가 높은 데이터셋에 적용하기 어렵다는 한계가 있다. 본 논문은 이를 해결하기 위해 우선 현존하는 한국어 수학 문장제 문제 데이터셋인 CC, IL, ALG514의 분류 난도를 측정한 후 5겹 교차 검증 기법을 사용하여 KoEPT의 성능을 평가하였다. 평가에 사용된 한국어 데이터셋들에 대하여, KoEPT는 CC에서는 기존 최고 성능과 대등한 99.1%, IL과 ALG514에서 각각 89.3%, 80.5%로 새로운 최고 성능을 얻었다. 뿐만 아니라 평가 결과 KoEPT는 분류 난도가 높은 데이터셋에 대해 상대적으로 개선된 성능을 보였다.

메모리내 연산 기술의 클라우드 신뢰실행 관련 연구 전망

  • 신수환;이호준
    • 정보보호학회지
    • /
    • 제33권5호
    • /
    • pp.11-16
    • /
    • 2023
  • 오늘 날의 클라우드 워크로드는 인공지능 및 빅 데이터 활용의 비약적인 발전으로 인하여 메모리 대역폭이 프로세서의 연산 속도를 따라가지 못해 병목 현상을 겪고 있다. 이러한 이른바 메모리 벽 문제 (Memory Wall Problem)를 해결하기 위해 컴퓨터 아키텍처 및 운영체제는 변화해 나가고 있다. 그 중 최근 가장 주목 받는 기술 중 하나인 메모리내 연산기술(Processing-In-Memory)는 프로세서를 메모리 디바이스 내에 탑재함으로써, 데이터를 메인 프로세서에 이동시켜 처리할 필요 없이 데이터 내부에서 처리한다. 이로 인해 대용량 데이터의 처리속도 향상과 동시에 메인 메모리버스의 부하를 줄여 클라우드 시스템의 전반적인 성능 향상 또한 꽤할 수 있다. 한편, 클라우드 아키텍처는 또 다른 요구에 의하여 변화를 거치고 있으며, 이는 바로 보안이다. 오늘 날의 컴퓨터 아키텍처 및 GPU등의 가속기들은 신뢰실행 기술 (Trusted Execution)의 지원을 통하여 클라우드에서의 민감한 연산을 격리 및 보호하고자 한다. Intel의 SGX와 NVIDIA GPU의 confidential computing기능 지원이 이러한 흐름을 대표한다. 최근 PIM을 활용한 보안기술의 새로운 방향들을 제시하는 연구들이 소개되고 있는 가운데, 본 논문은 클라우드 신뢰실행 (Trusted Execution)에서의 PIM을 적용한 최신 연구들의 방향을 소개하고 또한 향후 연구 전망을 제공하고자 한다. PIM기술의 동향과 PIM을 보안에 특화시킨 연구, 그리고 앞으로 해결되어야할 과제들을 논함으로써, 새로이 주목받는 PIM 기반 보안 기술들을 정리하고 향후 전망을 제공한다.

텍스트 마이닝 기반의 그래프 모델을 이용한 미발견 공공 지식 추론 (Inferring Undiscovered Public Knowledge by Using Text Mining-driven Graph Model)

  • 허고은;송민
    • 정보관리학회지
    • /
    • 제31권1호
    • /
    • pp.231-250
    • /
    • 2014
  • 정보통신기술의 발달로 학술 정보의 양이 기하급수적으로 증가하였고 방대한 양의 텍스트 데이터를 처리하기 위한 자동화된 텍스트 처리의 필요성이 대두되었다. 생의학 문헌에서 생물학적 의미와 치료 효과 등에 대한 정보를 발견해내는 바이오 텍스트 마이닝은 문헌 내의 각 개념들 간의 유의미한 연관성을 발견하여 의학 영역에서 상당한 시간과 비용을 줄여준다. 문헌 기반 발견 연구로 새로운 생의학적 가설들이 발견되었지만 기존의 연구들은 반자동화된 기법으로 전문가의 개입이 필수적이며 원인과 결과의 한가지의 관계만을 밝히는 제한점이 있다. 따라서 본 연구에서는 중간 개념인 B를 다수준으로 확장하여 다양한 관계성을 동시출현 개체와 동사 추출을 통해 확인한다. 그래프 기반의 경로 추론을 통해 각 노드 사이의 관계성을 체계적으로 분석하여 규명할 수 있었으며 새로운 방법론적 시도를 통해 기존에 밝혀지지 않았던 새로운 가설 제시의 가능성을 기대할 수 있다.

화장품을 바를 때 피부 마찰계수의 변화와 주관적인 평가와의 상관관계 연구 (A study on correlation between frictional coefficients and subjective evaluation while rubbing cosmetic product on skin)

  • 권영하;권현준;랑문정;이수민
    • 감성과학
    • /
    • 제8권4호
    • /
    • pp.385-391
    • /
    • 2005
  • 화장품을 바를 때 피부와 손가락 사이에서 일어나는 마찰계수는 화장품의 주관적 평가에 많은 영향을 주는 요소이다. in-vivo상태에서 피부와 접촉자 간의 마찰계수는 접촉자의 모양이나 거칠기의 정도 그리고 누르는 하중에 따라 변할 수 있다. 본 실험에서는 리니어 모터와 다축 로드셀을 이용하여 여러 가지 접촉자를 in-vivo상태에서 직접 피부에 접촉시키고 실시간으로 마찰계수를 측정할 수 있는 장치를 개발하였다. 이 장치를 이용하여 피부와 접촉자 간의 마찰계수를 측정하고 그 데이터를 화장품을 바를 때의 전후와 비교$\cdot$분석하였다. 또한 화장품을 바를 때 주관적인 평가에서 이용되는 형용사를 조사하며 마찰계수와의 그 상관관계를 분석하였다. 그 결과, 피부와 접촉자 간의 마찰계수는 화장품의 종류와 접촉자의 성질에 따라 0.17-1.2사이에서 나타나며, 주관적인 평가 또한 화장품을 바른 후 시간의 경과함에 따라 변하며, 그것은 마찰계수와 관련이 있음을 확인할 수 있었다.

  • PDF