• 제목/요약/키워드: Big data Era

검색결과 365건 처리시간 0.029초

Perspectives of Integrative Cancer Genomics in Next Generation Sequencing Era

  • Kwon, So-Mee;Cho, Hyun-Woo;Choi, Ji-Hye;Jee, Byul-A;Jo, Yun-A;Woo, Hyun-Goo
    • Genomics & Informatics
    • /
    • 제10권2호
    • /
    • pp.69-73
    • /
    • 2012
  • The explosive development of genomics technologies including microarrays and next generation sequencing (NGS) has provided comprehensive maps of cancer genomes, including the expression of mRNAs and microRNAs, DNA copy numbers, sequence variations, and epigenetic changes. These genome-wide profiles of the genetic aberrations could reveal the candidates for diagnostic and/or prognostic biomarkers as well as mechanistic insights into tumor development and progression. Recent efforts to establish the huge cancer genome compendium and integrative omics analyses, so-called "integromics", have extended our understanding on the cancer genome, showing its daunting complexity and heterogeneity. However, the challenges of the structured integration, sharing, and interpretation of the big omics data still remain to be resolved. Here, we review several issues raised in cancer omics data analysis, including NGS, focusing particularly on the study design and analysis strategies. This might be helpful to understand the current trends and strategies of the rapidly evolving cancer genomics research.

클라우드 컴퓨팅 서비스의 혁신특성, 테크노스트레스가 혁신저항 및 수용의도에 미치는 영향: 공공부문 도입을 중심으로 (Effects of Innovation Characteristics of Cloud Computing Services, Technostress on Innovation Resistance and Acceptance Intention: Focused on Public Sector)

  • 신우찬;안현철
    • 지식경영연구
    • /
    • 제20권2호
    • /
    • pp.59-86
    • /
    • 2019
  • As the era of the 4th Industrial Revolution evolves, not only private companies but also government agencies and institutions in public sector are adopting cloud computing services converged by new information technologies such as IoT, big data, and artificial intelligence to strengthen competitiveness and create new business values. The purpose of this study is to investigate the relationship between innovation characteristics, innovation resistance, and acceptance of innovative technologies from the perspective of cloud computing services in the public sector. In this study, we collected the survey data from 190 employees of IT division in the public sector, and analyzed the causal relationship between innovation characteristics, technostress, innovation resistance, and intention to adopt the cloud computing service that they perceived. As a result of the analysis, we demonstrated that innovation characteristics, technostress have significant effect on innovation resistance and acceptance intention, and that top executive commitment and innovation resistance also have significant effect on acceptance intention. This study provides meaningful practical implications for the staffs preparing for adoption of cloud computing services and the executives who make the final decision in public sector.

4차 산업혁명시대 무역인력양성 방향과 전략에 관한 연구 (The Direction & Strategy of Human Resources Development in Global Business Practise in the 4th Industrial Revolution)

  • 조원길
    • 무역학회지
    • /
    • 제44권4호
    • /
    • pp.67-85
    • /
    • 2019
  • This study analyzes the trade issues and curriculum issues of universities in the 4th Industrial Revolution era with the aim of finding strategies to improve the curriculum of international commerce and to cultivate trade manpower by matching them with the trade job competencies required by trade enterprises. To this end, trade college students, GTEP partners, industry-academia partners, and expert groups of N university were asked to provide information on trade curriculum for the current curriculum. The resulting data were analyzed by questionnaire frequency analysis and FGI method to reveal that both students and graduates are interested in improving the trade curriculum of the university, and that companies are also demanding talents who are responsible for the comprehensive process of trade practice and can perform sincerely and comprehensively. Therefore, we have established a new curriculum that is suitable for the 4th industrial age, opened a certificate acquisition course suitable for the needs of the company, and developed the commercial practice, trade simulation, capstone design, and PBL teaching method. Ways are suggesting to reduce mismatch between universities and companies.

Introduction of the Korea BioData Station (K-BDS) for sharing biological data

  • Byungwook Lee;Seungwoo Hwang;Pan-Gyu Kim;Gunwhan Ko;Kiwon Jang;Sangok Kim;Jong-Hwan Kim;Jongbum Jeon;Hyerin Kim;Jaeeun Jung;Byoung-Ha Yoon;Iksu Byeon;Insu Jang;Wangho Song;Jinhyuk Choi;Seon-Young Kim
    • Genomics & Informatics
    • /
    • 제21권1호
    • /
    • pp.12.1-12.8
    • /
    • 2023
  • A wave of new technologies has created opportunities for the cost-effective generation of high-throughput profiles of biological systems, foreshadowing a "data-driven science" era. The large variety of data available from biological research is also a rich resource that can be used for innovative endeavors. However, we are facing considerable challenges in big data deposition, integration, and translation due to the complexity of biological data and its production at unprecedented exponential rates. To address these problems, in 2020, the Korean government officially announced a national strategy to collect and manage the biological data produced through national R&D fund allocations and provide the collected data to researchers. To this end, the Korea Bioinformation Center (KOBIC) developed a new biological data repository, the Korea BioData Station (K-BDS), for sharing data from individual researchers and research programs to create a data-driven biological study environment. The K-BDS is dedicated to providing free open access to a suite of featured data resources in support of worldwide activities in both academia and industry.

하둡 클러스터의 대역폭을 고려한 압축 데이터 전송 및 저장 기법 (Data Transmitting and Storing Scheme based on Bandwidth in Hadoop Cluster)

  • 김용민;김희진;김영관;홍지만
    • 스마트미디어저널
    • /
    • 제8권4호
    • /
    • pp.46-52
    • /
    • 2019
  • 산업 현장과 공공 기관에서 생성 및 수집되는 데이터의 크기가 빠르게 증가하고 있다. 기존의 데이터 처리 서버는 스케일업 방식으로 성능을 높여 증가하는 데이터를 처리하였다. 그러나 데이터의 생성 속도가 폭증하는 빅데이터 시대에는 기존 방식의 서버로는 데이터 처리에 한계가 있다. 이러한 한계를 극복하기 위해 스케일 아웃 방식으로 데이터를 분산 처리하는 분산 클러스터 컴퓨팅 시스템이 등장하게 되었다. 그러나 분산 클러스터 컴퓨팅 시스템은 데이터를 분산 처리하기 때문에 네트워크 대역폭을 비효율적으로 사용할 경우 클러스터 전체의 성능을 하락시킬 수 있다. 본 논문에서는 네트워크 대역폭을 고려하여 하둡 클러스터에서 데이터 전송 시 데이터를 압축 전송하는 기법을 제안한다. 제안 기법은 네트워크 대역폭과 압축 알고리즘의 특징을 고려하여 최적의 압축 전송 기법을 선정 후 전송한다. 실험 결과는 제안 기법을 사용할 경우 데이터 전송 시간과 크기를 감소시킨 것을 보여준다.

빅데이터를 활용한 맞춤형 교육 서비스 활성화 방안연구 (Data Analytics in Education : Current and Future Directions)

  • 권영옥
    • 지능정보연구
    • /
    • 제19권2호
    • /
    • pp.87-99
    • /
    • 2013
  • 데이터의 급속한 증가로 데이터를 활용한 새로운 가치 창출은 기업뿐 아니라 국가 경쟁력의 중요한 요소로 대두대고 있다. 이에 따라 데이터를 분석하여 통찰력을 제시할 수 있는 데이터 과학자라 불리는 분석 전문가의 수요가 늘고 있는데, 이들 전문 인력 양성을 위해서는 정부, 학계, 산업의 공동 노력이 필요하다. 본 연구는 특히 교육 분야에서의 빅데이터 활용현황을 조사하고, 새로운 데이터 기반의 맞춤형 서비스 및 교육 과정을 제안한다. 또한, 데이터 과학자 양성을 위한 국내외 대학 및 기업의 대표적인 프로그램들을 살펴보고, 장기적인 관점에서 분석능력을 배양할 수 있는 새로운 교과과정도 제시한다. 본 연구는 다양한 사례를 바탕으로 대학에서 데이터를 활용한 교육환경 개선을 위한 방안을 모색하는데 도움을 주고자 한다.

통계모형의 정확도에 기반한 비식별화 데이터의 품질 측정 (Data Quality Measurement on a De-identified Data Set Based on Statistical Modeling)

  • 전희주;이현지;연규필;김동례
    • 한국콘텐츠학회논문지
    • /
    • 제19권5호
    • /
    • pp.553-561
    • /
    • 2019
  • 본 연구에서는 개인정보 비식별화 데이터의 통계적 유용성에 대한 품질 측정 방안에 대하여 통계 모형화에 따른 예측 정확도 측면에서 고찰하였다. 4차 산업혁명 시대에서 정보통신기술을 통한 혁신에는 반드시 빅데이터의 효과적인 활용이 필수적이지만, 개인정보 이슈는 적극적인 빅데이터 활용에 제약이 되고 있다. 이를 해결하기 위해 비식별화 가이드라인이 제정되었으며 다양한 개인정보 비식별화 방법이 활용되면서 개인정보의 실질적인 재식별 가능성은 매우 낮아졌다. 반면에 강력한 비식별화는 데이터의 유용성을 떨어뜨리는 부작용이 나타날 수 있다. 그 동안은 재식별 불가능한 비식별화 방법이 연구의 주를 이루어 왔다면 본 연구에서는 대표적인 비식별 방법인 KLT 모형에 의한 비식별화 데이터에 대한 통계적 유용성 측면의 품질 측정에 대하여 연구하였다. 비식별화 데이터에 대한 통계적 예측모형의 정확도에 기반하여 비식별화 된 데이터의 통계적 유용성이 어느 정도 훼손되는지에 대하여 사례분석을 수행하였다. 또한, 비식별 자료에 어느 정도의 비식별화 되지 않은 자료가 추가되어야 예측모형의 정확도를 회복하는 지를 살펴봄으로써 비식별화된 자료의 데이터 유용성 정도에 대한 새로운 측정지표를 제안하였다.

데이터 활용률 제고를 위한 기술 용어의 상호 네트워크 생성과 통제 (Generating and Controlling an Interlinking Network of Technical Terms to Enhance Data Utilization)

  • 정도헌
    • 정보관리학회지
    • /
    • 제35권1호
    • /
    • pp.157-182
    • /
    • 2018
  • 빅 데이터 시대에 접어들면서 저장 기술과 처리 기술이 급속도로 발전함에 따라, 과거에는 간과되었던 롱테일(long tail) 데이터가 많은 기업과 연구자들에게 관심의 대상이 되고 있다. 본 연구는 롱테일 법칙의 영역에 존재하는 데이터의 활용률을 높이기 위해 텍스트 마이닝 기반의 기술 용어 네트워크 생성 및 통제 기법을 제안한다. 특히 텍스트 마이닝의 편집 거리(edit distance) 기법을 이용해 학문분야에서 사용되는 기술 용어의 상호 네트워크를 자동으로 생성하는 효과적인 방안을 제시하였다. 데이터의 활용률 향상 실험을 위한 데이터 수집을 위해 LOD(linked open data) 환경을 이용하였으며, 이 과정에서 효과적으로 LOD 시스템의 데이터를 활용하는 기법과 용어의 패턴 처리 알고리즘을 제안하였다. 마지막으로, 생성된 기술 용어 네트워크의 성능 측정을 통해 제안한 기법이 롱테일 데이터의 활용률 제고에 효과적이었음을 확인하였다.

빅데이터 분석방법을 이용한 예측모형의 신뢰도 향상에 관한 연구 (A Study of improving reliability on prediction model by analyzing method Big data)

  • 송민구;김선배
    • 디지털융복합연구
    • /
    • 제11권6호
    • /
    • pp.103-112
    • /
    • 2013
  • 전통적인 방식의 예측모형 구축에서 사용되는 데이터는 주로 데이터베이스에 잘 보관되어 있는 정형데이터를 사용하였다. 하지만 지금의 상황은 스마트 시대의 도래로 인한 통신수단의 획기적인 발달로 비정형 데이터가 전체데이터의 80%를 상회하는 현실이다. 이러한 현실에서 기존의 방법대로 정형데이터 만을 이용하여 예측모형을 개발하면 예측모형의 신뢰성에 문제가 있을 것이다. 즉 전체데이터의 80%에 해당하는 비정형(SNS, 페이스북, 트위트, 이미지, 동영상 등)과 반정형(로그데이터)데이터를 반드시 포함하여 모형을 구축해야 만이 신뢰성을 현실화 시킬 수 있을 것이다. 본 논문에서는 예측모형 개발시 빅데이타 방법론을 적용하여 예측 모형의 신뢰성을 높이고, 데이터를 이용하여 제안된 방법과 전통적인 방법의 예측모형의 신뢰도를 비교 분석 하였다.

의사결정나무의 분기법 변화가 예측력에 미치는 영향 (The impact of the change in the splitting method of decision trees on the prediction power)

  • 장영재
    • 응용통계연구
    • /
    • 제35권4호
    • /
    • pp.517-525
    • /
    • 2022
  • 빅데이터 시대에 이르러 다양한 데이터 마이닝 기법이 주요 분석 방법론으로 제안되었다. 복잡 다양한 데이터가 양산되면서 데이터 마이닝 기법은 데이터 과학의 토대를 이루는 방법으로 부각되었다. 본고에서는 해석의 유용성과 예측력 향상의 측면 모두에 초점을 맞추어 다양한 실험 연구를 시행하였다. 구체적인 모형으로는 의사결정나무를 선택하였는데, 이는 실무적 사용 빈도가 높은 방법으로서 활용 폭이 넓을 뿐만 아니라 이해가 쉽고 성능평가가 용이한 방법론이기 때문이다. 의사결정나무모형을 대상으로 이 모형의 구조를 크게 변형시키지 않으면서도 예측력 향상의 목적을 이룰 수 있는 방법을 살펴보았으며 분기변수의 선택 방법이 모형의 성능에 미치는 영향을 분석하였다. 이 효과를 측정하기 위해서 다양한 모의실험 모델을 생성하고 분기법의 변화에 따른 예측력을 비교하였다. 비선형성을 지니면서 단일 분할을 통해서 하위 집합으로 명확하게 구분하기 어려운 복잡한 데이터의 경우에는 선형결합 분기방법이 예측력 제고에 도움을 주는 것으로 나타났다.