• Title/Summary/Keyword: 양적데이터

Search Result 278, Processing Time 0.039 seconds

민감한 양적 정보를 얻기 위한 확률화응답시스템의 구현

  • Park, Hui-Chang;Nam, Gi-Seong;Lee, Gi-Seong
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 2001.10a
    • /
    • pp.79-86
    • /
    • 2001
  • 본 논문에서는 민감한 양적 정보를 얻기 위한 조사에서 응답자들이 정직하게 응답하기를 꺼리는 질문들에 대하여 응답자의 비밀을 노출시키기 않고서 양적 정보에 대한 보다 정확한 정보를 얻을 수 있는 양적 확률화응답기법을 인터넷 상에서 사용할 수 있도록 구현하고자 한다. 본 시스템에 DB 환경에 바탕을 두어 기존의 온라인 설문조사 시스템 및 질적 확률화응답기법과 연계하여 자료를 공유할 수 있을 뿐만 아니라 독립된 스팟 서베이(spot survey)가 가능하도록 구현하고자 한다.

  • PDF

Quantitative Text Mining for Social Science: Analysis of Immigrant in the Articles (사회과학을 위한 양적 텍스트 마이닝: 이주, 이민 키워드 논문 및 언론기사 분석)

  • Yi, Soo-Jeong;Choi, Doo-Young
    • The Journal of the Korea Contents Association
    • /
    • v.20 no.5
    • /
    • pp.118-127
    • /
    • 2020
  • The paper introduces trends and methodological challenges of quantitative Korean text analysis by using the case studies of academic and news media articles on "migration" and "immigration" within the periods of 2017-2019. The quantitative text analysis based on natural language processing technology (NLP) and this became an essential tool for social science. It is a part of data science that converts documents into structured data and performs hypothesis discovery and verification as the data and visualize data. Furthermore, we examed the commonly applied social scientific statistical models of quantitative text analysis by using Natural Language Processing (NLP) with R programming and Quanteda.

A Case Study of Basic Data Science Education using Public Big Data Collection and Spreadsheets for Teacher Education (교사교육을 위한 공공 빅데이터 수집 및 스프레드시트 활용 기초 데이터과학 교육 사례 연구)

  • Hur, Kyeong
    • Journal of The Korean Association of Information Education
    • /
    • v.25 no.3
    • /
    • pp.459-469
    • /
    • 2021
  • In this paper, a case study of basic data science practice education for field teachers and pre-service teachers was studied. In this paper, for basic data science education, spreadsheet software was used as a data collection and analysis tool. After that, we trained on statistics for data processing, predictive hypothesis, and predictive model verification. In addition, an educational case for collecting and processing thousands of public big data and verifying the population prediction hypothesis and prediction model was proposed. A 34-hour, 17-week curriculum using a spreadsheet tool was presented with the contents of such basic education in data science. As a tool for data collection, processing, and analysis, unlike Python, spreadsheets do not have the burden of learning program- ming languages and data structures, and have the advantage of visually learning theories of processing and anal- ysis of qualitative and quantitative data. As a result of this educational case study, three predictive hypothesis test cases were presented and analyzed. First, quantitative public data were collected to verify the hypothesis of predicting the difference in the mean value for each group of the population. Second, by collecting qualitative public data, the hypothesis of predicting the association within the qualitative data of the population was verified. Third, by collecting quantitative public data, the regression prediction model was verified according to the hypothesis of correlation prediction within the quantitative data of the population. And through the satisfaction analysis of pre-service and field teachers, the effectiveness of this education case in data science education was analyzed.

Data analysis for quantitative proteomics research (프로테오믹스 연구를 위한 정량분석 데이터의 해석)

  • Kwon Kyung-Hoon
    • KOGO NEWS
    • /
    • v.6 no.1
    • /
    • pp.24-28
    • /
    • 2006
  • 프로테오믹스는 생물체 안에 포함되어 있는 단백질을 통합적으로 연구한다. 단백질을 동정(Protein identification)하고, 단백질의 상태를 분석(Protein characterization)하며, 단백질의 양적 변화를 관찰(Protein quantitation)한다. 단백질에 대한 분석, 특히 질량분석기에 의해 초고속으로 대량의 단백질 데이터를 생산하는 프테테오믹스의 연구는 정량적인 단백질 발현양상분석의 정확도를 높이고 분석시간을 단축하기 위해 다양한 실험기법과 데이터 분석기법을 동원하고 있다. 1) 단백질의 양적 차이나 양적 변화의 관찰은 바이오마커를 발굴하고 생명현상의 메카니즘을 규명하여 그 결과를 신약개발에 활용하기 위한 기초 연구이다. 이 글에서는 프로테오믹스 연구의 초창기부터 사용되어온 2차원 전기영동법에 의해 생성되는 2D-gel image에서의 스팟(spot)분석법과 함께, 탄뎀 질량분석기를 사용하는 ICAT, SILAC 등의 동위 원소를 사용한 라벨링(labeling) 방법, 라벨링을 하지 않는 label-free 방법 등 프로테오믹스에서의 정량분석법에 대한 기본 개념을 살펴보고, 이들에서의 데이터 분석 기술의 적용에 대해 간략히 소개하였다.

  • PDF

데이터통신서비스 이용자 실태조사

  • Korean Associaton of Information & Telecommunication
    • 정보화사회
    • /
    • s.5
    • /
    • pp.22-35
    • /
    • 1988
  • 데이터통신의 이용이 전 산업부문에 걸쳐 보편화되고 있는 추세이다. 데이터통신 서비스는 앞으로 기업뿐만 아니라 일반 공중에로 확산될 전망이다. 이와 같은 서비스 영역의 확산과 양적 팽창에 대비해서 데이터통신의 현재의 위상을 정립함은 물론 문제점을 정확히 도출하고 이를 개선할 방향을 제시하는 일이 필연적이다. 데이터통신 서비스 이용자 실태에 관한 설문조사를 통해 이같은 명제를 재조명해 본다.

  • PDF

Data Analysis Methods for Quantitative Proteomics Research

  • Gwon Kyeong-Hun
    • Proceedings of the Korean Society for Bioinformatics Conference
    • /
    • 2006.02a
    • /
    • pp.38-44
    • /
    • 2006
  • 프로테오믹스는 생물체 안에 포함되어 있는 단백질을 통합적으로 연구하는 학문이다. 단백질을 동정(Protein identification)하고, 단백질의 상태를 분석(Protein characterization)하며, 단백질의 양적 변화를 관찰(Protein quantitation)한다. 유전자로부터 mRNA 로 복제되고 codon 의 규칙에 따라 합성되는 단백질이 세포 내에 얼만큼 존재하는가라는 단백질의 양적인 변화는 세포 내의 환경에 따라 시시각각 변화할 수 있으며, 이러한 변화의 추적은 단백질의 기능을 밝히는 기초자료로서 중요성을 가진다. 특히 질병의 조기 진단을 위한 바이오마커를 발굴하기 위한 스크리닝 역할로서, 단백질의 발현 양상을 비교하는 프로테오믹스는 기대를 모으고 있다. 단백질에 대한 분석, 특히 질량분석기에 의해 초고속으로 대량의 단백질 데이터를 생산하는 프로테오믹스의 연구는 정량적인 단백질 발현양상 분석의 정확도를 높이기 위해 다양한 실험기법과 데이터 분석기법을 동원하고 있다. 이번 발표에서는 프로테오믹스에서 단백질의 양을 측정하기 위한 실험 방법들과 그에 따른 데이터 분석 방법들을 소개하고자 한다. 프로테오믹스 연구의 초창기부터 사용되어온 2차원 전기영동법에 의해 생성되는 2D-gel image 에서의 spot 분석법으로부터, 탄뎀 질량분석기를 사용하는 ICAT, iTRAQ 등의 labeling 방법에 의한 정량분석, 그리고 질량분석기의 정확도를 최대한으로 활용하는 label-free 방법에 대한 기본 개념을 살펴보고 데이터 분석 기술의 적용 방법을 알아본다.

  • PDF

공간 데이터 마이닝을 활용한 은행고객분석 -강남서초구를 중심으로-

  • 최경희;황철수
    • Proceedings of the KGS Conference
    • /
    • 2003.05a
    • /
    • pp.199-202
    • /
    • 2003
  • 정보기술과 컴퓨터 기술의 급속한 성장에 따른 데이터의 양적 증가로 최근 다양한 분야에서 과학적이고 정교한 분석이 요구되고 있다. 특히 은행분야는 금융환경과 소비자의 태도변화로 오래 전부터 축적해온 고객에 대한 방대한 데이터를 효과적으로 분석하여 이를 통한 사업성 증대를 뫼하고 있다 대부분의 은행의 고객 데이터 분석에서는 고객의 거래 정보나 인구통계 정보 분석이 대부분을 차지한다. (중략)

  • PDF

Conditions and potentials of Korean history research based on 'big data' analysis: the beginning of 'digital history' ('빅데이터' 분석 기반 한국사 연구의 현황과 가능성: 디지털 역사학의 시작)

  • Lee, Sangkuk
    • The Korean Journal of Applied Statistics
    • /
    • v.29 no.6
    • /
    • pp.1007-1023
    • /
    • 2016
  • This paper explores the conditions and potential of newly designed and tried methodology of big data analysis that apply to Korean history subject matter. In order to advance them, we need to pay more attention to quantitative analysis methodologies over pre-existing qualitative analysis. To obtain our new challenge, I propose 'digital history' methods along with associated disciplines such as linguistics and computer science, data science and statistics, and visualization techniques. As one example, I apply interdisciplinary convergence approaches to the principle and mechanism of elite reproduction during the Korean medieval age. I propose how to compensate for a lack of historical material by applying a semi-supervised learning method, how to create a database that utilizes text-mining techniques, how to analyze quantitative data with statistical methods, and how to indicate analytical outcomes with intuitive visualization.

A Query Language for Quantitative Analysis on Graph Databases (그래프 데이터베이스의 양적 분석을 위한 질의 언어)

  • Park, Sung-Chan;Lee, Sang-Goo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06a
    • /
    • pp.77-80
    • /
    • 2011
  • 그래프는 전산학의 주요 주제 중 하나이며 World Wide Web과 Social Network의 중요성이 커지면서 더욱 주목을 받고 있다. 그래프와 관련하여 그래프 데이터베이스에 대한 질의 모델에 관한 연구도 중요하게 다투어져 왔다. 하지만 이들 연구는 패턴 매칭을 통한 질의를 주로 다루었다. 하지만 그래프 데이터를 추천이나 검색 등의 응용하기 위해서는 PageRank 등 그래프 내의 연결 구조를 양으로 분석해내는 작업이 요구된다. 또한 SimRank 및 Random Walk with Restart 등 다양한 양적 분석 측도가 제안되고 있다. 이에 따라 본 연구에서는 Random Walk를 기반으로 하는 그래프에 대한 유연한 양적 분석을 지원하는 질의 언어를 제시한다. 또한 기존의 양적 분석 측도들이 본 질의 모델을 통하여 어떻게 표현되는지를 통하여 본 질의 모델의 유용성 및 확장성을 보인다.

A Text Classification System based on a Supervised Learning Algorithm (교사학습 알고리즘을 이용한 텍스트 분류 시스템)

  • 김진상;성정호;김성주
    • Proceedings of the Korea Database Society Conference
    • /
    • 1998.09a
    • /
    • pp.421-430
    • /
    • 1998
  • 지식경영을 위한 다양한 대상 업무중에서 텍스트 데이터의 마이닝은 특히 중요하다. 그 이유는 텍스트 데이터가 양적인 면에서 가장 풍부하고, 또 발견할 수 있는 지식을 가장 많이 포함하고 있기 때문이다. 본 논문에서는 텍스트 데이터베이스에서 지식발견을 위한 한 과정으로 텍스트 데이터베이스 내의 텍스트들을 분류하는 기법을 기술한다. 특히 문서 분류 방법은 데이터베이스의 일부 데이터를 훈련, 예제로 간주하여 교사 학습 알고리즘을 통해 학습한 후 나머지 데이터를 이용해 분류 정확성을 검증 및 향상시킨다. 시험 데이터로는 인터넷의 뉴스그룹의 기사를 이용하였고, 시험 결과 분류의 정확성은 한글 및 영문 모두 최소 70% 이상으로 나타났다.

  • PDF