• 제목/요약/키워드: 과학적 데이터 분석 방법론

검색결과 135건 처리시간 0.032초

데이터 과학의 방법론을 적용한 데이터 기반 디자인 방법론에 대한 연구 - 미세먼지 정보 서비스 앱의 디자인 리서치 사례를 중심으로 (Data-Driven Design Methodology based on Data Science Paradigm Focused on Design Research Case Study of Fine Dust Information App Service)

  • 이현진
    • 한국콘텐츠학회논문지
    • /
    • 제21권10호
    • /
    • pp.103-114
    • /
    • 2021
  • 본 연구는 데이터 과학의 분석적 연구 방법을 디자인 연구에 활용할 수 있는 방법을 모색, 실증해봄으로써 빅데이터 기반의 디자인 분야에서 데이터 자원을 효과적으로 활용하고, 빅데이터 기술과 디자인이 상생 발전할 수 있는 디자인 연구 방향을 제시하였다. 본 연구의 방법은 먼저 고전적인 디자인 리서치의 방법들과 데이터를 활용한 디자인 리서치의 연구 방법론, 데이터 과학의 연구 방법론을 고찰하고 디자인과 데이터 과학의 선행연구들을 종합하여 데이터 과학의 연구 방법론과 디자인 프로세스를 통합하는 데이터 기반 디자인의 연구 방법론을 개발 제안하였다. 제안된 연구 모델은 데이터 기반 서비스 앱의 디자인 리서치 사례 연구를 수행하여 제안한 방법론의 적용 가능성을 살펴보았으며, 제시한 연구 방법의 적용을 위하여 데이터 큐레이션 방법에 대한 연구와 디자이너의 데이터 문해력 확보가 향후 연구과제로 도출되었다.

빅데이터 분석 프로젝트 수행 방법론 (Bigdata Analysis Project Development Methodology)

  • 김형래;전도홍;지승현
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권3호
    • /
    • pp.73-85
    • /
    • 2014
  • 기업 경쟁력 제고를 위해 빅데이터 분석의 중요성이 대두됨에 따라, 기업의 문제점을 체계적으로 파악하고 이를 해결하여 사업적 가치로 재평가하기 위해서는 통합적 빅데이터 프로젝트 수행 방법이 필요하다. 이에 따라 실무적 활용 용이성을 높이도록 소프트웨어 개발과 프로젝트 관리가 융합된 "과학적 데이터 분석 방법론(SDAD)"를 제안한다. SDAD는 프로젝트 수행 과정을 문제정의, 데이터준비, 모델설계, 모델구현, 결과평가, 서비스구현의 6단계를 구성한 후, 단계별 과업을 공정별(47개)로 세분화하고 산출물(93개)을 도출한다. SDAD 는 기존의 ISP, DW, SW 개발 방법론에서 빅데이터 분석과 관련된 부분을 통합하고 쉽게 결과물을 연동할 수 있도록 하였다. 또한, 다양한 분야의 전문가로 구성된 참여자 간에 의사소통의 효율성을 높이기 위해 RACI 챠트를 통해 공정별 책임자를 할당하는 방법과 표준화된 의사소통 절차를 제시한다. SDAD 방법론은 한국고용정보원에서 수행한 빅데이터 프로젝트에 적용하여 감리의 평가를 받은 결과 적정한 것으로 나타났다.

빅데이터 분석은 사회과학 연구에서 방법론적 혁신인가? (Is Big Data Analysis to Be a Methodological Innovation? : The cases of social science)

  • 이상기
    • 문화기술의 융합
    • /
    • 제9권3호
    • /
    • pp.655-662
    • /
    • 2023
  • 사회과학 분야에서 빅데이터 연구는 기존의 사회과학 연구방법을 보완하는 역할을 하고 있다. 사회과학자들이 선호하는 서베이 및 실험 방법이 주로 회상 기억에 의존하여 다소 부정확하다면 빅데이터는 실시간 기록이라 보다 정확하다. 기존의 사회과학 연구가 시간과 비용 등의 이유로 연구대상을 전수 조사하기보다 표집에 의한 표본 조사를 주로 하는 것과 달리 빅데이터 연구는 전수에 가까운 데이터를 분석한다. 그렇지만 시간의 흐름에 따라 사회 분위기가 변할 수 있고, 연구대상도 동일하지 않아 연구의 반복 및 재현은 둘 다 쉽지 않다. 무엇보다 기존의 사회과학 연구가 '이론-방법-데이터'의 삼각구조가 튼튼한 데 반해 빅데이터를 활용한 분석은 이론의 빈약함을 보이고 있어 심각한 문제다. 과학적 설명논리로서의 이론이 없으면 연구결과를 얻고서도 제대로 해석하지 못하거나 온전히 활용 할 수 없기 때문이다. 그러므로 빅데이터 연구가 진정한 방법론적 혁신이 되기 위해서는 새로운 이론(블랙박스)을 창출하기 위한 연구자들의 노력과 함께 빅 씽킹(big thinking)이 필요함을 제안했다.

인공지능 기반 사회 통계 생산 방법론 고도화 방안: 가계동향조사와 생활시간조사 사례 (Advancing Societal Statistics Processing Methodology through Artificial Intelligence: A Case Study on Household Trend Survey and Time Use Survey)

  • 오교중;최호진;김일구;한승우;김건수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.563-567
    • /
    • 2023
  • 본 연구는 한국 통계청이 수행하는 가계동향조사와 생활시간조사에서 자료처리 과정 및 방법을 혁신하려는 시도로, 기존의 통계 생산 방법론의 한계를 극복하고, 대규모 데이터의 효과적인 관리와 분석을 가능하게 하는 인공지능 기반의 통계 생산을 목표로 한다. 본 연구는 데이터 과학과 통계학의 교차점에서 진행되며, 인공지능 기술, 특히 자연어 처리와 딥러닝을 활용하여 비정형 텍스트 분류 방법의 성능을 검증하며, 인공지능 기반 통계분류 방법론의 확장성과 추가적인 조사 확대 적용의 가능성을 탐구한다. 이 연구의 결과는 통계 데이터의 품질 향상과 신뢰성 증가에 기여하며, 국민의 생활 패턴과 행동에 대한 더 깊고 정확한 이해를 제공한다.

  • PDF

소셜 네트워크 분석 방법론을 활용한 1인 주거공간디자인 융합콘텐츠 상관관계 분석 (A Study on Correlation Analysis of One-Person Housing Space Design Convergence Contents by Using Social Network Analysis)

  • 박은수;김지은
    • 한국과학예술포럼
    • /
    • 제34권
    • /
    • pp.133-148
    • /
    • 2018
  • 우리나라의 가구구조는 앞으로 1인 가구가 가장 보편적인 가구 유형이 될 것으로 예측되고 있다. 이에 본 연구는 급격히 늘어난 1인 가구 주거자의 삶을 총체적으로 고려한 1인 주거 공간을 디자인하기 위한 콘텐츠를 도출하기 위해, 1인 가구 주거를 형성하는 사회·경제·문화적 영향요인 등을 빅데이터 분석을 통해 객관적으로 도출하고, 콘텐츠 간의 상관관계를 소셜 네트워크 분석 방법론을 활용하여 다각적으로 분석하였다. 빅 데이터 분석 방법론을 적용해 1인 주거공간과 관련된 총 60개의 핵심 콘텐츠를 도출하였으며, 소셜네트워크 분석을 통해 가장 영향력이 큰 콘텐츠는 공간의 편집, 공간 구성 카테고리로 도출되었다. 이는 주거공간은 사용자의 삶의 변화에 따라 탄력적으로 대응할 수 있는 디자인 아이디어가 중요한 부분을 차지한다고 볼 수 있다. 앞으로 더욱 구체화된 1인 주거 공간의 컨셉 및 디자인방법론에 대한 연구를 진행하고자 한다.

자율운항선박의 원격 상황인식을 위한 AIS 기반 항적 데이터 분석 기초연구

  • 최진우;박정홍;김혜진
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2020년도 추계학술대회
    • /
    • pp.52-53
    • /
    • 2020
  • 자율운항선박의 효과적인 운영을 위해서는 자선 주변 해상 환경의 장애물 및 자선, 타선에 대한 통합적인 상황인식 정보가 요구된다. 상황인식은 현재의 시점에서 관측되는 정보를 바탕으로 운항 해역에 대한 종합적인 인식과 함께 가까운 미래에서 발생할 수 있는 위험 상황 및 비정상 상황에 대한 추론까지를 포함한다. 본 연구에서는 이러한 자율운항선박의 원격 상황인식을 위한 기초연구로써, 선박자동식별시스템 AIS의 항적 정보 분석에 대한 내용을 수행한다. AIS에서 얻어지는 항적 정보를 이용한 해상 상황인식을 수행하기 위한 전처리 과정으로써, 손실 데이터에 대한 보간 방법에 대한 연구를 수행한다. 구체적인 방법론은, 추적필터를 이용한 보간 방법과 항적 정보 학습 기반의 보간 방법을 적용하였으며, AIS에서 얻어지는 실제 항적 데이터를 이용하여 초기 결과를 검증하였다.

  • PDF

학술정보사이트의 이용자 참여형 평가 (User Participation Evaluation of A Scholarly Information Site)

  • 박민수
    • 정보관리학회지
    • /
    • 제28권4호
    • /
    • pp.85-97
    • /
    • 2011
  • 본 연구의 목적은 과학기술분야 학술정보사이트의 이용자 참여형 평가 방법론을 개발 및 적용시킴으로써 평가사이트를 개선시키는 데 있다. 실험은 통제된 환경에서 이루어졌다. 아이트랙킹, 검색로그, 설문지를 통해 수집한 데이터는 정량적으로 분석하였다. 아이트랙킹 데이터 분석 결과를 토대로, 평가사이트상에서 불필요한 항목을 제거하였고 콘텐츠와 이미지들을 재배열하였다. 검색로그 데이터는 시스템의 효율성이 증가하였음을 보여주고 있다. 설문지 데이터 분석 결과 또한 시스템이 전반적으로 개선하였음을 보여준다.

Innovation Capability Index of Korea's Manufacturing Firms: An Empirical Study Using the Community Innovation Survey (CIS) Dataset

  • 신태영
    • 기술혁신학회지
    • /
    • 제2권3호
    • /
    • pp.48-60
    • /
    • 1999
  • 과학기술지표는 전통적으로 R&D 투입 데이터와 특허자료가 사용되었지만 본 연구에서는 이들의 단점을 극복할 대안으로 기업의 혁신활동 지표를 제시하고자 한다 먼저 한국의 CIS 데이터가 소개되고 계량분석을 이용한 방법론이 소개된다. 한편 이를 이용하여 산업별 혁신 능력지수를 제시한다

  • PDF

불용어 시소러스를 이용한 비정형 텍스트 데이터 후처리 방법론에 관한 연구 (A Study on Unstructured text data Post-processing Methodology using Stopword Thesaurus)

  • 이원조
    • 문화기술의 융합
    • /
    • 제9권6호
    • /
    • pp.935-940
    • /
    • 2023
  • 인공지능과 빅데이터 분석을 위해 웹 스크래핑으로 수집된 대부분의 텍스트 데이터들은 일반적으로 대용량이고 비정형이기 때문에 빅데이터 분석을 위해서는 정제과정이 요구된다. 그 과정은 휴리스틱 전처리 정제단계와 후처리 머시인 정제단계를 통해서 분석이 가능한 정형 데이터가 된다. 따라서 본 연구에서는 후처리 머시인 정제과정에서 한국어 딕셔너리와 불용어 딕셔너리를 이용하여 워드크라우드 분석을 위한 빈도분석을 위해 어휘들을 추출하게 되는데 이 과정에서 제거되지 않은 불용어를 효율적으로 제거하기 위한 "사용자 정의 불용어 시소러스" 적용에 대한 방법론을 제안하고 R의 워드클라우드 기법으로 기존의 "불용어 딕셔너리" 방법의 문제점을 보완하기 위해 제안된 "사용자 정의 불용어 시소러스" 기법을 이용한 사례분석을 통해서 제안된 정제방법의 장단점을 비교 검증하여 제시하고 제안된 방법론의 실무적용에 대한 효용성을 제안한다.

AutoEncoder 기반 역난독화 사전학습 및 전이학습을 통한 악성코드 탐지 방법론 (Malware detection methodology through on pre-training and transfer learning for AutoEncoder based deobfuscation)

  • 장재석;구본재;엄성준;한지형
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.905-907
    • /
    • 2022
  • 악성코드를 분석하는 기존 기법인 정적분석은 빠르고 효율적으로 악성코드를 탐지할 수 있지만 난독화된 파일에 취약한 반면,, 동적분석은 난독화된 파일에 적합하지만 느리고 비용이 많이 든다는 단점을 가진다. 본 연구에서는 두 분석 기법의 단점을 해결하기 위해 딥러닝 모델을 활용한 난독화에 강한 정적분석 모델을 제안하였다. 본 연구에서 제안한 방법은 원본 코드 및 난독화된 파일을 grayscale 이미지로 변환하여 데이터셋을 구축하고 AutoEncoder 를 사전학습시켜 encoder 가 원본 파일과 난독화된 파일로부터 원본 파일의 특징을 추출할 수 있도록 한 이후, encoder 의 output 을 fully connected layer 의 입력으로 넣고 전이학습시켜 악성코드를 탐지하도록 하였다. 본 연구에서는 제안한 방법론은 난독화된 파일에서 악성코드를 탐지하는 성능을 F1 score 기준 14.17% 포인트 향상시켰고, 난독화된 파일과 원본 파일을 전체를 합친 데이터셋에서도 악성코드 탐지 성능을 F1 score 기준 7.22% 포인트 향상시켰다.