• Title/Summary/Keyword: 데이터과학자

Search Result 591, Processing Time 0.029 seconds

Is Big Data Analysis to Be a Methodological Innovation? : The cases of social science (빅데이터 분석은 사회과학 연구에서 방법론적 혁신인가?)

  • SangKhee Lee
    • The Journal of the Convergence on Culture Technology
    • /
    • v.9 no.3
    • /
    • pp.655-662
    • /
    • 2023
  • Big data research plays a role of supplementing existing social science research methods. If the survey and experimental methods are somewhat inaccurate because they mainly rely on recall memories, big data are more accurate because they are real-time records. Social science research so far, which mainly conducts sample research for reasons such as time and cost, but big data research analyzes almost total data. However, it is not easy to repeat and reproduce social research because the social atmosphere can change and the subjects of research are not the same. While social science research has a strong triangular structure of 'theory-method-data', big data analysis shows a weak theory, which is a serious problem. Because, without the theory as a scientific explanation logic, even if the research results are obtained, they cannot be properly interpreted or fully utilized. Therefore, in order for big data research to become a methodological innovation, I proposed big thinking along with researchers' efforts to create new theories(black boxes).

양성자 가속기를 이용한 우주용 전자 부품의 방사선 인증 시험

  • 선종호;김성준;민경욱;정성근;최원호
    • Bulletin of the Korean Space Science Society
    • /
    • 2004.04a
    • /
    • pp.47-47
    • /
    • 2004
  • 사이클로트론 가속기를 이용한 양성자 우주환경의 모사시험이 수행되었다. 모사시험에 사용된 사이클로트론은 양성자를 약 106-108protons/$\textrm{cm}^2$/s의 선속에서 200MeV까지 가속할 수 있다. 가속된 양성자는 우주에서 사용될 전자 소자에 입사되었으며, 양성자 조사에 의한 소자의 누적 반응과 순간 반응이 모두 관찰되었다. 주된 순간 반응은 저장된 데이터의 변화였으나, 간헐적인 기능 정지 현상도 관찰되었다. 누적 반응은 소자 내에서 소모되는 전류의 증가로 나타났다. (중략)

  • PDF

KISTI-ML Platform: A Community-based Rapid AI Model Development Tool for Scientific Data (KISTI-ML 플랫폼: 과학기술 데이터를 위한 커뮤니티 기반 AI 모델 개발 도구)

  • Lee, Jeongcheol;Ahn, Sunil
    • Journal of Internet Computing and Services
    • /
    • v.20 no.6
    • /
    • pp.73-84
    • /
    • 2019
  • Machine learning as a service, the so-called MLaaS, has recently attracted much attention in almost all industries and research groups. The main reason for this is that you do not need network servers, storage, or even data scientists, except for the data itself, to build a productive service model. However, machine learning is often very difficult for most developers, especially in traditional science due to the lack of well-structured big data for scientific data. For experiment or application researchers, the results of an experiment are rarely shared with other researchers, so creating big data in specific research areas is also a big challenge. In this paper, we introduce the KISTI-ML platform, a community-based rapid AI model development for scientific data. It is a place where machine learning beginners use their own data to automatically generate code by providing a user-friendly online development environment. Users can share datasets and their Jupyter interactive notebooks among authorized community members, including know-how such as data preprocessing to extract features, hidden network design, and other engineering techniques.

Construction of Evaluation-Annotated Datasets for EA-based Clothing Recommendation Chatbots (패션앱 후기글 평가분석에 기반한 의류 검색추천 챗봇 개발을 위한 학습데이터 EVAD 구축)

  • Choi, Su-Won;Hwang, Chang-Hoe;Yoo, Gwang-Hoon;Nam, Jee-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.467-472
    • /
    • 2021
  • 본 연구는 패션앱 후기글에 나타나는 구매자의 의견에 대한 '평가분석(Evaluation Analysis: EA)'을 수행하여, 이를 기반으로 상품의 검색 및 추천을 수행하는 의류 검색추천 챗봇을 개발하는 LICO 프로젝트의 언어데이터 구축의 일환으로 수행되었다. '평가분석 트리플(EAT)'과 '평가기반요청 쿼드러플(EARQ)'의 구성요소들에 대한 주석작업은, 도메인 특화된 단일형 핵심어휘와 다단어(MWE) 핵심패턴들을 FST 방식으로 구조화하는 DECO-LGG 언어자원에 기반하여 반자동 언어데이터 증강(SSP) 방식을 통해 진행되었다. 이 과정을 통해 20여만 건의 후기글 문서(230만 어절)로 구성된 EVAD 평가주석데이터셋이 생성되었다. 여성의류 도메인의 평가분석을 위한 '평가속성(ASPECT)' 성분으로 14가지 유형이 분류되었고, 각 '평가속성'에 연동된 '평가내용(VALUE)' 쌍으로 전체 35가지의 {ASPECT-VALUE} 카테고리가 분류되었다. 본 연구에서 구축된 EVAD 평가주석 데이터의 성능을 평가한 결과, F1-Score 0.91의 성능 평가를 획득하였으며, 이를 통해 향후 다른 도메인으로의 확장된 적용 가능성이 유효함을 확인하였다.

  • PDF

Frame Arguments Role Labeling for Event extraction in Dialogue (대화문에서의 이벤트 추출을 위한 프레임 논항 역할 분류기)

  • Heo, Cheolhun;Noh, Youngbin;Hahm, Younggyun;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.119-123
    • /
    • 2020
  • 이벤트 추출은 텍스트에서 구조화된 이벤트를 분석하는 것이다. 본 논문은 대화문에서 발생하는 다양한 종류의 이벤트를 다루기 위해 이벤트 스키마를 프레임넷으로 정한다. 대화문에서의 이벤트 논항은 이벤트가 발생하는 문장 뿐만 아니라 다른 문장 또는 대화에 참여하는 발화자에서 발생할 수 있다. 대화문 주석 데이터의 부재로 대화문에서의 프레임 파싱 연구는 진행되지 않았다. 본 논문이 제안하는 모델은 대화문에서의 이벤트 논항 구간이 주어졌을 때, 논항 구간의 역할을 식별하는 모델이다. 해당 모델은 이벤트를 유발한 어휘, 논항 구간, 논항 역할 간의 관계를 학습한다. 대화문 주석 데이터의 부족을 극복하기 위해 문어체 주석 데이터인 한국어 프레임넷을 활용하여 전이학습을 진행한다. 이를 통해 정확도 51.21%를 달성한다.

  • PDF

Research Trends and Considerations for Blockchain-based IoT Cloud Systems (블록체인 기반 IoT 클라우드 시스템에 대한 연구동향 및 고찰)

  • Kim, Tae Woo;Park, Jong Hyuk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.349-352
    • /
    • 2020
  • 클라우드는 가상화 기술을 사용한 리소스의 유연성과 뛰아난 접근성을 장점으로 빅데이터, 딥러닝 등 여러 분야에서 클라우드를 사용하고 있다. 최근 클라우드와 결합된 IoT 시스템을 통해 시스템 관리, 데이터 처리 및 저장, 데이터를 이용한 빅데이터 활용 등 여러 방법으로 사용 할 수 있어 많은 관심을 받고 있다. 그러나 IoT 클라우드의 많은 활용에 따라 대규모 시스템화, 여러 사용자의 개인정보 저장 등의 이유로 많은 공격자의 표적이 되고있다. 여러 공격자의 공격을 방아하기 위해 IoT 클라우드 시스템은 블록체인, 보안 IoT 디바이스, 변형된 클라우드 모델등 여러 연구가 진행되고 있다. 본 논문에서는 최근 연구되고 있는 블록체인, 클라우드, IoT 시스템의 동향에 대해 조사하고, 기존에 연구되었던 기술을 바탕으로 효과적인 블록체인 기반의 IoT 클라우드 시스템을 제안한다. 제안하는 IoT 클라우드 시스템은 블록체인 기술을 사용하여 보안정책을 관리할 수 있어 신뢰성이 높으며, 클라우드 시스템이 작동하지 않을 경우 페일오버 기능을 수행할 수 있어 가용성이 뛰어나다.

Objectivity in Korean News Reporting : Machine Learning-Based Verification of News Headline Accuracy (기계학습 기반 국내 뉴스 헤드라인의 정확성 검증 연구)

  • Baik, Jisoo;Lee, Seung Eon;Han, Jiyoung;Cha, Meeyoung
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.281-286
    • /
    • 2021
  • 뉴스 헤드라인에 제3자의 발언을 직접 인용해 전언하는 이른바 '따옴표 저널리즘'이 언론 보도의 객관주의 원칙을 해치는지는 언론학 및 뉴스 구독자에게 중요한 문제이다. 이 연구는 온라인 포털사이트를 통해 실시간 유통되는 한국어 기사의 정확성을 판별하기 위한 기계학습(Machine Learning) 모델을 제안한다. 이 연구에서 제안하는 모델은 Edit Distance와 FastText 기법을 활용해 기사 제목과 본문 내 인용구의 유사성을 측정하고, XGBoost 모델을 활용해 최종 분류한다. 아울러 이 모델을 통해 229만 건의 뉴스 헤드라인에 대해 직접 인용구가 포함된 기사가 취재원의 발언을 주관적인 윤색없이 독자들에게 전하고 있는지를 판별했다. 이뿐만 아니라 딥러닝 기반의 KoELECTRA 모델을 활용해 기사의 제목 내 인용구에 대한 감성 분석을 진행했다. 분석 결과, 윤색이 가미되지 않은 직접 인용형 기사의 비율이 지난 20년 동안 10% 이상 증가했으며, 기사 제목의 인용구에 나타나는 감정은 부정 감성이 긍정 감성의 2.8배 정도로 우세했다. 이러한 시도는 앞으로 계산사회과학 방법론과 빅데이터에 기반한 언론 보도의 평가 및 개선에 도움을 주리라 기대한다.

  • PDF

Parent's Role in Rearing Gifted Children: Case of Mothers of Gifted Children in Korea Science Gifted Academy (영재아 양육에 대한 어머니의 역할: 한국과학영재학교 사례를 중심으로)

  • Shim, Eun-Young;Kim, So-Mee;Choe, Seung-Urn
    • Journal of the Korean earth science society
    • /
    • v.30 no.4
    • /
    • pp.495-512
    • /
    • 2009
  • We arranged and classified rearing patterns of gifted children's parents in order to find out mothers' roles for their gifted children. We developed a frame of parents' role to analyze the rearing cases of nine mothers whose children currently attend the Korea Science Gifted Academy. We surveyed and conducted semi-structured interviews with nine mothers to collecting qualitative data and were able to find out their roles that were classified into 4 distinctive roles: Instructor, Supporter, Dialogist and Moral Discipliner. Findings indicated that there was no significant difference between the roles found from parents' interview and the ones found from literature review. However, it is noticed that Korean mothers not only played a role for connecting their children's human networks but also did the role for controling the natural process of learning Korean characters and words with siblings as well as parents before school age.

Modeling of metadata for agricultural and livestock food product (농축산물 식품 메타데이터 모델링)

  • Cho, Hyeeun;Kim, Dae-young
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2016.10a
    • /
    • pp.475-478
    • /
    • 2016
  • This paper deals with how to operate the metadata for agricultural and livestock food product through the GS1 Source which is a GS1 standard metadata service. We defines GS1 standard identifiers for identifying food product and explain the guidelines for the methods how to document with GS1 standard schema and how to query the metadata in the storage of GS1 Source.

  • PDF

Implementation of TMO-based Real-time Multi-target Tele-monitoring System (TMO기반의 실시간 다중 상대 원격 모니터링 시스템의 구현)

  • Zheng, Xue;Jeong, Karp-Joo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2007.06b
    • /
    • pp.422-426
    • /
    • 2007
  • 오늘날에 있어서는 e-Science는 점차 현실 생활에 침투되고 있는 추세를 보이며 많은 기기들의 발전과 더불어 온라인 원격 제어, 무선통신 등이 보다 쉽게, 많은 영역에서 지원되고 있다. 과학영역에서의 원격 실험은 세계적인 이슈로 부상되면서 여기에 관련된 각종의 구상과 기술들이 차츰 구축되어 나가고 있는 현실이다. 본 논문은 이런 시각에서 출발하여 원격 실험의 중요한 부분인 다중상대 원격 모니터링 시스템의 구현에 포커스를 두고 있다. TMO 기반의 실시간 다중상대 원격 모니터링 시스템은 지역적으로 떨어져있는 여러 개의 관찰 대상을 실시간 미들웨어를 사용하여 보다 정확하게, 다각도, 고화질로 보여주는데 목표를 두고 있으며 보안적인 차원에서 환경과 접목을 할 예정이다. 본 논문에서는 로컬에 있는 카메라와 네트워크로 연결되어 있는 데이터 수집자(Data Collector)의 구현을 바탕으로 기술 되어 있다. 데이터 수집자는 카메라/센서에서 발생되는 RAW 데이터를 직접 받아서 동기화 해주고 실시간으로 보여주는 기능을 하며 특정된 파일 포맷으로 데이터를 저장해주는 역할을 한다.

  • PDF