• 제목/요약/키워드: 데이터 논문

검색결과 41,647건 처리시간 0.049초

FCM 클러스터링 기반 지도 학습 알고리즘을 이용한 당뇨병 예측 분석 (Diabetes Predictive Analytics using FCM Clustering based Supervised Learning Algorithm)

  • 박태언;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.580-582
    • /
    • 2022
  • 본 논문에서는 데이터를 정량화하여 특징을 분류하기 위한 방법으로 퍼지 클러스터링 기반 지도 학습 방법을 제안한다. 제안된 방법은 FCM 클러스터링을 기법을 적용하여 군집화를 수행한다. 그리고 군집화 된 데이터들 중에서는 정확히 분류되지 않은 데이터가 존재하므로 분류되지 않은 데이터에 대해 지도 학습 방법을 적용한다. 본 논문에서는 당뇨병의 유무를 타겟 데이터로 설정하고 나머지 8개의 속성의 데이터를 FCM 기반 지도 학습 방법을 적용하여 당뇨병의 유무를 예측한다. 당뇨병 예측에 대한 성능을 30회의 K-겹 교차검증 (K-Fold Corss Validation)을 이용하여 평가하였으며, 다층 퍼셉트론의 경우에는 훈련 데이터가 77.88%, 테스트 데이터가 62.78%로 나타났고 제안된 방법의 경우에는 훈련 데이터가 79.96%, 테스트 데이터 74.16%로 나타났다.

  • PDF

초·중·고등학생 대상 데이터 교육 연구 동향 분석 (The Analysis on Research Trends in Data Education for K-12 students)

  • 문현우;이영준
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.391-394
    • /
    • 2023
  • 본 연구에서는 국내 초·중·고 정보교육에서 이뤄지고 있는 데이터 교육 연구 동향을 분석하여, 향후 데이터 교육의 연구 방향을 제안하고자 하였다. 이를 위해 2015년부터 2023년 5월까지 게재된 국내 논문 중 데이터 교육 관련 논문 45편을 발행 연도, 연구 대상, 연구 분야, 데이터 리터러시 요소별로 분석하였다. 분석 결과 데이터 교육은 초등학생을 대상으로 집중적으로 이뤄지고 있었고 개발 및 적용 관련 연구가 가장 많이 이뤄지고 있었다. 또한 데이터 리터러시의 전 요소를 포함한 연구와 인공지능과 관련된 연구의 비중이 높음을 확인할 수 있었다. 따라서 본 연구를 바탕으로 SW·AI 교육을 위한 데이터 교육이 활발히 이뤄지길 기대한다.

  • PDF

자율주행자동차의 빅데이터 분석을 통한 연구 동향 파악 (Identify research trends through big data analysis method for autonomous driving car)

  • 남궁혜리;강선준;원유형;박성욱
    • 한국기술혁신학회:학술대회논문집
    • /
    • 한국기술혁신학회 2017년도 추계학술대회 논문집
    • /
    • pp.459-468
    • /
    • 2017
  • 본 논문에서는 자율주행자동차와 관련한 주제어를 선정하여 KCI 등재 논문의 서론 자료를 수집하고, 이에 빅데이터 분석 기법을 적용하였다. 이를 토대로 자율주행자동차와 관련된 다양한 이슈 분석을 통해 자율주행자동차의 연구 동향을 파악할 수 있으며, 추가적인 연구가 필요한 분야에 대해 알 수 있다. 제4차 산업혁명의 영향으로 등장한 다양한 기술들의 활용이라고 볼 수 있는 자율주행자동차는 2025년 상용화 될 가능성이 높다. 자율주행자동차의 상용화를 위해 지속적인 연구와 논의가 필요하지만, 과거부터 등재된 자율주행자동차 관련 KCI 논문 빅데이터 분석을 통해 기술들 간의 군집 방식과 주제어의 밀집도, 네트워킹 형성 방식 등에 대해 파악할 수 있다. 이처럼 논문 데이터 분석을 통해 향후 정부출연(연), 혹은 기업체에서 더욱 발전시켜야 할 부분에 대해 인지하고 정부 차원의 과제 지원과 연구를 통해 자율 주행자동차 상용화를 촉진시킬 수 있을 것이라고 예상한다.

  • PDF

체적 데이터의 특징점을 이용한 효율적인 볼륨 랜더링 (Volume Rendering Using Special Point of Volume Data)

  • 김형균;김용호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.666-669
    • /
    • 2005
  • 본 논문에서는 3차원 형태로 체적 데이터를 효율적으로 랜더링 하기 위해서, 체적 데이터의 특징점을 추출하고 이를 이용하여 3차원 형태로 복원한다. 여기서, 3D Point(Vertext)를 이용하여 체적 데이터를 랜더링하고자 하여 체적소들에 대해 특정한 3D Points 추출하는 PEF 과정과 랜더링 과정을 담당하는 정점 변환 파이프라인 과정을 제안한다. 일반적으로, 고화질의 광선 추적 랜더링 처리의 경우 계샨량이 많아 그 만큼 랜더링 속도가 떨어져 체적에 대한 다른 ?A너링 기법들이 많이 제안되고 있지만, 본 논문은 다른 각도로의 접근하고자 하여, 기존의 광선 추적에 비해 저화질과 매끄럽지 않는 영상을 나타내지만, 추출된 데이터만 고려하기 때문에 계샨량을 많이 줄일 수 있어 처리속도가 개선되어 졌을 볼 수가 있다. 또한, 본 논문에서 기존의 광선 추적 기법에서 표현하는 회전, 절단, 축소/확대의 기능을 그대로 OpenGL을 이용하여 본 논문에서 제안한 처리 단계로 하여 3차원 랜더링 프로그램 제작 하였다.

  • PDF

한국인 연구자의 논문 데이터 분석과 활용 (Analysis and Usage of Research Data of Korean Researchers)

  • 최원준;김재훈;김정환
    • 한국콘텐츠학회논문지
    • /
    • 제17권12호
    • /
    • pp.537-544
    • /
    • 2017
  • 국내뿐만 아니라 전 세계적으로 과학기술정보 데이터는 꾸준하게 증가하고 있다. 분야에 관계없이 하루에도 많은 양의 문헌이 만들어지고 배포되는 현 시점에서 연구자들이 이러한 문헌 정보를 효과적으로 사용하여 가치 있고 인간 생활에 유용한 연구 활동을 지원하기 위한 요구가 늘어나고 있다. 과거에는 연구자가 필요한 정보를 검색하는 수준에서 벗어나 이제는 데이터와 데이터를 연결시키고 활용 가능한 고부가가치 정보를 찾아내어 연구자에게 제시하는 서비스로 점점 변화하고 있다. 본 연구에서는 국내외의 과학기술정보 데이터 중에서 한국인 연구자가 작성한 문헌 데이터를 분석하여 활용 사례를 알아보고, 연구자들을 위한 서비스에 도움을 주는 정보를 제시하고자 한다.

WT-Heuristics: 스트림 데이터 환경에서의 효율적인 필터 연산자 순서화 기법 (WT-Heuristics: An Efficient Filter Operator Ordering Technology in Stream Data Environments)

  • 민준기
    • 정보처리학회논문지D
    • /
    • 제15D권2호
    • /
    • pp.163-170
    • /
    • 2008
  • 인터넷과 인트라넷의 확산에 따라, 스트림 데이터 처리 (stream data processing) 와 같은 새로운 분야가 등장하게 되었다. 스트림 데이터는 실시간적이고 연속적으로 생성된다. 본 논문에서는 시간에 따라서 예측할 수 없게 특성이 바뀌는 데이터 스트림에 대한 처리에 대하여 다룬다. 특별히, 본 논문에서는 스트림 데이터에 대한 질의문을 구성하는 연산자들 간의 효율적인 수행 순서 생성 기법인 WT-Heuristics를 제안한다. WT-Heuristics 기법은 연산 실행 순서에서 인접한 두 연산자들의 연산 순서만을 고려함으로써 효율적으로 연산자 순서를 결정할 수 있다. 또한 본 논문에서 제안하는 방법은 시스템의 부담을 적게 주면서도 데이터의 변화에 따라 수행 순서를 변화시킨다.

데이터사이언스 연구의 지적 구조 분석 및 시각화 (Analyzing and Visualizing the Intellectual Structure of Data Science)

  • 박형주
    • 한국콘텐츠학회논문지
    • /
    • 제22권7호
    • /
    • pp.18-29
    • /
    • 2022
  • 본 탐색적 연구의 목적은 데이터사이언스 관련 논문의 연구 동향을 분석하는 것이다. 본 연구는 Clarivate Analytics사의 Web of Science(WoS)에 색인된 데이터사이언스 관련 논문을 분석의 대상으로 했다. 2012년부터 2021년까지 WoS에 색인된 데이터사이언스 관련 논문 총 17,997편을 분석했다. 데이터사이언스 연구의 지적 구조를 집중 분석하기 위해 기술 분석, 인용 분석, 공동 저자 네트워크 분석, 동시 출현 네트워크 분석, 서지 결합 분석, 동시 인용 분석을 수행했다. 본 연구의 결과는 향후 데이터사이언스 관련 연구의 방향성 모색에 유용하게 사용될 수 있다.

병렬 코퍼스 필터링과 한국어에 최적화된 서브 워드 분절 기법을 이용한 기계번역 (Parallel Corpus Filtering and Korean-Optimized Subword Tokenization for Machine Translation)

  • 박찬준;김경민;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.221-224
    • /
    • 2019
  • 딥러닝을 이용한 Neural Machine Translation(NMT)의 등장으로 기계번역 분야에서 기존의 규칙 기반,통계기반 방식을 압도하는 좋은 성능을 보이고 있다. 본 논문은 기계번역 모델도 중요하지만 무엇보다 중요한 것은 고품질의 학습데이터를 구성하는 일과 전처리라고 판단하여 이에 관련된 다양한 실험을 진행하였다. 인공신경망 기계번역 시스템의 학습데이터 즉 병렬 코퍼스를 구축할 때 양질의 데이터를 확보하는 것이 무엇보다 중요하다. 그러나 양질의 데이터를 구하는 일은 저작권 확보의 문제, 병렬 말뭉치 구축의 어려움, 노이즈 등을 이유로 쉽지 않은 상황이다. 본 논문은 고품질의 학습데이터를 구축하기 위하여 병렬 코퍼스 필터링 기법을 제시한다. 병렬 코퍼스 필터링이란 정제와 다르게 학습 데이터에 부합하지 않다고 판단되며 소스, 타겟 쌍을 함께 삭제 시켜 버린다. 또한 기계번역에서 무엇보다 중요한 단계는 바로 Subword Tokenization 단계이다. 본 논문은 다양한 실험을 통하여 한-영 기계번역에서 가장 높은 성능을 보이는 Subword Tokenization 방법론을 제시한다. 오픈 된 한-영 병렬 말뭉치로 실험을 진행한 결과 병렬 코퍼스 필터링을 진행한 데이터로 만든 모델이 더 좋은 BLEU 점수를 보였으며 본 논문에서 제안하는 형태소 분석 단위 분리를 진행 후 Unigram이 반영된 SentencePiece 모델로 Subword Tokenization를 진행 하였을 시 가장 좋은 성능을 보였다.

  • PDF

XML 계층구조론 이용한 비디오 검색 및 데이터 관리 (Video Searching System using XML Hierarchical structure)

  • 윤은일;김동석;박병호;최영식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (A)
    • /
    • pp.160-162
    • /
    • 2002
  • 본 논문에서는 한국통신 멀티미디어연구소에서 개발한 XML 계층구조를 이용한 비오 검색 시스템에 대해 설명한다. 대용량 비디오 데이터 및 관련 메타데이터의 관리 및 제어를 위해서 비디오 데이터와 관련메타데이터에 대해 XML 계층구조를 생성하여 저장하고 검색 요청시 XML 계층구조를 반영하는 Xpath 생성하여 질의처리를 한다. 본 논문에서는 XML 계층구조를 이용한 비디오 검색 시스템을 설계 하고 구현한다.

  • PDF

예약 알로하 방식 매체접속제어 프로토콜에서의 채널 할당 (Channel Allocation in Reservation ALOHA Medium Access Control Protocol)

  • 정충교
    • 전자공학회논문지S
    • /
    • 제36S권3호
    • /
    • pp.1-7
    • /
    • 1999
  • 일대다 형상을 갖는 통신시스템에서 많이 고려되는 예약 알로하 방식 매체접속제어 프로토콜의 성능은 예약 채널과 데이터 채널의 분배 양식에 의해 달라진다. 본 논문에서는 이 프로토콜을 직렬 2단 대기열 모델로 근사화하고, 데이터의 지연을 성능 척도로 하여 이를 줄이는 세가지 채널 할당 방식을 제시하였다. 그리고 이들에 대한 모의실험을 통해 그 동작 특성을 규명하고 성능을 평가하였다. 그 결과 이들의 성능은 트래픽의 특성, 특히 데이터 길이의 분산에 크게 의존하며, 일반적으로는 데이터에 우선권을 주는 방식이 우수하나, 데이터 길이의 분산이 큰 경우에는 비례배분 할당 방식이 우수한 것으로 평가되었다.

  • PDF