• 제목/요약/키워드: 데이터 정제

검색결과 469건 처리시간 0.028초

SHAP을 활용한 벌크선 메인엔진 연료 소모량 예측연구 (A Study on the Prediction of Fuel Consumption of Bulk Ship Main Engine Using Explainable Artificial Intelligence)

  • 김현주;박민규;이지환
    • 한국항해항만학회지
    • /
    • 제47권4호
    • /
    • pp.182-190
    • /
    • 2023
  • 본 연구에서는 벌크 선박의 연료 소비를 예측하기 위해 XGBoost와 SHapley Additive exPlanation (SHAP)을 사용하는 예측 모델을 제안한다. 기존 연구에서도 선박 엔진 데이터와 기상데이터를 활용하였지만 선박 연료소모량 예측 모델에 대한 예측 결과의 신뢰성과 예측 모델 구현에 사용된 변수들에 대한 설명이 부족한 한계가 있었다. 이러한 문제를 해결하기 위해 본 연구에서는 XGBoost와 SHAP를 사용하여 예측 모델을 개발하였다. 이 연구는 연구 배경, 범위, 관련 규정 및 이전 연구들, 그리고 연구 방법론에 대한 소개를 제공하며, 또한 벌크선 데이터 정제 방법과 예측 모델 결과의 검증을 설명한다.

빅데이터를 위한 트랜스포머 기반의 언어 인식 기법 (Transformer-based Language Recognition Technique for Big Data)

  • 황치곤;윤창표;이수욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.267-268
    • /
    • 2022
  • 최근, 빅데이터 분석은 기계학습의 발전에 따른 다양한 기법들을 이용할 수 있다. 현실에서 수집된 빅데이터는 단어 간의 관계성에 대한 의미적 분석을 바탕으로 같거나 유사한 용어에 대한 자동화된 정제기법이 부족하다. 빅데이터는 보통 문장의 형태로 구성되어 있고, 이에 대한 형태소 분석이나 문장의 이해가 필요하다. 이에 자연어를 분석하기 위한 기법인 NLP는 단어의 관계성과 문장을 이해할 수 있다. 본 논문에서는 빅데이터를 시계열 접근법인 RNN의 단점을 보완한 기법인 트랜스포머와 리포머의 장단점에 대해 연구한다.

  • PDF

키워드 네트워크 분석을 이용한 연구데이터 관련 국내 연구 동향 분석 (An Analysis of Domestic Research Trend on Research Data Using Keyword Network Analysis)

  • 한상우
    • 한국도서관정보학회지
    • /
    • 제54권4호
    • /
    • pp.393-414
    • /
    • 2023
  • 본 연구는 연구데이터 관련 국내 연구의 동향을 파악하기 위하여 RISS에서 연구데이터 관련 논문을 수집하였으며, 데이터 정제 후 총 58건의 연구논문을 대상으로 134개의 저자 키워드를 추출하여 키워드 네트워크 분석을 수행하였다. 분석 결과, 첫째, 아직까지 국내에서 연구데이터 관련 연구의 수가 58건에 지나지 않아 추후 많은 관련 연구가 진행될 필요가 있음을 알 수 있었다. 둘째, 연구데이터 관련 연구 분야는 대부분 복합학 중 문헌정보학에 집중되어 있었다. 셋째, 연구데이터 관련 저자 키워드의 빈도분석 결과 '연구데이터관리', '연구데이터공유', '데이터리포지터리', '오픈사이언스' 등이 다빈도 주요 키워드로 분석되어 연구데이터 관련 연구는 위의 키워드를 중심으로 진행되고 있음을 알 수 있었다. 키워드 네트워크 분석 결과에서도 다빈도 키워드는 연결 중심성 및 매개 중심성에서 중심적인 위치를 차지하며 관련 연구에서 핵심 키워드에 위치하고 있음을 알 수 있었다. 본 연구의 결과를 통하여 최근의 연구데이터 관련 동향을 파악할 수 있었고, 향후 집중적으로 연구해야 하는 분야를 확인할 수 있었다.

빅데이터 분석을 통한 발명 교육 센터에 대한 사회적 인식 (Social Perception of the Invention Education Center as seen in Big Data)

  • 이은상
    • 한국융합학회논문지
    • /
    • 제13권1호
    • /
    • pp.71-80
    • /
    • 2022
  • 이 연구의 목적은 빅데이터 분석 방법을 이용하여 발명 교육 센터에 대한 사회적 인식을 확인해 보는 데 있다. 이를 위해 TEXTOM 사이트를 이용하여 네이버와 다음 사이트의 블로그, 카페, 뉴스 채널에서 '발명+교육+센터'를 검색 키워드로 2014년 1월부터 2021년 9월까지의 데이터를 수집하였다. 수집된 데이터는 TEXTOM 사이트에서 정제하였으며, 텍스트 마이닝 분석과 의미 연결망 분석을 위해 TEXTOM 사이트, Ucinet 6, Netdraw 프로그램을 이용하였다. 수집된 데이터는 1차와 2차의 정제 과정을 거쳐 단어빈도를 바탕으로 주요 키워드 60개를 선정하였으며, 선정된 주요 키워드는 매트릭스 데이터로 변환하여 의미 연결망 분석을 실시하였다. 이 연구의 텍스트 마이닝 분석 결과 '학생', '운영', '한국발명진흥회', '특허청' 등이 의미 있는 키워드임을 확인하였다. 의미 연결망 분석 결과 발명 교육 센터와 관련된 '교육 운영', '발명 대회', '교육 과정 및 진행', '사업 모집 및 지원', '주관 및 선정 기관' 등 5개의 군집을 확인할 수 있었다. 이 연구의 결과는 발명 교육 센터에 대한 연구를 수행하는 연구자나 정책 입안자의 학술 연구에 활용될 수 있을 것이다.

개인 방송 플랫폼 기술: 아프리카 TV와 유튜브를 중심으로

  • 윤영석;이현우
    • 정보와 통신
    • /
    • 제33권4호
    • /
    • pp.56-63
    • /
    • 2016
  • 개인 방송에 대한 관심이 폭증하고 있음에도 불구하고, 이에 대한 학술적 연구를 찾아보기는 어렵다. 본고는 대표적인 개인 방송 플랫폼인 아프리카 TV와 유튜브의 콘텐츠-시청자 매칭 기술과 대용량 데이터의 효율적 전송 기술을 중심으로 알아 본다. 개인 방송 플랫폼은 UGC(User Generated Contents)의 생산과 소비의 접점을 제공하는 중요한 역할을 담당한다. 개인 방송의 가장 큰 문제는 부적합한 콘텐츠의 무분별한 노출과 확산이다. 개인 방송 콘텐츠 생산자와 콘텐츠에 대한 정제 기술이 요구된다.

분산 환경에서의 서비스 및 컨텐츠 관리 시스템 설계 및 구현 (Service & Content Management System in distributed environments)

  • 윤인숙;장범환;정태명
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (A)
    • /
    • pp.232-234
    • /
    • 2002
  • 분산 컴퓨팅 환경에서 개인화된 사용자 정보, 외부 환경 정보와 로그 데이터를 기반으로 네트워크 상태를 모니터링하고 관리하여 안전하고 효율적인 서비스와 컨텐츠 정보를 제시하도록 한다. 사용자가 원하는 작업 요청 시 관리 서버는 평가 항목을 바탕으로 에이전트와 연계하여 실시간 정보를 송 수신하여 사용자에게 정제된 서비스 및 컨텐츠를 제공한다. 본 논문은 분산환경에서 자바 기술을 기반으로 서비스 및 컨텐츠 관리 시스템 설계 모델을 제안하고 구현을 통해 장점 및 특성을 기술한다.

  • PDF

유전자 프로그래밍을 이용한 RNA 구조 문법 학습 (Learning of RNA Structural Grammar using Genetic Programming)

  • 남진우;정제균;장병탁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.425-427
    • /
    • 2003
  • RNA는 세포내에서 유전자 발현에 직, 간접적으로 중요한 역할을 하며, RNA 구조는 세포 내에서의 기능과 깊은 연관이 있기 때문에 RNA 구조를 예측하는 것은 중요한 의미를 갖는다, 본 논문에서는 진화연산의 한가지인 유전자 프로그래밍(genetic programming) 방법을 사용하여 염기서열 정보를 참고하는 RNA 구조 문법의 학습 방법을 보여 준다. 이 RNA 구조를 의미하는 문법을 트리(tree)형태의 함수로 코드화(encoding) 한 후 이것을 유전자 프로그래밍 방법으로 진화시킨다. 진화를 통해 최적의 적합도를 갖는 트리의 문법을 테스트 데이터를 통해 평가한 결과 0.893의 특이도(speicificity)와 0.752의 민감도(sensitivity)를 보였다.

  • PDF

FPGA를 이용하여 다양한 클럭 데이터 전송 (The Transmission of Random Clock Data using FPGA)

  • 김윤권;신형승;정제명
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2006년 학술대회 논문집 정보 및 제어부문
    • /
    • pp.385-387
    • /
    • 2006
  • We made the logic that can transmit the service data and clock of interest by using the optical signal and demodulate the original signal at the receiving end. Because We can interface the all communications equipment to which We intended to send the signal. We can modulate the dock and clocked data using optical signal and then transmit the original optical signal to the receiving end, finally, arbitrarily control the traffic between ports.

  • PDF

비대칭 분해 필터를 통한 웨이블릿 영역에서의 영상 잡음 제거 (Image Denoising using an Asymmetric Analysis Filter in the Wavelet Domain)

  • 오준환;최창렬;정제창;김영섭
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅳ
    • /
    • pp.1723-1726
    • /
    • 2003
  • 본 논문에서는 상세 부밴드에서의 PSNR과 웨이블릿 계수의 계층적 데이터 구조 측면에 초점을 맞추어 웨이블릿 영역에서의 신호 해석을 통한 잡음 제거를 연구하였다. 제안된 방식은 기존의 방식들과는 달리 수직 또는 수평 방향의 고주파 성분에 의한 상세 부밴드에서의 에너지 편중을 고려하여 이들의 에너지의 편중에 따른 분해 필터를 적응적으로 설계하고 부밴드의 에너지를 재분배시켜 성능을 향상 시켰으며, 웨이블릿 계수의 상호 의존성을 고려한 지역윈도우 사용해 기존의 방식을 개선하였다.

  • PDF

지상파 DMB 서비스를 위한 미들웨어 지상파 DMB 서비스를 위한 미들웨어 (Technology and Standard Trends of Middleware for Terrestrial DMB Service)

  • 정예선;안상우;김규현;정제창
    • 전자통신동향분석
    • /
    • 제20권2호통권92호
    • /
    • pp.76-82
    • /
    • 2005
  • 휴대용 지상파 DMB 서비스는 양방향 서비스를 매개체로 방송과 통신을 융합하는 시발점이 될 것으로 기대되며, 이런 서비스를 제공하기 위한 지상파 DMB용 미들웨어의 개발이 시급히 필요하다. 따라서, 현재 지상파 DMB 미들웨어는 다양한 데이터 방송서비스를 제공할 수 있는 최적화된 구조에 대한 표준화가 진행중이다. 본 논고에서는 지상파 DMB 미들웨어 표준화 동향을 살펴보고, 관련 미들웨어 기술들을 소개하고, 이들의 최근 동향을 소개한다.