• 제목/요약/키워드: design and analysis of algorithms

검색결과 632건 처리시간 0.034초

잠재 토픽 기반의 제품 평판 마이닝 (Latent topics-based product reputation mining)

  • 박상민;온병원
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.39-70
    • /
    • 2017
  • 최근 여론조사 분야에서 데이터에 기반을 둔 분석 기법이 널리 활용되고 있다. 기업에서는 최근 출시된 제품에 대한 선호도를 조사하기 위해 기존의 설문조사나 전문가의 의견을 단순 취합하는 것이 아니라, 온라인상에 존재하는 다양한 종류의 데이터를 수집하고 분석하여 제품에 대한 대중의 기호를 정확히 파악할 수 있는 방안을 필요로 한다. 기존의 주요 방안에서는 먼저 해당 분야에 대한 감성사전을 구축한다. 전문가들은 수집된 텍스트 문서들로부터 빈도가 높은 단어들을 정리하여 긍정, 부정, 중립을 판단한다. 특정 제품의 선호를 판별하기 위해, 제품에 대한 사용 후기 글을 수집하여 문장을 추출하고, 감성사전을 이용하여 문장들의 긍정, 부정, 중립을 판단하여 최종적으로 긍정과 부정인 문장의 개수를 통해 제품에 대한 선호도를 측정한다. 그리고 제품에 대한 긍 부정 내용을 자동으로 요약하여 제공한다. 이것은 문장들의 감성점수를 산출하여, 긍정과 부정점수가 높은 문장들을 추출한다. 본 연구에서는 일반 대중이 생산한 문서 속에 숨겨져 있는 토픽을 추출하여 주어진 제품의 선호도를 조사하고, 토픽의 긍 부정 내용을 요약하여 보여주는 제품 평판 마이닝 알고리즘을 제안한다. 기존 방식과 다르게, 토픽을 활용하여 쉽고 빠르게 감성사전을 구축할 수 있으며 추출된 토픽을 정제하여 제품의 선호도와 요약 결과의 정확도를 높인다. 실험을 통해, K5, SM5, 아반떼 등의 국내에서 생산된 자동차의 수많은 후기 글들을 수집하였고, 실험 자동차의 긍 부정 비율, 긍 부정 내용 요약, 통계 검정을 실시하여 제안방안의 효용성을 입증하였다.

비콘을 활용한 위치기반 지역축제 모바일 애플리케이션과 데이터 분석 시스템 개발 (Developments of Local Festival Mobile Application and Data Analysis System Applying Beacon)

  • 김송이;김원표;정철
    • 한국과학예술포럼
    • /
    • 제31권
    • /
    • pp.21-32
    • /
    • 2017
  • 지역축제는 문화를 형성하는 소통의 장으로 국내 관광 사업의 수요를 증가시키고, 지역의 이미지 창출, 전통 문화의 보존, 관광객 유입, 일자리 창출, 지역문화의 콘텐츠 개발, 지역특산품 판매 촉진 등 지역경제에 많은 파급효과와 지역경제 활성화에 중요한 가치를 지니고 있다. 무선통신 기술인 사물인터넷(IoT, Internet of Thing) 요소기술은 점차적으로 발전하고 있고, 특히 사물인터넷 서비스 중 하나인 비콘은 국내·외에서 다양한 서비스 형태로 활용되고 있다. 그러나 이러한 사물인터넷 서비스, 디지털 및 모바일 기술의 확산에도 불구하고, 수 없이 많은 지역축제에 대한 정보를 개인이 하나하나 찾기란 쉽지 않고, 기존에 개발된 축제 관련 애플리케이션은 단순 정보전달 수준에 국한되어 있거나 일회성인 축제 정보제공, 축제장 내의 정보제공 방식, 개발 축제마다 별도의 애플리케이션 형태제공, 단발성 사용 등의 문제점을 안고 있다. 이러한 배경 하에 본 연구는 비콘을 활용한 위치기반 지역축제 모바일 애플리케이션과 데이터 분석 시스템 개발하여 축제 방문객에게 맞춤형 정보를 제공하는데 그 목적이 있다. 본 연구의 기술개발을 통해 '축제장 혼잡도 알고리즘', '방문객 통계분석 알고리즘', '맞춤형 정보 알고리즘'의 총 3개의 알고리즘 및 데이터분석 시스템을 개발했고, 개발된 애플리케이션과 데이터 분석 시스템을 통해 실제 축제장에서 베타테스트를 실시했다. 그 결과, 방문객 행태 DB 구축, 지역축제 방문객에게 Hot place 기능, 대기시간 기능, 맞춤형 정보제공의 서비스와 기능을 제공할 수 있었다. 또한, 출시 3개월 간 1만 3천 건 이상의 다운로드 실적 달성, 구글플레이스토어에 '축제' 관련 애플리케이션 중 노출 1위를 달성하는 등 지역 관광 축제 플랫폼으로서의 시장성과 우수성을 인정받았다. 본 연구는 다음과 같은 순서로 기술한다. 2장에서는 본 연구의 기술개발과 관련된 지역축제, 사물인터넷, 비콘 서비스, 축제 관련 애플리케이션의 선행연구를 살펴보고, 3장에서는 지역축제 모바일 애플리케이션 설계와 데이터 분석 시스템의 구현환경을 상세히 기술한다. 4장에서는 본 연구에서 개발한 모바일 애플리케이션과 데이터 분석 시스템이 제대로 적용되지는 실험하기 위해 베타테스를 실시하여 제품의 성능평가를 기술하고, 마지막으로 5장에서는 결론과 향후 연구과제에 대해 기술한다.

계산과학공학플랫폼 품질 특성이 사용자 만족도에 영향을 미치는 요인에 관한 연구 (An Analysis of the Factors Affecting User Satisfaction in Computational Science and Engineering Platforms: A Case Study of EDISON)

  • 온누리;김남규;류기명;장한빛나래;이종숙
    • 인터넷정보학회논문지
    • /
    • 제20권6호
    • /
    • pp.85-93
    • /
    • 2019
  • Computational Science and Engineering is a convergence study that understands and solves complex problems such as science, engineering, and social phenomena through modeling using computing resources. Computational science and engineering combines algorithms, computational and informatics, and infrastructure. The importance of computational science is increasing with the improvement of computer performance and the development of large data processing technology. In Korea, Korea Institute of Science and Technology Information (KISTI) has been developing national computational science engineering software and utilization technology by combining basic science and computing technology through EDISON project. The EDISON project builds an open EDISON platform and integrates and services information systems in seven areas of computational science and engineering (computational thermal fluids, nanophysics, computational chemistry, structural dynamics, computational design, and computational medicine). Using this, we have established a web-based curriculum to lay the groundwork for fostering scientific talent and commercializing computational science and engineering software. The purpose of this study is to derive the quality characteristic factors of computational science platform and to empirically examine the effect on user satisfaction. This paper examines how the quality characteristics of information systems, the computational science engineering platform, affect the user satisfaction by modifying the research questions according to the propensity of the computational science platform by referring to the success factors of DeLone and McLean's information system. Based on the results of this study, we will suggest strategic implications for platform improvement by searching the priority of quality characteristics of computational science platform.

Association Between Gestational Diabetes Mellitus and Subsequent Risk of Cancer: a Systematic Review of Epidemiological Studies

  • Tong, Gui-Xian;Cheng, Jing;Chai, Jing;Geng, Qing-Qing;Chen, Peng-Lai;Shen, Xin-Rong;Liang, Han;Wang, De-Bin
    • Asian Pacific Journal of Cancer Prevention
    • /
    • 제15권10호
    • /
    • pp.4265-4269
    • /
    • 2014
  • Purpose: This study aimed at summarizing epidemiological evidence of the association between gestational diabetes mellitus (GDM) and subsequent risk of cancer. Materials and Methods: We searched Medline, Embase, Cancer Lit and CINAHL for epidemiological studies published by February 1, 2014 examining the risk of cancer in patients with history of GDM using highly inclusive algorithms. Information about first author, year of publication, country of study, study design, cancer sites, sample sizes, attained age of subjects and methods used for determining GDM status were extracted by two researchers and Stata version 11.0 was used to perform the meta-analysis and estimate the pooled effects. Results: A total of 9 articles documented 5 cohort and 4 case-control studies containing 10,630 cancer cases and 14,608 women with a history of GDM were included in this review. Taken together, the pooled odds ratio (OR) between GDM and breast cancer risk was 1.01 (0.87-1.17); yet the same pooled ORs of case-control and cohort studies were 0.87 (0.71-1.06) and 1.25 (1.00-1.56) respectively. There are indications that GDM is strongly associated with higher risk of pancreatic cancer (HR=8.68) and hematologic malignancies (HR=4.53), but no relationships were detected between GDM and other types of cancer. Conclusions: Although GDM increases the risk of certain types of cancer, these results should be interpreted with caution becuase of some methodological flaws. The issue merits added investigation and coordinated efforts between researchers, antenatal clinics and cancer treatment and registration agencies to help attain better understanding.

데이터 마이닝 기법을 활용한 군용 항공기 비행 예측모형 및 비행규칙 도출 연구 (A Study on the Development of Flight Prediction Model and Rules for Military Aircraft Using Data Mining Techniques)

  • 유경열;문영주;정대율
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제31권3호
    • /
    • pp.177-195
    • /
    • 2022
  • Purpose This paper aims to prepare a full operational readiness by establishing an optimal flight plan considering the weather conditions in order to effectively perform the mission and operation of military aircraft. This paper suggests a flight prediction model and rules by analyzing the correlation between flight implementation and cancellation according to weather conditions by using big data collected from historical flight information of military aircraft supplied by Korean manufacturers and meteorological information from the Korea Meteorological Administration. In addition, by deriving flight rules according to weather information, it was possible to discover an efficient flight schedule establishment method in consideration of weather information. Design/methodology/approach This study is an analytic study using data mining techniques based on flight historical data of 44,558 flights of military aircraft accumulated by the Republic of Korea Air Force for a total of 36 months from January 2013 to December 2015 and meteorological information provided by the Korea Meteorological Administration. Four steps were taken to develop optimal flight prediction models and to derive rules for flight implementation and cancellation. First, a total of 10 independent variables and one dependent variable were used to develop the optimal model for flight implementation according to weather condition. Second, optimal flight prediction models were derived using algorithms such as logistics regression, Adaboost, KNN, Random forest and LightGBM, which are data mining techniques. Third, we collected the opinions of military aircraft pilots who have more than 25 years experience and evaluated importance level about independent variables using Python heatmap to develop flight implementation and cancellation rules according to weather conditions. Finally, the decision tree model was constructed, and the flight rules were derived to see how the weather conditions at each airport affect the implementation and cancellation of the flight. Findings Based on historical flight information of military aircraft and weather information of flight zone. We developed flight prediction model using data mining techniques. As a result of optimal flight prediction model development for each airbase, it was confirmed that the LightGBM algorithm had the best prediction rate in terms of recall rate. Each flight rules were checked according to the weather condition, and it was confirmed that precipitation, humidity, and the total cloud had a significant effect on flight cancellation. Whereas, the effect of visibility was found to be relatively insignificant. When a flight schedule was established, the rules will provide some insight to decide flight training more systematically and effectively.

소나 영상 기반의 수중 물체 인식과 추종을 위한 구조 : Part 2. 확률적 후보 선택을 통한 실시간 프레임워크의 설계 및 구현 (A Framework of Recognition and Tracking for Underwater Objects based on Sonar Images : Part 2. Design and Implementation of Realtime Framework using Probabilistic Candidate Selection)

  • 이영준;김태균;이지홍;최현택
    • 전자공학회논문지
    • /
    • 제51권3호
    • /
    • pp.164-173
    • /
    • 2014
  • 수중 로봇 분야에서 수중 환경 인식은 매우 중요하나, 탁도 등의 제약으로 인하여 수중 광학 카메라의 사용은 제한적이다. 대안으로 기대하는 수중 영상 소나의 경우, 소나 영상의 품질이 영상 처리에 의해 자연물을 그대로 인식하기에 충분히 안정적이며 정확하지 못하다. 이를 극복하고자 본 논문의 Part 1에서 초음파의 특징을 고려한 인공 표식을 제안하였으며, 형상 행렬 기반의 인식 방법을 함께 제안하고 검증하였다. 그러나 실제 해양 환경은 복잡하고 동적인 잡음 요소가 많다. 이러한 문제를 추가로 해결하기위해 본 논문의 Part 2에서는 연속되는 소나 영상에서 확률적으로 인식 후보를 선별하여 인식하고, 추적하는 프레임워크를 제안한다. 이 프레임워크는 4단계, 즉 유사도 기반 관심 후보의 선정, 확률 기반 최종 후보의 선정, 선정된 후보의 인식, 그리고 인식된 물체의 추적으로 구성되어 있다. 이러한 4단계의 구조가 병렬로 처리되어 실시간 처리가 가능하며 인식 대상체의 변경이나 알고리즘의 보강을 위한 유연한 구조를 가진다. 제안한 프레임워크를 구성하는 파티클 필터 기반의 후보 선별 알고리즘과 평균-이동 (mean-shift) 기법에 의한 추적 방법을 함께 제안하였다. 수조 실험과 실해역 실험을 수행을 통하여 성능을 검증하였으며 결과에 대한 상세한 분석을 수행하였다. 인공 표식의 추적에서 얻어진 상대거리, 방향 등의 정보는 수중 로봇의 제어와 항법을 위해 사용될 것으로 기대하고 있다.

AI 및 텍스트 마이닝 기법을 활용한 지반조사보고서 데이터 추출 자동화 (Automated Data Extraction from Unstructured Geotechnical Report based on AI and Text-mining Techniques)

  • 박지민;서완혁;서동희;윤태섭
    • 한국지반공학회논문집
    • /
    • 제40권4호
    • /
    • pp.69-79
    • /
    • 2024
  • 현장 지반정수 데이터는 다양한 현장 및 실내시험을 통해 획득된 후 지반조사보고서의 형태로 작성되어 유통된다. 효율적인 설계 및 시공을 위해선 지반정수의 디지털 데이터베이스화가 필수적이나, 현재 지반조사보고서 데이터는 수동 입력 방식으로 많은 시간과 인력이 소요되며, 오류가 발생하기도 한다. 본 연구는 이미지 기반 딥러닝 모델 및 텍스트 마이닝 기법을 사용하여 지반조사보고서에서 데이터를 자동으로 추출하는 방법을 제안하였다. 딥러닝 기반의 페이지 분류 모델과 텍스트 서칭 알고리즘을 사용하여 지반조사보고서 부록 내 세부 지반시험 결과 보고서를 100%의 정확도로 분류할 수 있었다. 컴퓨터 비전 알고리즘을 통해 보고서 페이지 내 유효한 데이터 영역을 결정하고, 텍스트 분석을 통해 추출 데이터 항목과 상응하는 지반 데이터를 짝지어 데이터를 추출했다. 제안한 모델은 205개의 지반조사 보고서로 구성된 데이터셋을 통해 검증되었으며, 평균 93.0%의 데이터 추출 정확도를 기록하였다. 마지막으로, 추출 모델의 실무 적용성을 위해 사용자 인터페이스 기반 프로그램을 개발하였다. 프로그램 내 사용자 상호작용을 통해 지반조사보고서 PDF 파일을 업로드하고 자동으로 보고서를 분석 및 데이터를 추출, 편집할 수 있도록 했다. 이를 통해 지반조사보고서의 디지털화 및 지반 데이터베이스 구축이 더욱 효율적이고 정확하게 이루어질 수 있을 것으로 판단된다.

모바일 헬스케어를 위한 MAC 프로토콜 설계에 관한 연구 (A Study on MAC Protocol Design for Mobile Healthcare)

  • 정필성;김현규;조양현
    • 한국정보통신학회논문지
    • /
    • 제19권2호
    • /
    • pp.323-335
    • /
    • 2015
  • 모바일 헬스케어란 정보 통신 기술과 바이오 기술을 융합한 신개념 의료서비스로서 시간과 공간에 구애받지 않고 언제 어디서나 건강과 생활을 관리하여 건강한 삶을 유지시키기 위한 건강관리 서비스이다. 모바일 헬스케어를 위해서는 생체신호 계측 관련 기술인 WBAN(Wireless Body Area Network)과 모바일 장치를 이용한 데이터 분석 및 모니터링 기술이 필수적이다. 모바일 헬스케어 환경에서는 이용자의 모바일 장치를 중심으로 구성된 WBAN이 이동 중에 다른 WBAN을 만나게 되면 하나의 매체에 두 개의 WBAN이 동작하는 결과가 된다. 두 개 이상의 WBAN이 충돌하게 되면 노드들이 서로 부여 받은 슬롯에 보내는 데이터 프레임들의 충돌이 발생하며 이는 전송실패와 더불어 데이터 재전송으로 인한 불필요한 에너지 소모를 가져오게 된다. 본 논문에서는 이러한 문제점들을 해결하기 위해서 다음과 같이 모바일 헬스케어를 지원하는 MAC 프로토콜 요소기술을 제안하였다. 첫째, 제안하는 슈퍼프레임은 노드가 할당된 슬롯에서 데이터 전송을 보장받는 TDMA(Time Division Multiple Access) 기반의 경쟁 구간과 CSMA/CA 알고리즘을 통해 데이터를 전송하는 경쟁 구간을 가진다. 둘째, 제안하는 MAC 프로토콜을 기반으로 하는 WBAN의 충돌을 감지하고 네트워크를 병합하는 알고리즘을 제안하였다. 이동성을 가지는 WBAN이 다른 WBAN과 충돌하게 되면 네트워크를 재구성하여 노드가 전송하는 데이터 프레임 충돌을 줄이도록 하였다. 제안하는 슈퍼프레임 구조와 네트워크 병합 알고리즘의 성능평가를 위해서 OMNeT++ 네트워크 시뮬레이션 프레임워크 기반의 Castalia를 사용하였다. 성능평가 결과 제안한 MAC 프로토콜을 사용했을 때가 IEEE 802.15.6을 사용했을 때 보다 충돌 확률이 감소하여 패킷 전송 성공률과 에너지 효율이 개선된 것을 확인할 수 있었다.

치주질환 예측을 위한 치과 X-선 영상에서의 초해상화 알고리즘 적용 가능성 연구 (Investigation of the Super-resolution Algorithm for the Prediction of Periodontal Disease in Dental X-ray Radiography)

  • 김한나
    • 한국방사선학회논문지
    • /
    • 제15권2호
    • /
    • pp.153-158
    • /
    • 2021
  • 치주질환의 조기 진단률 및 예측 정확도 향상을 위한 X-선 영상 분석은 매우 중요한 분야이다. 이러한 치과 X-선 영상의 화질 개선을 위한 인공 지능 기반의 알고리즘 개발 및 적용에 관한 연구는 전 세계적으로 널리 수행 중이다. 따라서 본 연구의 목표는 치주질환 예측을 위한 치과 X-선 영상에서의 초해상화 알고리즘의 모델링 및 적용 가능성에 관하여 평가하는 것이다. 초해상화 알고리즘은 convolution layer와 ReLU를 기반으로 구성하였고, 저해상도 영상을 2배로 업샘플링 한 영상을 입력으로 사용하였다. 딥러닝 훈련을 위해 사용한 치과 X-선 데이터는 1,500장을 사용하였다. 영상의 정량적 평가는 2가지 영상의 비교를 통해 유사도를 측정할 수 있는 인자인 root mean square error와 structural similarity를 사용하였다. 이와 더불어 최근에 개발된 no-reference 기반으로 사용되는 natural image quality evaluator 와 blind/referenceless image spatial quality evaluator를 추가적으로 분석하였다. 결과적으로 기존에 사용되던 bicubic 기반의 업샘플링 기법을 사용하였을 때에 비하여 제안하는 방법이 치과 X-선 영상에서 평균적으로 유사도와 no-reference 기반의 평가 인자가 각각 1.86 그리고 2.14배 향상됨을 확인하였다. 결론적으로 치주질환의 예측을 위한 초해상화 알고리즘의 치과 X-선 영상에서의 유용성을 증명하였고 향후 다양한 분야에서의 적용 가능성이 높을 것으로 기대된다.

CNN 기법을 활용한 운전자 시선 사각지대 보조 시스템 설계 및 구현 연구 (A Study on Design and Implementation of Driver's Blind Spot Assist System Using CNN Technique)

  • 임승철;고재승
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권2호
    • /
    • pp.149-155
    • /
    • 2020
  • 한국도로교통공단은 교통사고분석시스템(TAAS)을 활용하여 2015년부터 발생한 교통사고 원인을 분석한 통계를 제공하고 있다. 교통사고 발생 주요 원인으로, 2018년 한해 전체 교통사고 발생원인 중 전방주시 부주의가 대부분의 원인임을 TAAS를 통해 발표했다. 교통사고 원인에 대한 통계자료의 세부항목으로 운전 중 스마트폰 사용, DMB 시청 등의 안전운전 불이행 51.2%와 안전거리 미확보 14%, 보행자 보호의무 위반 3.6% 등으로, 전체적으로 68.8%의 비율을 보여준다. 본 논문에서는 Deep Learning의 알고리듬 중 CNN(Convolutional Neural Network)를 활용하여 첨단 운전자 보조 시스템 ADAS(Advanced Driver Assistance Systems)을 개선한 시스템을 제안하고자 한다. 제안된 시스템은 영상처리에 주로 사용되는 Conv2D 기법을 사용하여 운전자의 얼굴과 눈동자의 조향을 분류하는 모델을 학습하고, 차량 전방에 부착된 카메라로 자동차의 주변 object를 인지 및 검출하여 주행환경을 인지한다. 그 후, 학습된 시선 조향모델과 주행환경 데이터를 사용하여 운전자의 시선과 주행환경에 따라, 위험요소를 3단계로 분류하고 검출하여 운전자의 전방 및 사각지대 보조한다.