• 제목/요약/키워드: Big data Problem

검색결과 574건 처리시간 0.027초

방문간호사업에 대한 대상자의 인식에 관한 연구 (A Study on the Recognition of Client Home Visit Nursing Care Services in Public Health Centers)

  • 민영선;정연강;한승의
    • 지역사회간호학회지
    • /
    • 제11권2호
    • /
    • pp.399-410
    • /
    • 2000
  • In this, analyzing the type of subjectivity in which people would have about home visit nursing services originating from public health care centers. I tried to research more effective ways to improve home visit nursing care services. and later. for the development of home visit nursing care. to supply basic data. The method for this study was the Q-method. created by William Stephenson. and was adequate for the study of subjectivity. For this study. through the deep interview. literature inquiry, and the discussion course. 206 Q-statement sentences were abstracted. and based on them, after Q-sample-selection. I then collected the Q-categorized-result from 32 subjects from Mar. 10. 2000 to Mar. 25. 2000. Through the statistic a analysis of PC-Qunal program. the subjectivity species were categorized and analyzed. The study results show that there are 3 sorts of recognition types. and they are analyzed in the following; The first type: the positively receiving type shows that they feel thankful and a trusting feeling about home visit nursing. The second type: the negatively mistrusting type shows that they had doubtful attitudes about the specialty of home visit nursing: they wanted medicine or nutrition remedies rather than health education and concerning the their own health care, they prefered the hospitals or clinics. The third type: the conditional receiving type shows that even though they had a positive receiving attitude about home visit nursing wanting to consult with the home visit nurses about the difficult problem which could not easily be settled, hoping that the home visit nurses could visit them more often, in their actual lives. they strongly indicated their attitudes concerning money as more important than home visits. The subjects in these 3 types commonly had a good feeling about the kindness of the home visit nurses: the first and third types also had a positive recognition about home visit nursing; however. in aspects of the evaluation and receiving attitudes, they showed a big difference. When all the above results are integrated. in the case of the first type the home visit nursing service, which satisfied the demand for health care of the medically weak people. should be continuously supplied. Additionally in case of the second type (negatively mistrust). continuous education and support should be supplied with enough interest to lead their concerns about their own health care as well as lead medical spending in a productive and effective direction in order to change their impressions. Through this study. I learned that the recognition of the objectives of home visit nursing services can be categorized in to 3 types and could be analyzed. Thus I wish that this study helps to present basic data which contributes to the development of the home visit nursing field.

  • PDF

국가핵심기술 관계망 구축을 통한 연관정보 분석연구: 디스플레이 기술을 중심으로 (A Study on the Analysis of Related Information through the Establishment of the National Core Technology Network: Focused on Display Technology)

  • 박세희;윤원석;장항배
    • 한국전자거래학회지
    • /
    • 제26권2호
    • /
    • pp.123-141
    • /
    • 2021
  • 경제 구조의 기술 의존성이 강해져 국가핵심기술의 중요성은 더욱 대두되고 있다. 하지만 기술 자체적 특성으로 인해 연관 범위가 추상적이고 국가핵심기술 고유의 특성상 정보공개가 제한적이기 때문에 보호대상이 될 기술의 범위를 정하는 것에 어려움이 있다. 이를 해결하기 위해 국가핵심기술과 연관성이 높은 중요 기술을 판별하는 데에 최적화 된 문헌 종류와 분석 기법을 제안하였다. 디스플레이 분야 국가핵심기술 키워드로 수집한 네 개 문헌종류(뉴스, 논문, 보고서, 특허) 데이터에 빅데이터 분석의 텍스트 마이닝 분석기법인 TF-IDF와 LDA 토픽 모델링을 적용하는 파일럿 테스트를 진행하였다. 그 결과로 특허 데이터에 LDA 토픽 모델링을 적용한 결과가 국가핵심기술과 연관성이 높은 중요기술을 추출하였다. OLED, 마이크로LED를 포함하여 디스플레이 전후방산업에 관련된 중요 기술을 판별 할 수 있었으며 이 결과를 관계망으로 시각화하여 국가핵심기술과 연관된 중요 기술의 범위를 명확히 하였다. 본 연구를 통해 기술이 가지는 연관범위의 모호성을 보다 명확히 하였으며, 국가핵심기술이 가지는 제한적인 정보공개 특성을 극복할 수 있다.

Small CNN-RNN Engraft Model Study for Sequence Pattern Extraction in Protein Function Prediction Problems

  • Lee, Jeung Min;Lee, Hyun
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권8호
    • /
    • pp.49-59
    • /
    • 2022
  • 본 논문에서는 2020년 기준 단백질 서열을 이용한 기능과 구조 예측 분야에서 가장 많이 사용되고 있는 딥러닝 모델인 CNN과 LSTM/GRU 모델을 동일한 조건 하에 비교 평가한 연구를 토대로 새로운 효소 기능 예측 모델인 PSCREM을 설계하였다. CNN 합성곱 시 누락되는 세부 패턴을 보존하기 위하여 서열 진화정보를 이용하였으며 중첩 RNN을 통해 기능적으로 중요한 의미를 가지는 아미노산 간의 관계 정보를 추출하고 특징 맵 제작에 참조하였다. 사용된 RNN 계열의 알고리즘은 LSTM과 GRU로 보통 stacked RNN 기법으로 100 units 이상 2~3회 쌓는 것이 일반적이나 본 논문에서는 10, 20 unit으로 구성한 뒤 중첩시켜서 특징 맵 제작에 사용하였다. 모델에 들어가는 데이터는 단백질 서열 데이터로 PSSM profile로 가공한 뒤 사용되었다. 실험 결과 효소 번호 첫 번째 자리를 예측하는 문제에 대해 86.4%의 정확도를 나타냄을 입증하였고, 효소 번호 3번째 자리까지 예측 정확도 84.4%의 성능을 내는 것을 확인하였다. PSCREM은 Overlapped RNN을 통해 단백질 기능에 관련된 고유 패턴을 더 잘 파악하며 Overlapped RNN은 단백질 기능 및 구조 예측 추출 분야에 새로운 방법론으로서 제안된다.

역량중심 교육과정 개발을 위한 학업성취도 예측 시스템: D대학 사례를 중심으로 (Learning Ability Prediction System for Developing Competence Based Curriculum: Focusing on the Case of D-University)

  • 김성국;오창헌
    • 실천공학교육논문지
    • /
    • 제14권2호
    • /
    • pp.267-277
    • /
    • 2022
  • 대학에서의 학업성취도란 대학교육을 통한 결과로서 학생들이 구현한 질적 변화와 발달의 수준이라는 포괄적 의미로 인식되고 있다. 따라서 대학생의 학업성취도는 창의성, 리더십, 글로벌 역량 등 다양한 인재상에 대한 시대적, 사회적 요구와 연계되어 그 의미를 부여하게 되지만 실질적으로 대학교육의 성과지표로서 중요하게 인식되고 있는 것은 학점으로 귀결 되고 있다. 이러한 학점을 통한 학업성취도의 측정은 많은 문제를 가지고 있는데, 특히, 평가 방식과 내용 그리고 대학의 서열화 효과 등에 의해 학점을 통한 학업성취도의 표준화는 매우 어려운 문제로 인식되고 있다. 본 연구는 머신러닝 기법을 활용하여 D대학 졸업생을 대상으로 학업성취도의 우수 여부를 예측하는 시스템을 제시한다. 사용된 변수는 일부 개인정보와 졸업연도, 학번, 학과명, 계열명 등의 학사 정보 등 최대 96개를 활용하여 분석하였으나 개인정보나 학과정보 등은 이미 결정되어 노력에 의해 변경될 수 없는 데이터이므로 분석 대상이 될 항목은 이미 결정된 데이터를 제외한 학과별/학생별 역량으로 한정하였다. 본 연구에서는 경기권 소재 전문대학인 D대학의 미션, 비전, 교육목표 및 인재상 등이 반영된 핵심역량의 분석을 통해 학업 성취도 예측시스템을 구현해 보고, 해당 시스템의 도입이 학업성취도에 미치는 영향을 머신러닝을 활용하여 예측하기위해 진행되었다. 향후 연구결과를 학과에서 진행되는 교육과정 수립 및 학생 지도 등에 적용하여 학업성취도를 향상시킬 수 있는 근거를 마련하는데 활용할 예정이다.

SDN 환경에서 온톨로지를 활용한 애플리케이션 네트워크의 품질 위반상황 식별 방법 (Violation Detection of Application Network QoS using Ontology in SDN Environment)

  • 황제승;김웅수;박준석;염근혁
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제13권6호
    • /
    • pp.7-20
    • /
    • 2017
  • 클라우드 및 빅데이터의 확산, 대규모 트래픽 폭증으로 인하여 기존 네트워크는 복잡성과 관리 효율성에 많은 문제점이 발생하였다. 이 문제를 해결하기 위해 네트워크 장비의 전송 기능과 제어 기능을 분리하여 프로그래밍을 통해 네트워크 장비를 제어 할 수 있는 소프트웨어 정의 네트워킹(SDN) 환경이 제시되었다. 이에 따라 SDN에 기존 레거시 장비들을 연결하는 방법, 효율적인 데이터 통신을 위한 패킷 관리 방법, 중앙 집중화된 구조에서의 컨트롤러 부하를 분산하는 방법 등 SDN 컨트롤러의 성능을 향상시키기 위한 연구들이 많이 진행되고 있다. 그러나 네트워크를 이용하는 애플리케이션 품질 관점에서 SDN을 제어하는 연구는 부족한 실정이다. 즉, 네트워크 서비스 품질을 만족하는 라우팅 경로 구축, 변경 등을 지원하기 위해 애플리케이션 네트워크 서비스 품질에 대한 계약을 기반으로 네트워크의 요구사항을 파악하고 현재 네트워크 상태 정보를 수집하여 네트워크 서비스 품질 위반 상황을 식별하는 메커니즘이 필요하다. 본 논문은 SDN 환경에서 애플리케이션의 네트워크 서비스 품질을 보장하며 원활한 서비스 제공을 위해 온톨로지를 사용하여 네트워크 경로의 품질 위반상황을 판별하는 방법을 제시한다.

LSTM-AutoEncoder를 활용한 선박 메인엔진의 이상 탐지 및 라벨링 (Outlier Detection and Labeling of Ship Main Engine using LSTM-AutoEncoder)

  • 김도희;한영재;김혜미;강성필;김기훈;배혜림
    • 한국빅데이터학회지
    • /
    • 제7권1호
    • /
    • pp.125-137
    • /
    • 2022
  • 운송 산업은 우리나라의 3면이 바다로 둘러싸여 있는 지리적 요건과 자원 소비량의 대부분을 수입에 의존하는 자원 빈곤 문제로 인해 중요한 산업 중 하나이다. 그 중에서도 해운업의 비중은 운송 산업의 대부분을 차지할 정도로 크며, 해운업에서의 유지보수는 선박의 운영 효율성 개선 및 비용 감소에 있어서도 중요하다. 그러나 현재 선박이 유지보수를 위해 일정기간 주기로 검사가 시행되고, 이에 따라 시간과 비용이 발생하며 원인규명도 제대로 되지 않고 있다. 따라서 본 연구에서는 제안 방법론인 LSTM-AutoEncoder를 활용해 실제 선박 운항 데이터에 대해 시점을 고려하여 선박 고장의 원인이 될 수 있는 이상 탐지를 수행한다. 또한 클러스터링을 통해 군집화를 수행하고 이상치에 대해 요인별로 그룹화를 통해 선박 메인엔진 고장의 잠재 원인을 규명한다. 이는 선박의 다양한 정보에 대해 보다 빠르게 모니터링이 가능하고, 이상 정도를 식별할 수 있다. 또한 현재 선박의 고장 감시시스템에 있어서도 구체화된 경보 점 설정과 고장 진단 체계를 갖추고, 유지보수시점을 찾는 데 도움을 줄 수 있을 것이다.

다중 클래스 데이터셋의 메타특징이 판별 알고리즘의 성능에 미치는 영향 연구 (The Effect of Meta-Features of Multiclass Datasets on the Performance of Classification Algorithms)

  • 김정훈;김민용;권오병
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.23-45
    • /
    • 2020
  • 기업의 경쟁력 확보를 위해 판별 알고리즘을 활용한 의사결정 역량제고가 필요하다. 하지만 대부분 특정 문제영역에는 적합한 판별 알고리즘이 어떤 것인지에 대한 지식은 많지 않아 대부분 시행착오 형식으로 최적 알고리즘을 탐색한다. 즉, 데이터셋의 특성에 따라 어떠한 분류알고리즘을 채택하는 것이 적합한지를 판단하는 것은 전문성과 노력이 소요되는 과업이었다. 이는 메타특징(Meta-Feature)으로 불리는 데이터셋의 특성과 판별 알고리즘 성능과의 연관성에 대한 연구가 아직 충분히 이루어지지 않았기 때문이며, 더구나 다중 클래스(Multi-Class)의 특성을 반영하는 메타특징에 대한 연구 또한 거의 이루어진 바 없다. 이에 본 연구의 목적은 다중 클래스 데이터셋의 메타특징이 판별 알고리즘의 성능에 유의한 영향을 미치는지에 대한 실증 분석을 하는 것이다. 이를 위해 본 연구에서는 다중 클래스 데이터셋의 메타특징을 데이터셋의 구조와 데이터셋의 복잡도라는 두 요인으로 분류하고, 그 안에서 총 7가지 대표 메타특징을 선택하였다. 또한, 본 연구에서는 기존 연구에서 사용하던 IR(Imbalanced Ratio) 대신 시장집중도 측정 지표인 허핀달-허쉬만 지수(Herfindahl-Hirschman Index, HHI)를 메타특징에 포함하였으며, 역ReLU 실루엣 점수(Reverse ReLU Silhouette Score)도 새롭게 제안하였다. UCI Machine Learning Repository에서 제공하는 복수의 벤치마크 데이터셋으로 다양한 변환 데이터셋을 생성한 후에 대표적인 여러 판별 알고리즘에 적용하여 성능 비교 및 가설 검증을 수행하였다. 그 결과 대부분의 메타특징과 판별 성능 사이의 유의한 관련성이 확인되었으며, 일부 예외적인 부분에 대한 고찰을 하였다. 본 연구의 실험 결과는 향후 메타특징에 따른 분류알고리즘 추천 시스템에 활용할 것이다.

딥러닝 시계열 알고리즘 적용한 기업부도예측모형 유용성 검증 (Corporate Default Prediction Model Using Deep Learning Time Series Algorithm, RNN and LSTM)

  • 차성재;강정석
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.1-32
    • /
    • 2018
  • 본 연구는 경제적으로 국내에 큰 영향을 주었던 글로벌 금융위기를 기반으로 총 10년의 연간 기업데이터를 이용한다. 먼저 시대 변화 흐름에 일관성있는 부도 모형을 구축하는 것을 목표로 금융위기 이전(2000~2006년)의 데이터를 학습한다. 이후 매개 변수 튜닝을 통해 금융위기 기간이 포함(2007~2008년)된 유효성 검증 데이터가 학습데이터의 결과와 비슷한 양상을 보이고, 우수한 예측력을 가지도록 조정한다. 이후 학습 및 유효성 검증 데이터를 통합(2000~2008년)하여 유효성 검증 때와 같은 매개변수를 적용하여 모형을 재구축하고, 결과적으로 최종 학습된 모형을 기반으로 시험 데이터(2009년) 결과를 바탕으로 딥러닝 시계열 알고리즘 기반의 기업부도예측 모형이 유용함을 검증한다. 부도에 대한 정의는 Lee(2015) 연구와 동일하게 기업의 상장폐지 사유들 중 실적이 부진했던 경우를 부도로 선정한다. 독립변수의 경우, 기존 선행연구에서 이용되었던 재무비율 변수를 비롯한 기타 재무정보를 포함한다. 이후 최적의 변수군을 선별하는 방식으로 다변량 판별분석, 로짓 모형, 그리고 Lasso 회귀분석 모형을 이용한다. 기업부도예측 모형 방법론으로는 Altman(1968)이 제시했던 다중판별분석 모형, Ohlson(1980)이 제시한 로짓모형, 그리고 비시계열 기계학습 기반 부도예측모형과 딥러닝 시계열 알고리즘을 이용한다. 기업 데이터의 경우, '비선형적인 변수들', 변수들의 '다중 공선성 문제', 그리고 '데이터 수 부족'이란 한계점이 존재한다. 이에 로짓 모형은 '비선형성'을, Lasso 회귀분석 모형은 '다중 공선성 문제'를 해결하고, 가변적인 데이터 생성 방식을 이용하는 딥러닝 시계열 알고리즘을 접목함으로서 데이터 수가 부족한 점을 보완하여 연구를 진행한다. 현 정부를 비롯한 해외 정부에서는 4차 산업혁명을 통해 국가 및 사회의 시스템, 일상생활 전반을 아우르기 위해 힘쓰고 있다. 즉, 현재는 다양한 산업에 이르러 빅데이터를 이용한 딥러닝 연구가 활발히 진행되고 있지만, 금융 산업을 위한 연구분야는 아직도 미비하다. 따라서 이 연구는 기업 부도에 관하여 딥러닝 시계열 알고리즘 분석을 진행한 초기 논문으로서, 금융 데이터와 딥러닝 시계열 알고리즘을 접목한 연구를 시작하는 비 전공자에게 비교분석 자료로 쓰이기를 바란다.

기계학습을 활용한 상품자산 투자모델에 관한 연구 (A Study on Commodity Asset Investment Model Based on Machine Learning Technique)

  • 송진호;최흥식;김선웅
    • 지능정보연구
    • /
    • 제23권4호
    • /
    • pp.127-146
    • /
    • 2017
  • 상품자산(Commodity Asset)은 주식, 채권과 같은 전통자산의 포트폴리오의 안정성을 높이기 위한 대체투자자산으로 자산배분의 형태로 투자되고 있지만 주식이나 채권 자산에 비해 자산배분에 대한 모델이나 투자전략에 대한 연구가 부족한 실정이다. 최근 발전한 기계학습(Machine Learning) 연구는 증권시장의 투자부분에서 적극적으로 활용되고 있는데, 기존 투자모델의 한계점을 개선하는 좋은 성과를 나타내고 있다. 본 연구는 이러한 기계학습의 한 기법인 SVM(Support Vector Machine)을 이용하여 상품자산에 투자하는 모델을 제안하고자 한다. 기계학습을 활용한 상품자산에 관한 기존 연구는 주로 상품가격의 예측을 목적으로 수행되었고 상품을 투자자산으로 자산배분에 관한 연구는 찾기 힘들었다. SVM을 통한 예측대상은 투자 가능한 대표적인 4개의 상품지수(Commodity Index)인 골드만삭스 상품지수, 다우존스 UBS 상품지수, 톰슨로이터 CRB상품지수, 로저스 인터내셔날 상품지수와 대표적인 상품선물(Commodity Futures)로 구성된 포트폴리오 그리고 개별 상품선물이다. 개별상품은 에너지, 농산물, 금속 상품에서 대표적인 상품인 원유와 천연가스, 옥수수와 밀, 금과 은을 이용하였다. 상품자산은 전반적인 경제활동 영역에 영향을 받기 때문에 거시경제지표를 통하여 투자모델을 설정하였다. 주가지수, 무역지표, 고용지표, 경기선행지표 등 19가지의 경제지표를 이용하여 상품지수와 상품선물의 등락을 예측하여 투자성과를 예측하는 연구를 수행한 결과, 투자모델을 활용하여 상품선물을 리밸런싱(Rebalancing)하는 포트폴리오가 가장 우수한 성과를 나타냈다. 또한, 기존의 대표적인 상품지수에 투자하는 것 보다 상품선물로 구성된 포트폴리오에 투자하는 것이 우수한 성과를 얻었으며 상품선물 중에서도 에너지 섹터의 선물을 제외한 포트폴리오의 성과가 더 향상된 성과를 나타남을 증명하였다. 본 연구에서는 포트폴리오 성과 향상을 위해 기존에 널리 알려진 전통적 주식, 채권, 현금 포트폴리오에 상품자산을 배분하고자 할 때 투자대상은 상품지수에 투자하는 것이 아닌 개별 상품선물을 선정하여 자체적 상품선물 포트폴리오를 구성하고 그 방법으로는 기간마다 강세가 예측되는 개별 선물만을 골라서 포트폴리오를 재구성하는 것이 효과적인 투자모델이라는 것을 제안한다.

온라인 쇼핑몰에서 상품 설명 이미지 내의 키워드 인식을 위한 딥러닝 훈련 데이터 자동 생성 방안 (The way to make training data for deep learning model to recognize keywords in product catalog image at E-commerce)

  • 김기태;오원석;임근원;차은우;신민영;김종우
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.1-23
    • /
    • 2018
  • E-commerce 환경의 발전으로 소비자들은 다양한 상품들을 한 자리에서 폭 넓게 비교할 수 있게 되었다. 하지만 온라인 쇼핑몰에 올라와있는 상당량의 주요 상품 정보들이 이미지 형태이기 때문에 컴퓨터가 인지할 수 있는 텍스트 기반 검색 시스템에 반영될 수 없다는 한계가 존재한다. 이러한 한계점은 일반적으로 기존 기계학습 기술 및 OCR(Optical Character Recognition) 기술을 활용해, 이미지 형태로 된 키워드를 인식함으로써 개선할 수 있다. 그러나 기존 OCR 기술은 이미지 안에 글자가 아닌 그림이 많고 글자 크기가 작으면 낮은 인식률을 보인다는 문제가 있다. 이에 본 연구에서는 기존 기술들의 한계점을 해결하기 위하여, 딥러닝 기반 사물인식 모형 중 하나인 SSD(Single Shot MultiBox Detector)를 개조하여 이미지 형태의 상품 카탈로그 내의 텍스트 인식모형을 설계하였다. 하지만 이를 학습시키기 위한 데이터를 구축하는 데 상당한 시간과 비용이 필요했는데, 이는 지도학습의 방법론을 따르는 SSD 모형은 훈련 데이터마다 직접 정답 라벨링을 해줘야 하기 때문이다. 본 연구는 이러한 문제점을 해결하기 위해 '훈련 데이터 자동 생성 프로그램'을 함께 개발하였다. 훈련 데이터 자동 생성 프로그램을 통해 수작업으로 데이터를 만드는 것에 비하여 시간과 비용을 대폭 절감할 수 있었으며, 생성된 훈련용 데이터를 통해 모형의 인식 성능을 높일 수 있었다. 더 나아가 실험연구를 통해 자동으로 생성된 훈련 데이터의 특징별로 인식기 모형의 성능에 얼마나 큰 영향을 끼치는지 알아보고, 성능 향상에 효과적인 데이터의 특징을 분석하였다. 본 연구를 통해서 개발된 상품 카탈로그 내 텍스트 인식모형과 훈련 데이터 자동 생성 프로그램은 온라인 쇼핑몰 판매자들의 상품 정보 등록 수고를 줄여줄 수 있으며, 구매자들의 상품 검색 시 결과의 정확성을 향상시키는 데 기여할 수 있을 것으로 기대한다.