• 제목/요약/키워드: Classification Models

검색결과 1,557건 처리시간 0.023초

인공지능의 사회적 수용도에 따른 키워드 검색량 기반 주가예측모형 비교연구 (Comparison of Models for Stock Price Prediction Based on Keyword Search Volume According to the Social Acceptance of Artificial Intelligence)

  • 조유정;손권상;권오병
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.103-128
    • /
    • 2021
  • 최근 주식의 수익률과 거래량을 설명하는 주요 요인으로서 투자자의 관심도와 주식 관련 정보 전파의 영향력이 부각되고 있다. 또한 인공지능과 같은 혁신 신기술을 개발보급하거나 활용하려는 기업의 경우 거시환경 및 시장 불확실성 때문에 기업의 미래 주식 수익률과 주식 변동성을 예측하기 어렵다는 문제를 가지고 있다. 이는 인공지능 활성화의 장애요인으로 인식되고 있다. 따라서 본 연구의 목적은 인공지능 관련 기술 키워드의 인터넷 검색량을 투자자의 관심 척도로 사용하여, 기업의 주가 변동성을 예측하는 기계학습 모형을 제안하는 것이다. 이를 위해 심층신경망 LSTM(Long Short-Term Memory)과 벡터자기회귀(Vector Autoregression)를 통해 주식시장을 예측하고, 기술의 사회적 수용 단계에 따라 키워드 검색량을 활용한 주가예측 성능 비교를 통해 기업의 투자수익 예측이나 투자자들의 투자전략 의사결정을 지원하는 주가 예측 모형을 구축하였다. 또한 인공지능 기술의 세부 하위 기술에 대한 분석도 실시하여 기술 수용 단계에 따른 세부 기술 키워드 검색량의 변화를 살펴보고 세부기술에 대한 관심도가 주식시장 예측에 미치는 영향을 살펴보았다. 이를 위해 본 연구에서는 인공지능, 딥러닝, 머신러닝 키워드를 선정하여, 2015년 1월 1일부터 2019년 12월 31일까지 5년간의 인터넷 주별 검색량 데이터와 코스닥 상장 기업의 주가 및 거래량 데이터를 수집하여 분석에 활용하였다. 분석 결과 인공지능 기술에 대한 키워드 검색량은 사회적 수용 단계가 진행될수록 증가하는 것으로 나타났고, 기술 키워드를 기반으로 주가예측을 하였을 경우 인식(Awareness)단계에서 가장 높은 정확도를 보였으며, 키워드별로 가장 좋은 예측 성능을 보이는 수용 단계가 다르게 나타남을 확인하였다. 따라서 기술 키워드를 활용한 주가 예측 모델 구축을 위해서는 해당 기술의 하위 기술 분류를 고려할 필요가 있다. 본 연구의 결과는 혁신기술을 기반으로 기업의 투자수익률을 예측하기 위해서는 기술에 대한 대중의 관심이 급증하는 인식 단계를 포착하는 것이 중요하다는 점을 시사한다. 또한 최근 금융권에서 선보이고 있는 빅데이터 기반 로보어드바이저(Robo-advisor) 등 투자 의사 결정 지원 시스템 개발 시 기술의 사회적 수용도를 세분화하여 키워드 검색량 변화를 통해 예측 모델의 정확도를 개선할 수 있다는 점을 시사하고 있다.

머신러닝을 이용한 터널발파설계 자동화를 위한 기초연구 (A fundamental study on the automation of tunnel blasting design using a machine learning model)

  • 김양균;이제겸;이승원
    • 한국터널지하공간학회 논문집
    • /
    • 제24권5호
    • /
    • pp.431-449
    • /
    • 2022
  • 지금까지 국내에서는 수 많은 터널들이 완공되어 오면서 시공에서뿐 아니라 설계에서도 다양한 경험과 기술이 지속적으로 축적되어 왔다. 따라서 이제는 매우 복잡한 지질조건 또는 특수한 터널구조가 아니라면 일반적인 터널설계작업은 설계 항목에 따라 기존 유사 설계사례를 수정 또는 보완하는 것만으로도 충분한 경우도 적지 않다. 특히 터널발파설계의 경우, 실제 터널시공시 현장에서 시험발파를 통해 시공을 위한 발파설계를 추가로 수행하는 것이 일반적이라는 것을 감안할때, 설계단계에서 수행하는 발파설계는 예비설계 성격을 지니고 있어 기존의 유사 설계사례를 참고하는 것도 타당하다고 사료된다. 한편 최근 4차산업혁명시대에 들어서면서 전 산업분야에 걸쳐 그 활용도가 급증하고 있는 인공지능은 터널 및 발파분야에서도 다양하게 활용되고 있지만, 발파터널의 경우 발파진동 및 암반분류 등의 예측 분야에서 주로 활용되고 있을 뿐 터널발파패턴 설계에 활용된 사례는 많지 않다. 따라서 본 연구에서는 터널발파설계를 인공지능의 한 분야인 머신러닝 모델을 이용하여 자동화하기 위한 시도를 하였다. 이를 위하여 25개 학습용 터널설계 자료 및 2개의 시험용 설계자료에서 4가지의 입력데이터(지보패턴, 도로유형, 상반 및 하반 단면적) 및 16개의 출력데이터(심발공 종류, 비장약량, 천공수, 각 발파공 그룹별 공간격과 저항선 등)를 발췌하였다. 이를 기반으로 3가지 머신러닝 모델, 즉, XGBoost, ANN, SVM 모델을 시험한 결과 XGBoost모델이 상대적으로 최상의 결과를 나타내었다. 또한 이를 이용하여 실제 발파설계 상황을 가정하여 발파패턴을 제안하도록 한 결과 일부 항목에서 보완이 필요하긴 하지만 일반적 설계와 유사한 결과를 나타내었다. 본 연구가 기초연구 성격이어서 전체 발파설계를 완벽하게 수행하기는 아직 부족하지만, 향후 충분한 발파설계데이터를 확보하고 세부적인 처리과정을 보완하여 실용적인 활용이 가능하도록 추가 연구를 수행할 계획이다.

머신러닝을 활용한 수도권 약수터 수질 예측 모델 개발 (Development of a water quality prediction model for mineral springs in the metropolitan area using machine learning)

  • 임영우;엄지연;곽기영
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.307-325
    • /
    • 2023
  • 코로나19 팬데믹의 장기화로 인해 실내 생활에 지쳐가는 사람들이 우울감, 무기력증 등을 해소하기 위해 근거리의 산과 국립공원을 찾는 빈도가 폭발적으로 증가하였다. 자연으로 나온 수많은 사람들이 오가는 걸음을 멈추고 숨을 돌리며 쉬어가는 장소가 있는데 바로 약수터이다. 산이나 국립공원이 아니더라도 근린공원 또는 산책로에서도 간간이 찾아볼 수 있는 약수터는 수도권에만 약 6백여개가 위치해 있다. 하지만 불규칙적이고 수작업으로 수행되는 수질검사로 인해 사람들은 실시간으로 검사 결과를 알 수 없는 상태에서 약수를 음용하게 된다. 따라서 본 연구에서는 약수터 수질에 영향을 미치는 요인을 탐색하고 다양한 곳에 흩어져 있는 데이터를 수집하여 실시간으로 약수터 수질을 예측할 수 있는 모델을 개발하고자 한다. 데이터 수집의 한계로 인해 서울과 경기로 지역을 한정한 후 데이터 관리가 잘 이루어지고 있는 18개 시의 약 300여개 약수터를 대상으로 2015~2020년의 수질 검사 데이터를 확보하였다. 약수터 수질 적합 여부에 영향을 미칠 것으로 여겨지는 다양한 요인들 중 두 차례의 검토를 거쳐 총 10개의 요인을 최종 선별하였다. 최근 주목받고 있는 자동화 머신러닝 기술인 AutoML 기법을 활용하여 20여가지의 머신러닝 기법들 중 예측 성능 기준 상위 5개의 모델을 도출하였으며 그 중 catboost 모델이 75.26%의 예측 분류 정확도로 가장 높은 성능을 가지고 있음을 확인하였다. 추가로 SHAP 기법을 통해 분석에 사용한 변인들이 예측에 미치는 절대적인 영향력을 살펴본 결과 직전 수질 검사에서 부적합 판정을 받았는지 여부가 가장 중요한 요인이었으며 그 외 평균 기온, 과거 연속 2번 수질 부적합 판정 기록 유무, 수질 검사 당일 기온, 약수터 고도 등이 수질 부적합 여부에 영향을 미치고 있음을 확인하였다.

비즈니스 모델 혁신 프레임워크 기반의 액셀러레이터 투자결정요인 연구 (A Study of Accelerator Investment Determinants Based on Business Model Innovation Framework)

  • 정문수;김은희
    • 벤처창업연구
    • /
    • 제17권2호
    • /
    • pp.65-80
    • /
    • 2022
  • 스타트업의 불확실성과 위험한 특성에도 불구하고 이들에게 전문적인 보육과 투자를 실행하는 액셀러레이터의 독특하고 중요한 역할은 창업생태계에서 날로 중요해지고 있다. 그러나 액셀러레이터의 생존에 지대한 영향을 미치는 투자결정요인에 대한 학계의 연구는 초기 단계로 소수의 실증연구가 진행되었으나 아직 이론적인 토대를 갖추지 못한 상황이다. 이에 본 연구는 액셀러레이터의 투자 대상이 되는 스타트업의 본질과 속성을 반영하고 있는 비즈니스 모델 혁신 이론을 기반으로 비즈니스 모델 혁신 프레임워크를 제시하고 12개의 투자결정요인을 도출한다. 프레임워크는 스타트업의 혁신의 대상과 방향 그리고 동력을 비즈니스 모델과 전략, 동적역량으로 각각 정의하였고, 비즈니스 모델 혁신 프레임워크를 기준으로 기존의 액셀러레이터의 투자결정요인에 대해 논의하였다. 연구결과는 첫째, 비즈니스 모델 혁신의 정적관점에서 대부분 항목이 충실히 구성되었으나 활동성을 평가하는 핵심활동과 고객관계와 관련된 요인이 부족한 것으로 나타났다. 둘째, 전략관점에서는 내부전략 요인인 핵심자원의 정의와 내용을 포괄할 수 있는 요인개발의 필요성이 제기되었다. 셋째, 동적관점에서 액셀러레이터의 투자결정요인의 상당수가 기본 수준의 동적역량에 집중 된 것을 발견하였다. 이는 적은 자원과 소수의 인원으로 솔루션을 개발해야 하는 스타트업의 특성을 반영한 결과로 판단할 수 있다. 본 연구는 비즈니스 모델 혁신 프레임워크를 제시하고, 프레임워크를 기반으로 액셀러레이터의 투자결정요인을 도출함으로써 투자결정요인에 대한 이론적 기반을 마련하고 후속 연구의 기초를 놓았다는 점에 학문적 의의가 있다. 또한 본 연구를 통해 제시된 비즈니스 모델 혁신 프레임워크는 스타트업, 액셀러레이터, 창업지원기관의 성과 제고에 기여할 수 있다는 점에서 실무적 의의를 가진다.

최근 11년간 서울대학교병원 교정과에 내원한 순구개열 환자의 내원 현황에 관한 연구(1988.3 - 1999.2) (The study on the cleft lip and/or palate patients who visited Dept. of Orthodontics, Seoul National University Dental Hospital during last 11 years (1988.3-1999.2))

  • 양원식;백승학
    • 대한치과교정학회지
    • /
    • 제29권4호
    • /
    • pp.467-481
    • /
    • 1999
  • 순구개열은 악안면 선천성 기형 중에서 발생율이 가장 높으며, 여러 선학들의 조사연구에 의하면 순구개열의 발생빈도가 증가하는 것으로 알려져 있다. 따라서 순구개열 환자의 치료에서 중요한 부분을 담당하는 교정과의 순구개열환자의 내원동향에 관한 역학조사가 필요하다고 생각된다. 이에 저자들은 서울대학교병원 교정과에 내원한 순구개열 교정환자들의 연도별, 종류별, 성별, 연령별, Angle씨 부정교합군별 분포에 따른 역학적 특성과 국내병원에서의 수술시기 등의 치료현황에 대한 임상자료 등을 파악하고, 이를 순구개열 환자의 교정 진단 및 치료계획 수립에 중요한 기초자료로 사용하기 위하여 본 연구를 시행하였다. 1988년 3월 1일부터 1999년 2월 28일까지 서울대학교병원 교정과에 내원한 순구개열 환자(총 250명)와 그 부모들을 대상으로 한 초진시의 문진, 시진을 통하여 기록한 교정 chart및 cleft chart내용, X-tay film과 모형을 대상으로 조사를 시행하여 다음과 같은 결론을 얻었다. 1. 본 병원 교정과에 내원한 순구개열 환자의 수는 1988년부터 1990년까지 증가한 후 1992년까지 감소추세를 보였고, 1993년부터 1996년까지 비교적 일정한 추세를 보이다가 1997년 이후 현저한 증가 추세를 보였다. 2. 내원한 환자를 순구개열의 종류에 따라 조사한 결과 구순열:구순치조열:구개열:구순구개열이 7.6:19.2:9.6:63.6의 비율을 보였다. 편측 대 양측의 발생빈도는 구순열은 79:21, 구순치조열은 77:23,구순구개열은 75.5:24.5으로서 편측의 발생빈도가 양측에 비해서 높았다. 그리고 편측성에서 좌, 우측간의 발생빈도는 구순열이 53.3:46.7, 구순치조열이 59.5:40.5, 구순구개열이 59.2:40.8 으로서 좌측의 발생빈도가 우측에 비해서 높았다. 3. 순구개열의 남:여 발생빈도는 구순열은 57.9:42.1, 구순치조열은 68.8:31.2, 구순구개열은 76.1:23.9 로서 남자의 발생빈도가 여자에 비해서 높았다. 그러나 구개열에서는 41.7:58.3으로서 여자의 발생빈도가 남자에 비해서 높게 나타났다. 4. 내원 환자를 연령군 별로 조사한 결과 7-12세 군이 $52\%$로서 압도적으로 많았고, 0-6세 군 ($20.4\%$), 13-18세 군($17.2\%$), 18세 이상 군 ($10.4\%$)의 순이었다. 5. 구순열의 봉합수술시기로는 0-3개월 군이 $60.3\%$로서 가장 많았고, 4-6개월 군이 $17.9\%$로 두 번째였다. 6. 구개열의 봉합수술시기로는 1-2세군이 $31.7\%$로 가장 많았고, 0-1세군은 $25.6\%$, 2-3세군이 $12.1\%$였다. 구개 및 상악 성장이 어느 정도 이루어진 5세 이상 군은 $11.6\%$를 차지하였다.7. 구순 반흔 제거수술시기로는 4-6세군 ($27.5\%$), 6-8세군 ($19.6\%$), 2-4세군 ($13.7\%$)이 $60\%$이상을 차지하여 초등학교 취학 전에 구순의 반흔을 제거하려 함을 알 수 있었다. 8. 비변형 교정수술시기로는 0-2세군 ($7.1\%$), 2-4세군 ($14.3\%$), 4-6세군 ($21.4\%$), 6-8세군 ($14.3\%$)으로 초등학교 취학이전이 $57.1\%$로서 최근의 조기 치료경향을 반영하는 것으로 보인다. 9. 인두피판술은 평균 6세에 시행되었으며, 수술 시행 시기별의 차이를 보이지 않고 고른 분포를 보였다. 10. 내원한 환자를 순구개열 종류와 Angle씨 분류법에 의해 조사한 결과, 구순열군은 I급이 가장 많았고 III, II 급의 순이었으며, 구순치조열, 구개열, 구순구개열군은 III급이 가장 많았고, I, II 급의 순이었다. 그리고 III급의 발생빈도의 비율차이는 구순치조열은 $61.7\%$, 구개열은 $73.9\%$, 구순구개열군에서 $79.3\%$로서 구순구개열에서 압도적으로 III급의 발생빈도가 높게 나타났다. 11. 모든 연령군에서 III급 부정교합의 빈도가 가장 많아서($72.7\%$) 전치부의 반대교합이 주된 내원 동기가 됨을 간접적으로 알 수 있었다.

  • PDF

스마트폰 다종 데이터를 활용한 딥러닝 기반의 사용자 동행 상태 인식 (A Deep Learning Based Approach to Recognizing Accompanying Status of Smartphone Users Using Multimodal Data)

  • 김길호;최상우;채문정;박희웅;이재홍;박종헌
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.163-177
    • /
    • 2019
  • 스마트폰이 널리 보급되고 현대인들의 생활 속에 깊이 자리 잡으면서, 스마트폰에서 수집된 다종 데이터를 바탕으로 사용자 개인의 행동을 인식하고자 하는 연구가 활발히 진행되고 있다. 그러나 타인과의 상호작용 행동 인식에 대한 연구는 아직까지 상대적으로 미진하였다. 기존 상호작용 행동 인식 연구에서는 오디오, 블루투스, 와이파이 등의 데이터를 사용하였으나, 이들은 사용자 사생활 침해 가능성이 높으며 단시간 내에 충분한 양의 데이터를 수집하기 어렵다는 한계가 있다. 반면 가속도, 자기장, 자이로스코프 등의 물리 센서의 경우 사생활 침해 가능성이 낮으며 단시간 내에 충분한 양의 데이터를 수집할 수 있다. 본 연구에서는 이러한 점에 주목하여, 스마트폰 상의 다종 물리 센서 데이터만을 활용, 딥러닝 모델에 기반을 둔 사용자의 동행 상태 인식 방법론을 제안한다. 사용자의 동행 여부 및 대화 여부를 분류하는 동행 상태 분류 모델은 컨볼루션 신경망과 장단기 기억 순환 신경망이 혼합된 구조를 지닌다. 먼저 스마트폰의 다종 물리 센서에서 수집한 데이터에 존재하는 타임 스태프의 차이를 상쇄하고, 정규화를 수행하여 시간에 따른 시퀀스 데이터 형태로 변환함으로써 동행 상태분류 모델의 입력 데이터를 생성한다. 이는 컨볼루션 신경망에 입력되며, 데이터의 시간적 국부 의존성이 반영된 요인 지도를 출력한다. 장단기 기억 순환 신경망은 요인 지도를 입력받아 시간에 따른 순차적 연관 관계를 학습하며, 동행 상태 분류를 위한 요인을 추출하고 소프트맥스 분류기에서 이에 기반한 최종적인 분류를 수행한다. 자체 제작한 스마트폰 애플리케이션을 배포하여 실험 데이터를 수집하였으며, 이를 활용하여 제안한 방법론을 평가하였다. 최적의 파라미터를 설정하여 동행 상태 분류 모델을 학습하고 평가한 결과, 동행 여부와 대화 여부를 각각 98.74%, 98.83%의 높은 정확도로 분류하였다.

토픽모델링을 활용한 COVID-19 학술 연구 기반 연구 주제 분류에 관한 연구 (A study on the classification of research topics based on COVID-19 academic research using Topic modeling)

  • 유소연;임규건
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.155-174
    • /
    • 2022
  • 2020년 1월부터 2021년 10월 현재까지 COVID-19(치명적인 호흡기 증후군인 코로나바이러스-2)와 관련된 학술 연구가 500,000편 이상 발표되었다. COVID-19와 관련된 논문의 수가 급격하게 증가함에 따라 의료 전문가와 정책 담당자들이 중요한 연구를 신속하게 찾는 것에 시간적·기술적 제약이 따르고 있다. 따라서 본 연구에서는 LDA와 Word2vec 알고리즘을 사용하여 방대한 문헌의 텍스트 자료로부터 유용한 정보를 추출하는 방안을 제시한다. COVID-19와 관련된 논문에서 검색하고자 하는 키워드와 관련된 논문을 추출하고, 이를 대상으로 세부 주제를 파악하였다. 자료는 Kaggle에 있는 CORD-19 데이터 세트를 활용하였는데, COVID-19 전염병에 대응하기 위해 주요 연구 그룹과 백악관이 준비한 무료 학술 자료로서 매주 자료가 업데이트되고 있다. 연구 방법은 크게 두 가지로 나뉜다. 먼저, 47,110편의 학술 논문의 초록을 대상으로 LDA 토픽 모델링과 Word2vec 연관어 분석을 수행한 후, 도출된 토픽 중 'vaccine'과 관련된 논문 4,555편, 'treatment'와 관련된 논문 5,791편을 추출한다. 두 번째로 추출된 논문을 대상으로 LDA, PCA 차원 축소 후 t-SNE 기법을 사용하여 비슷한 주제를 가진 논문을 군집화하고 산점도로 시각화하였다. 전체 논문을 대상으로 찾을 수 없었던 숨겨진 주제를 키워드에 따라 문헌을 분류하여 토픽 모델링을 수행한 결과 세부 주제를 찾을 수 있었다. 본 연구의 목표는 대량의 문헌에서 키워드를 입력하여 특정 정보에 대한 문헌을 분류할 수 있는 방안을 제시하는 것이다. 본 연구의 목표는 의료 전문가와 정책 담당자들의 소중한 시간과 노력을 줄이고, 신속하게 정보를 얻을 수 있는 방법을 제안하는 것이다. 학술 논문의 초록에서 COVID-19와 관련된 토픽을 발견하고, COVID-19에 대한 새로운 연구 방향을 탐구하도록 도움을 주는 기초자료로 활용될 것으로 기대한다.