• 제목/요약/키워드: 성능개선

검색결과 12,193건 처리시간 0.047초

대용량 소셜 미디어 감성분석을 위한 반감독 학습 기법 (Semi-supervised learning for sentiment analysis in mass social media)

  • 홍소라;정연오;이지형
    • 한국지능시스템학회논문지
    • /
    • 제24권5호
    • /
    • pp.482-488
    • /
    • 2014
  • 대표적인 소셜 네트워크 서비스(SNS)인 트위터의 내용을 분석하여 자동으로 트윗에 나타난 사용자의 감성을 분석하고자 한다. 기계학습 기법을 사용해서 감성 분석 모델을 생성하기 위해서는 각각의 트윗에 긍정 또는 부정을 나타내는 감성 레이블이 필요하다. 그러나 사람이 모든 트윗에 감성 레이블을 붙이는 것은 비용이 많이 소요되고, 실질적으로 불가능하다. 그래서 본 연구에서는 "감성 레이블이 있는 데이터"와 함께 "감성 레이블이 없는 데이터"도 활용하기 위해서 반감독 학습기법인 self-training 알고리즘을 적용하여 감성분석 모델을 생성한다. Self-training 알고리즘은 "레이블이 있는 데이터"의 레이블이 있는 데이터를 활용하여 "레이블이 없는 데이터"의 레이블을 확정하여 "레이블이 있는 데이터"를 확장하는 방식으로, 분류모델을 점진적으로 개선시키는 방식이다. 그러나 데이터의 레이블이 한번 확정되면 향후 학습에서 계속 사용되므로, 초기의 오류가 계속적으로 학습에 영향을 미치게 된다. 그러므로 조금 더 신중하게 "레이블이 없는 데이터"의 레이블을 결정할 필요가 있다. 본 논문에서는 self-training 알고리즘을 이용하여 보다 높은 정확도의 감성 분석 모델을 생성하기 위하여, self-training 중 "감성 레이블이 없는 데이터"의 레이블을 결정하여 "감성 레이블이 있는 데이터"로 확장하기 위한 3가지 정책을 제시하고, 각각의 성능을 비교 분석한다. 첫 번째 정책은 임계치를 고려하는 것이다. 분류 경계로부터 일정거리 이상 떨어져 있는 데이터를 선택하고자 하는 것이다. 두 번째 정책은 같은 개수의 긍/부정 데이터를 추가하는 것이다. 한쪽 감성에 해당하는 데이터에만 국한된 학습을 하는 것을 방지하기 위한 것이다. 세 번째 정책은 최대 개수를 고려하는 것이다. 한 번에 많은 양의 데이터가 "감성 레이블이 있는 데이터"에 추가되는 것을 방지하고 상위 몇%만 선택하기 위해서, 선택되는 데이터의 개수의 상한선을 정한 것이다. 실험은 긍정과 부정으로 분류되어 있는 트위터 데이터 셋인 Stanford data set에 적용하여 실험하였다. 그 결과 학습된 모델은 "감성 레이블이 있는 데이터" 만을 가지고 모델을 생성한 것보다 감성분석의 성능을 향상 시킬 수 있었고 3가지 정책을 적용한 방법의 효과를 입증하였다.

X-tree Diff: 트리 기반 데이터를 위한 효율적인 변화 탐지 알고리즘 (X-tree Diff: An Efficient Change Detection Algorithm for Tree-structured Data)

  • 이석균;김동아
    • 정보처리학회논문지C
    • /
    • 제10C권6호
    • /
    • pp.683-694
    • /
    • 2003
  • 인터넷 사용이 급속도로 증가함에 따라 XML/HTML 문서와 같이 트리 구조로 표현되는 데이터의 변화 탐지가 중요한 연구 분야로 등장하고 있다. 본 논문에서는 효율적인 변화 탐지를 위한 데이터 구조로 X-tree와 이에 기초한 휴리스틱 변화 탐지 알고리즘 X-tree Diff 를 제안한다. X-tree Diff 는 X-tree 의 변화 내용에 대한 최소 비용 편집 스크립트를 찾는 알고리즘과는 달리 휴리스틱 트리 대응 알고리즘을 통해 병화 내용을 확인하는 알고리즘으로, X-tree 에 속한 모든 노드에 대해 각각의 노드를 루트로 하는 서브트리의 구조와 서브트리속에 속한 노드들의 데이터들을 128비트 해시값으로 표현한 값인 트리 MD를 각 노드에 저장하고, 이를 변화 탐지 과정에서 활용하여 신-구 버전의 X-tree들에 속한 서브트리들의 비교을 효율적으로 처리한다. X-tree Diff 는 4단계로 구성되며 1)신-구버넌의 X-tree노드들에 대해, 우선 1:1 대응이 가능한 모든 동등한 서브트리 쌍을 찾고, 2) 이들 서브트리 쌍의 루트로부터 신-구 버전의 X-tree의 루트까지의 경로 상에 존재하는 노드들에 대한 대응관계를 결정한다. 3) 그 후 신-구 버전의 X-tree의 루트들로부터 깊이 우선 탐색으로 노드를 방문하며 대응이 결정되지 않은 노드들에 대한 대응여부를 결정해 나간다. 4) 마지막까지 대응여부가 결정되지 않은 도드들은 삭제나 삽입된 것으로 간주한다. X-tree Diff XML 문서들에 대한 버저닝(Versioning) 을 목적으로 설계된 BUILD Diff 알고리즘과 달리 XML/HTML 에 공통적으로 사용할 수 있을 뿐 아니라, 알고리즘이 명확하고 간결하여 다양한 형태의 확장이 가능하다. 알고리즘의 성능도 개선되어 신-구 X-tree의 노드의 수를 n이라 할 때, O(n)의 시간 복잡도를 갖는다. 제안된 알고리즘은 현재 보안 관련 상용 시스템인 WIDS(Web-Document Instrusion Detection System) 에서 사용되고 있으며, 본 논문에서는 WIDS를 이용하여 20여개 신문-방송 사이트에서 변화가 탐지된 11,000 개 페이지에 대한 성능평가를 보이고 있다.

ANN 및 SVR 알고리즘을 활용한 최적 터널지보패턴 선정에 관한 연구 (A study on the optimization of tunnel support patterns using ANN and SVR algorithms)

  • 이제겸;김양균;이승원
    • 한국터널지하공간학회 논문집
    • /
    • 제24권6호
    • /
    • pp.617-628
    • /
    • 2022
  • 터널 건설 시 암반 등급에 따라 다양한 지보재를 적절히 병용하여 지보패턴을 결정하고 시공이 이루어진다. 이 과정에서 시공 경험이 풍부한 전문가의 기술적 판단이 필요한데, 터널 설계의 초기 단계인 타당성 조사 및 기본설계 단계에는 상대적으로 짧은 수행기간과 부족한 자료 및 예산으로 인해 설계에 많은 어려움이 존재한다. 터널 건설의 급증과 함께 축적된 설계 데이터와 머신러닝을 활용한다면, 지보패턴 설계를 보다 신속하고 신뢰도 있게 수행할 수 있다. 따라서 본 연구에서는 암반등급 판정 및 해당 암반등급에 적합한 지보패턴 설계를 자동화하고자 국내 48개 도로터널의 설계자료 및 지반조사 자료를 수집하였으며, 8개의 입력항목(암종, 전기비저항, 심도, 터널연장, 터널연장에 따른 방재등급, 위험도지수에 따른 방재등급, 터널 종류, 터널 단면적)과 11개의 출력항목(암반등급, 숏크리트 제원 2개 항목, 록볼트 제원 3개 항목, 강지보 제원 3개 항목, 콘크리트 라이닝 2개 항목)에 대한 데이터를 정리하였다. 이와 같이 정리된 데이터를 활용하여 2가지 머신러닝 알고리즘(SVM, ANN)을 활용하여 3가지 머신러닝 모델(S1, A1, A2)을 개발하였으며, 세 가지 모델의 성능을 비교해본 결과 출력값의 데이터 형식에 따라 서로 다른 손실함수를 적용한 ANN 기반의 A2 모델이 가장 뛰어난 성능을 보였다. 본 연구를 통해 머신러닝을 활용한 지보패턴 설계의 가능성을 확인할 수 있었으며, 향후 지속적으로 실제 설계에 사용함으로써 단점을 보완하고 적용성을 개선해 나간다면 설계에 보다 큰 도움을 줄 수 있는 지보패턴 설계 모델을 개발할 수 있을 것으로 기대된다.

GOCI-II 대기보정 알고리즘의 소개 및 초기단계 검증 결과 (Introduction of GOCI-II Atmospheric Correction Algorithm and Its Initial Validations)

  • 안재현;김광석;이은경;배수정;이경상;문정언;한태현;박영제
    • 대한원격탐사학회지
    • /
    • 제37권5_2호
    • /
    • pp.1259-1268
    • /
    • 2021
  • '천리안 해양위성 2호(2nd Geostationary Ocean Color Imager: GOCI-II)는 천리안 해양위성 1호(GOCI)의 후속위성으로 1개의 근자외 채널(380 nm), 8개의 가시광 채널(412, 443, 490, 510, 555, 620, 660, 680 nm), 3개의 근적외 채널(709, 745, 865 nm)의 총 12개 파장대에서 다분광 관측을 하며, 1시간 간격의 시간 해상도로 한반도 주변 동북아 해양, 1일 간격으로 반구(full disk)영역의 해양 환경 자료를 생산한다. 해색 자료처리의 첫 단계로 대기 상층 복사휘도에서 해수표면 반사도를 계산하는 대기보정을 수행하며, GOCI-II의 표준 대기보정은 GOCI 대기보정 방법에 이론적인 기반을 두고 있으며, GOCI-II에 새로 추가된 밴드 중 620, 709 nm를 이용하여 탁도가 높은 해역에서의 대기보정 성능을 향상시켰다. 본 연구에서는 GOCI-II 지상국 시스템에 구현 되어있는 대기보정 알고리즘을 우선 소개하고, 현장 측정 원격반사도 자료를 이용하여 초기단계 검증을 수행하였다. 검증은 1차적으로 대양에서 수집된 현장 자료와의 비교를 통해 수행하였으며 여기서의 대기보정 정확도는 대양 대기보정 정확도 요구범위인 청색 파장대 오차율 5% 이내의 범위를 만족시켰다. 그러나 연안의 해양관측타워에 설치된 무인 관측장비인 AERONET-OC로 수집된 원격반사도 자료를 이용한 추가적인 검증결과에서는 대양과 달리 높은 오차율을 보여주었다. 연안에서의 대기보정 정확도는 추후 추가적인 근적외 파장대 대리교정을 통해 보완이 가능할 것으로 보이며, 지속적인 검보정 활동을 통해 수집된 현장자료들을 이용할 경우 연안뿐 아니라 전체적인 대기보정 성능 향상이 가능할 것으로 기대된다. 이후 검보정 활동을 통해 개선된 대기보정은 주기적으로 GOCI-II 지상국 시스템에 반영하여 재처리 및 재 배포를 수행할 예정이다.

EPB 쉴드 TBM 챔버 내 혼합방법에 따른 배토상태거동에 대한 연구 (A study on the soil conditioning behaviour according to mixing method in EPB shield TBM chamber)

  • 김연덕;황병현;조성우;김상환
    • 한국터널지하공간학회 논문집
    • /
    • 제23권4호
    • /
    • pp.233-252
    • /
    • 2021
  • 본논문은 쉴드 TBM 챔버(Chamber) 내 배토처리 효율성 향상을 위한 연구이다. 현재 국내에서는 TBM 공법을 이용한 시공사례가 증가하는 추세이다. TBM 공법 사용의 증가에 따른 디스크 커터(Disc Cutter), 커터 비트(Cutter bit) 및 세그먼트와 같은 TBM 공법의 연구 또한 증가하는 추세를 보인다. 하지만 챔버와 챔버 내 교반 성능에 대한 연구는 미비한 실정이다. 원활한 배토처리와 굴착토의 거동을 개선하기 위하여 챔버 내 효과적인 믹싱 바 배치에 따른 교반 효율 변화에 대한 연구를 수행하였다. 축소모형 실험은 식별의 용이성을 위하여 색이 다른 플라스틱 소재를 사용하여 지반을 조성하였다. 또한 믹싱 바 배치를 상이하게 하여 4가지 Case로 분류하였으며, 입도분포를 단입도와 다입도로 분류하여 총 8가지의 Case로 실험을 진행하였다. 모든 Case의 커터헤드의 회전속도는 5 RPM으로 동일하며, 실험시간 또한 동일한 조건인 1분 30초로 진행하였다. 교반 효율을 확인하기 위하여 각 Case별 상부, 중부(좌 or 우), 하부 위치의 시료를 채취하여 분석하였다. 축소모형실험 결과 실제 사용되는 Case 1과 Case 1-1보다 새로운 배치방법인 Case 4와 Case 4-1의 교반 효율이 증가하는 양상을 보인다. 그에 따라 챔버 내 믹싱 바 배치를 변경하여 교반 효율을 증가시킬 수 있을 것으로 보이며, 교반 효율증가에 따라 공기 절약에 효과적일 것으로 판단된다. 따라서 본 연구는 국내 쉴드 TBM 공법 활용에 있어 큰 지표로써 작용할 것으로 보인다.

라디오파 해동기의 해동 및 가열성능 분석 (Frozen Food Thawing and Heat Exchanging Performance Analysis of Radio Frequency Thawing Machine)

  • 김진세;박석호;최동수;최승렬;김용훈;이수장;박천완;한귀정;조병관;박종우
    • 산업식품공학
    • /
    • 제21권1호
    • /
    • pp.57-63
    • /
    • 2017
  • 본 연구는 제작된 27.12 MHz 라디오파 해동기의 성능을 분석하고, 냉동 식재료의 해동 중 열전달 특성을 분석하기 위하여 수행되었다. 라디오파 해동 중 크기에 따른 가열 특성 분석을 위한 한천겔 블록과 식품 및 출력별 해동 속도와 최대가열온도를 분석하기 위하여 일정한 크기의 시료를 $-80^{\circ}C$에 냉동하여 준비하고 각각 50, 100, 200 및 400 W의 라디오파를 가하여 해동을 수행하였다. 그 결과 한천겔은 크기에 관계없이 내외부에서 균등해동이 이루어졌으며, 각 출력별 $-5^{\circ}C$에서 $0^{\circ}C$까지의 상변화 시간은 무에서 30, 26, 13, 8분, 돈육 등심에서 38, 25, 11, 5분, 우둔살에서 23, 17, 11, 6분, 닭 가슴살에서 42, 29, 13, 9분, 참치에서 225, 23, 10, 5분이 소요되었다. 각 식재료에서 라디오파의 출력이 증가할수록 해동속도가 급격히 증가하였지만 상변화 구간에서 지연되어 완전해동까지는 시간이 다소 소요되었으나 효과적으로 균일 해동이 이루어졌다. 해동 이후 최대가열온도는 무, 돈육 등심, 우둔살, 닭 가슴살, 참치에서 50 W는 각각 19.5, 9.2, 21.8, 8.8 및 $16.8^{\circ}C$였으며, 100 W에서 23.5, 15.5, 27.3, 12.3 및 $19^{\circ}C$, 그리고 200 W에서는 42, 26.9, 45.7, 22.1와 $39.4^{\circ}C$, 마지막으로 400 W에서는 48.5, 54.7, 63.6, 57.3과 $44.9^{\circ}C$까지 상승하였다. 출력 증가에 따라 모든 식재료에서 최대가열온도 또한 증가하였지만 냉동 식재료의 수분 및 지방 함량이 라디오파 가열속도 미치는 영향은 나타나지 않았다. 이러한 결과는 제작된 라디오파 해동기가 고출력으로 갈수록 해동효율이 증가하는 반면 해동 후 가열이 일어나기 때문에 이를 제어하기 위한 개선이 필요하며, 라디오파 해동이 냉동 식재료의 해동품질에 미치는 영향에 대한 추가적인 연구 또한 필요할 것으로 판단된다.

효과적인 비점오염원관리를 위한 접근 방향 (The Effective Approach for Non-Point Source Management)

  • 박재홍;류지철;신동석;이재관
    • 한국습지학회지
    • /
    • 제21권2호
    • /
    • pp.140-146
    • /
    • 2019
  • 비점오염원 관리를 위해 정책의 변환이 필요한 부분으로는 비점오염원관리는 국토의 이용 및 개발이 시작되는 시점부터 체계적으로 이루어지도록 제도의 패러다임이 전환되어야 한다. 비점관리지역의 국고지원 방식 및 운영방안을 전환하여 최저지원율은 보장해 주고 그 이상은 지자체의 비점오염저감사업의 추진현황과 성과등을 평가하여 추가로 지원해 줄 수 있는 방식으로의 전환을 통해 사업효과를 극대화할 필요가 있다. 신규 제도가 마련되어야 할 부분으로는 비점오염저감사업의 추진성과를 평가하고 운영효과를 모니터링 할 수 있도록 평가체계가 마련되어야 한다. 지자체가 비점오염원저감사업을 충실히 수행하여 계획된 성과를 달성하고 지속적인 유지관리가 될 수 있도록 지자체의 책임행정을 유도할 수 있는 관련 근거 규정이 필요시 된다. 대안마련이 필요한 요소로는 자동채수 분석에서 $100{\mu}m$ 필터의 사용에 따른 문제점, 강우시 채수 및 분석의 적시성 확보, 효율적인 비점측정망 운영관리 방안을 들 수 있다. 대안으로는 채수 분석장비의 성능개선, 권역별 비점오염물질측정망 모니터링통합센터 운영 등을 검토해볼 필요가 있다. 또한 국고보조사업으로 추진된 비점오염저감시설로 인한 오염물질의 삭감량을 수질오염총량제의 개발부하량으로 사용할 수 있도록 요구할 경우 삭감량에 따라 비점오염저감시설의 유지관리 비용 일부를 인센티브형식으로 지원하는 방안을 고려해 볼 수 있다.

핵심 농기계(트랙터, 콤바인 및 이앙기) 이용 및 수리실태 분석 (Analysis of Utilization and Maintenance of Major Agricultural machinery (Tractor, Combine Harvester and Rice Transplanter))

  • 홍성하;최규홍
    • 한국국제농업개발학회지
    • /
    • 제30권4호
    • /
    • pp.292-299
    • /
    • 2018
  • 농가의 핵심 농기계 이용 만족도를 조사 분석한 결과, 수입산이 국산 대비 트랙터는 1.2배, 콤바인 1.3배, 이앙기 1.4배 높은 것으로 나타났다. 즉 가격과 사후봉사를 제외한 작업성능, 조작편이성, 내구성, 고장빈도에서 높은 만족도를 보였고, 이는 전자유압제어, 파워트레인 및 변속기 설계, 신소재, 저소음 캐빈 등 기술수준의 차이가 반영된 결과로 여겨진다. 국산 농기계의 품질향상을 통한 적극적인 대응이 필요한 것으로 판단된다. 대리점을 대상으로 한 핵심 농기계의 부품 및 소모품에서 고장 수리 빈도수가 높게 나타났다. 트랙터는 주요 4개 부위에서 85.3%, 콤바인은 5개 부위에서 89.6%, 이앙기는 3개 부위에서 80.5%가 발생한 것으로 분석되었다. 그리고 제조사를 대상으로 한 수입산 대비 국산의 기술수준이 중소형 트랙터, 4조 콤바인 및 6조 이앙기는 근접하였으나, 트랙터는 60-100%, 콤바인 70-100%, 이앙기 70-95%로 평가되었다. 또한 국산의 문제점으로 트랙터는 내구성과 조작편이성, 콤바인은 내구성, 이앙기는 조작편이성을 가장 큰 문제로 인식되고 있다. 농가, 대리점 및 제조사의 조사결과를 종합해보면, 농가 및 대리점에서는 품질 개선과 내구성 향상이 시급하다고 응답하는 반면에, 제조업체는 주로 작업성능과 조작편이성 향상 기술개발에 역점을 두고 있어 현장과 괴리감을 보였다. 따라서 제조사에서는 농가와 대리점의 애로사항을 설계 생산에 적극 반영해야 할 것으로 판단된다. 특히, 수입산 농기계 대비 국산의 가장 큰 문제점은 잔고장으로 대표되는 품질 문제로 분석되었다. 이는 제조사 입장에서 농기계 판매의 계절성에 따른 경영악화와 소량 생산으로 인한 한정적인 제품원가 절감요소가 낳은 결과로 판단된다. 제조사 입장에서는 시장의 가격경쟁력 강화를 위해 자체적으로 기종별 부품 공용화와 다량 구매 부품의 원가절감 전략을 구사하고 있는데, 이로 인해 오히려 품질 저하와 농가 불만 증가를 초래, 점진적인 시장점유율 하락을 인지하면서도 부품개발 등에 적극적으로 대응하지 못하고 있는 것으로 나타났다. 결론적으로 국산 농기계 부품의 신뢰성 및 내구성 시험 강화를 위해 일본 수준의 시험검정과 연속시험 보완이 필요하며, 농가 보호를 위해 고장 수리 빈도수가 높은 주요 부품에 대한 정례적인 사후검정기준 마련 등 제도적 보완이 필요할 것으로 판단된다. 또한 국내 농기계산업의 활성화와 국산농기계의 국내외 시장경쟁력 강화를 위해, 현재 시점에서 정책적으로 제조사와 부품 제조업체를 포함하는 공용부품 개발, 제조 및 공급을 위한 농기계부품연구원의 설립이 절대적으로 필요한 시기로 판단된다.

양자 간 대화 상황에서의 화자인식을 위한 문장 시퀀싱 방법을 통한 자동 말투 인식 (Automatic Speech Style Recognition Through Sentence Sequencing for Speaker Recognition in Bilateral Dialogue Situations)

  • 강가람;권오병
    • 지능정보연구
    • /
    • 제27권2호
    • /
    • pp.17-32
    • /
    • 2021
  • 화자인식은 자동 음성시스템에서 중요한 기능을 담당하며, 최근 휴대용 기기의 발전 및 음성 기술, 오디오 콘텐츠 분야 등이 계속해서 확장됨에 따라 화자인식 기술의 중요성은 더구나 부각 되고 있다. 이전의 화자인식 연구는 음성 파일을 기반으로 화자가 누구인지 자동으로 판정 및 정확도 향상을 위한 목표를 가지고 진행되었다. 한편 말투는 중요한 사회언어학적 소재로 사용자의 사회적 환경과 밀접하게 관련되어 있다. 추가로 화자의 말투에 사용되는 종결어미는 문장의 유형을 결정하거나 화자의 의도, 심리적 태도 또는 청자에 대한 관계 등의 기능과 정보를 가지고 있다. 이처럼 종결어미의 활용형태는 화자의 특성에 따라 다양한 개연성이 있어 특정 미확인 화자의 종결어미의 종류와 분포는 해당 화자를 인식하는 것에 도움이 될 것으로 보인다. 기존 텍스트 기반의 화자인식에서 말투를 고려한 연구가 적었으며 음성 신호를 기반으로 한 화자인식 기법에 말투 정보를 추가한다면 화자인식의 정확도를 더욱 높일 수 있을 것이다. 따라서 본 연구의 목적은 한국어 화자인식의 정확도를 개선하기 위해 종결어미로 표현되는 말투(speech style) 정보를 활용한 방법을 제안하는 것이다. 이를 위해 특정인의 발화 내용에서 등장하는 종결어미의 종류와 빈도를 활용하여 벡터값을 생성하는 문장 시퀀싱이라는 방법을 제안한다. 본 연구에서 제안한 방법의 우수성을 평가하기 위해 드라마 대본으로 학습 및 성능평가를 수행하였다. 본 연구에서 제안한 방법은 향후 실존하는 한국어 음성인식 서비스의 성능 향상을 위한 수단으로 사용될 수 있으며 지능형 대화 시스템 및 각종 음성 기반 서비스에 활용될 것을 기대한다.

인공지능의 사회적 수용도에 따른 키워드 검색량 기반 주가예측모형 비교연구 (Comparison of Models for Stock Price Prediction Based on Keyword Search Volume According to the Social Acceptance of Artificial Intelligence)

  • 조유정;손권상;권오병
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.103-128
    • /
    • 2021
  • 최근 주식의 수익률과 거래량을 설명하는 주요 요인으로서 투자자의 관심도와 주식 관련 정보 전파의 영향력이 부각되고 있다. 또한 인공지능과 같은 혁신 신기술을 개발보급하거나 활용하려는 기업의 경우 거시환경 및 시장 불확실성 때문에 기업의 미래 주식 수익률과 주식 변동성을 예측하기 어렵다는 문제를 가지고 있다. 이는 인공지능 활성화의 장애요인으로 인식되고 있다. 따라서 본 연구의 목적은 인공지능 관련 기술 키워드의 인터넷 검색량을 투자자의 관심 척도로 사용하여, 기업의 주가 변동성을 예측하는 기계학습 모형을 제안하는 것이다. 이를 위해 심층신경망 LSTM(Long Short-Term Memory)과 벡터자기회귀(Vector Autoregression)를 통해 주식시장을 예측하고, 기술의 사회적 수용 단계에 따라 키워드 검색량을 활용한 주가예측 성능 비교를 통해 기업의 투자수익 예측이나 투자자들의 투자전략 의사결정을 지원하는 주가 예측 모형을 구축하였다. 또한 인공지능 기술의 세부 하위 기술에 대한 분석도 실시하여 기술 수용 단계에 따른 세부 기술 키워드 검색량의 변화를 살펴보고 세부기술에 대한 관심도가 주식시장 예측에 미치는 영향을 살펴보았다. 이를 위해 본 연구에서는 인공지능, 딥러닝, 머신러닝 키워드를 선정하여, 2015년 1월 1일부터 2019년 12월 31일까지 5년간의 인터넷 주별 검색량 데이터와 코스닥 상장 기업의 주가 및 거래량 데이터를 수집하여 분석에 활용하였다. 분석 결과 인공지능 기술에 대한 키워드 검색량은 사회적 수용 단계가 진행될수록 증가하는 것으로 나타났고, 기술 키워드를 기반으로 주가예측을 하였을 경우 인식(Awareness)단계에서 가장 높은 정확도를 보였으며, 키워드별로 가장 좋은 예측 성능을 보이는 수용 단계가 다르게 나타남을 확인하였다. 따라서 기술 키워드를 활용한 주가 예측 모델 구축을 위해서는 해당 기술의 하위 기술 분류를 고려할 필요가 있다. 본 연구의 결과는 혁신기술을 기반으로 기업의 투자수익률을 예측하기 위해서는 기술에 대한 대중의 관심이 급증하는 인식 단계를 포착하는 것이 중요하다는 점을 시사한다. 또한 최근 금융권에서 선보이고 있는 빅데이터 기반 로보어드바이저(Robo-advisor) 등 투자 의사 결정 지원 시스템 개발 시 기술의 사회적 수용도를 세분화하여 키워드 검색량 변화를 통해 예측 모델의 정확도를 개선할 수 있다는 점을 시사하고 있다.