• 제목/요약/키워드: 성능개선

검색결과 12,193건 처리시간 0.05초

온라인 쇼핑몰에서 상품 설명 이미지 내의 키워드 인식을 위한 딥러닝 훈련 데이터 자동 생성 방안 (The way to make training data for deep learning model to recognize keywords in product catalog image at E-commerce)

  • 김기태;오원석;임근원;차은우;신민영;김종우
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.1-23
    • /
    • 2018
  • E-commerce 환경의 발전으로 소비자들은 다양한 상품들을 한 자리에서 폭 넓게 비교할 수 있게 되었다. 하지만 온라인 쇼핑몰에 올라와있는 상당량의 주요 상품 정보들이 이미지 형태이기 때문에 컴퓨터가 인지할 수 있는 텍스트 기반 검색 시스템에 반영될 수 없다는 한계가 존재한다. 이러한 한계점은 일반적으로 기존 기계학습 기술 및 OCR(Optical Character Recognition) 기술을 활용해, 이미지 형태로 된 키워드를 인식함으로써 개선할 수 있다. 그러나 기존 OCR 기술은 이미지 안에 글자가 아닌 그림이 많고 글자 크기가 작으면 낮은 인식률을 보인다는 문제가 있다. 이에 본 연구에서는 기존 기술들의 한계점을 해결하기 위하여, 딥러닝 기반 사물인식 모형 중 하나인 SSD(Single Shot MultiBox Detector)를 개조하여 이미지 형태의 상품 카탈로그 내의 텍스트 인식모형을 설계하였다. 하지만 이를 학습시키기 위한 데이터를 구축하는 데 상당한 시간과 비용이 필요했는데, 이는 지도학습의 방법론을 따르는 SSD 모형은 훈련 데이터마다 직접 정답 라벨링을 해줘야 하기 때문이다. 본 연구는 이러한 문제점을 해결하기 위해 '훈련 데이터 자동 생성 프로그램'을 함께 개발하였다. 훈련 데이터 자동 생성 프로그램을 통해 수작업으로 데이터를 만드는 것에 비하여 시간과 비용을 대폭 절감할 수 있었으며, 생성된 훈련용 데이터를 통해 모형의 인식 성능을 높일 수 있었다. 더 나아가 실험연구를 통해 자동으로 생성된 훈련 데이터의 특징별로 인식기 모형의 성능에 얼마나 큰 영향을 끼치는지 알아보고, 성능 향상에 효과적인 데이터의 특징을 분석하였다. 본 연구를 통해서 개발된 상품 카탈로그 내 텍스트 인식모형과 훈련 데이터 자동 생성 프로그램은 온라인 쇼핑몰 판매자들의 상품 정보 등록 수고를 줄여줄 수 있으며, 구매자들의 상품 검색 시 결과의 정확성을 향상시키는 데 기여할 수 있을 것으로 기대한다.

뉴럴 텐서 네트워크 기반 주식 개별종목 지식개체명 추출 방법에 관한 연구 (A Study on Knowledge Entity Extraction Method for Individual Stocks Based on Neural Tensor Network)

  • 양윤석;이현준;오경주
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.25-38
    • /
    • 2019
  • 정보화 시대의 넘쳐나는 콘텐츠들 속에서 사용자의 관심과 요구에 맞는 양질의 정보를 선별해내는 과정은 세대를 거듭할수록 더욱 중요해지고 있다. 정보의 홍수 속에서 사용자의 정보 요구를 단순한 문자열로 인식하지 않고, 의미적으로 파악하여 검색결과에 사용자 의도를 더 정확하게 반영하고자 하는 노력이 이루어지고 있다. 구글이나 마이크로소프트와 같은 대형 IT 기업들도 시멘틱 기술을 기반으로 사용자에게 만족도와 편의성을 제공하는 검색엔진 및 지식기반기술의 개발에 집중하고 있다. 특히 금융 분야는 끊임없이 방대한 새로운 정보가 발생하며 초기의 정보일수록 큰 가치를 지녀 텍스트 데이터 분석과 관련된 연구의 효용성과 발전 가능성이 기대되는 분야 중 하나이다. 따라서, 본 연구는 주식 관련 정보검색의 시멘틱 성능을 향상시키기 위해 주식 개별종목을 대상으로 뉴럴 텐서 네트워크를 활용한 지식 개체명 추출과 이에 대한 성능평가를 시도하고자 한다. 뉴럴 텐서 네트워크 관련 기존 주요 연구들이 추론을 통해 지식 개체명들 사이의 관계 탐색을 주로 목표로 하였다면, 본 연구는 주식 개별종목과 관련이 있는 지식 개체명 자체의 추출을 주목적으로 한다. 기존 관련 연구의 문제점들을 해결하고 모형의 실효성과 현실성을 높이기 위한 다양한 데이터 처리 방법이 모형설계 과정에서 적용되며, 객관적인 성능 평가를 위한 실증 분석 결과와 분석 내용을 제시한다. 2017년 5월 30일부터 2018년 5월 21일 사이에 발생한 전문가 리포트를 대상으로 실증 분석을 진행한 결과, 제시된 모형을 통해 추출된 개체명들은 개별종목이 이름을 약 69% 정확도로 예측하였다. 이러한 결과는 본 연구에서 제시하는 모형의 활용 가능성을 보여주고 있으며, 후속 연구와 모형 개선을 통한 성과의 제고가 가능하다는 것을 의미한다. 마지막으로 종목명 예측 테스트를 통해 본 연구에서 제시한 학습 방법이 새로운 텍스트 정보를 의미적으로 접근하여 관련주식 종목과 매칭시키는 목적으로 사용될 수 있는 가능성을 확인하였다.

한국어 음소 단위 LSTM 언어모델을 이용한 문장 생성 (Korean Sentence Generation Using Phoneme-Level LSTM Language Model)

  • 안성만;정여진;이재준;양지헌
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.71-88
    • /
    • 2017
  • 언어모델은 순차적으로 입력된 자료를 바탕으로 다음에 나올 단어나 문자를 예측하는 모델로 언어처리나 음성인식 분야에 활용된다. 최근 딥러닝 알고리즘이 발전되면서 입력 개체 간의 의존성을 효과적으로 반영할 수 있는 순환신경망 모델과 이를 발전시킨 Long short-term memory(LSTM) 모델이 언어모델에 사용되고 있다. 이러한 모형에 자료를 입력하기 위해서는 문장을 단어 혹은 형태소로 분해하는 과정을 거친 후 단어 레벨 혹은 형태소 레벨의 모형을 사용하는 것이 일반적이다. 하지만 이러한 모형은 텍스트가 포함하는 단어나 형태소의 수가 일반적으로 매우 많기 때문에 사전 크기가 커지게 되고 이에 따라 모형의 복잡도가 증가하는 문제가 있고 사전에 포함된 어휘 외에는 생성이 불가능하다는 등의 단점이 있다. 특히 한국어와 같이 형태소 활용이 다양한 언어의 경우 형태소 분석기를 통한 분해과정에서 오류가 더해질 수 있다. 이를 보완하기 위해 본 논문에서는 문장을 자음과 모음으로 이루어진 음소 단위로 분해한 뒤 입력 데이터로 사용하는 음소 레벨의 LSTM 언어모델을 제안한다. 본 논문에서는 LSTM layer를 3개 또는 4개 포함하는 모형을 사용한다. 모형의 최적화를 위해 Stochastic Gradient 알고리즘과 이를 개선시킨 다양한 알고리즘을 사용하고 그 성능을 비교한다. 구약성경 텍스트를 사용하여 실험을 진행하였고 모든 실험은 Theano를 기반으로 하는 Keras 패키지를 사용하여 수행되었다. 모형의 정량적 비교를 위해 validation loss와 test set에 대한 perplexity를 계산하였다. 그 결과 Stochastic Gradient 알고리즘이 상대적으로 큰 validation loss와 perplexity를 나타냈고 나머지 최적화 알고리즘들은 유사한 값들을 보이며 비슷한 수준의 모형 복잡도를 나타냈다. Layer 4개인 모형이 3개인 모형에 비해 학습시간이 평균적으로 69% 정도 길게 소요되었으나 정량지표는 크게 개선되지 않거나 특정 조건에서는 오히려 악화되는 것으로 나타났다. 하지만 layer 4개를 사용한 모형이 3개를 사용한 모형에 비해 완성도가 높은 문장을 생성했다. 본 논문에서 고려한 어떤 시뮬레이션 조건에서도 한글에서 사용되지 않는 문자조합이 생성되지 않았고 명사와 조사의 조합이나 동사의 활용, 주어 동사의 결합 면에서 상당히 완성도 높은 문장이 발생되었다. 본 연구결과는 현재 대두되고 있는 인공지능 시스템의 기초가 되는 언어처리나 음성인식 분야에서 한국어 처리를 위해 다양하게 활용될 수 있을 것으로 기대된다.

모사된 컴프턴 카메라 투사데이터의 재구성을 위한 OSEM 알고리즘의 부분집합 구성법 비교 연구 (A Comparative Study of Subset Construction Methods in OSEM Algorithms using Simulated Projection Data of Compton Camera)

  • 김수미;이재성;이미노;이주한;김중현;김찬형;이춘식;이동수;이수진
    • Nuclear Medicine and Molecular Imaging
    • /
    • 제41권3호
    • /
    • pp.234-240
    • /
    • 2007
  • 목적: 본 연구에서는 컴프턴 카메라의 투사데이터를 재구성하기 위하여 부분집합 개수에 비례하여 고속화된 수렴속도를 보이는 통계학적 영상재구성 방법인 OSEM 알고리즘을 적용하였다. 또한 연산시간 및 퍼센트 오차 측면에서 컴프턴 투사데이터의 부분집합 구성 시 여러 구분방법에 대한 비교연구를 수행함으로써 컴프턴 투사데이터의 최적화된 OSEM 알고리즘을 제안하고자 하였다. 대상 및 방법: 산란부와 흡수부로 구성된 컴프턴 카메라의 투사데이터를 재구성하기 위하여 단순역투사, 기댓값 최대화 방법과 OSEM 알고리즘을 구현하였다. 그리고 OSEM의 경우 컴프턴 투사데이터는 산란부 및 흡수부의 검출위치 및 산란각에 따라 부분 집합으로 구분하였다. EM 알고리즘은 64번의 반복연산을 수행하였으며 OSEM은 16개의 부분집합에 대해 4번의 반복연산을 수행하였다. 각 재구성 방법과 부분집합 구분방법에 대한 정량적 성능평가를 위하여 계산 시간과 퍼센트 오차를 측정하였다. 결과: SBP 방법에 비해 모든 통계학적 영상재구성 방법의 결과들이 보다 정확하였다. 64번 반복연산을 수행한 EM 알고리즘에 비해 4번의 반복연산과 16개의 부분집합을 가지는 모든 OSEM 알고리즘은 유사한 퍼센트 오차를 나타내면서 14배 빠른 수렴속도를 보였다. OSEM의 경우, 부분집합의 구분방법에 따라 연산속도와 재구성된 영상의 정확도 면에서는 거의 차이가 없었다. 결론: 본 연구의 실험 결과를 통하여 핵의학 영상 분야에서 사용하는 OSEM 알고리즘이 컴프턴 카메라에 대한 재구성 알고리즘으로 유용함을 확인하였으며 OS-EM 방법은 EM에 비해 유사한 결과영상을 재구성하면서 14배 빠른 수렴속도를 보이며 컴프턴 투사데이터를 부분집합으로 구분 시 검출위치와 산란각을 모두 이용하는 것이 가장 효율적인 것으로 간주된다.NIS와 EGFP의 이중 리포터 유전자를 가지고 있는 HepG2 세포주가 성공적으로 만들어졌다. 세포의 약 50% 정도가 형광 현미경 아래에서 관찰되었다. NIS 유전자의 발현은 역전사효소 중합효소 연쇄반응 실험을 통해서 확인하였고, NIS가 발현된 세포의 방사능옥소 섭취량은 대조군에 비하여 약 9배 정도 높게 나타났다. 방사능옥소 유출량 실험에서는 약 9분에 반 정도의 옥소가 유출되는 것이 확인되었다. 구축된 세포주를 이식한 후 획득한 형광 영상, 감마카메라과 소동물용 PET 영상에서는 반대쪽의 대조군 세포를 이식한 것에 비하여 뚜렷한 형광신호가 보였고, 더 높은 방사능옥소 섭취가 확인되었다. 결론: NIS와 EGFP의 이중 리포터 유전자를 가지는 간암 세포주가 성공적으로 구축되었고, 소동물에서 두 유전자를 각각 치료용 리포터 유전자와 영상 리포터 유전자로의 사용이 가능할 것이라고 생각된다.타내는 중요한 효소로 인정되고 있으며, 조직의 손상, 발암, 염증, 성인병 및 노화 등과 같은 여러 가지 유해 작용을 일으킨다. 정상군에 비해 대조군은 1.74배 수치가 증가되었으며, RCM투여군의 대조군과 비교 시 57.4% 감소되는 효과를 볼 수 있었다. 본 연구는 LPS로부터 유도된 산화적 스트레스에 대한 복분자의 선투여 후 예방효과를 알아보았다. 생약재의 일종인 복분자의 경우 LPS로 유도된 산화적 스트레스 억제 및 지질대사로부터의 개선 효과가 있는 것으로 판단되며 지질과산화에 대해서 강한 억제 활성을 나타내는 것을 알 수 있었다. 이러한 결과로 복분자는 생활 습관병의 예방과 개선에 유효한 것으로 사료되었으며, 지질대사와 과산화지표의 검증을 통해 기능성 식품소재로 활용될 수 있음을 보여주었다.로서 역시 CTV 치료계획에서 적게 조사되었다(p=0.005). 기존의 ICRU 치료계획은

2조형(條型) Combine의 이용(利用)에 관(關)한 연구(硏究) (A Study on the Utilzation of Two Furrow Combine)

  • 이상우;김성래
    • 농업과학연구
    • /
    • 제3권1호
    • /
    • pp.95-104
    • /
    • 1976
  • 도입(導入)된 2조용(條用) Combine으로 통일(統一) 및 밀양(密陽) 15호(號) 수도품종(水稻品種)에 대(對)한 포장수확작업(圃場收穫作業)을 실시(實施)하여 Combine의 작업정도(作業精度) 작업성능(作業性能) 기계적(機械的)인 적응성(適應性)을 파악(把握)하고 한국(韓國)에서의 보급전망(普及展望)을 분석검토(分析檢討)한바 그 결과(結果)를 요약(要約)하면 다음과 같다. 1. 장간종(長稈種)인 밀양(密陽)15호(號)에 대(對)한 Combine 수확작업(收穫作業)은 수확적기(收穫適期)로 부터 13일(日) 경과후(經過後)까지 5회(回)에 걸쳐 시기별(時期別)로 수확작업(收穫作業)을 실시(實施)한바 완숙도(完熟度)에 관계(關係)없이 수확작업(收穫作業) 양호(良好)하였으며 포장손실율(圃場損失率) 1% 미탈곡율(未脫穀率) 1%로 양호(良好)한 편(便)이었다. 2. 단간종(短稈種)인 통일(統一)에 대(對)한 Combine 수확작업(收穫作業)은 완숙기(完熟期)로 부터 수확시기(收穫時期)가 경과(經過)될 수록 포장손실(圃場損失)이 Fig 1과 같은 경향으로 5.13%에서 10.34%로 증가(增加) 하였으며 통일(統一)벼 수확(收穫)을 위(爲)하여는 기계적(機械的)인 개선(改善)이 많이 요망(要望)되었다. 3. 공시(供試)된 Combine은 장간종용(長稈種用)의 기종(機種)이어서 벼 이삭의 높이가 균일(均一)치 못한 단간종(短稈種) 통일(統一)벼는 탈곡부(脫穀部)의 공급(供給) Chain과 급실(扱室)과의 거리가 커서 급동(扱胴)의 급치(扱齒)에 못미치는 부분(部分)이 있어 미탈곡립율(未脫穀粒率)이 평균(平均) 1.6%이었다. 4. Combine 탈곡부(脫穀部) 급동(扱胴)의 회전수(回轉數)(240~350R.P.M)와 동할미(胴割米)의 관계(關係)는 통일(統一) 및 밀양(密陽)15호(號) 양품종(兩品種) 모두 동할율(胴割率)이 1% 미만(未滿)으로 유의차(有意差)가 없었다. 5. 통일(統一)벼는 벼 이삭이 잎속에 들어 있어 탈곡시(脫穀時) 검불의 양(量)이 많으며 특(特)히 생탈곡시(生脫穀時)는 검불량이 더 많이 생기므로 양곡부(揚穀部) 및 배진구(排塵口)에서 폐쇄현상(閉鎖現像)이 자주 일어남으로 선별(選別) 및 배진장치(排塵裝置)의 개선(改善)이 요망(要望)된다. 6. Combine의 접지압(接地壓)은 $0.19kg/cm^2$로 Fig3과 같은 약(弱)한 지내력(地耐力)의 토양(土壤)에서 Combine의 Track이 25cm 침하(沈下)하여도 Combine의 주행(走行)은 가능(可能)하였다. 그러나 지내력(地耐力)은 지점(地点)에 따라 균일(均一)치 않아 침하(沈下)의 깊이가 균일(均一)치 못함으로 침하(沈下) 5cm정도(程度)에서는 예취(刈取) 높이의 조정(調整)없이 수확작업(收穫作業)이 가능(可能)할 것으로 인정(認定)된다. 7. 관행수확작업(慣行收穫作業)과 Combine 수확작업(收穫作業)의 경제성(經濟性)을 검토(檢討)한바 수도맥작(水稻麥作)의 연간(年間) 사용일수(使用日數)를 40일(日)로 하고 작업일수율(作業日數率) 60% 포장작업효율(圃場作業效率) 56%로 할 때 작업속도(作業速度)를 0.273m/sec로 하여 분석(分析)한바 1일작업시간(日作業時間)을 8시간(時間)으로 할 때 연간부담면적(年間負擔面積)이 4.7ha로 ha당(當) 수확작업비용(收穫作業費用)이 관행수확작업비용(慣行收穫作業費用)과 일치(一致)함으로 통일(統一)벼 수확작업(收穫作業)에 이용(利用)될 수 있도록 Combine의 기계적(機械的)인 보완개량(補完改良)이 뒤따르면 Combine의 흡착(吸着)은 경제적(經濟的)으로 타당(妥當)하다고 인정(認定)된다. 8. 장간종(長稈種)의 현(現) Combine을 통일품종수확(統一品種收穫) 작업(作業)에 이용(利用)키 위(爲)하여는 전면측방(前面側方)의 divider가 벼이식에 닿지 않도록 조절할 수 있게 하고 급동(扱胴)과 feed chain의 간격(間隔)을 좁히고 배진장치(排塵裝置)를 개량(改良)하고 수도간장(水稻稈長)에 따라 기계전후조정범위(機械前後調整範圍)를 넓히고 배수불량(排水不良)한 답(畓)에서의 이용(利用)을 위(爲)하여 Track의 폭(幅)을 넓히는 등(等)의 개량(改良)이 요망(要望)된다.

  • PDF

우주개발사업의 지속발전을 위한 국내입법의 개선방향에 관한 연구 (A Study on Improvement on National Legislation for Sustainable Progress of Space Development Project)

  • 이강빈
    • 항공우주정책ㆍ법학회지
    • /
    • 제25권1호
    • /
    • pp.97-158
    • /
    • 2010
  • 우리나라는 1992년 최초의 인공위성 우리별 1호를 발사한 이후, 현재까지 11기의 인공위성을 발사하였다. 2007년 국가우주위원회에서 우주개발중장기 기본계획을 수정 보완한 우주개발진흥계획을 수립하였다. 동 계획에 의하면, 2010년 까지 총 13기의 인공위성 개발, 2020년경까지 한국형 우주발사체 개발, 2021년 달 탐사선 발사 등이 예정되어 있다. 한편 2009년 6월 전남 고흥군 외나로도에 우주센터가 준공되어 동년 8월 우리나라 최초의 소형 우주발사체 나로호 KSLV-1가 1차 발사되었으며, 2010년 6월 나로호가 2차 발사되었다. 유엔에서 채택되어 발효 중인 우주개발 관련 국제조약으로는 1967년 우주조약, 1968년 우주구조반환협정, 1971년 우주손해책임조약, 1972년 우주물체등록조약, 1979년 달 조약 등 5가지 조약이 있으며, 우리나라는 달 조약을 제외한 4가지 조약을 가입 비준하였다. 세계 주요국의 우주개발 관련 국내입법례로는, 미국의 1958년 국가항공우주법 및 1998년 상업우주법, 영국의 1986년 우주법, 프랑스의 1961년 국립우주센터 설립법, 캐나다의 1990년 우주청법, 일본의 2008년 우주기본법, 러시아의 1993년 우주활동법 등이 제정되어 있다. 우리나라의 우주개발 관련 국내입법으로는, 1987년 항공우주산업개발 촉진법, 2005년 우주개발진흥법, 2008년 우주손해배상법 등이 제정 시행되고 있으며, 이러한 국내입법의 개선방향은 다음과 같다. 지식경제부는 2009년 12월 23일 항공우주산업개발촉진법 전부 개정안을 입법 예고하였는 바, 개정안의 주요내용으로는 (1) 법의 제명 "항공우주산업육성법"으로 변경, (2) 항공비행시험장 등 정의규정 신설, (3) 항공우주산업 기본계획 수립, 항공우주산업위원회 설치, (4) 항공우주산업의 육성을 위한 사업, (5) 탐색개발, 국제공동개발, (6) 협동개발, (7) 공제사업, (8) 우주산업의 기반 조성을 위한 사업, (9) 항공우주산업의 집적 활성화, (10) 항공비행시험장의 지정 등, (11) 특정사업자의 지정 및 지원제도 폐지, (12) 성능검사 및 품질검사 폐지 등에 관하여 규정하고 있다. 우주개발진흥법의 개정방향으로는 (1) 우주개발진흥법과 항공우주산업개발촉진법과의 법체계상의 중복문제, (2) 국가우주위원회와 국가과학기술위원회 간에 우주개발에 관한 국가연구개발 예산의 배분, 조정문제, (3) 우주개발에 있어서 환경의 배려 및 보전, (4) 우주개발에 관한 시책 및 규제를 위한 법제상 조치 강구 및 법제의 정비 등의 사항에 관하여 수정 보완이 되어야 할 것이다. 우주손해배상법의 개정방향으로는 (1) 우주손해의 정의와 간접손해, (2) 손해배상책임 한도액의 통화단위, (3) 우주물체 공동발사자의 연대책임 및 구상권, (4) 우주손해배상심의위원회의 설치 등의 사항에 관하여 수정보완이 되어야 할 것이다. 우리나라가 2013년에 우주여행의 실현을 위하여 미국의 민간 유인 우주선 제작사인 XCOR 에어로스페이스사로 부터 우주선을 도입하여 운항할 계획이다. 앞으로 우주여행 관련기업들을 비롯한 상업우주운송 기업체들의 국내진출이 예상되므로 상업우주운송에 대한 안전인증 및 관리감독 체계의 마련이 시급하며, 국내 상업우주운송산업의 육성에 관한 정책개발과 현행 항공법 및 우주개발 관련 법령의 적절한 보완 정비가 필요하다.

  • PDF

감정예측모형의 성과개선을 위한 Support Vector Regression 응용 (Application of Support Vector Regression for Improving the Performance of the Emotion Prediction Model)

  • 김성진;유은정;정민규;김재경;안현철
    • 지능정보연구
    • /
    • 제18권3호
    • /
    • pp.185-202
    • /
    • 2012
  • 오늘날 정보사회에서는 정보에 대한 가치를 인식하고, 이를 위한 정보의 활용과 수집이 중요해지고 있다. 얼굴 표정은 그림 하나가 수천개의 단어를 표현할 수 있듯이 수천 개의 정보를 지니고 있다. 이에 주목하여 최근 얼굴 표정을 통해 사람의 감정을 판단하여 지능형 서비스를 제공하기 위한 시도가 MIT Media Lab을 필두로 활발하게 이루어지고 있다. 전통적으로 기존 연구에서는 인공신경망, 중회귀분석 등의 기법을 통해 사람의 감정을 판단하는 연구가 이루어져 왔다. 하지만 중회귀모형은 예측 정확도가 떨어지고, 인공신경망은 성능은 뛰어나지만 기법 자체가 지닌 과적합화 문제로 인해 한계를 지닌다. 본 연구는 사람들의 자극에 대한 반응으로서 나타나는 얼굴 표정을 통해 감정을 추론해내는 지능형 모형을 개발하는 것을 목표로 한다. 기존 얼굴 표정을 통한 지능형 감정판단모형을 개선하기 위하여, Support Vector Regression(이하 SVR) 기법을 적용하는 새로운 모형을 제시한다. SVR은 기존 Support Vector Machine이 가진 뛰어난 예측 능력을 바탕으로, 회귀문제 영역을 해결하기 위해 확장된 것이다. 본 연구의 제안 모형의 목적은 사람의 얼굴 표정으로부터 쾌/불쾌 수준 그리고 몰입도를 판단할 수 있도록 설계되는 것이다. 모형 구축을 위해 사람들에게 적절한 자극영상을 제공했을 때 나타나는 얼굴 반응들을 수집했고, 이를 기반으로 얼굴 특징점을 도출 및 보정하였다. 이후 전처리 과정을 통해 통계적 유의변수를 추출 후 학습용과 검증용 데이터로 구분하여 SVR 모형을 통해 학습시키고, 평가되도록 하였다. 다수의 일반인들을 대상으로 수집된 실제 데이터셋을 기반으로 제안모형을 적용해 본 결과, 매우 우수한 예측 정확도를 보임을 확인할 수 있었다. 아울러, 중회귀분석이나 인공신경망 기법과 비교했을 때에도 본 연구에서 제안한 SVR 모형이 쾌/불쾌 수준 및 몰입도 모두에서 더 우수한 예측성과를 보임을 확인할 수 있었다. 이는 얼굴 표정에 기반한 감정판단모형으로서 SVR이 상당히 효과적인 수단이 될 수 있다는 점을 알 수 있었다.

사용자 로그 분석에 기반한 노인 돌봄 솔루션 구축 전략: 효돌 제품의 사례를 중심으로 (Implementation Strategy for the Elderly Care Solution Based on Usage Log Analysis: Focusing on the Case of Hyodol Product)

  • 이준식;유인진;박도형
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.117-140
    • /
    • 2019
  • 고령화 현상이 가속화되고, 취약계층 노인과 관련된 다양한 사회문제가 제기됨에 따라 노인세대의 건강과 안전을 보호하기 위한 효과적인 노인 돌봄 솔루션의 필요성이 커지고 있다. 최근에는 노인 돌봄의 수단으로 첨단화된 ICT 기술을 탑재한 스마트 토이를 활용하고자 하는 사례가 늘고 있다. 특히 스마트 토이를 통해 기록되는 노인 행태에 대한 로그 데이터는 노인 돌봄 관련 정책 수립, 노인 돌봄 서비스 컨셉 기획 및 개발과 같은 분야에 정량적이고 객관적인 설명지표로써 활용 가치가 높을 것으로 전망된다. 그러나 현재까지 노인 돌봄 스마트 토이와 관련된 연구 중 스마트 토이를 통해 기록된 사용자 행동 로그에 주목하여 이를 의사결정에 활용하고자 하는 연구는 부족한 실정이다. 본 연구는 기존에 충분히 논의되지 않았던 스마트 토이 사용자 행동 로그 데이터에 대한 분석을 중심으로, 노인 돌봄 솔루션의 사용자 경험 증진을 위한 효과적인 인사이트를 도출하는 것을 목적으로 한다. 구체적으로 사용자 프로파일링 기반 행태 분석과 사용 행태에 따른 삶의 질 변화 메커니즘 도출을 단계적으로 수행하였다. 분석 결과, 5개의 노인 생활관리 요인으로부터 노인집단 유형을 분류할 수 있는 2개의 중요한 차원을 도출하였으며, 도출한 차원에 근거하여 전체 노인 사용자를 3개의 유형으로 분류하고 유형별 스마트 토이 사용 행태 차이를 프로파일링 분석을 통해 확인할 수 있었다. 이후 스마트 토이 사용 행태에 따른 삶의 질 변화 메커니즘을 도출하기 위한 단계적 회귀분석을 수행하였으며, 스마트 토이와의 상호작용, 스마트 토이의 콘텐츠 사용, 스마트 토이가 관찰한 노인의 가정 내 활동 정도가 노인의 우울감 개선과 생활패턴 개선에 미치는 영향 및 이를 중재하는 경로로써 스마트 토이에 대한 사용자의 성능평가와 만족감의 역할을 밝혀내었다.

평점과 리뷰 텍스트 감성분석을 결합한 추천시스템 향상 방안 연구 (How to improve the accuracy of recommendation systems: Combining ratings and review texts sentiment scores)

  • 현지연;유상이;이상용
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.219-239
    • /
    • 2019
  • 개인에게 맞춤형 서비스를 제공하는 것이 중요해지면서 개인화 추천 시스템 관련 연구들이 끊임없이 이루어지고 있다. 추천 시스템 중 협업 필터링은 학계 및 산업계에서 가장 많이 사용되고 있다. 다만 사용자들의 평점 혹은 사용 여부와 같은 정량적인 정보에 국한하여 추천이 이루어져 정확도가 떨어진다는 문제가 제기되고 있다. 이와 같은 문제를 해결하기 위해 현재까지 많은 연구에서 정량적 정보 외에 다른 정보들을 활용하여 추천 시스템의 성능을 개선하려는 시도가 활발하게 이루어지고 있다. 리뷰를 이용한 감성 분석이 대표적이지만, 기존의 연구에서는 감성 분석의 결과를 추천 시스템에 직접적으로 반영하지 못한다는 한계가 있다. 이에 본 연구는 리뷰에 나타난 감성을 수치화하여 평점에 반영하는 것을 목표로 한다. 즉, 사용자가 직접 작성한 리뷰를 감성 수치화하여 정량적인 정보로 변환해 추천 시스템에 직접 반영할 수 있는 새로운 알고리즘을 제안한다. 이를 위해서는 정성적인 정보인 사용자들의 리뷰를 정량화 시켜야 하므로, 본 연구에서는 텍스트 마이닝의 감성 분석 기법을 통해 감성 수치를 산출하였다. 데이터는 영화 리뷰를 대상으로 하여 도메인 맞춤형 감성 사전을 구축하고, 이를 기반으로 리뷰의 감성점수를 산출한다. 본 논문에서 사용자 리뷰의 감성 수치를 반영한 협업 필터링이 평점만을 고려하는 전통적인 방식의 협업 필터링과 비교하여 우수한 정확도를 나타내는 것을 확인하였다. 이후 제안된 모델이 더 개선된 방식이라고 할 근거를 확보하기 위해 paired t-test 검증을 시도했고, 제안된 모델이 더 우수하다는 결론을 도출하였다. 본 연구에서는 평점만으로 사용자의 감성을 판단한 기존의 선행연구들이 가지는 한계를 극복하고자 리뷰를 수치화하여 기존의 평점 시스템보다 사용자의 의견을 더 정교하게 추천 시스템에 반영시켜 정확도를 향상시켰다. 이를 기반으로 추가적으로 다양한 분석을 시행한다면 추천의 정확도가 더 높아질 것으로 기대된다.

다년도 분광 데이터를 이용한 콩의 생체중, 엽면적 지수 추정 (Estimation of Fresh Weight and Leaf Area Index of Soybean (Glycine max) Using Multi-year Spectral Data)

  • 장시형;유찬석;강예성;박준우;김태양;강경석;박민준;백현찬;박유현;강동우;쩌우쿤옌;김민철;권연주;한승아;전태환
    • 한국농림기상학회지
    • /
    • 제23권4호
    • /
    • pp.329-339
    • /
    • 2021
  • 콩은 논 대표적인 밭작물로써 온도, 수분, 토양과 같은 환경 조건에 민감하기 때문에 재배 시 포장 관리가 매우 중요하다. 작물 상태를 비파괴적, 비접촉적 방법으로 측정할 수 있는 분광 기술을 활용한다면 작황 예측, 작물 스트레스 및 병충해 판별 등 생육 진단 및 처방을 통해 품질과 수확량을 높일 수 있다. 본 연구에서는 회전익 무인기에 탑재된 다중분광 센서를 이용하여 시험 포장에서 콩 생육 추정 모델 개발하고 재현성을 확인하기 위해 농가 포장에 검증을 수행하였다. 분광 데이터로 산출된 정규화 식생지수(NDVI, GNDVI), 단순비 식생지수(RRVI, GRVI)와 콩 생육 데이터(생체중, LAI)를 선형회귀분석을 실시하여 모델을 개발하였으며 괴산에 위치한 농가포장에서 검증을 실시하였다. 그 결과 생체중의 경우 정규화 식생지수를 이용 시 포화되기 때문에 단순비 식생지수 GRVI를 이용한 모델의 성능이 가장 높았다(R2=0.74, RMSE=246 g/m2, RE=34.2%). 괴산 농가 포장에 생체중 모델 검증 결과 RMSE=392 g/m2, RE=32%로 나타났으며 작부 체계별 나누어 검증 결과 단작 포장과 이모작 포장 생체중 모델은 RMSE=315 g/m2, RE=26% 및 RMSE=381 g/m2, RE=31%로 나타났다. 작부 체계별 포장과 적산온도가 유사한 연도별 시험 포장(2018+2020년, 2019년)을 나누어 생체중 모델 개발한 결과 단년도(2019년)의 성능이 높게 나타났다. 작부 체계별 적산온도가 유사한 검증과 기존 검증 간 비교 결과 단작 포장은 RMSE 및 RE를 기준으로 각각 29.1%와 34.3%로 개선되었으나 이모작 포장은 -19.6%, -31.3%로 저하되었다. 적산온도 이외의 환경 요인, 분광 및 생육 데이터 추가 시 다양한 환경 조건에서 재배되는 콩 생육을 추정 가능할 것으로 판단된다.