• 제목/요약/키워드: Visual Intelligence

검색결과 244건 처리시간 0.03초

현대 디자인 트랜드 분석 통한 AI CARE 디자인 그래픽 기획에 관한 타당성 분석에 관한 연구 -AI CARE BED 파트별 분석과 디자인 제안을 중심으로- (A Study on the Feasibility Analysis of AI CARE Design Graphic Planning through Modern Design Trend Analysis -Focusing on AI CARE BED part-by-part analysis and design proposal-)

  • 조현경
    • 문화기술의 융합
    • /
    • 제7권3호
    • /
    • pp.599-604
    • /
    • 2021
  • AI 인공지능으로 각 분야가 융합된 시대에 디자인에서는 AI-CARE 기능의 디자인과 UI UX 디자인이 각광 받는 시기에 들어와 있다. 새로운 기능에 맞는 시각 효과는 형태 디자인의 적용과 색의 트랜드가 중요하다. 본 논문에서는 이를 활용하여 형태 트랜드의 정리와 적용에 관한 사례를 제시하고, 디자인 방향을 제시하고자 한다. 도입부에서는 최신 디자인 환경 요인을 분석하여 새로운 제안의 방향으로 연구하였다. 본문에서는 기능 디자인 형태를 분리하여 기획에서의 디자인 방향과 고려사항 대한 부분을 연구하였으며, 디자인 작업의 방향성을 제시하였다. 형태와 색채 부분의 단계에서 미니멀리즘과 유니버셜 디자인, 어포던스 디자인의 흐름에 맞는 계획서를 제안하였다. 사례 실습을 바탕으로 한 본론의 연구 방법은 부분별 디자인 작업에 특화된 형태와 색채에 관한 콘텐츠를 어떻게 고려할 것인가에 대한 고찰이며, 콘텐츠 이미지에서 새로운 영역의 UI UX 분야 그래픽 제작이 실현 가능하도록 제안하였다. 본 연구를 통해 AI CARE 베드 PART별로, 디자인 방향성과 타당성을 제안함으로써 형태와 색의 도출 방법의 디자인 방향성과 기획에 도달했다.

AI 영화영상콘텐츠를 위한 AI 예술창작 사례연구 (AI Art Creation Case Study for AI Film & Video Content)

  • 전병원
    • 문화기술의 융합
    • /
    • 제7권2호
    • /
    • pp.85-95
    • /
    • 2021
  • 현재 우리는 창작도구로서 컴퓨터와 창작자로서 컴퓨터 사이에 서 있다. 또한 포스트 시네마적 상황이라 할 수 있는 새로운 장르의 영화들이 등장하고 있다. 본 논문은 AI 시네마의 출현 가능성을 진단하고자 한다. AI 시네마의 가능성을 확인하고자 영화 창작의 필요조건이라 할 수 있는 스토리, 서사의 창작, 이미지의 창작, 사운드의 창작이 인공지능에 의해 가능한지 사례조사를 통해 살펴보았다. 먼저 AI 페인팅 알고리즘인 Obvious, GAN 및 CAN의 시각이미지 생성을 확인했다. 둘째, AI 사운드, 음악은 이미 인간과 협력하여 유통 단계에 들어섰다. 셋째, AI는 이미 드라마 대본을 완성 할 수 있고, 빅 데이터를 활용한 자동 시나리오 제작 프로그램도 인기를 얻고 있다. 즉, 우리는 필수적인 영화 제작 요구 사항이 AI 알고리즘으로 충족될 수 있음을 확인할 수 있다. 마노 비치의 'AI 장르 컨벤션' 관점에서 웹 다큐멘터리와 데스크톱 다큐멘터리는 포스트 시네마로서 AI 시네마의 대표적인 장르라고 할 수 있다. AI, 웹 다큐멘터리, 데스크톱 다큐멘터리가 존재하고 있는 환경이 동일하기 때문이다. 본 논문은 포스트시네마의 창작자로서 AI에 대한 연구를 통해 4차 산업혁명시대 영화라는 매체가 개척해야 할 새로운 길을 제시하고 있다.

스마트 플랫폼을 이용한 전통시장 활성화 방안 연구 (A study on the Revitalization of Traditional Market with Smart Platform)

  • 박정호;최은영
    • 서비스연구
    • /
    • 제13권1호
    • /
    • pp.127-143
    • /
    • 2023
  • 현재 국내 전통시장은 중앙정부와 지방자치단체 등 많은 관련 주체들의 다양한 사업 추진에도 불구하고 2000년대 초반부터 시작된 침체의 늪을 벗어나지 못하고 있다. 이러한 전통시장의 봉착된 위기를 극복하기 위하여 최근에는 빅데이터 분석, 인공지능, 사물인터넷 등과 같은 정보통신기술이 융합된 스마트 전통시장 구축 방안에 대한 R&D가 다양하게 진행되고 있다. 본 연구에서는 전통시장 활성화 관련하여 2012년 이후부터 최근까지 진행되었던 여러 선행연구 및 전통시장 이용자, 해외 전통시장의 ICT 기술 적용사례 등을 분석하고, 분석된 내용을 토대로 ICT 기술을 활용하여 스마트 전통시장을 구축하기 위한 모델을 제안한다. 본 연구에서 제안하는 모델에는 방문객과 상호작용할 수 있는 전통시장 메타버스의 구축, NFC 기술을 접목시킨 디지털 사이니지를 통한 전통시장 방문 인증, IoT와 AI 기술을 적용한 화재감지 기능의 정확성 고도화, 시장 상품 출시 정보 및 이벤트 알림을 위한 스마트폰 앱 개발, 그리고 이상 네 가지 방안과 연동하는 전자상거래 시스템을 포함하는 방안이 포함된다. 제안 모델은 온라인 쇼핑 및 모바일 기기 사용에 익숙한 MZ 세대를 전통시장의 주요 고객으로 확대시키기 위한 방안이라 말할 수 있다. 따라서 제시된 모델을 기반으로 스마트 전통시장 플랫폼이 구현되어 운영된다면, MZ 세대 및 외국인 관광객들에게 전통시장에 대한 흥미와 관심을 이끌어 낼 수 있어 스마트 전통시장을 하나의 문화 콘텐츠로 자리매김하게 만들 것이며, 보다 안전한 시장 환경 조성과 함께 적시에 효과적인 마케팅을 전개할 수 있어 향후 전통시장 활성화에 기여할 수 있을 것이다.

딥러닝 기반 비디오 캡셔닝의 연구동향 분석 (Analysis of Research Trends in Deep Learning-Based Video Captioning)

  • 려치;이은주;김영수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제13권1호
    • /
    • pp.35-49
    • /
    • 2024
  • 컴퓨터 비전과 자연어 처리의 융합의 중요한 결과로서 비디오 캡셔닝은 인공지능 분야의 핵심 연구 방향이다. 이 기술은 비디오 콘텐츠의 자동이해와 언어 표현을 가능하게 함으로써, 컴퓨터가 비디오의 시각적 정보를 텍스트 형태로 변환한다. 본 논문에서는 딥러닝 기반 비디오 캡셔닝의 연구 동향을 초기 분석하여 CNN-RNN 기반 모델, RNN-RNN 기반 모델, Multimodal 기반 모델, 그리고 Transformer 기반 모델이라는 네 가지 주요 범주로 나누어 각각의 비디오 캡셔닝 모델의 개념과 특징 그리고 장단점을 논하였다. 그리고 이 논문은 비디오 캡셔닝 분야에서 일반적으로 자주 사용되는 데이터 집합과 성능 평가방안을 나열하였다. 데이터 세트는 다양한 도메인과 시나리오를 포괄하여 비디오 캡션 모델의 훈련 및 검증을 위한 광범위한 리소스를 제공한다. 모델 성능 평가방안에서는 주요한 평가 지표를 언급하며, 모델의 성능을 다양한 각도에서 평가할 수 있도록 연구자들에게 실질적인 참조를 제공한다. 마지막으로 비디오 캡셔닝에 대한 향후 연구과제로서 실제 응용 프로그램에서의 복잡성을 증가시키는 시간 일관성 유지 및 동적 장면의 정확한 서술과 같이 지속해서 개선해야 할 주요 도전과제와 시간 관계 모델링 및 다중 모달 데이터 통합과 같이 새롭게 연구되어야 하는 과제를 제시하였다.

학령기 정상아동에서 '전산화 신경인지기능검사'의 타당도 및 신뢰도 분석 (The Validity and Reliability of 'Computerized Neurocognitive Function Test' in the Elementary School Child)

  • 이종범;김진성;서완석;신현진;배대석;이혜린
    • 정신신체의학
    • /
    • 제11권2호
    • /
    • pp.97-117
    • /
    • 2003
  • 연구목적: 학령기 정상아동에 있어서 전산화 신경인지기능검사의 타당도 및 신뢰도를 알아보고자 하였다. 방 법: 2002년 6월부터 2003년 1월까지 평균 범위 이상의 지능을 유지하고 있고, 배제기준(ru1e out criteria)을 통과한 학년별 남녀 각각 10명씩, 120명의 정상아동에게 K-ABC, K-PIC 및 전산화 신경인지기능검사를 실시하였다. 그리고 이들 중 무작위로 선발된 30명에게 검사-재검사 신뢰도(reliability)를 알아보기 위해 4주뒤 전산화 신경인지기능검사를 재실시하였다. 결 과: 타당도 검증을 위한 상관분석 결과, 4가지 연속수행검사는 성인을 대상으로 한 연구와 동일하였으며, 기억력 검사에서도 단기기억의 순방향과 역방향 검사의 차이를 보이면서 선행연구와 동일하였다. 고위인지기능검사들에서는 각기 다른 측정 목적을 가지고 있는 검사들로 구성되어 있음을 시사하였다. 12개 검사 43개의 변수에 대해 요인분석을 실시한 결과, 10개의 요인이 도출되었으며, 전체 설병변량은 75.5%였다. 도출된 요인은 '주의력 유지, 정보처리속도, 경계력, 언어학습, 주의의 배분 및 개념형성, 사고의 유연성, 개념형성, 시각기억능력, 단기기억, 선택적 주의력' 순이었다. 해석적 준거(criteria)를 마련하기 위한 K-ABC와의 상관분석에서, K-ABC의 하위척도와 선택적인 관련성이 있음을 확인하였다. 신뢰도 검증에서, 연습효과를 반영하는 결과들이 발견되었으며, 특히 고위인지기능검사에서 현저하였다. 하지만, 각 검사 군의 반분신뢰도와 내적 일치도는 유의하게 높았다. 결 론: 아동기 정상아동의 전산화 신경인지기능 수행은 성인과는 다른 발달적 특성을 반영하고 있음을 발견할 수 있었으며, 신경심리학적 배경을 가진 표준화된 지능검사와의 관계를 알아봄으로써 해석적 준거 마련을 위한 기본적인 정보를 얻을 수 있었다.

  • PDF

국민학교아동의 학습부진에 관련된 요인 (Factors Related to Poor School Performance of Elementary School Children)

  • 박정한;김귀연;허규숙;이주영;김두희
    • Journal of Preventive Medicine and Public Health
    • /
    • 제26권4호
    • /
    • pp.628-649
    • /
    • 1993
  • 국민학생들의 학습부진에 관련된 요인을 조사하여 의학적 예방 및 치료 대책을 고안해 보기 위해, 대구 시내에서 고소득층 밀집지역과 저소득층 밀집지역의 국민학교 1개씩을 선정하고, 각 학교의 2, 4, 6학년 학생 중 학업 성적이 하위 10%에 속하는 학생(학습부진군) 175명과 이에 대한 대조군으로 성적이 상위 5%에 속하는 학생(우수군) 97명을 대상으로 하여 이들에게 시력검사, 청력검사, 신체검사(체중, 신장, 두위)를 한 후, 고대 Stanford-Binet test를 이용한 지능검사와 TAI-K로 시험불안반응검사를 하고 발달소아학 전문의사가 신경학적 검진을 하였다. 아동의 어머니에게는 가정 환경, 어머니의 출산력, 아동의 출생 전후 및 과거력에서 의학적 특이사항, 그리고 행동양상에 관해 설문조사하고, 담임 선생에게 설문지를 통해 학교에서의 행동양상을 조사하였다. 아동의 두발을 적당량 채취하여 두발중 납, 카드뮴, 아연의 함량을 원자흡광분광광도계로 분석하였다. 학습부진과 각 요인과의 단순상관 관계분석에서 통계적으로 유의한 요인들을 이용한 다중지수형 회귀분석 (multiple logistic regression analysis)을 하여 학습부진의 관련요인을 찾았다. 단순분석에서 학습부진과 유의한 관련성이 있는 것은 남아인 경우, 출산순위가 높은 경우, 결손가정인 경우, 부모의 학력이 낮거나 직업이 노동직인 경우, 아동의 체중, 신장 및 두위가 작은 경우, 시력장애가 있는 경우, 지능지수가 낮은 경우, 시험불안반응점수가 높은 경우, 과잉활동성 아동인 경우로 나타났다. 다중지수형 회귀분석결과 학습부진과 관련되는 요인은 아동의 높은 출산순위 (odds ratio=2.06), 남아인 경우(odds ratio=5.91), 결손가정(odds ratio=9.29), 신장이 표준치-1 표준편차보다 작은 경우(odds ratio=11.12), 높은 시험불안점수(odds ratio=1.07), 과잉활동성 장애아동(odds ratio=9.67), 그리고 지능지수(odds ratio=0.85)였다. 두발중 중금속 함량의 분석결과 모두 학습부진과 뚜렷한 관련성이 없었으며, 납과 카드뮴의 함량은 학습부진군과 우수군 모두 남아가 여아에 비해 높았으며, 남은 학년과 역상관 관계(p<0.05)를, 아연은 정상관 관계(p<0.05)를 나타내었다. 학습부진과 유의한 관련성이 있는 요인들 중 조정가능한 것은 출산순위, 신장, 과잉활동성 장애 등으로, 가족계획을 통해 알맞은 수의 자녀를 갖도록 하고, 영유아기에서부터 사춘기에 이르기까지 적절한 영양공급을 하며, 과잉활동성 아동을 조기에 발견하여 의사의 진단을 받아 치료를 받도록 하는 것이 학습부진을 예방 및 해결하는데 도움이 될 것이다. 또한 부모와 담임 선생이 학습부진아에게 본인의 지적능력 이상의 기대나 학습의 강요로 불안을 조장하지 않도록 해야 할 것이다.

  • PDF

장애물 인식 지능을 갖춘 자율 이동로봇의 구현 (Implementation of a Self Controlled Mobile Robot with Intelligence to Recognize Obstacles)

  • 류한성;최중경
    • 대한전자공학회논문지SP
    • /
    • 제40권5호
    • /
    • pp.312-321
    • /
    • 2003
  • 본 논문은 장애물을 인식하고 회피하면서 목적지까지 자율적으로 이동할 수 있는 로봇을 구현한 논문이다. 우리는 본 논문에서 영상처리보드의 구현이라는 하드웨어적인 부분과 자율 이동로봇을 위한 영상궤환 제어라는 소프트웨어의 두 가지 결과를 나타내었다. 첫 번째 부분에서, 영상처리를 수행하는 제어보드로부터 명령을 받는 로봇을 나타내었다. 우리는 오랫동안 CCD카메라를 탑재한 자율 이동로봇에 대하여 연구해왔다. 로봇의 구성은 DSP칩을 탑재한 영상보드와 스텝모터 그리고 CCD카메라로 구성된다. 시스템 구성은 이동로봇의 영상처리 보드에서 영상을 획득하고 영상처리 알고리즘을 수행하고 로봇의 이동경로를 계산한다. 이동로봇에 탑재된 CCD카메라에서 획득한 영상 정보는 매 샘플링 시간마다 캡쳐한다. 화면에서 장애물의 유무를 판별한 후 좌 혹은 우로 회전하여 장애물을 회피하고 이동한 거리를 Feedback하는 시스템을 구현하여 초기에 지정한 목표지점가지 로봇이 갈 수 있도록 간략한 경로를 계획하여 절대좌표를 추적해 나가는 알고리즘을 구현한다. 이러한 영상을 획득하고 알고리즘을 처리하는 영상처리 보드의 구성은 DSP (TMS320VC33), ADV611, SAA7111, ADV7176A, CPLD(EPM7256ATC144), SRAM 메모리로 구성되어 있다. 두 번째 부분에서는 장애물을 인식하고 회피하기 위하여 두 가지의 영상궤환 제어 알고리즘을 나타낸다. 첫 번째 알고리즘은 필터링, 경계검출 NOR변환, 경계치 설정 등의 영상 전처리 과정을 거친 영상을 분할하는 기법이다. 여기에서는 Labeling과 Segmentation을 통한 pixel의 밀도 계산이 도입된다. 두 번째 알고리즘은 위와 같이 전처리된 영상에 웨이브렛 변환을 이용하여 수직방향(y축 성분)으로 히스토그램 분포를 20 Pixel 간격으로 스캔한다. 파형 변화에 의하여 장애물이 있는 부분의 히스토그램 분포는 거의 변동이 없이 나타난다. 이러한 특성을 분석하여 장애물이 있는 곳을 찾아내고 이것을 회피하기 위한 알고리즘을 세웠다. 본 논문은 로봇에 장착된 한 개의 CCD 카메라를 이용하여 장애물을 회피하면서 초기에 설정해둔 목적지가지 도달하기 위한 알고리즘을 제안하였으며, 영상처리 보드를 설계 및 제작하였다. 영상처리 보드는 일반적인 보드보다 빠른 속도(30frame/sec)와 해상도를 지원하며 압축 알고리즘을 탑재하고 있어서 영상을 전송하는 데에 있어서도 탁월한 성능을 보인다.

쇼핑몰 이미지 저작권보호를 위한 영상 워터마킹 (Image Watermarking for Copyright Protection of Images on Shopping Mall)

  • 배경율
    • 지능정보연구
    • /
    • 제19권4호
    • /
    • pp.147-157
    • /
    • 2013
  • 디지털 환경의 도래와 언제 어디서나 접근할 수 있는 고속 네트워크의 도입으로 디지털 콘텐츠의 자유로운 유통과 이용이 가능해졌다. 이러한 환경은 역설적으로 다양한 저작권 침해를 불러 일으키고 있으며, 온라인 쇼핑몰에서 사용하는 상품 이미지의 도용이 빈번하게 발생하고 있다. 인터넷 쇼핑몰에 올라오는 상품 이미지와 관련해서는 저작물성에 대한 시비가 많이 일어나고 있다. 2001년 대법원 판결에 의하면 햄 광고를 위하여 촬영한 사진은 단순히 제품의 모습을 전달하는 사물의 복제에 불과할 뿐 창작적인 표현이 아니라고 적시하였다. 다만 촬영자의 손해액에 대해서는 인정함으로써 광고사진 촬영에 소요되는 통상적인 비용을 손해액으로 산정하게 하였다. 상품 사진 이외의 실내사진이라 하여도 '한정된 공간에서 촬영되어 누가 찍어도 동일한 사진'이 나올 수 밖에 없는 경우에는 창작성을 인정하지 않고 있다. 2003년 서울지방법원의 판례는 쇼핑몰에 사용된 사진에서 피사체의 선정, 구도의 설정, 빛의 방향과 양의 조절, 카메라 각도의 설정, 셔터의 속도, 셔터찬스의 포착 기타 촬영방법, 현상 및 인화 등의 과정에서 촬영자의 개성과 창조성이 인정되면 저작권법에 의하여 보호되는 저작물에 해당한다고 선고하여 손해를 인정하였다. 결국 쇼핑몰 이미지도 저작권법상의 보호를 받기 위해서는 단순한 제품의 상태를 전달하는 것이 아니라 촬영자의 개성과 창조성이 인정될 수 있는 노력이 필요하다는 것이며, 이에 따라 쇼핑몰 이미지를 제작하는 비용이 상승하고 저작권보호의 필요성은 더욱 높아지게 되었다. 온라인 쇼핑몰의 상품 이미지는 풍경사진이나 인물사진과 같은 일반 영상과 달리 매우 독특한 구성을 갖고 있으며, 따라서 일반 영상을 위한 이미지 워터마킹 기술로는 워터마킹 기술의 요구사항을 만족시킬 수 없다. 쇼핑몰에서 주로 사용되는 상품 이미지들은 배경이 흰색이거나 검은색, 또는 계조(gradient)색상으로 이루어져 있어서 워터마크를 삽입할 수 있는 공간으로 활용이 어렵고, 약간의 변화에도 민감하게 느껴지는 영역이다. 본 연구에서는 쇼핑몰에 사용되는 이미지의 특성을 분석하고 이에 적합한 이미지 워터마킹 기술을 제안하였다. 제안된 이미지 워터마킹 기술은 상품 이미지를 작은 블록으로 분할하고, 해당 블록에 대해서 DCT 양자화 처리를 함으로써 워터마크 정보를 삽입할 수 있도록 하였다. 균일한 DCT 계수 양자화 값의 처리는 시각적으로 영상에 블록화 현상을 불러오기 때문에 제안한 알고리즘에서는 블록의 경계 면에 붙어있는 영상 값에 대해서는 양자화 값의 분배를 작게 하고, 경계 면에서 멀리 떨어져있는 영상 값에 대해서는 양자화 값의 분배를 크게 함으로써 영상의 객관적 품질뿐 아니라 시각적으로 느끼는 주관적 품질도 향상 시켰다. 제안한 알고리즘에 의해서 워터마크가 삽입된 쇼핑몰 이미지의 PSNR(Peak Signal to Noise Ratio)은 40.7~48.5[dB]로 매우 우수한 품질을 보였으며, 일반 쇼핑몰 이미지에서 많이 사용되는 JPEG 압축은 QF가 70 이상인 경우에는 BER이 0이 나왔다.

전이학습 기반 다중 컨볼류션 신경망 레이어의 활성화 특징과 주성분 분석을 이용한 이미지 분류 방법 (Transfer Learning using Multiple ConvNet Layers Activation Features with Principal Component Analysis for Image Classification)

  • 바트후 ?바자브;주마벡 알리하노브;팡양;고승현;조근식
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.205-225
    • /
    • 2018
  • Convolutional Neural Network (ConvNet)은 시각적 특징의 계층 구조를 분석하고 학습할 수 있는 대표적인 심층 신경망이다. 첫 번째 신경망 모델인 Neocognitron은 80 년대에 처음 소개되었다. 당시 신경망은 대규모 데이터 집합과 계산 능력이 부족하여 학계와 산업계에서 널리 사용되지 않았다. 그러나 2012년 Krizhevsky는 ImageNet ILSVRC (Large Scale Visual Recognition Challenge) 에서 심층 신경망을 사용하여 시각적 인식 문제를 획기적으로 해결하였고 그로 인해 신경망에 대한 사람들의 관심을 다시 불러 일으켰다. 이미지넷 첼린지에서 제공하는 다양한 이미지 데이터와 병렬 컴퓨팅 하드웨어 (GPU)의 발전이 Krizhevsky의 승리의 주요 요인이었다. 그러므로 최근의 딥 컨볼루션 신경망의 성공을 병렬계산을 위한 GPU의 출현과 더불어 ImageNet과 같은 대규모 이미지 데이터의 가용성으로 정의 할 수 있다. 그러나 이러한 요소는 많은 도메인에서 병목 현상이 될 수 있다. 대부분의 도메인에서 ConvNet을 교육하기 위해 대규모 데이터를 수집하려면 많은 노력이 필요하다. 대규모 데이터를 보유하고 있어도 처음부터 ConvNet을 교육하려면 많은 자원과 시간이 소요된다. 이와 같은 문제점은 전이 학습을 사용하면 해결할 수 있다. 전이 학습은 지식을 원본 도메인에서 새 도메인으로 전이하는 방법이다. 전이학습에는 주요한 두 가지 케이스가 있다. 첫 번째는 고정된 특징점 추출기로서의 ConvNet이고, 두번째는 새 데이터에서 ConvNet을 fine-tuning 하는 것이다. 첫 번째 경우, 사전 훈련 된 ConvNet (예: ImageNet)을 사용하여 ConvNet을 통해 이미지의 피드포워드 활성화를 계산하고 특정 레이어에서 활성화 특징점을 추출한다. 두 번째 경우에는 새 데이터에서 ConvNet 분류기를 교체하고 재교육을 한 후에 사전 훈련된 네트워크의 가중치를 백프로퍼게이션으로 fine-tuning 한다. 이 논문에서는 고정된 특징점 추출기를 여러 개의 ConvNet 레이어를 사용하는 것에 중점을 두었다. 그러나 여러 ConvNet 레이어에서 직접 추출된 차원적 복잡성을 가진 특징점을 적용하는 것은 여전히 어려운 문제이다. 우리는 여러 ConvNet 레이어에서 추출한 특징점이 이미지의 다른 특성을 처리한다는 것을 발견했다. 즉, 여러 ConvNet 레이어의 최적의 조합을 찾으면 더 나은 특징점을 얻을 수 있다. 위의 발견을 토대로 이 논문에서는 단일 ConvNet 계층의 특징점 대신에 전이 학습을 위해 여러 ConvNet 계층의 특징점을 사용하도록 제안한다. 본 논문에서 제안하는 방법은 크게 세단계로 이루어져 있다. 먼저 이미지 데이터셋의 이미지를 ConvNet의 입력으로 넣으면 해당 이미지가 사전 훈련된 AlexNet으로 피드포워드 되고 3개의 fully-connected 레이어의 활성화 틀징점이 추출된다. 둘째, 3개의 ConvNet 레이어의 활성화 특징점을 연결하여 여러 개의 ConvNet 레이어의 특징점을 얻는다. 레이어의 활성화 특징점을 연결을 하는 이유는 더 많은 이미지 정보를 얻기 위해서이다. 동일한 이미지를 사용한 3개의 fully-connected 레이어의 특징점이 연결되면 결과 이미지의 특징점의 차원은 4096 + 4096 + 1000이 된다. 그러나 여러 ConvNet 레이어에서 추출 된 특징점은 동일한 ConvNet에서 추출되므로 특징점이 중복되거나 노이즈를 갖는다. 따라서 세 번째 단계로 PCA (Principal Component Analysis)를 사용하여 교육 단계 전에 주요 특징점을 선택한다. 뚜렷한 특징이 얻어지면, 분류기는 이미지를 보다 정확하게 분류 할 수 있고, 전이 학습의 성능을 향상시킬 수 있다. 제안된 방법을 평가하기 위해 특징점 선택 및 차원축소를 위해 PCA를 사용하여 여러 ConvNet 레이어의 특징점과 단일 ConvNet 레이어의 특징점을 비교하고 3개의 표준 데이터 (Caltech-256, VOC07 및 SUN397)로 실험을 수행했다. 실험결과 제안된 방법은 Caltech-256 데이터의 FC7 레이어로 73.9 %의 정확도를 얻었을 때와 비교하여 75.6 %의 정확도를 보였고 VOC07 데이터의 FC8 레이어로 얻은 69.2 %의 정확도와 비교하여 73.1 %의 정확도를 보였으며 SUN397 데이터의 FC7 레이어로 48.7%의 정확도를 얻었을 때와 비교하여 52.2%의 정확도를 보였다. 본 논문에 제안된 방법은 Caltech-256, VOC07 및 SUN397 데이터에서 각각 기존에 제안된 방법과 비교하여 2.8 %, 2.1 % 및 3.1 %의 성능 향상을 보였다.

사용자 간 신뢰관계 네트워크 분석을 활용한 협업 필터링 알고리즘의 예측 정확도 개선 (Enhancing Predictive Accuracy of Collaborative Filtering Algorithms using the Network Analysis of Trust Relationship among Users)

  • 최슬비;곽기영;안현철
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.113-127
    • /
    • 2016
  • 협업 필터링(Collaborative Filtering)은 유용성과 정교성 면에서 가장 성공적인 추천 알고리즘으로 평가받으며 산업계나 학계에서 많이 활용 및 연구되고 있지만, 기본적으로 사용자들이 평가한 점수에만 기반하여 추천결과를 생성하는 한계점이 있다. 이에 본 연구는 사용자가 상품을 구매할 때 자신이 신뢰하는 타인의 추천을 더 적극적으로 수용할 것이라는 점에 착안하여, 사용자의 평점 외에 사용자 간 신뢰관계를 소셜네트워크분석으로 분석한 결과를 추가로 반영하는 추천 알고리즘들을 제안하였다. 구체적으로 본 연구에서는 소셜네트워크분석에서 네트워크 내의 중심적 위치를 나타내는 척도인 내향 및 외향 중심성을 활용하여 사용자 간 유사도를 산출하는 알고리즘들과 사용자 신뢰 네트워크를 탐색하여 추천 대상이 되는 사용자가 직접 간접적으로 신뢰하는 사용자의 평가점수를 보다 높게 반영하는 알고리즘을 제안한 뒤 그 성능을 비교해 보았다. 실제 데이터에 적용하여 분석한 결과, 사용자 신뢰 네트워크의 내향 중심성 지수를 조건 없이 적용한 경우에는 오히려 정확도의 감소만을 야기하는 것으로 나타났고, 일정 임계치 이상의 외향 중심성을 갖는 사용자에 한해 내향 중심성 지수를 고려한 추천 알고리즘은 전통적인 협업 필터링에 비해 약간의 정확도 개선이 이루어짐을 확인할 수 있었다. 아울러, 사용자 신뢰 네트워크를 기반으로 탐색하는 알고리즘이 가장 우수한 성능을 보이는 것을 알 수 있었으며, 전통적인 협업 필터링과 비교해서도 통계적으로 유의한 수준의 정확도의 개선이 이루어짐을 확인할 수 있었다.