1. 서 론
최근에 들어, 전세계적으로 창업을 권유하는 국가정책이 활성화 됨에 따라, 기업이나 브랜드의 정체성을 상징하는 로고를 어떻게 디자인 하느냐 또한 많은 이슈가 되고 있다. 로고는 기업의 경영방침 혹은 이념과 같은 의미를 시각적으로 전달하는 기능을 수행한다. 특히, 시각적으로 정보를 전달하는 로고영상은 그래픽적 요소를 통해 소비자에게 정보를 전달하기 때문에, 로고 영상의 색상과 형태가 가장 중요한 역할을 수행한다[1]. 소비자가 로고를 통해 기업의 이념을 파악하는 것 또한 중요하지만, 먼저 소비자가 적어도 한 번 이상 봤던 로고를 기억해야만 로고가 제 기능을 수행 할 수 있다. 따라서, 소비자의 기억에 잘 남도록 로고를 디자인하는 것은 로고를 이용한 마케팅의 효과를 더욱 상승시킬 수 있으며, 로고의 기억용이성(Memorability)는 산업디자이너가 로고를 디자인 할 때 첫 번째로 풀어야 하는 문제다.
기억용이성(Memorability)의 개념은 사실상 아주 모호하며, 패턴이 쉽게 드러나지 않아 계산적으로 분석하기 쉽지 않다. 사람들은 많은 영상에 노출되더라도 한 번 본 영상을 기억해내는 능력이 있다. 하지만, 영상의 기억용이성은 보는 이와 상황 등에 따라 결과가 동등하지 않다. 예를 들어, 영상에 익숙한 객체나 상황이 있다면 기억에 잘 남는 반면에, 같은 영상을 객체나 상황과 전혀 무관한 사람이 본다면 쉽게 기억하지 못 할 가능성이 매우 높다[2,3]. 본 논문에서는 후자의 경우에 대한 로고 영상의 기억용이성을 분석한다. 따라서, 익숙한 객체나 상황이 포함되지 않은 영상의 기억용이성을 예측하는 것은 높은 기억용이성을 필요로 하는 분야에서 그 목적을 달성 할 수 있도록 기여하며 로고 영상이 특히 그러하다.
기계학습 알고리즘을 통해 영상의 기억용이성을 예측하는 연구는 다양한 응용가능성 때문에 최근 많은 연구자들이 관심을 가지고 있다. 시청자의 기억에 잘 남는 로고를 분석하고 기억용이성을 높이는 요소에 대해 분석을 수행한 연구는 없지만, 특정 영상 혹은 일반적인 영상에서의 기억 정도를 분석하고 어떠한 요소가 기억 정도를 높이는지에 대한 연구는 수행되어 왔다. P. Isola et al.[2]은 영상의 기억용이성 측정 실험 방법을 개발해 보는 이, 기억이 보존되는 기간에 따라 기억용이성이 달라지지 않음을 증명했으며, 실험을 통해 측정된 기억용이성과 계산적인 영상처리 알고리즘을 적용해 영상의 기억용이성에 미치는 요소를 찾았다. P. Isola et al. [5]는 T. F. Brady et al. [4]에서 개발된 기억용이성 측정방법을 얼굴영상에 적용하고 이를 기반으로 얼굴 영상의 기억용이성을 예측하는 알고리즘을 연구했다. 예측된 얼굴영상의 기억용이성은 단순히 얼굴 전체에 대한 기억용이성이 아니라 얼굴의 자세한 요소를 분석함으로써 낮은 기억용이성의 얼굴을 기억용이성이 높아지도록 수정하는 응용 프로그램을 개발했다. P. Isola et al. [3]는 영상의 특이성이 친근한 객체와 상황만큼 기억용이성에 큰 영향을 미친다는 것을 찾았으며, 영상의 친근한 객체 혹은 상황이 기억용이성을 높이기도 하지만 때로는 “어디서 본 것 같다.”라는 잘못된 기억을 초래할 수 도 있으며, 특이성은 확실히 사람들이 기억을 잘 할 수 있도록 한다는 결론을 내렸다. 하지만 로고 영상은 심볼이나 텍스트로 구성된 상징적 요소를 포함한다는 점에서 일반적인 영상이나 얼굴 영상과 다르다. 그러므로, 로고 영상의 기억용이성을 분석하고 예측하는 새로운 접근 방법이 필요하다.
따라서 본 연구는 P. Isola et al. [2]의 메모리 게임을 사용해 로고영상의 기억용이성을 측정하고 이를 분석해 로고의 기억용이성에 영향을 주는 영상 요소를 정의한다. 특히, 로고영상에서 정보전달의 역할을 수행하는 로고의 색상과 형태 특성에 계산적 수치화 방법을 적용해 기억용이성을 높이는 로고영상의 요소를 수치화한다. 수치화된 방법과 실험을 통해 측정된 기억용이성 사이의 유사도를 비교해 가장 높은 유사도를 갖는 방법을 일반적인 영상 특징 추출 알고리즘(SIFT, HoG)과 결합함으로써, 로고영상의 새로운 특징 디스크립터를 정의한다. 마지막으로, 제안된 로고 영상의 기억용이성 특징 디스크립터를 Support Vector Regression(SVR)에 적용해 기계학습을 수행함으로써 로고영상의 기억용이성을 예측하는 알고리즘을 제안한다. 본 논문에서 연구된 방법은 로고의 색상과 형태에 따른 기억용이성을 수치화된 평가가 가능하도록 하며, 자동으로 다양한 영상 특징 분석을 통해 입력된 로고 영상의 기억용이성을 평가해 로고 디자인 평가에 응용될 수 있다. 또한 제안된 로고 디자인 기억용이성 평가 모델은 간판, 인테리어, 건축 등 다양한 산업 디자인 분야에 적용해 응용될 수 있다. 예를 들어, 간판영상을 구성하는 시각적 특성 요소를 분석하고 기억용이성에 영향을 미치는 특징을 정의한다. 정의된 간판영상의 시각적 특징을 기반으로 기계학습 모델링을 사용해 기억용이성 점수를 자동으로 평가하는 방법으로 응용 할 수 있다. Fig. 1은 본 논문의 연구 개요를 보여준다.
Fig. 1.An overview of our model.
로고의 기억용이성을 분석하기 위한 로고 영상 데이터셋이 없기 때문에, 우리는 인터넷 영상 검색과 “findicons.com”를 통해 2,200장의 로고영상을 수집했다. 우리가 수집한 로고영상 데이터셋은 색상, 형태 특성 태그를 포함하는 1,200장의 로고영상과 태그를 포함하지 않는 일반적인 로고영상 데이터 1,000장을 포함한다. 이 때, 기억용이성을 측정하는 실험에 사용되는 로고영상은 대중성, 노출성에 의해 많이 알려진 로고 영상이 아닌 대부분이 접해보지 못한 국외 중소 브랜드의 로고 영상만을 수집했다. 이미 피험자들에게 노출되었던 로고영상은 객관적인 기억용이성을 측정하기 어렵기 때문이다[3]. 두 번째 기여로, 우리는 영상의 기억용이성을 나타낼 수 있는 새로운 영상 특징 디스크립터를 제안한다. 우리는 영상 특성을 계산적으로 수치화하는 방법을 적용해 그 결과를 실험을 통해 측정된 기억용이성 점수와 비교해 기억용이성을 잘 나타내는 수치화 방법을 찾았다. 이 수치화 방법을 기존의 일반적인 영상 특징 디스크립터와 결합함으로써, 성능이 더 나아진 영상의 기억용이성 예측 모델을 제작했다.
본 논문의 구성은 다음과 같다. 2절은 기억용이성 예측과 관련 연구를 설명한다. 3절에서는 로고의 이론적 설명(3.1절)과 본 논문에 사용될 데이터 수집에 대한 내용(3.2절)을 다룬다. 3.3절은영상의 기억용이성을 측정하기 위한 메모리 게임 실험, 3.4절에서는 로고 영상의 기억용이성을 나타낼 수 있는 색상과 형태의 특징을 수치화하며. 4절에서는 메모리게임, 기억용이성 예측 모델의 실험 결과를 보여준다.
2. 관련 연구
영상의 기억용이성에 대한 연구는 유연한 응용성 때문에 인지학 뿐만 아니라 컴퓨터 과학 분야에서 많은 연구가 이루어 지고 있다[2,3,4,5,6,7,8,9]. 하지만 기억용이성을 공학적으로 접근하여 수치화하기 시작한 것은 얼마 되지 않았으며, 최근 아름다움(Beauty), 미학(Aesthetics)과 같은 인간의 주관적 요소가 크게 적용되는 부분을 공학적인 측면으로 접근하려는 연구가 활발해짐과 동시에 기억용이성과 같은 인지적 분야의 연구 또한 활발해졌다.
특히 P. Isola et al. [3]는 영상의 기억용이성은 다른 보는 이에 관계 없이 안정적이고 고유한 특징이라는 가설을 세웠다. 그들은 처음 노출된 사진이 일정시간이 흐른 뒤에 다시 나타났을 때, 이를 기억하는 확률을 측정해 기억용이성을 계산하는 실험 방법을 제안했다. 실험을 통해 측정된 영상의 기억용이성을 기반으로 기억용이성을 높이는 요소에 대한 분석을 수행했다. A. Khosla et al. [8]는 일반적인 영상에서 기억용이성에 영향을 미치는 영역을 추출하고 분석하는 연구를 수행했으며, P. Isola et al. [5]는 실험을 통해 기억에 잘 남는 얼굴영상을 찾고 얼굴 영상에 SIFT, HOG와 같은 일반적 특징을 추출했다. 이를 기계학습 알고리즘에 적용하여 입력 얼굴영상의 기억용이성을 예측하는 시스템을 구축했다. 더 나아가 예측된 얼굴 영상의 기억용이성을 기반으로 기억용이성이 높아지도록 얼굴영상을 수정하는 기술을 개발했다.
이와 같이 일반적인 영상 혹은 얼굴 영상의 기억용이성을 측정하는데 있어 전역적인 특징추출 방법을 적용하여 연구를 수행한 것은 여러 차례 시도되었지만, 로고영상과 같이 상징적 의미를 지닌 영상에 대해 기억용이성을 높여주는 특징을 상세하게 정의하여 분석한 연구는 없다.
3. 로고의 기억용이성 예측을 위한 융합된 영상 특징 벡터
3.1 로고의 특성
로고는 기업과 브랜드 그리고 상품(이하 기업만 언급)의 이미지와 정체성을 시각화한 것이다. 따라서, 로고는 기업에 대한 소비자의 이미지 형성에 중요한 역할을 한다.
로고는 심볼마크, 로고타입, 로고마크로 나눌 수 있다[11]. Fig. 2는 로고의 종류의 예시를 보여주며, 이 세 가지는 마케팅에 사용된다. 소비자는 기업을 접할 때, 기업의 로고에 가장 먼저 노출된다. 즉, 로고는 소비자로 하여금 기업의 이미지를 떠올릴 때, 가장 먼저 상기시키는 수단이다.
Fig. 2.Examples of logo. (a) is Symbol Mark, (b) is Logo Type and (c) is Logo Mark. As showing, there are many graphic components in Symbol Mark and Logo Mark.
심볼마크(Fig. 2(a))는 특정 의미를 대리로 표현하는 표식을 뜻하며, 흔히 기호라고 불려진다. 대게 심볼마크는 브랜드의 경영방침, 이념 등을 시각적으로 상징화한 것이다. 심볼마크는 CI(Corporate Identity)에서 가장 핵심적인 요소로 기업의 이미지를 어필하는데 가장 많이 사용된다[11]. 로고타입(Fig. 2(b))은 브랜드의 명칭을 공식적으로 표현하기 위해 이미지, 의미 등을 조합하여 디자인된 글꼴이다. 로고타입은 대게 심볼마크와 동시에 표기된다. 로고마크(Fig. 2(c))는 로고타입과 심볼마크의 기능을 융합한 것으로 문자의 정보전달 능력과 그래픽의 이미지 전달 능력을 결합시킨 형태다. 워드마크라고도 불리어지는 로고마크는 최근 가장 흔히 사용된다.
심볼마크, 로고타입, 로고마크는 기능이 모두 다르므로 기업은 세 종류의 로고를 모두 사용하며, 그에 따른 용도를 다르게 사용한다. 본 연구는 심볼마크, 로고타입, 로고마크 중 영상 요소가 많이 포함되어 있기 때문에, 영상처리를 통해 분석이 가능한 심볼마크와 로고마크를 중심으로 연구를 수행한다.
3.2 데이터셋
공식적으로 사용되는 로고 영상의 데이터셋이 존재하지 않기 때문에, 우리는 로고의 기억용이성을 측정하기 위한 2,200장의 로고영상을 인터넷 영상 검색과 “findicons.com”사이트를 통해 수집했다. 우리의 로고영상 데이터셋은 로고의 색상이 기억용이성에 미치는 영향을 알아보기 위한 색상 카테고리 600장과 형태가 기억용이성에 미치는 영향을 알아보기 위한 형태 카테고리 600장으로 구성되어 있다(Fig. 3). 색상 카테고리는 오늘날 전세계적으로 가장 영향력 있는 기업 혹은 브랜드의 로고 중 가장 많은 색상 분포를 이루고 있는 빨강, 파랑, 노랑 색상 계열이 각각 200장씩 구성되어 있다[10]. 우리는 빨강, 파랑, 노랑 색상 계열이 기억용이성에 미치는 영향을 연구하기 위해, 불확실한 색상 분포를 가지고 있는 데이터셋은 수집하지 않았다. 예를 들어, 노란색 배경에 빨간색 텍스쳐의 분포가 많은 영상은 제외한 후 실험을 진행했다. 형태 카테고리는 원형, 삼각형, 사각형 계열이 각각 200장씩 포함되어있다. 형태 카테고리를 이루고 있는 원형, 삼각형, 사각형 계열은 완벽한 형태를 이루는 로고영상이 아닌 각 계열에 근접한 외곽을 가지고 있는 로고영상을 의미한다. 나머지 카테고리가 분류되지 않은 1,000장의 일반적인 로고 영상 데이터셋이 포함된다. 모든 로고영상은 256×256 크기로 변환되어 사용된다. 우리의 로고 영상 데이터셋은 도시 환경에서의 로고 검출, 기억에 잘 남는 로고영상 디자인 등의 분야에서 유용하게 사용될 수 있다.
Fig. 3.Example of a logo dataset. Especially, it shows the logo image dataset about the color set and the shape set.
3.3 기억용이성 측정을 위한 실험
로고는 소비자로 하여금 기업의 정체성이나 가치를 대리로 표현하는 것으로, 소비자와 기업 사이의 매개체 역할을 해준다. 그러므로, 소비자가 한 번 본 로고를 다시 봤을 때, 기억해 낼 수 있도록 하는 궁극적 목적이 있다.
우리는 로고 영상의 기억용이성을 측정하기 위해 메모리 게임을 수행한다[2,3]. 메모리 게임은 크라우드 소싱 실험을 통해 여러 장의 영상으로 구성된 시퀀스에서, 특정 영상을 반복적으로 보여주고 피험자가 이 영상을 찾아내는 실험 방법이다. 실험 중 반복되는 영상은 기억용이성을 측정하는 영상의 반복(메모리 반복, Memory Repeat)과 피험자의 실험 집중여부를 판단하기 위한 영상의 반복(경계 반복, Vigilance Repeat)을 포함한다. 만약 피험자가 i번째 영상의 메모리 반복을 찾았다면, 해당 로고의 맞춰진 횟수 Ci가 늘어난다. 모든 피험자의 실험이 완료된 후에 우리는 Mi =Ci/Ni를 통해 로고 영상 i의 기억용이성 확률을 계산한다. 여기서 Ni는 i영상이 반복되어 나타난 횟수를 의미한다. 기억용이성 확률은 [1.0,10.0]으로 정규화되어 기억용이성 점수로 사용된다. Fig. 4는 메모리 게임에서 한 레벨의 시퀀스를 보여준다.
Fig. 4.The sequence of Visual Memory Game’s one level.
3.4 로고의 기억용이성에 영향을 주는 구성 요소 분석 및 수치화
본 연구는 로고의 기억용이성에 영향을 미치는 로고의 특성을 SIFT와 HoG와 같은 일반적인 영상 특징 디스크립터에 결합하여 로고 기억용이성 예측 모델을 위한 새로운 디스크립터를 제안한다. 메모리 게임을 통해 측정된 기억용이성 점수와 로고영상의 색상과 형태 특징을 계산적으로 수치화한 결과 사이의 스피어맨 유사도(Spearman’s Correlation)를 측정한 다. 색상과 형태 특징을 수치화한 방법 중 그 결과가 실험을 통해 측정된 기억용이성 점수와 가장 높은 유사도를 보일 때, 로고 기억용이성의 색상, 형태 특성의 디스크립터로 사용된다.
우리는 로고의 색상 특성을 수치화 하기 위해, 로고 영상의 빨강, 초록, 파랑, 색조(Hue), 포화도(Saturation), 강도(Intensity), 휘도(Y), Cb, Cr 각 색상 공간의 평균 분포 값(MeanColor(l))을 식(1)을 사용해 측정했다.
여기서, lcolor(x, y)는 입력 로고영상에서 배경색상을 제외한 로고 영역에 대한 픽셀 값을 의미한다. 이는 로고 객체의 영역이 아닌 배경 영역의 색상이 값에 포함되는 것을 막기 위해 전체 영상 영역의 픽셀값을 사용하지 않는다.
로고의 형태가 기억용이성에 미치는 영향을 분석하기 위해, 메모리 게임을 통해 얻어진 결과 중 가장 높은 평균 기억용이성을 갖는 형태 특성 계열의 평균 영상과 각 로고의 하우스돌프 거리(Hausdorff Distance, HD), 수정된 하우스돌프 거리(Modified Hausdorff Distance, MHD)[12] 그리고 HOG 형태 거리[13] 를 측정했다. 이 때, 형태 거리 측정 방법은 A형태와 B 형태간의 차이 거리를 측정하는 알고리즘으로 본 연구에 사용될 때는 측정된 거리를 [1.010.0]으로 정규화 한 뒤, 각 결과에 10을 뺀 결과값을 사용한다.
로고 영상 내부에 포함된 브랜드 네임, 텍스쳐의 형태 값 등을 제외한 로고 전체 형태를 다루기 위해, 로고 객체 영역의 선을 캐니 엣지 추출 알고리즘을 통해 추출하고 로고의 최외곽선선을 제외한 나머지선은 제거해 연산에 사용하지 않는다. 얻어진 각 로고 영상의 최외곽선 점 집합 A = a1,⋯, am과 가장 높은 기억용이성 점수를 갖는 형태 계열의 평균 영상점 집합 B = b1,⋯, bn의 하우스돌프 거리, 수정된 하우스돌프 거리, HoG 형태 거리를 계산한다. 식(2)는 하우스돌프 거리와 수정된 하우스돌프 거리의 연산에 사용된다.
여기서 h(A,B)는 하우스돌프 거리와 수정된 하우스돌프 거리가 각각 다르게 연산되는데, 식(3)은 하우스돌프, 식(4)는 수정된 하우스돌프 거리에 사용된다.
HoG 형태 거리[13]는 형태 분류를 위해 HoG 방법을 통해 얻어진 지역적 디스크립터와 전역적 디스크립터를 사용하였다. 본 연구는 로고 영상의 전역적, 지역적 디스크립터를 추출하기 위해 최고 고유값을 찾는데 주성분 분석(Principal Component Analysis, PCA)기반 외곽선 점 집합의 최고 방향성(peak orientation)을 구했다. 로고영상의 최외곽선의 평균값과 관련된 고유값의 방향은 특징 추출 윈도우의 최고 각(peak angle)을 구할 수 있도록 한다. 이 과정을 거친 뒤, 회전 행렬을 영상에 적용하여 같은 과정을 반복한다. 우리는 8방향에 대하여 연산을 수행하고 1×40 벡터 디스크립터를 얻을 수 있다.
평균 형태의 HoG 디스크립터를 추출하고 유사한 형태 영상의 디스크립터를 통해 같은 과정을 반복하여 지역, 전역적 디스크립터를 융합한 분류 벡터를 얻는다. 이를 통해 각 로고 영상과의 에러율을 측정하여 형태 거리를 수치화 한다.
4. 실험 결과
4.1 기억용이성 점수 측정 실험
이 실험의 목적은 로고영상으로부터 기억용이성을 측정해 로고 구성 요소의 영향을 분석하고 이를 기계학습 디스크립터로 사용 할 수 있도록 하는 것이다. 본 실험은 웹상에 구축된 실험 프로그램을 통해 웹 크라우드소싱 실험으로 진행되었다.
4.1.1 실험 방법
로고영상의 기억용이성 점수를 측정하기 위해, 피험자는 비주얼 메모리 게임을 수행한다. 각 피험자는 하나의 레벨에서 반복되어 나타나는 로고 영상을 식별했을 때, 버튼을 누른다. 하나의 레벨에서 로고 영상은 1초씩 나타나며 로고영상 사이에 1.4초간의 빈 화면이 나타난다.
본 실험에 사용되는 로고 영상 데이터는 색상 데이터셋 600장과 형태 데이터셋 600장이다. 색상 데이터는 빨강, 파랑, 노랑 계열의 특성이 로고의 기억용이성에 미치는 영향을 분석하는데 사용되며, 각 계열별로 200장씩 구성된다. 형태 데이터는 원형, 삼각형, 사각형 계열의 특성이 로고의 기억용이성에 미치는 영향을 분석하는데 사용되며, 각 계열이 200장씩 구성된다. 로고영상의 크기는 모두 256×256이다.
4.1.2 실험 과정
우리는 10개의 레벨을 하나의 시퀀스로 구성시키며, 각 레벨은 120번의 로고영상 나타남으로 구성된다. 120번의 로고영상 나타남은 한 장의 타겟 영상과 108장의 일반 영상으로 구성되는데, 타겟 영상이 해당 레벨에서 기억용이성이 측정되는 영상이다. 즉, 하나의 레벨에서 기억용이성이 측정되는 영상은 타겟 영상 한 장뿐이다. 이 방법은 P. Isola et al. [2]와 유사하게, 타겟 영상이 120번의 영상 나타남 중 2-10번째 사이에 처음 나타난 후 91-109번 후에 다시 한번 나타나며, 피험자는 이 반복을 찾는 것이 목표다. 일반 영상 108장 중 임의적으로 선택된 10장의 영상이 처음 나타난 시점으로부터 1-7번 뒤에 반복되어 나타난다. 이 반복은 피험자의 실험 집중여부를 판단하기 위한 반복으로, 피험자가 하나의 레벨을 수행하는 동안 5번의 일반 영상 반복을 찾아내지 못하거나 반복되지 않은 영상을 반복했다고 잘못 누를 경우 해당 실험은 자동으로 취소된다. 피험자는 하나의 레벨 사이에 약 5분, 하나의 시퀀스당 하루의 휴식을 필수로 갖게 된다. Fig. 5은 전체 실험의 프로토콜을 보여준다.
Fig. 5.Experiment protocol of Visual Memory Game.
4.1.3 기억용이성 측정실험 결과
본 실험은 20-40대 사이 피험자 60명이 참여했으며, 하나의 레벨에 소요되는 시간은 총 4.8분이다.
로고의 색상특성이 기억용이성에 미치는 영향을 분석하기 위해, 빨강, 파랑, 노랑 계열의 로고 영상의 기억용이성 점수의 평균을 측정했다. Table 1에서 왼쪽 표는 색상 계열에 따른 평균 기억용이성을 보여준다. 결과적으로, 노란색 계열의 로고영상의 기억용이성이 0.57로 가장 높은 평균 점수를 보여준다.
Table 1.Mean memorability each affiliations
로고의 형태특성이 기억용이성에 미치는 영향을 분석하기 위해, 원형, 삼각형, 사각형 계열의 로고 기억용이성 점수의 평균을 측정했다. Table 1에서 오른쪽 표는 형태 특성에 따른 평균 기억용이성을 보여주며, 사각형 계열이 0.63으로 가장 높은 평균기억용이성으로 측정됐다.
4.2 로고 영상의 특성 수치화 결과
우리는 로고의 기억용이성을 예측하는 모델에 사용될 로고 기억용이성 특징 디스크립터를 만들기 위해, 메모리 게임을 통해 측정된 기억용이성 점수와 로고영상의 색상, 형태 특성을 수치화하는 방법들 사이의 스피어맨 유사도를 비교했다. 스피어맨 유사도 방법은 그 결과가 -1에 가까울수록 반비례함을 의미하며, 1에 가까울수록 비례함을 의미한다. 가장 높은 유사도를 보이는 색상, 형태 특성 수치화 알고리즘을 선택해 로고 영상의 특징 디스크립터를 추출하는데 사용한다. 통해 유사도를 측정했다.
색상 특성 수치화 알고리즘의 각 결과와 메모리게임 실험을 통해 측정된 기억용이성 사이의 유사도를 비교한 결과는 Table 2와 같으며, 휘도를 의미하는 Y 색상 공간과 기억용이성 사이의 유사도가 ρ=0.74로 가장 높게 측정됐다. 이는 로고 영역의 Y 색상공간이 로고 영상의 기억용이성을 나타내는 색상 특성임을 의미한다.
Table 2.Spearman’s correlation between memorability score and computational method about color
형태 특성 수치와 알고리즘의 각 결과와 메모리게임 실험을 통해 측정된 기억용이성 사이의 유사도를 비교한 결과는 Table 3과 같으며, 수정된 하우스돌프 거리 알고리즘이 ρ=0.69로 기억용이성 점수와 가장 유사하게 측정됐다. Fig. 6는 각 계산적 수치화 결과와 실험을 통해 측정된 기억용이성 점수 사이의 분포를 나타낸다.
Table 3.Spearman’s correlation between memorability score and computational method about shape
Fig. 6.Distribution about spearman’s correlation between memorability score(x-axis) and computational methods (y-axis). (a.1~a.9) is set of memorability-computational methods about color, (b.1~b.3) is set of memorabilitycomputational methods about shape.
4.3 로고의 기억용이성 예측 모델
입력되는 로고 영상의 기억용이성을 예측하는 모델을 만들기 위해, 우리는 기존의 일반적인 영상 특징 디스크립터와 영상 특성 수치화 알고리즘을 융합한 새로운 특징 디스크립터를 제안한다. 본 논문에서는, 일반적인 영상 디스크립터로 SIFT와 HoG를 사용했으며, 기억용이성 점수와 가장 높은 유사도를 갖는 특성 수치화 방법인 평균 Y값과 수정된 하우스돌프 거리를 각각 색상, 형태에 대한 특징 디스크립터로 사용했다. 우리의 영상 특징 디스크립터의 성능을 증명하기 위해, 일반적인 영상 특징 디스크립터를 사용한 기억용이성 예측 모델과 우리의 방법을 적용한 모델 사이의 성능 비교를 수행했다.
기억용이성 예측 모델은 SVR 기계학습 방법을 사용했다. 1,200장의 로고영상이 학습에 사용 됐으며, 240장의 로고영상이 테스트에 사용됐다. 테스트 데이터의 예측된 기억용이성 결과와 메모리 게임을 통해 측정된 기억용이성 점수와의 스피어맨 유사도를 비교한 결과는 Table 4에 보여진다. 제안된 로고 영상 특징 디스크립터를 사용해 예측 모델을 만들었을 때, 가장 유사도가 높은 것을 볼 수 있다(ρ=0.68).
Table 4.Spearman’correlation between prediction results and memorability of logo each descriptors
5. 결 론
본 연구에서, 우리는 로고영상의 기억용이성을 예측하는 모델에 사용될 새로운 영상 특징 디스크립터를 제안했다. 제안된 연구는 크라우드소싱을 통한 기억용이성 측정, 새로운 특징 디스크립터, 기억용이성 예측 세 부분으로 나누어 질 수 있다. 첫째로 로고영상의 기억용이성을 측정하기 위해 우리는 P. Isola et al. [2]의 메모리 게임을 사용했다. 그리고 기억용이성 측정 결과를 기반으로, 로고 영상의 색상과 형태 특성을 계산적으로 수치화하는 적합한 방법을 찾았다. 마지막으로, 우리가 제안한 로고영상 특징 디스크립터를 SIFT, HoG와 결합해 새로운 특징 디스크립터를 만들고 이를 SVR 기계학습 방법에 적용해 로고의 기억용이성을 예측하는 모델을 만들었다. 실험 결과를 기반으로, 일반적인 영상 특징 디스크립터와 우리가 선택한 색상, 형태 특성 수치화 방법을 결합한 예측 모델이 일반적인 특징 디스크립터만을 사용했을 때보다 예측 성능이 높다는 것을 알 수 있다.
앞으로의 연구에서는 로고 영상의 영상적 특징뿐만 아니라 해당 로고를 사용하는 브랜드 혹은 기업의 인지도, 업종, 로고의 노출 빈도 등 로고의 의미적 특징(Semantics Features)을 분석하고 이에 따른 로고의 기억용이성을 분석하도록 발전시킬 수 있다. 또한 예측된 로고 영상의 기억용이성을 기반으로 입력 로고영상의 기억용이성을 높일 수 잇도록 영상 수정방법을 제안하는 시스템 연구를 수행 할 수 있다.
References
- H.Y. Chu and H.J. Lee, “Periodical Characteristics of Shape and Color in Korean Corporate Symbol Mark,” Journal of Korean Society of Design Science, Vol. 25, No. 3, pp. 184-197, 2012.
- P. Isola, J. Xiao, D. Parikh, A. Torralba, and A. Oliva, "What Makes a Photograph Memorable?," IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 36, No. 7, pp, 1469-1482, 2014. https://doi.org/10.1109/TPAMI.2013.200
- P. Isola, D. Parikh, A. Torralba and A. Oliva, "Understanding the Intrinsic Memorability of Images," Proceeding of In Advances in Neural Information Processing Systems, pp. 2429-2437, 2011.
- T.F. Brady, T. Konkle, G.A. Alvarez, and A. Oliva, "Visual Long-term Memory has a Massive Storage Capacity for Object Details," Proceedings of the National Academy of Sciences, Vol. 105, No. 38, pp. 14325-14329, 2008. https://doi.org/10.1073/pnas.0803390105
- A. Khosla, W. Bainbridge, A. Torralba, and A. Oliva, "Modifying the Memorability of Face Photographs," Proceeding of 2013 IEEE International Conference on Computer Vision, pp. 3200-3207, 2013.
- G.D.A. Brown, I. Neath, and N. Chater, "A Temporal Ratio Model of Memory," Psychological review, Vol. 114, No. 3, pp. 539, 2007. https://doi.org/10.1037/0033-295X.114.3.539
- T. Konkle, T.F. Brady, G.A. Alvarez, and A. Oliva, "Scene Memory is More Detailed Than You Think the Role of Categories in Visual Long-term Memory," Psychological Science, Vol. 21, No. 11, pp. 1551-1556, 2010. https://doi.org/10.1177/0956797610385359
- A. Khosla, J. Xiao, A. Torralba, and A. Oliva, "Memorability of Image Regions," Proceeing of Advances in Neural Information Processing Systems, pp. 305-313, 2012.
- Z. Bylinskii, P. Isola, C. Bainbridge, A. Torralba, and A. Oliva, “Intrinsic and Extrinsic Effects on Image Memorability,” Vision Research, Vol. 116, Part. B, pp. 165-178, 2015. https://doi.org/10.1016/j.visres.2015.03.005
- Color Trends + Palettes (2015). http://www.colourlovers.com/ (accessed May., 12, 2014).
- Y.J. Shin, "The Study on Preference According to Visual Shape of Hangeul Logotype," Science of Emotion and Sensibility, Vol. 12, No. 2, pp. 193-204, 2009.
- D.P. Huttenlocher, G.A. Klanderman, and W. J. Rucklidge, "Comparing Images using the Hausdorff Distance," IEEE Transactions on Pattern Analysis and Machine Intelligence, Vol. 15, No. 9, pp. 850-863, 1993. https://doi.org/10.1109/34.232073
- K. Lim and H.K. Gallogahi, "Shape Classification using Local and Global Features," Proceeding of 2010 Fourth Pacific-Rim Symposium on IEEE Image and Video Technology, pp. 115-120, 2010.
- S. Dhar, V. Ordonez, and T.L. Berg, "High Level Describable Attributes for Predicting Aesthetics and Interestingness," Proceeding of 2011 IEEE Conference on IEEE Computer Vision and Pattern Recognition, pp. 1657-1664, 2011.
- I. Rock and P. Englestein, "A Study of Memory for Visual Form," The American Journal of Psychology, Vol. 72, No. 2, pp. 221-229, 1959. https://doi.org/10.2307/1419366
- Z.X. Wang and D.H. Kim, "Research in Off-Screen Space and Cognitive Psychology," Journal of Korea Multimedia Society, Vol. 13, No. 2, pp. 341-347, 2010.
- H.Y. Lee and S.K. Kwon, "A Simplification Method of Intra Prediction Considering Importance of Subjective Interest Region," Journal of Korea Multimedia Society, Vol. 12, No. 7, pp. 922-928, 2009.
- D.K. Kim, J.S. Park, and K.S. Son, "New Speech Enhancement Method using Psychoacoustic Criteria," Journal of Korea Multimedia Society, Vol. 4, No. 1, pp. 56-66, 2001.
Cited by
- 브랜드 인지도 향상을 위한 로고타입 상징성에 관한 연구 vol.23, pp.4, 2015, https://doi.org/10.9717/kmms.2020.23.4.581