• 제목/요약/키워드: Retrieval Model

검색결과 815건 처리시간 0.031초

다차원 텍스트 큐브를 이용한 호텔 리뷰 데이터의 다차원 키워드 검색 및 분석 (Multi-Dimensional Keyword Search and Analysis of Hotel Review Data Using Multi-Dimensional Text Cubes)

  • 김남수;이수안;조선화;김진호
    • 정보화연구
    • /
    • 제11권1호
    • /
    • pp.63-73
    • /
    • 2014
  • 웹의 발달로 텍스트 등으로 이루어진 비정형 데이터의 활용에 대한 관심이 높아지고 있다. 웹상에서 사용자들이 작성한 대부분의 비정형 데이터는 사용자의 주관이 담겨져 있어 이를 적절히 분석할 경우 사용자의 취향이나 주관적인 관점 등의 아주 유용한 정보를 얻을 수 있다. 이 논문에서는 이러한 비정형 텍스트 문서를 다양한 차원으로 분석하기 하는데 OLAP(온라인 분석 처리)의 다차원 데이터 큐브 기술을 활용한다. 다차원 데이터 큐브는 간단한 문자나 숫자 형태의 정형적인 데이터에 대해 다차원 분석하는데 널리 사용되었지만, 텍스트 문장으로 이루어진 비정형 데이터에 대해서는 활용되지 않았다. 이러한 텍스트 데이터베이스에 포함된 정보를 다차원으로 분석하기 위한 방법으로 텍스트 큐브 모델이 최근에 제안되었는데, 이 텍스트 큐브는 정보 검색에서 널리 사용하는 용어 빈도수(Term Frequency)와 역 인덱스(Inverted Index)를 측정값으로 이용하여 텍스트 데이터베이스에 대한 다차원 분석을 지원한다. 이 논문에서는 이러한 다차원 텍스트 큐브를 활용하여 실제 서비스되고 있는 호텔 정보 공유 사이트의 리뷰 데이터 분석에 활용하였다. 이를 위해 호텔 리뷰 데이터에 대한 다차원 텍스트 큐브를 생성하였으며, 이를 이용하여 다차원 키워드 검색 기능을 제공하여 사용자 중심의 의미있는 정보 검색이 가능한 시스템을 설계 및 구현하였다. 또한, 본 논문에서 제안하는 시스템에 대해 다양한 실험을 수행하였으며 이를 통해 제안된 시스템의 실효성을 검증하였다.

정보검색에 있어서 두 패러다임의 비교분석 : 이용자에 대한 새로운 인식을 중심으로 (A Comparative Study of Two Paradigms in Information Retrieval: Centering on Newer Perspectives on Users)

  • 조명대
    • 한국문헌정보학회지
    • /
    • 제24권
    • /
    • pp.333-369
    • /
    • 1993
  • 정보검색 시스템을 대하는 대부분의 이용자의 대답은 '이용하기에 어렵다'라는 것이다. 기계적인 정보검색을 기본 철학으로 하는 기존의 matching paradigm은 정보 곡체를 여기 저기 내용을 옮길 수 있는 물건으로 간주한다. 그리고 기존의 정보시스템은 이용자가 시스템을 구성한 사람의 의도 (즉, indexing, cataloguing rule)를 완전히 이해한다면, 즉 완전하게 질문식(query)을 작성한다면, 효과적인 검색을 할 수 있는 그런 시스템이다. 그러나 어느 이용자가 그 복잡한 시스템을 이해하고 정보검색을 할 수 있겠는가? 한마디로 시스템을 설계한 사람의 의도로 이용자가 적응해서 검색을 한다는 것은 아주 힘든 일이다. 그러나 우리가 이용자에 대한 인식을 다시 한다면 보다 나은 시스템을 만들 수 있다고 본다. 우리 인간은 아주 창조적이어서 자기가 처한 상황에서 이치에 맞게끔 자기 나름대로의 행동을 할 수 있다(sense-making approach). 이 사실을 인식한다면, 왜 이용자들의 행동양식에 시스템 설계자가 적응을 못하는 것인가? 하고 의문을 던질 수 있다. 앞으로의 시스템이 이용자들의 자연스러운 행동 패턴에 맞게 끔 설계된다면 기존의 시스템과 함께 쉽게 이용할 수 있는 편리한 시스템이 설계될 수 있을 것이다. 그러므로 도서관 및 정보학 연구에 있어서 기존의 분류. 목록에 대한 연구와 이용자체에 대한연구(예를 들면, 몇 시에 이용자가 많은가? 어떤 종류의 책을 어떤 계충에서 많이 보는가? 도서 및 잡지가 어떻게 양적으로 성장해 왔는가? 등등의 use study)와 함께 여기서 제시한 제3의 요소인 이용자의 인식(cognition)을 시스템설계에 반드시 도입을 해야만 한다고 본다(user-centric approach). 즉 이용자를 중간 중간에서 도울 수 있는 facilitator가 많이 제공되어야 한다. 이용자의 다양한 패턴의 정보요구(information needs)에 부응할 수 있고, 질문식(query)을 잘 만들 수 없는 이용자를 도울 수 있고(ASK hypothesis: Anomolous State of Knowledge), 어떤 질문식 없이도 자유스럽게 Browsing할 수 있는(예를 들면 hypertext) 시스템을 설계하기 위해서는 눈에 보이는 이용자의 행동패턴(external behavior)도 중요하지만 우리 눈에는 보이지 않는 이용자의 심리상태를 이해한다면 훨씬 나은 시스템을 만들 수 있다. 이용자가 '왜?' '어떤 상황에서,' '어떤 목적으로,' '어떻게,' 정보를 검색하는지에 대해서 새로운 관심을 들려서 이용자들이 얼마나 우리 시스템 설계자들의 의도에 미치지 못한다는 사실을 인식 해야한다. 이 분야의 연구를 위해서는 새로운 paradigm이 필수적으로 필요하다고 본다. 단지 'user-study'만으로는 부족하며 새로운 시각으로 이용자를 연구해야 한다. 가령 새롭게 설치된 computer-assisted system에서 이용자들이 어떻게, 그리핀 어떤 분야에서 왜 그렇게 오류 (error)를 범하는지 분석한다면 앞으로의 computer 시스템 선계에 큰 도움을 줄 수 있을 것으로 믿는다. 실제로 많은 방법이 개발되고 있다. 그러면 시스템 설계자가 가졌던 이용자들이 이러 이러한 방식으로 정보검색을 할 것이라는 예측과(즉, conceptual model) 실제 이용자들이 정보검색을 할 때 일어나는 행동패턴 사이에는(즉, mental model) 상당한 차이점이 있다는 것을 알게 될 것이다. 이 차이점을 줄이는 것이 시스템 설계자의 의무라고 생각한다. 결론적으로, Computer에 대한 새로운 지식과 함께 이용자들의 인식을 연구할 수 있는, 철학적이고 방법론적인 연구를 계속하나가면서, 이용자들의 행동패턴을 어떻게 시스템 설계에 적용할 수 있는 지를 연구해야 한다. 중요하게 인식해야할 사실은 구 Paradigm을 완전히 무시하라는 것은 아니고 단지 이용자에 대한 새로운 인식을 추가하자는 것이다. 그것이 진정한 User Study가 될 수 있는 길이라고 생각하며, 컴퓨터와 이용자 사이의 '원활한 의사교환'이 필수불가결 한 지금 우리 학문이 가야 할 한 연구분야이다. (Human Interaction with Computers)

  • PDF

NOAA AVHRR 자료를 이용한 해수면온도 산출에 황사가 미치는 영향 (Examining Influences of Asian dust on SST Retrievals over the East Asian Sea Waters Using NOAA AVHRR Data)

  • 전형욱;손병주
    • 대한원격탐사학회지
    • /
    • 제25권1호
    • /
    • pp.45-59
    • /
    • 2009
  • 본 연구에서는 NOAA AVHRR 밝기온도 자료로부터 해수면 온도(SST) 산출에 황사 에어로솔은 미치는 영향을 복사전달 모델을 사용하여 분석하고, SST 복원 알고리즘을 개선하였다. 봄철의 황사에 의한 AVHRR 밝기온도 변화를 모의하기 위한 복사전달 모델의 입력 자료로서 지상 태양광 관측 자료로부터 분석한 황사 에어로솔 광학적 특성 (에어로솔 광학적 두께 및 크기분포)과 라디오 존데 연직분포 자료(기압, 기온, 및 습도)를 이용하였다. 황사 에어로솔은 적외선 복사대에서 흡수에 비해 산란이 매우 큼을 보였으며, 이러한 특징은 지표면에서 방출되는 상향복사량을 산란시켜 대기상부에서 관측되는 밝기 온도를 감소시키는 경향과 관련이 있다. 광학적 두께가 1인 황사의 경우 직하점에서 약 2 K, 위성 천정각이 $50^{\circ}$인 경우에는 약 4 K의 감쇄를 유발하였다. 황사 존재시 AVHRR 적의채널 11, $12{\mu}m$의 밝기온도 차 역시 감소하는 경향을 보이고 있지만 그 값은 미미하였다. 기존 SST 복원 알고리즘은 황사발생시 SST를 실제 값보다도 낮게 산출함을 보였으며, 이를 보정하기 위해 에어로솔 광학적 두께, $11{\mu}m$에서의 밝기온도, 그리고 위성 천정각을 추가하여 알고리즘을 개선하였다. 개선된 SST 복원 알고리즘은 황사의 두께가 1인 경우 2.7 K정도의 오차를 개선하였다.

인공위성 SAR 영상 기반 태풍 중심 산정 (Estimation of Typhoon Center Using Satellite SAR Imagery)

  • 정준범;박경애;변도성;정광영;이은일
    • 한국지구과학회지
    • /
    • 제40권5호
    • /
    • pp.502-517
    • /
    • 2019
  • 지구온난화와 급속한 기후 변화는 북서 태평양 내 태풍의 특성에 오랫동안 영향을 미쳤고, 이로 인해 한반도 연안에서 치명적인 재해가 증가하고 있다. 마이크로파 센서의 일종인 Synthetic Aperature Radar (SAR)는 위성 광학 및 적외선 센서로는 바람을 구할 수 없는, 흐린 대기 조건인 태풍 주위에서 고해상도 바람장을 생산할 수 있다. SAR 자료로부터 해상풍을 산출하기 위한 Geophysical Model Functions (GMFs)에는 풍향 입력이 필수적이며, 이는 태풍 중심을 정확히 추정하는 것에 기반해야 한다. 본 연구는 태풍 중심 탐지 방법의 문제점을 개선하고 이를 해상풍 산출에 반영하기 위하여, Sentinel-1A 영상을 이용해 태풍 중심을 추정하였다. 그 결과는 한국 및 일본 기상청이 제공한 태풍 경로자료와 비교하여 검증하였고, Himawari-8 위성의 적외 영상도 활용하여 검증하였다. 태풍의 초기 중심 위치는 VH 편파를 이용해 설정하여 오차의 발생 가능성을 줄였다. 탐지된 중심은 한국 및 일본 기상청에서 제공하는 4개 태풍의 경로 자료와 평균 23.76 km의 차이를 보였다. Himawari-8 위성에서 추정된 태풍 중심에 비교했을 때 결과는 육지 근처에 위치하면서 58.73 km의 큰 차이를 보인 한 태풍을 제외하고는 평균 11.80 km의 공간 변이를 보였다. 이는 고해상도 SAR 영상이 태풍 중심을 추정하고 태풍 주위 해상풍 산출에 활용될 수 있음을 시사한다.

합성곱 신경망의 비지니스 응용: 런웨이 이미지를 사용한 의류 분류를 중심으로 (Business Application of Convolutional Neural Networks for Apparel Classification Using Runway Image)

  • 서이안;신경식
    • 지능정보연구
    • /
    • 제24권3호
    • /
    • pp.1-19
    • /
    • 2018
  • 최근 딥러닝은 오디오, 텍스트 및 이미지 데이터와 같은 비 체계적인 데이터를 대상으로 다양한 추정, 분류 및 예측 문제에 사용 및 적용되고 있다. 특히, 의류산업에 적용될 경우 딥러닝 기법을 활용한 의류 인식, 의류 검색, 자동 제품 추천 등의 심층 학습을 기반으로 한 응용이 가능하다. 이 때의 핵심모형은 합성곱 신경망을 사용한 이미지 분류이다. 합성곱 신경망은 입력이 전달되고 출력에 도달하는 과정에서 가중치와 같은 매개 변수를 학습하는 뉴런으로 구성되고, 영상 분류에 가장 적합한 방법론으로 사용된다. 기존의 의류 이미지 분류 작업에서 대부분의 분류 모형은 의류 이미지 자체 또는 전문모델 착용 의류와 같이 통제된 상황에서 촬영되는 온라인 제품 이미지를 사용하여 학습을 수행한다. 하지만 본 연구에서는 통제되지 않은 상황에서 촬영되고 사람들의 움직임과 다양한 포즈가 포함된 스트릿 패션 이미지 또는 런웨이 이미지를 분류하려는 상황을 고려하여 분류 모형을 훈련시키는 효과적인 방법을 제안한다. 이동성을 포착하는 런웨이 의류 이미지로 모형을 학습시킴으로써 분류 모형의 다양한 쿼리 이미지에 대한 적응력을 높일 수 있다. 모형 학습 시 먼저 ImageNet 데이터셋을 사용하여 pre-training 과정을 거치고 본 연구를 위해 수집된 32 개 주요 패션 브랜드의 2426개 런웨이 이미지로 구성된 데이터셋을 사용하여 fine-tuning을 수행한다. 학습 과정의 일반화를 고려해 10번의 실험을 수행하고 제안된 모형은 최종 테스트에서 67.2 %의 정확도를 기록했다. 본 연구 모형은 쿼리 이미지가 런웨이 이미지, 제품 이미지 또는 스트릿 패션 이미지가 될 수 있는 다양한 분류 환경에 적용될 수 있다. 구체적으로는 패션 위크에서 모바일 어플리케이션 서비스를 통해 브랜드 검색을 용이하게 하는 서비스를 제공하거나, 패션 잡지사의 편집 작업에 사용되어 브랜드나 스타일을 분류하고 라벨을 붙일 수 있으며, 온라인 쇼핑몰에서 아이템 정보를 제공하거나 유사한 아이템을 추천하는 등의 다양한 목적에 적용될 수 있다.

보안 서비스를 고려한 이동 에이전트 모델과 클라이언트-서버 모델의 성능 비교 (A Performance Comparison of the Mobile Agent Model with the Client-Server Model under Security Conditions)

  • 한승완;정기문;박승배;임형석
    • 한국정보과학회논문지:정보통신
    • /
    • 제29권3호
    • /
    • pp.286-298
    • /
    • 2002
  • 분산 컴퓨팅 환경에서 프로세스 사이의 상호 협력을 위한 통신으로 인격 프로시져 호출이 전통적으로 사용되고 있다. 분산 응용이 더욱 복잡해짐에 따라 최근 이동 에이전트 패러다임이 등장하였다. 이처럼 다양한 상호 협력을 위한 통신 패러다임이 등장함에 따라 각 패러다임의 성능에 대한 평가와 비교 연구가 이루어지고 있다. 그러나 기존의 연구에서 성능 평가를 위해 사용한 성능 모델들은 보안 서비스를 위한 평가 요소를 고려하고 있지 않기 때문에 실제 분산 환경을 제대로 반영하지 못한다. 분산 환경은 개방되어 있으므로 정보의 노출이나 도청과 같은 공격에 있어서 상당히 취약하다. 이러한 분산 환경에서 안전하게 작업을 수행하기 위해서는 여러 가지 공격으로부터 응용 프로그램이나 정보를 보호하기 위한 보안 서비스가 고려되어야 한다. 본 논문에서는 상호 협력을 위한 통신 패러다임 중 인격 프로시져 호출과 이동 에이전트의 성능을 평가하고 비교한다. 분산 응용 프로그램을 안전하게 수행하기 위해 고려해야 하는 보안 서비스에 관하여 알아보고, 이러한 보안 서비스를 적용한 새로운 성능 모델을 제시한다. N개의 데이타베이스 서버에서 사용자가 필요한 정보를 검색하는 작업을 Petri Net으로 모델링하고, 각 파라미터에 수치 값을 할당해서 수행속도를 측정하여 두 패러다임의 성능을 비교한다. 본 논문에서 안전한 통신을 위하여 보안 서비스를 적용한 두 성능 모델의 비교 결과는 다음과 같다. 원격 프로시져 호출은 연산 비용이 높은 암호화 메커니즘을 포함하는 통신 횟수와 통신량이 많기 때문에 실행 시간이 급격하게 증가하지만, 이동 에이전트 패러다임은 통신 횟수와 통신량을 줄인 수 있으므로 실행시간이 완만하게 증가하는 것을 살펴볼 수 있다.멀티미디어 제작환경을 구축하는 것이 디지털 방송 시대의 방송 사업자에게 가장 중요한 과제중의 하나가 되었다. 멀티미디어 제작환경을 구축함으로써 영상, 음성 및 다양한 부가 데이터를 포함하는 멀티미디어 프로그램을 편리하게 제작할 수 있으며, 데이터베이스로부터 필요한 영상 이미지를 자유롭게 합성, 조작하는 등, 매우 다양하고 편리한 제작기법을 활용할 수 있다. 또한 멀티미디어를 응용한 제작 분야로서 컴퓨터 그래픽스 기술은 방송의 사전제작에 커다란 기여를 하고 있으며, 이미 선거방송을 비롯한 여러가지 프로그램은 가상스튜디오와 가상캐릭터 기술을 활용하여 제작하고 있다. 방송사업자는 이러한 멀티미디어 제작시스템을 근간으로 영상검색, 영상 합성, 스크립트 편집, 가상현실 응용 등 고도의 제작 기법을 활용함으로써 사용자 친화성, 다이나믹한 표현, 실시간, 대화성을 특징으로 하는 다양한 멀티미디어 서비스를 시청자에게 제공할 수 있을 것이다.is. Using the results, we can identify dominant overestimation sources that should be analyzed more accurately to get tighter WCET estimations. To make our method independent of any existing analysis techniques, we use simulation based methodology. We have implemented a MIPS R3000 simulator equipped with several switches, each of which determines the accuracy level of the timing analysis

부스팅 기반 기계학습기법을 이용한 지상 미세먼지 농도 산출 (Estimation of Ground-level PM10 and PM2.5 Concentrations Using Boosting-based Machine Learning from Satellite and Numerical Weather Prediction Data)

  • 박서희;김미애;임정호
    • 대한원격탐사학회지
    • /
    • 제37권2호
    • /
    • pp.321-335
    • /
    • 2021
  • 미세먼지 (PM10) 및 초미세먼지 (PM2.5)는 인체에 흡수 가능하여 호흡기 질환 및 심장 질환과 같이 인체건강에 악영향을 미치며, 심각할 경우 조기 사망에 영향을 줄 수 있다. 전 세계적으로 현장관측기반의 모니터링을 수행하고 있지만 미 관측지역에 대한 대기질 분포의 공간적인 한계점이 존재하여 보다 광범위한 지역에 대한 지속적이고 정확한 모니터링이 필요한 상황이다. 위성기반 에어로졸 정보를 사용함으로써 이러한 현장 관측자료의 한계점을 극복할 수 있다. 따라서 본 연구에서는 다양한 위성 및 모델자료를 활용하여 2019년도에 대해 한 시간 단위의 지상 PM10 및 PM2.5 농도를 추정하였다. GOCI 위성의 관측영역을 포함하는 동아시아 지역에 대해 트리 기반 앙상블 방법을 사용하는 Boosting 기법인 GBRTs (Gradient Boosted Regression Trees)와 LightGBM (Light Gradient Boosting Machine)을 활용하여 모델을 구축하였다. 또한, 기상변수 및 토지피복변수의 사용유무에 따른 모델의 성능을 비교하기 위해 두 가지 festure set으로 나누어 테스트하였다. 두 기법 모두 주요 변수인 AOD (Aerosol Optical Depth), SSA (Single Scattering Albedo), DEM (Digital Eelevation Model), DOY (Day of Year), HOD (Hour of Day)와 기상변수 및 토지피복변수를 함께 사용한 Feature set 1을 사용하였을 때 높은 정확도를 보였다. Feature set 1에 대해 GBRT 모델이 LightGBM에 비해서약 10%의 정확도 향상을 보였다. 가장 정확도가 높았던 기상 및 지표면 변수를 포함한 Feature set1을 사용한 GBRT기반 모델을 최종모델로 선정하였으며 (PM10: R2 = 0.82 nRMSE = 34.9%, PM2.5: R2 = 0.75 nRMSE = 35.6%), 계절별 및 연평균 PM10 및 PM2.5 농도에 대한 공간적인 분포를 확인해본 결과, 현장관측자료와 비슷한 공간 분포를 보였으며, 국가별 농도 분포와 계절에 따른 시계열 농도 패턴을 잘 모의하였다.

GEMS 위성관측에 기반한 지면반사도 산출 시에 오차 유발 변수에 대한 민감도 실험 (Sensitivity Experiment of Surface Reflectance to Error-inducing Variables Based on the GEMS Satellite Observations)

  • 신희우;유정문
    • 한국지구과학회지
    • /
    • 제39권1호
    • /
    • pp.53-66
    • /
    • 2018
  • 지면반사도 정보는 열평형 및 환경/기후 모니터링에 중요하다. 본 연구에서는 정지궤도위성의 Geostationary Environment Monitoring Spectrometer (GEMS) 관측에서 300-500 nm 파장 영역의 지면반사도 산출 시에 오차 유발 요소에 대한 민감도를 조사하였다. 장차 GEMS 지면반사도 산출 시에 오차 분석을 위하여 극궤도 위성의 MODerate resolution Imaging Spectroradiometer (MODIS; 공간 해상도 $1km{\times}1km$) 자료 및 Ozone Mapping Instrument (OMI; $12km{\times}24km$) 자료 그리고 복사전달모델 수치실험도 분석에 사용하였다. 본 연구에서 오차 유발 요소는 구름, 레일리 산란, 에어로졸, 오존 그리고 지면 특성이다. GEMS 저해상도($8km{\times}7km$)에서의 구름 탐지율은 MODIS 대비 약 79%이었으나, GEMS 화소의 운량이 40% 이하에서는 상대적으로 낮았다. 이러한 경향은 구름 이외의 다른 효과(에어로졸, 지면 특성)로 인하여 주로 발생하였다. RGB 영상과 복사전달모델 계산을 기초로 조사된 레일리 산란 효과는 육지에 비하여 해양 지역에서 뚜렷하였다. 지면반사도가 0.2보다 작은 경우에 위성관측 대기상단 반사도는 에어로졸 양에 비례하였으나, 0.2보다 큰 경우에는 그 반대 경향을 보였다. 또한 에어로졸 양에 의한 지면반사도 산출 오차는 자외선 영역에서 파장에 따라 급격하게 증가하였으나, 가시광선에서는 일정하거나 다소 감소하였다. 오존 흡수는 자외선 영역(328-354 nm) 중 328 nm에서 가장 크게 나타났다. 지면반사도가 0.15인 육지 경우에 음의 오존전량 아노말리(-100 DU)로 인한 지면반사도 산출 오차는 +0.1이었다. 본 연구는 GEMS 위성관측을 이용한 지면반사도 원격탐사의 정확도를 높이는데 기여할 수 있다.

일화 기억의 의미적 범주화가 세부 기억의 부호화에 미치는 영향에 대한 자기공명영상 분석 연구 (The effect of semantic categorization of episodic memory on encoding of subordinate details: An fMRI study)

  • 이세중;한상훈
    • 인지과학
    • /
    • 제28권4호
    • /
    • pp.193-221
    • /
    • 2017
  • 의미적 연관성을 지닌 일화들의 범주화는 기억을 더 효과적으로 구조화하는데 도움이 된다. 그러나 해당 일화의 하위 세부 기억들에 대한 상기한 범주화의 영향은 아직 명확하게 알려져 있지 않다. 본 연구에서는 fMRI 실험을 통해 의미적 범주화가 이루어지는 동안 상위의 일화 기억에 주의를 기울이는 것이 하위 세부기억의 생성을 방해하는지, 혹은 강화하는지 실험하였다. 참가자들에게 한 사이클 내에서 각각 2개의 하위단어를 가지고 있는 5개의 목표 단어들이 순서대로 제시되었는데, 참가자들은 해당 사이클 내에서 제시된 목표 단어들을 포함할 수 있는 범주를 떠올릴 수 있는지 응답한 후 그 범주에 대한 주관적 확신도를 평정하였다. fMRI 내 과정이 끝난 후 참가자들은 스캐너 밖으로 이동하여 제시되었던 단서 단어의 하위 단어들에 대한 단서 회상과제를 수행하였다. 행동 실험 결과 매 사이클의 세 번째 시행에서 범주화 과제의 반응속도가 감소하였고 동시에 주관적 확신도 수준이 증가하였는데, 이는 해당 시행에서 의미적 범주화가 완성되었음을 의미한다. 주목할 점은 세 번째 시행 바로 직전에 제시되었던 하위 단어들의 회상 정확도가 그 다음 시행 직전에 제시된 단어들에 비해 유의미하게 낮았다는 점이며 이는 범주화가 완성될 때 일화 기억의 하위 세부 요소들이 손상되었음을 의미한다. 일반선형모델을 통한 분석 결과 의미적 범주화가 완성되기 직전의 시행에서 의미적 기억망과 관련이 있는 것으로 알려져 있는 측두회와 하전두회에서 유의미한 활성화가 나타났다. 또한 패턴 유사성 분석 결과 또한 측두회, 하전두회, 해마 영역에서 세 번째 시행 간의 활성화 패턴이 두 번째 시행의 활성화 패턴에 비해 더 일관적인 것으로 나타났다. 본 연구는 의미적 범주화가 하위 세부 일화 기억을 방해할 수 있다는 것을 보여주며, 이러한 범주화가 진행되는 동안 일어나는 의미적 인출 경험이 관련된 일화 기억의 흔적에 질적인 영향을 미칠 수 있음을 시사한다.

Conditional Generative Adversarial Network(CGAN) 기반 협업 필터링 추천 시스템 (Conditional Generative Adversarial Network based Collaborative Filtering Recommendation System)

  • 강소이;신경식
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.157-173
    • /
    • 2021
  • 소비자의 욕구와 관심에 맞추어 개인화된 제품을 추천하는 추천 시스템은 비즈니스에 필수적인 기술로서의 그 중요성이 증가하고 있다. 추천 시스템의 대표적인 모형 중 협업 필터링은 우수한 성능으로 다양한 분야에서 활용되고 있다. 그러나 협업필터링은 사용자-아이템의 선호도 정보가 충분하지 않을 경우 성능이 저하되는 희소성의 문제가 있다. 또한 실제 평점 데이터의 경우 대부분 높은 점수에 데이터가 편향되어 있어 심한 불균형을 갖는다. 불균형 데이터에 협업 필터링을 적용할 경우 편향된 클래스에 과도하게 학습되어 추천 성능이 저하된다. 이러한 문제를 해결하기 위해 많은 선행연구들이 진행되어 왔지만 추가적인 외부 데이터 또는 기존의 전통적인 오버샘플링 기법에 의존한 추천을 시도하였기에 유용성이 떨어지고 추천 성능 측면에서 한계점이 있었다. 본 연구에서는 CGAN을 기반으로 협업 필터링 구현 시 발생하는 희소성 문제를 해결함과 동시에 실제 데이터에서 발생하는 데이터 불균형을 완화하여 추천의 성능을 높이는 것을 목표로 한다. CGAN을 이용하여 비어있는 사용자-아이템 매트릭스에 실제와 흡사한 가상의 데이터를 생성하여, 희소성을 가지고 있는 기존의 매트릭스로만 학습한 것과 비교했을 때 높은 정확도가 예상된다. 이 과정에서 Condition vector y를 이용하여 소수 클래스에 대한 분포를 파악하고 그 특징을 반영하여 데이터를 생성하였다. 이후 협업 필터링을 적용하고, 하이퍼파라미터 튜닝을 통해 추천 시스템의 성능을 최대화하는데 기여하였다. 비교 대상으로는 전통적인 오버샘플링 기법인 SMOTE, BorderlineSMOTE, SVM-SMOTE, ADASYN와 GAN을 사용하였다. 결과적으로 데이터 희소성을 가지고 있는 기존의 실제 데이터뿐만 아니라 기존 오버샘플링 기법들보다 제안 모형의 추천 성능이 우수함을 확인하였으며, RMSE, MAE 평가 척도에서 가장 높은 예측 정확도를 나타낸다는 사실을 증명하였다.