• 제목/요약/키워드: Rating Distribution

검색결과 270건 처리시간 0.026초

데이터거래 활성화를 위한 데이터상품가치 평가모델 연구 (Data Product Value Evaluation Method for Data Exchange Platform)

  • 김수진;이정현;박천웅
    • 한국콘텐츠학회논문지
    • /
    • 제21권12호
    • /
    • pp.34-46
    • /
    • 2021
  • 국내 데이터 거래시장은 구매데이터의 불합리한 가격책정이 데이터 거래 시의 주요 애로사항으로 지속적으로 언급되고 있다. 이는 상품정보 및 사용경험 부족으로 인해 데이터상품의 가치를 제대로 평가할 수 없는데서 발생한 문제로, 데이터 거래소는 거래활성화를 위해 가격 외에 수요자가 데이터상품의 가치를 종합적으로 판단할 수 있는 정보 제공이 필요하다. 데이터 가치평가에 주로 적용되는 원가기반, 수익기반, 시장기반 평가방법은 공급자 관점에서의 가치평가결과인 가격정보만 수요자와 공유가능하기 때문에 거래 및 유통을 활성화하기 위한 데이터가치평가방법으로는 부족한 점이 있다. 본 논문은 데이터거래 이해관계자(거래소, 공급자, 수요자)가 공통된 시각으로 데이터상품의 가치를 판단하고 공유할 수 있는 측정가능한 가치평가방법을 개발하는 것을 목표로 한다. 이를 위해 해외 데이터거래소 및 관련 연구에서 중요하게 생각하고 있는 데이터상품의 가치동인을 파악하고, 가치동인별로 정량적 측정이 가능한 평가방식을 도출하였다. 또한, 거래용 데이터상품을 활용하여 평점표 형식의 평가기준을 개발하고, 상대적 가치비교가 가능하도록 계층화분석(AHP)을 통해 가치평가지수를 개발하였다. 실제 데이터상품에 평가기준을 적용할 결과, 개별 데이터상품의 특성에 따라 가치평가값이 차별화됨에 따라 가치비교도구로 활용가능함을 알 수 있었다.

국내 인·허가 온열의료기기 기술 현황 조사 및 분석 (The Current State of Intended Equipment for Heating in Medical Use Based on Domestic Licensed Medical Devices)

  • 임수란;박정환;박지연;김송이
    • Korean Journal of Acupuncture
    • /
    • 제40권4호
    • /
    • pp.156-168
    • /
    • 2023
  • Objectives : This study aimed to determine the status of thermal stimulation devices approved in Korea for medical applications over the past 10 years, and based on this, to obtain insight for future thermal treatment in Korean medical institutions. Methods : We searched the item classification list entitled "Regulations on Medical Device Items and Rating by Item" from the Ministry of Food and Drug Safety Notice No. 2021-24, 2021 (Enforced March 19, 2021; www.mfds.go.kr) for individually licensed heaters using the terms "heat" and "heating". Results : We identified 17 items of thermal stimulation product group, of which 1,308 devices were licensed by February 4, 2022, and 53.2% of them (n=696) were devices with valid permits for distribution in Korea. Among the licensed devices, heating pad systems under/overlay (electric, home use) were approved the most, but combinational stimulator (for medical use, home use; Grade 2) accounted for the highest percentage among the current valid permission. Moxibustion apparatuses were licensed separately for electrical use and non-electrical use, and occupied a low percentage of the total devices. We analyzed 307 devices that were accompanied by technical documents and found that the heat sources were wires in 145 (47.2%), infrared rays in 44 (14.3%) and ultrasonic waves in 42 (13.7%) devices. Most (83.1%) devices were used for pain relief, while other applications included beauty, cancer treatment, maintenance of infant body temperature, and healing fractures. Conclusions : Thermal stimulation devices accounted for about 0.9% of all medical devices, and among them, combinational stimulators and heating pad systems under/overlay had the most valid permits. Thermal stimulation devices using heating wires and infrared rays were the most prevalent, and most were used to relieve pain. In order to develop a range of thermal stimulation devices that can be utilized in Korean medical institutions, it is imperative that they have potential applications beyond pain management, addressing various medical purposes. To achieve this, foundational research is necessary to effectively apply diverse heat sources based on medical objectives.

산악기상자료와 목재평형함수율에 기반한 산림연료습도 추정식 개발 (Modeling and mapping fuel moisture content using equilibrium moisture content computed from weather data of the automatic mountain meteorology observation system (AMOS))

  • 이훈택;원명수;윤석희;장근창
    • 한국지리정보학회지
    • /
    • 제22권3호
    • /
    • pp.21-36
    • /
    • 2019
  • 본 연구는 산불 위험 예측의 주요 인자인 10시간 사연료습도(10-h FMC)를 산악기상관측망 기상자료로 추정하는 방법을 마련하기 위해 수행되었다. 안성(도심지)과 홍릉 두 지점(숲 속, 숲 밖)의 자동기상관측소에서 기상인자와 10-h FMC를 측정하고 이를 이용해 10-h FMC 추정식을 도출했다. 도출한 추정식을 이용해 지난 6년간(2013~2018년) 산불발생 다발일의 10-h FMC를 분석하고 전국 10-h FMC 지도를 제작했다. 기상인자(기온, 풍속, 목재평형함수율, 강우량)와 10-h FMC의 회귀분석 결과 목재평형함수율이 가장 효율적으로 10-h FMC를 설명했음을 확인했다. 목재평형함수율을 이용해 도출한 10-h FMC 추정식은 모형 적합과 검증과정 모두에서 높은 적합도를 보였다. 각 연구지의 추정식을 서로 다른 연구지에 적용하면 모형의 적합도가 같은 연구지에서 만든 식을 적용했을 때보다 줄어들었지만 여전히 만족할 만한 결과를 보였다. 본 연구의 회귀식은 10-h FMC와 목재평형함수율 사이 강우 후 건조반응 차이와 식생 유무가 10-h FMC에 미치는 영향을 반영하지 못해 적합도가 줄어든 것으로 나타났다. 마지막으로 도출한 추정식을 사용한 공간분석을 통해 지난 6년간 산불발생 다발일의 산불 중 70% 이상이 10.5% 이하의 10-h FMC 조건에서 발생했음을 확인했다. 본 연구 결과는 산악기상관측망과 연계하여 전국 산지의 10-h FMC를 추정하는 데 사용할 수 있다. 10-h FMC는 산불 위험 예측 기초 연구 자료로 활용되어 재해 관련 국가 정책 결정에 기여할 것으로 판단된다.

영화 흥행에 영향을 미치는 새로운 변수 개발과 이를 이용한 머신러닝 기반의 주간 박스오피스 예측 (Development of New Variables Affecting Movie Success and Prediction of Weekly Box Office Using Them Based on Machine Learning)

  • 송정아;최근호;김건우
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.67-83
    • /
    • 2018
  • 2013년 누적인원 2억명을 돌파한 한국의 영화 산업은 매년 괄목할만한 성장을 거듭하여 왔다. 하지만 2015년을 기점으로 한국의 영화 산업은 저성장 시대로 접어들어, 2016년에는 마이너스 성장을 기록하였다. 영화산업을 이루고 있는 각 이해당사자(제작사, 배급사, 극장주 등)들은 개봉 영화에 대한 시장의 반응을 예측하고 탄력적으로 대응하는 전략을 수립해 시장의 이익을 극대화하려고 한다. 이에 본 연구는 개봉 후 역동적으로 변화하는 관람객 수요 변화에 대한 탄력적인 대응을 할 수 있도록 주차 별 관람객 수를 예측하는데 목적을 두고 있다. 분석을 위해 선행연구에서 사용되었던 요인 뿐 아니라 개봉 후 역동적으로 변화하는 영화의 흥행순위, 매출 점유율, 흥행순위 변동 폭 등 선행연구에서 사용되지 않았던 데이터들을 새로운 요인으로 사용하고 Naive Bays, Random Forest, Support Vector Machine, Multi Layer Perception등의 기계학습 기법을 이용하여 개봉 일 후, 개봉 1주 후, 개봉 2주 후 시점에는 차주 누적 관람객 수를 예측하고 개봉 3주 후 시점에는 총 관람객 수를 예측하였다. 새롭게 제시한 변수들을 포함한 모델과 포함하지 않은 모델을 구성하여 실험하였고 비교를 위해 매 예측시점마다 동일한 예측 요인을 사용하여 총 관람객 수도 예측해보았다. 분석결과 동일한 시점에 총 관람객 수를 예측했을 경우 보다 차주 누적 관람객 수를 예측하는 것이 더 높은 정확도를 보였으며, 새롭게 제시한 변수들을 포함한 모델의 정확도가 대부분 높았으며 통계적으로 그 차이가 유의함으로써 정확도에 기여했음을 확인할 수 있었다. 기계학습 기법 중에는 Random Forest가 가장 높은 정확도를 보였다.

광릉숲 내 봉선사천의 저서성 대형무척추동물의 군집 특성 및 생물학적 하천평가 (Community Characteristics and Biological Quality Assessment on Benthic Macroinvertebrates of Bongseonsa Stream in Gwangneung Forest, South Korea)

  • 정상우;조용찬;이황구
    • 한국환경생태학회지
    • /
    • 제31권6호
    • /
    • pp.508-519
    • /
    • 2017
  • 광릉숲 생물권보전지역은 오랜 기간 보전 관리된 희귀 생태계로서 생물다양성 변화 모니터링 및 보전 연구가 활발하게 수행되고 있다. 그러나 하천 건강성 평가 지표로서 저서성 대형무척추동물의 다양성과 군집 특성에 대한 연구는 찾아보기 어렵다. 본 연구는 2016년 4월부터 9월까지 광릉숲을 관통하는 봉선사천 및 인근 계류에 대한 하천평가를 위해 저서성 대형무척추동물의 군집분석을 수행하였다. 조사 결과, 저서성 대형무척추동물은 총 5문 8강 17목 56과 114종이 출현하였으며, 유수 지역에서 서식하는 하루살이목과 날도래목이 각각 30종(32.3%), 16종(17.2%)으로 다양성이 높았고, 오염된 하천에서 일반적으로 정착하는 실지렁이류(Tubificidae sp.), 개똥하루살이(Baetis fuscatus), 명주각다귀 KUa (Antocha KUa), 꼬마줄날도래(Cheumatopsyche brevilineata)의 출현빈도가 높게 나타났다. 섭식기능군에서는 모아먹는무리와 잡아먹는무리가 비교적 높게 출현하였고, 계류지역에서는 썰어먹는무리와 긁어먹는무리가 높게 나타났다. 서식기능군에서는 붙는무리와 굴파는무리가 우세하게 출현하였으며, 여울지역의 미소서식처 다양성을 대변하였다. 군집분석 결과, 우점도지수는 평균 $0.48{\pm}0.10$으로 분석되었으며, 광릉숲 계류의 GS 8에서 0.33으로 가장 낮게 나타났으며, 봉선사천 BS 1에서 가장 높게 나타났다. 다양도와 풍부도지수는 우점도지수와 반비례하여 나타났으며, 우점도가 낮은 GS 8의 다양도와 풍부도지수는 각각 2.53, 4.22로 나타났다. 하천의 군집안정성 분석 결과, 봉선사천은 저항력과 회복력이 높은 I특성군, 광릉숲 수계는 저항력과 회복력이 낮은 III특성군이 높은 것으로 나타나 광릉숲의 수계가 교란에 민감한 종들이 많이 분포하고 있는 것으로 분석되었다. 생물학적 수질평가에서는 저서성 대형무척추동물생태점수 $50.88{\pm}17.69$, 한국오수생물지수 $1.11{\pm}0.57$, 저서동물지수 $78.55{\pm}11.05$로 평가되었으며, 광릉숲 계류 GS 8에서 ESB (63점), KSI (0.55), BMI (89.9)로 가장 좋은 수환경과 수질 I등급인 최우선보호수역으로 나타났다. 그에 반에 봉선사천 BS 1에서는 ESB (25점), KSI (2.13), BMI (62.7)로 수질등급이 가장 낮은 III등급인 최우선개선수역으로 평가되었다. 전체적으로 광릉숲 내의 수계보다는 주변에 위치한 봉선사천의 수계에서 수서곤충의 다양성은 증가하는 것으로 나타났으나 과거 연도별 종구성의 군집구조는 뚜렷한 차이가 있는 것으로 나타났다.

AdaBoost 알고리즘기반 SVM을 이용한 부실 확률분포 기반의 기업신용평가 (Corporate Credit Rating based on Bankruptcy Probability Using AdaBoost Algorithm-based Support Vector Machine)

  • 신택수;홍태호
    • 지능정보연구
    • /
    • 제17권3호
    • /
    • pp.25-41
    • /
    • 2011
  • 최근 몇 년간 SVM(support vector machines)기법은 패턴인식 또는 분류의사결정문제를 위한 분석기법으로서 기존의 데이터마이닝 기법과 비교할 때, 매우 높은 성과를 갖는 것으로 인식되어 왔다. 더 나아나 많은 연구자들은 SVM기법이 1980년대 이후 대표적인 예측 및 분류모형으로 인정받은 인공신경망기법(ANNs : Artificial Neural Networks)에 비해 더 성과가 좋다는 사실을 실증적으로 입증해 왔다(Amendolia et al., 2003; Huang et al., 2004, Huang et al., 2005; Tay and Cao, 2001; Min and Lee, 2005; Shin et al., 2005; Kim, 2003). 일반적으로 이와 같이 다양한 데이터마이닝 기법에 의해 분석되는 이진분류 또는 다분류 의사결정문제들은 특히 금융분야 등에 있어서 오분류비용에 민감하며, 이로 인한 오분류의 경제적 손실도 상대적으로 매우 크다고 할 수 있다. 따라서 기업부도예측모형과 같은 이진분류모형의 결과값을, 부도확률에 기초하여 정교하게 계산된 사후확률의 개념으로서 다분류의 신용등급평가의 문제로 변환할 필요가 있다. 그러나, SVM 모형의 결과값은 기본적으로 그와 같은 부도확률분포를 보여주지 않는다. 따라서, 그러한 확률분포를 정교하게 보여줄 방법을 제시할 필요가 있다(Platt, 1999; Drish, 2001). 본 연구는 AdaBoost 알고리즘기반의 SVM 모형을 이용하여, 이진분류모형으로서 IT 기업의 부실예측모형에 적용한 후, 이 SVM 모형의 예측결과를 SVM의 손실함수에 적용하여 계산된 값을 사후부도확률의 정규분포 특성에 따라 이를 구간화하여 IT기업에 대한 다분류 신용등급 평가의 문제로 전환시키는 방법을 제시하였다. 그리고 본 연구에서 제안하는 방법은 이러한 AdaBoost 알고리즘기반 SVM 모형이 각 기업이 고유한 신용위험(부도확률)을 갖고 있다는 조건하에서, 신용등급부여를 위한 부도확률분포 구간을 정교하게 조정함으로써 오분류 문제를 좀 더 줄일 수 있음을 제시하였다.

자기공명분석기를 이용한 통증관리 (Clinical Study of Acute and Chronic Pain by the Application of Magnetic Resonance Analyser $I_{TM}$)

  • 박욱;진희철;조명현;윤석준;이진승;이정석;최석환;김성열
    • The Korean Journal of Pain
    • /
    • 제6권2호
    • /
    • pp.192-198
    • /
    • 1993
  • In 1984, a magnetic resonance spectrometer(magnetic resonance analyser, MRA $I_{TM}$) was developed by Sigrid Lipsett and Ronald J. Weinstock in the USA, Biomedical applications of the spectrometer have been examined by Dr. Hoang Van Duc(pathologist, USC), and Nakamura, et al(Japan). From their theoretical views, the biophysical functions of this machine are to analyse and synthesize a healthy tissue and organ resonance pattern, and to detect and correct an abnormal tissue and organ resonance pattern. All of the above functions are based on Quantum physics. The healthy tissue and organ resonance patterns are predetermined as standard magnetic resonance patterns by digitizing values based on peak resonance emissions(response levels or high pitched echo-sounds amplified via human body). In clinical practice, a counter or neutralizing resonance pattern calculated by the spectrometer can correct a phase-shifted resonance pattern(response levels or low pitched echo-sounds) of a diseased tissue and organ. By administering the counter resonance pattern into the site of pain and trigger point, it is possible to readjust the phase-shifted resonance pattern and then to alleviate pain through regulation of the neurotransmitter function of the nervous system. For assessing clinical effectiveness of pain relief with MRA $I_{TM}$ this study was designed to estimate pain intensity by the patient's subjective verbal rating scale(VRS such as graded to no pain, mild, moderate and severe) before application of it, to evaluate an amount of pain relief as applied the spectrometer by the patients subjective pain relief scale(visual analogue scale, VAS, 0~100%), and then to observe a continuation of pain relief following its application for managing acute and chronic pain in the 102 patients during an 8 months period beginning March, 1993. An application time of the spectrometer ranged from 15 to 30 minutes daily in each patient at or near the site of pain and trigger point when the patient wanted to be treated. The subjects consisted of 54 males and 48 females, with the age distribution between 23~40 years in 29 cases, 41~60 years in 48 cases and 61~76 years in 25 cases respectively(Table 1). The kinds of diagnosis and the main site of pain, the duration of pain before the application, and the frequency of it's application were recorded on the Table 2, 3 and 4. A distinction between acute and chronic pain was defined according to both of the pain intervals lasting within and over 3 months. The results of application of the spectrometer were noted as follows; In 51 cases of acute pain before the application, the pain intensities were rated mild in 10 cases, moderate in 15 cases and severe in 26 cases. The amounts of pain relief were noted as between 30~50% in 9 cases, 51~70% in 13 cases and 71~95% in 29 cases. The continuation of pain relief appeared between 6~24 hours in two cases, 2~5 days in 10 cases, 6~14 days in 4 cases, 15 days in one case, and completely relived of pain in 34 cases(Table 5~7). In 51 cases of chronic pain before the application, the pain intensities were rated mild in 12 cases, moderate in l8 cases and severe in 21 cases. The amounts of pain relief were noted as between 0~50% in 10 cases, 51~70% in 27 cases and 71~90% in 14 cases. The continuation of pain relief appeared to have no effect in two cases. The level of effective duration was between 6~12 hours in two cases, 2~5 days in 11 cases, 6~14 days in 14 cases, 15~60 days in 9 cases and in 13 cases the patient was completely relieved of pain(Table 5~7). There were no complications in the patients except a mild reddening and tingling sensation of skin while applying the spectrometer. Total amounts of pain relief in all of the subjects were accounted as poor and fair in 19(18.6%) cases, good in 40(39.2%) cases and excellent in 43(42.2%) cases. The clinical effectiveness of MRA $I_{TM}$ showed variable distributions from no improvements to complete relief of pain by the patient's assessment. In conclusion, we suggest that MRA $I_{TM}$ may be successful in immediate and continued pain relief but still requires several treatments for continued relief and may be gradually effective in pain relief while being applied repeatedly.

  • PDF

청소년 자존감 DAP 인물화 검사 개발 및 디지털화 측정 시스템 방향성 연구 (A study on developing a new self-esteem measurement test adopting DAP and drafting the direction of digitalizing measurement program of DAP)

  • 우성주;박종욱
    • 한국HCI학회논문지
    • /
    • 제8권1호
    • /
    • pp.1-9
    • /
    • 2013
  • 본 연구는 DAP(Draw A Person)를 적용한 청소년 자존감 측정 시스템을 개발하고, 디지털화 프로그램의 방향성을 제시하려는 데에 목적을 둔다. 자존감 측정에 있어서 대량 측정 방식에서는 놓치기 쉬운 개인의 내면적 상황 등을 반영하는 DAP 측정방식을 활용하여 효율성을 높이려는 의도이다. 또한 DAP 테스트가 가진 주관적 평가기준의 한계성을 극복하기 위해 Handler의 불안지수(anxiety index)에 의해 수치화된 인물화의 배점을 기준으로 디지털화를 시도하고자 한다. 이를 위해 2009년 6월 30일부터 10월 31일까지 4개월 동안 중학교 2학년 학생 73명(남: 28명, 여: 45명)을 대상으로 기존의 청소년 자존감 진단프로그램을 통해 얻었던 효과를 극대화하고, 더불어 정량적 데이터를 얻기 위해 DAP(Draw A Person)검사의 디지털화 측정시스템을 개발하고자 총 4단계를 걸쳐 실시하였다. 첫 번째 단계에서는 피실험자 73명 전원에게 자아가치관검사를 실시한 후, 자존감이 높은 그룹 36명과 낮은 그룹 37명을 선별하였다. 두 번째 단계에서는 위 두 그룹에게 MMPI검사를 통한 D(우울성), Pd(반사회성), Sc(분열성)항목의 검사결과를 기준으로 다시 자존감이 높은 그룹 7명과 자존감이 낮은 그룹 13명을 선별하였고, 세 번째 단계에는 최종 그룹 20명에게 DAP검사를 개별적으로 실시하였다. 이 검사들은 청소년의 특성을 최대한 반영하기 위해 실시한 것으로, 세 검사에서 서로 유사한 성격을 갖는 평가척도를 기준으로 자존감과의 관계를 비교 분석하여 디지털화 측정 프로그램 개발의 필요성과 방향성의 타당 정도를 검증하고자 하였다. 연구에서는 자존감이 높은 학생 2명과 낮은 학생 2명의 DAP검사를 샘플로 하여 추출된 결과를 비교분석하여, 기존 진단 프로그램이 가진 한계점을 개선할 수 있는지를 진단검사의 상호신뢰성 비교를 통해 확인하였다. 이를 바탕으로, 네 번째 단계에서는 정량적 방식의 접근성을 높이고 향상시킬 수 있는 디지털화 방법으로 전문가 시스템(Expert System)을 활용하였고, 그 결과 자존감 심리측정 검사결과에서 광범위하게 표현되었던 평가척도보다 구체적이고 개별적인 평가척도를 얻을 수 있는 가능성을 확인할 수 있었다. 본 연구에서 제시하는 DAP검사의 디지털화 측정프로그램은 앞 단계의 검사와 진단을 바탕으로 진행시켜 신뢰성을 높였다.

  • PDF

영역별 맞춤형 감성사전 구축을 통한 영화리뷰 감성분석 (Sentiment analysis on movie review through building modified sentiment dictionary by movie genre)

  • 이상훈;최정;김종우
    • 지능정보연구
    • /
    • 제22권2호
    • /
    • pp.97-113
    • /
    • 2016
  • 인터넷상의 데이터가 급속하게 증가함에 따라 막대한 양의 데이터를 목적에 맞게 적절히 활용하는 빅데이터 분석이 활발하게 진행되고 있다. 최근에는 기존의 정형 데이터분석이 가진 한계점을 보완하는 방법으로 비정형 데이터 분석 분야 중 하나인 텍스트마이닝 기법에 대한 연구들이 다수 이루어지고 있으며, 특히 텍스트를 기반으로 문장의 긍정, 부정을 판별하고 분류하는 감성분석과 관련된 연구들이 활발하게 이루어지고 있다. 이러한 연구의 연장선 상에서, 본 연구는 감성분석에 사용되는 감성사전을 데이터의 특성에 맞게 적절하게 변형하여 구축하는 방법을 시도하였다. 데이터가 속한 영역의 특성을 고려하지 않은 기존의 범용 감성사전을 감성분석에 사용할 경우, 해당 영역에서 쓰이는 단어 또는 감정 표현을 반영하지 못하므로 감성분석의 정확성이 떨어질 수 있다. 따라서 감성분석에 있어서 영역 맞춤형 감성사전의 사용 시 데이터 영역의 특성을 정확하게 반영해 분석의 정확성을 높여줄 것으로 기대할 수 있다. 본 연구에서는 영화 리뷰 데이터를 분석 대상으로 선정하였으며, 대표적 영화정보 사이트 IMDb에서 발생된 약 2년간의 영화리뷰 데이터를 수집 분석하였다. 분석에 앞서 영화 장르별 사용되는 단어의 의미가 각각 다를 것을 고려하여 영화를 '액션', '애니메이션', '코메디', '드라마', '공포', '과학공상' 6개 장르로 분류했다. 맞춤형 감성사전 구축을 위한 핵심 기법으로 SO-PMI(Semantic Orientation from Point-wise Mutual Information)를 활용하였으며, 어휘 간 극성이 뚜렷하게 구분되는 형용사에 한정하여 연구를 진행했다. 분석결과 맞춤형사전을 활용한 감성분석 예측정확도는 영화 장르별로 상이했다. '애니메이션'을 제외한 5개 장르에서 기존의 범용 감성사전대비 맞춤형 감성사전의 예측정확도가 통계적으로 유의한 수준의 성능 향상을 보였다. 본 연구에서는 데이터 영역의 특성에 맞는 맞춤형 사전 구축을 통한 감성분석의 예측의 성능 향상을 확인하였다. 향후 감성사전 구축 시 동사, 부사 등 다양한 품사의 어휘를 추가하여 감성분석 예측정확도를 높이는 방안을 모색할 수 있을 것이다.

Conditional Generative Adversarial Network(CGAN) 기반 협업 필터링 추천 시스템 (Conditional Generative Adversarial Network based Collaborative Filtering Recommendation System)

  • 강소이;신경식
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.157-173
    • /
    • 2021
  • 소비자의 욕구와 관심에 맞추어 개인화된 제품을 추천하는 추천 시스템은 비즈니스에 필수적인 기술로서의 그 중요성이 증가하고 있다. 추천 시스템의 대표적인 모형 중 협업 필터링은 우수한 성능으로 다양한 분야에서 활용되고 있다. 그러나 협업필터링은 사용자-아이템의 선호도 정보가 충분하지 않을 경우 성능이 저하되는 희소성의 문제가 있다. 또한 실제 평점 데이터의 경우 대부분 높은 점수에 데이터가 편향되어 있어 심한 불균형을 갖는다. 불균형 데이터에 협업 필터링을 적용할 경우 편향된 클래스에 과도하게 학습되어 추천 성능이 저하된다. 이러한 문제를 해결하기 위해 많은 선행연구들이 진행되어 왔지만 추가적인 외부 데이터 또는 기존의 전통적인 오버샘플링 기법에 의존한 추천을 시도하였기에 유용성이 떨어지고 추천 성능 측면에서 한계점이 있었다. 본 연구에서는 CGAN을 기반으로 협업 필터링 구현 시 발생하는 희소성 문제를 해결함과 동시에 실제 데이터에서 발생하는 데이터 불균형을 완화하여 추천의 성능을 높이는 것을 목표로 한다. CGAN을 이용하여 비어있는 사용자-아이템 매트릭스에 실제와 흡사한 가상의 데이터를 생성하여, 희소성을 가지고 있는 기존의 매트릭스로만 학습한 것과 비교했을 때 높은 정확도가 예상된다. 이 과정에서 Condition vector y를 이용하여 소수 클래스에 대한 분포를 파악하고 그 특징을 반영하여 데이터를 생성하였다. 이후 협업 필터링을 적용하고, 하이퍼파라미터 튜닝을 통해 추천 시스템의 성능을 최대화하는데 기여하였다. 비교 대상으로는 전통적인 오버샘플링 기법인 SMOTE, BorderlineSMOTE, SVM-SMOTE, ADASYN와 GAN을 사용하였다. 결과적으로 데이터 희소성을 가지고 있는 기존의 실제 데이터뿐만 아니라 기존 오버샘플링 기법들보다 제안 모형의 추천 성능이 우수함을 확인하였으며, RMSE, MAE 평가 척도에서 가장 높은 예측 정확도를 나타낸다는 사실을 증명하였다.