• Title/Summary/Keyword: predicting method

검색결과 2,782건 처리시간 0.033초

다양한 강우강도 및 패턴에 따른 WEPP 모형의 유출‧첨두유출‧토양유실량 평가 (Evaluation of Runoff‧Peak Rate Runoff and Sediment Yield under Various Rainfall Intensities and Patterns Using WEPP Watershed Model)

  • 최재완;류지철;김익재;임경재
    • 한국수자원학회논문집
    • /
    • 제45권8호
    • /
    • pp.795-804
    • /
    • 2012
  • 최근 강우강도 및 패턴이 변화함에 따라 전세계적으로 토양유실이 증가하고 있다. 그 결과, 수생태계 건전성이 악화되고, 농업작물이 피해를 입어 수확량이 감소된다. 그동안 유출 및 토양유실을 예측하거나 비점오염원을 감소시키는 연구가 많이 수행되어 왔다. USLE는 수년간 토양유실을 산정하는데 사용되어왔으나, 강우강도나 패턴변화를 적용하기에는 적절하지 못했다. 물리적 기반인 WEPP 모형은 다양한 강우강도 및 패턴변화를 적용하는데 적절하다. 본 연구에서는 WEPP 모형을 이용하여 Huff의 4분위, 다양한 강우간격, 설계강우에 따른 토양유실, 유출, 첨두유출을 산정하였다. 5분간격 강우 데이터와 60분 간격 강우 데이터를 비교한 결과 토양유실은 24%, 유출은19%, 첨두유출은 16%가 차이나는 것으로 나타났다. 유출 및 토양유실이 5분 간격 강우량에서 실측치와 가장 유사한 것으로 나타나 강우데이터의 간격이 짧을수록 더 정확하게 모의할 수 있는 것으로 나타났다. Huff의 4분위를 이용하여 토양유실량, 유출량, 첨두유출량을 산정한 결과 토양유실량, 유출량, 첨두유출량 모두 3분위에서 가장 높게 발생하는 것으로 나타났다. 강원도 홍천지역 빈도별 확률강우를 이용하여 토양유실량, 유출량, 첨두유출량의 변화를 모의하였다. 2년 빈도와 300년 빈도에서 강우량은 167% 증가하였다. 유사량과 유출량, 첨두유출량은 각각 906.2%, 249.4%, 183.9% 증가하여 유사량의 증가율이 가장 큰 것으로 나타났다. 본 연구의 결과에서 보이는 바와 같이 WEPP 모형을 이용하여 향후 기후변화에 따른 유출 및 토양유실의 예측이 가능할 것으로 판단된다.

추천시스템의 효과적 도입을 위한 소셜네트워크 분석 (Social Network Analysis for the Effective Adoption of Recommender Systems)

  • 박종학;조윤호
    • 지능정보연구
    • /
    • 제17권4호
    • /
    • pp.305-316
    • /
    • 2011
  • 협업필터링은 다양한 분야에서 널리 활용되고 있지만 협업필터링의 추천 성능은 적용하는 기업의 비즈니스 형태나 발생하는 거래 데이터의 특성에 따라 다르게 나타나고 있다. 기업에서 협업필터링 추천시스템을 구축하려면 상당한 시간과 비용이 소요되기 때문에 구축된 추천시스템의 성과가 높지 않다면 기업 자원의 낭비를 초래할 뿐만 아니라 부정확한 추천서비스를 받는 고객들의 불만을 살 수 있다. 따라서 추천시스템 도입을 검토할 때 기업이 갖고 있는 데이터의 특성을 파악하고 이를 통해 추천시스템을 도입하는 것이 타당한지 사전에 예측할 수 있다면 불필요한 도입으로 인한 경제적 손실과 고객 만족도 저하를 막을 수 있을 것이다. 기존 연구에서는 협업필터링 추천 성과에 희박성, 우연성, 커버리지 등이 영향을 미칠 수 있다고 설명하고 있지만 이러한 요인들이 어떻게 얼마나 추천 성과에 영향을 미치는지, 요인들 간에 어떠한 상관관계가 있는지는 현재까지 구체적으로 밝혀진 바가 없다. 본 연구에서는 구매 트랜잭션으로부터 생성된 소셜네트워크로부터 밀도, 군집화계수, 집중도 등의 구조적 지표를 측정한 후 이들이 추천성과에 어떻게 영향을 미치는지 통계적 분석을 통해 실증적으로 규명한다. 이를 통해 협업필터링 추천시스템에 대한 도입 여부를 결정하고자 할 때 유용하게 사용될 수 있는 지침을 제공하고자 한다.

청소년 비행행동 측정도구 개발 (DEVELOPMENT OF SCALE FOR MEASURING DELINQUENT BEHAVIOR)

  • 김현실;김헌수
    • Journal of the Korean Academy of Child and Adolescent Psychiatry
    • /
    • 제11권1호
    • /
    • pp.79-90
    • /
    • 2000
  • 연구 목적:본 연구는 요인분석을 통하여 한국 청소년의 비행행동 유형을 분류하고, 청소년 비행행동을 조기에 평가하기 위한 측정도구 개발을 위한 연구이다. 방 법:서울 및 지방의 소아·청소년 정신과 외래 방문청소년 4명, 소년원, 분류심사원의 재소청소년 4명과, 중 ${\cdot}$ 고교에 재학중인 학생청소년 4명, 총 12명을 대상으로 실시한 개인면담 내용과 관련문헌 고찰을 근거로 총 31개 문항으로 구성된 예비도구를 작성하였다. 다음 단계로 본 예비도구에 대한 신뢰도와 타당도를 검증하였는데 도구의 타당도 검증은 전문가집단에 의한 내용타당도와 요인분석을 통한 구성타당도를 검증하였으며, 신뢰도 검증은 검사-재검사 신뢰도, 내적 일관성 정도 및 각 문항과 요인과의 상관계수를 조사하였다. 이상의 검증과정을 통하여 31개 문항이 모두 청소년 비행행동 평가를 위한 최종 도구로 확정되었다. 마지막으로 실제 상황에서의 최종도구의 변별력 정도를 확인하기 위하여 학생청소년군과 비행청소년군총 2,177명을 대상으로 본 도구를 이용한 설문조사를 실시한 후 t 검정을 하였다. 결 과:1) 최종확정된 도구는 총 31개 문항 3개 요인으로 구성되어 있으며 이들 요인들의 총설명변량은 52.2%였다. 또한 31개 문항들은 모두 각 요인에 .40이상의 유의한 적재량을 보였다. 2) 3개요인 중 요인 I 은 반사회적 비행행동으로 명명하였고 총 17개문항으로 구성되어 있으며, 요인 II는 공격적 비행행동으로 총 8개문항, 그리고 요인 III은 정신병질적 비행행동으로 총 6개 문항으로 구성되어 있다. 3) 본 도구의 총 31개 문항의 신뢰도는 Cronbach Coefficient Alpha값이 .952였으며, 각 요인별 신뢰도 는 요인 Ⅰ이 .950, 요인 II가 .866, 그리고 요인 III이 .721이었다. 4) 본 도구의 변별력을 확인하기 위하여 학생청소년군과 비행청소년군을 대상으로 실시한 요인별 차이검정 결과 요인 Ⅰ, 요인 II, 요인 III 및 전체 문항 모두에서 학생청소년군과 비행청소년군간에 유의한 차이가 있었다. 결 론:1) 본 연구를 통해 개발된 도구를 다른 대상자에게 반복 적용하여 연구함으로써 계속적인 신뢰도와 타당도 검증이 필요하다. 2) 이상적인 도구평가기준은 신뢰도와 타당도 뿐만 아니라 단순성, 효율성, 객관성 등까지도 고려되어져야 한다는 관점에서 볼 때, 본 도구는 지속적인 수정 보완 작업이 필요하며 이 과정을 통하여 보다 완전한 도구가 될 수 있으리라 추론된다. 3) 본 도구를 적용하여 한국청소년의 비행행동 유형이 어떤 것인지를 파악하고 이와 관련된 치료적 접근, 비행가능 청소년에 대한 사전 평가 척도까지도 연구 개발할 수 있다고 본다.

  • PDF

인터벤션에서 Calibration Mode에 대한 오차율 비교 (Comparison on the Error Rates of Calibration Modes in Intervention)

  • 공창기;류영환
    • 한국방사선학회논문지
    • /
    • 제14권5호
    • /
    • pp.619-626
    • /
    • 2020
  • 이 연구의 목적은 경피적 혈관내 풍선 확장술이나 스텐트 삽입술에서 Balloon이나 Stent의 직경 및 길이를 예측 할 때 사용되는 정량적인 평가 도구인 Calibration Mode중 Catheter Calibration Mode, Auto Calibration Mode 그리고 Segment Calibration Mode에서의 오차율에 대해 알아보고자 하였다. Calibration의 정량적인 평가를 위해 정교하게 제작된 직경 × 길이(2 mm × 80 mm) Copper Wire와 5, 10, 15, 30, 40 mm의 Metal Ball을 이용하여 실험하였고, 아크릴 팬텀은 25 mm, 50 mm, 75mm, 100 mm, 125 mm, 150mm, 175 mm, 200 mm로 하여 각각의 높이에서 혈관조영 촬영장치로 Subtraction 영상을 획득하여 장비 회사에서 제공하는 소프트웨어인 Stenosis Analysis Tools을 이용하여 측정하였다. Catheter Calibration Mode에서의 오차율을 평가하기 위한 방법으로 Copper Wire를 각각의 아크릴 팬텀위에 올려놓고 촬영하였으며, Copper Wire 직경 2 mm를 Catheter의 직경으로 Setting하였고, 길이 8 mm Copper Wire의 길이를 Multi-segments로 측정하여 분석한 결과 1.13 ~ 5.63%의 오차율이 나타났다. Auto Calibration Mode에서의 오차율을 평가하기 위한 방법으로 각각의 아크릴 팬텀을 높이에서 아크릴 높이에 대한 수치를 입력하고, 8 mm Copper Wire의 길이를 Multi-segments 측정하여 분석한 결과 0 ~ 0.26%의 오차율이 나타났다. Segment Calibration Mode에서의 오차율을 평가하기 위한 방법으로 테이블 바닥에 있는 각각의 Metal Ball을 각각 Calibration하고, 각각의 아크릴 팬텀 위에 올려 있는 8 mm Copper Wire의 길이를 측정하여 아크릴 팬텀 높이 변화에 대한 8 mm Copper Wire 길이를 Mutli-segments 측정하여 분석한 결과 1.05 ~ 19.04%의 오차율이 나타났다. 그리고 Auto Calibration Mode에서 OID 변화에 대한 실험은 아크릴 팬텀의 높이는 100mm로 고정하고 OID만 450 mm ~ 600 mm로 변화를 하였을때 오차율은 0.13 ~ 0.38%로 나타났다. 결론적으로 소프트웨어에서 제공하는 정량적인 혈관의 치수평가를 하기 위한 이들 Calibration Mode 중 Auto Calibration Mode에서 높이 값을 입력하는 것이 오차율이 가장 적은 Calibration 방법임을 확인하였으며, Metal ball이나 기타 다른 물체를 이용하여 Calibration을 하기 위해서는 시술부위와 동등한 높이에 놓고 Calibration을 하는 방법이 오차율을 가장 줄일 수 있는 방법으로 사료된다.

다양한 다분류 SVM을 적용한 기업채권평가 (Corporate Bond Rating Using Various Multiclass Support Vector Machines)

  • 안현철;김경재
    • Asia pacific journal of information systems
    • /
    • 제19권2호
    • /
    • pp.157-178
    • /
    • 2009
  • Corporate credit rating is a very important factor in the market for corporate debt. Information concerning corporate operations is often disseminated to market participants through the changes in credit ratings that are published by professional rating agencies, such as Standard and Poor's (S&P) and Moody's Investor Service. Since these agencies generally require a large fee for the service, and the periodically provided ratings sometimes do not reflect the default risk of the company at the time, it may be advantageous for bond-market participants to be able to classify credit ratings before the agencies actually publish them. As a result, it is very important for companies (especially, financial companies) to develop a proper model of credit rating. From a technical perspective, the credit rating constitutes a typical, multiclass, classification problem because rating agencies generally have ten or more categories of ratings. For example, S&P's ratings range from AAA for the highest-quality bonds to D for the lowest-quality bonds. The professional rating agencies emphasize the importance of analysts' subjective judgments in the determination of credit ratings. However, in practice, a mathematical model that uses the financial variables of companies plays an important role in determining credit ratings, since it is convenient to apply and cost efficient. These financial variables include the ratios that represent a company's leverage status, liquidity status, and profitability status. Several statistical and artificial intelligence (AI) techniques have been applied as tools for predicting credit ratings. Among them, artificial neural networks are most prevalent in the area of finance because of their broad applicability to many business problems and their preeminent ability to adapt. However, artificial neural networks also have many defects, including the difficulty in determining the values of the control parameters and the number of processing elements in the layer as well as the risk of over-fitting. Of late, because of their robustness and high accuracy, support vector machines (SVMs) have become popular as a solution for problems with generating accurate prediction. An SVM's solution may be globally optimal because SVMs seek to minimize structural risk. On the other hand, artificial neural network models may tend to find locally optimal solutions because they seek to minimize empirical risk. In addition, no parameters need to be tuned in SVMs, barring the upper bound for non-separable cases in linear SVMs. Since SVMs were originally devised for binary classification, however they are not intrinsically geared for multiclass classifications as in credit ratings. Thus, researchers have tried to extend the original SVM to multiclass classification. Hitherto, a variety of techniques to extend standard SVMs to multiclass SVMs (MSVMs) has been proposed in the literature Only a few types of MSVM are, however, tested using prior studies that apply MSVMs to credit ratings studies. In this study, we examined six different techniques of MSVMs: (1) One-Against-One, (2) One-Against-AIL (3) DAGSVM, (4) ECOC, (5) Method of Weston and Watkins, and (6) Method of Crammer and Singer. In addition, we examined the prediction accuracy of some modified version of conventional MSVM techniques. To find the most appropriate technique of MSVMs for corporate bond rating, we applied all the techniques of MSVMs to a real-world case of credit rating in Korea. The best application is in corporate bond rating, which is the most frequently studied area of credit rating for specific debt issues or other financial obligations. For our study the research data were collected from National Information and Credit Evaluation, Inc., a major bond-rating company in Korea. The data set is comprised of the bond-ratings for the year 2002 and various financial variables for 1,295 companies from the manufacturing industry in Korea. We compared the results of these techniques with one another, and with those of traditional methods for credit ratings, such as multiple discriminant analysis (MDA), multinomial logistic regression (MLOGIT), and artificial neural networks (ANNs). As a result, we found that DAGSVM with an ordered list was the best approach for the prediction of bond rating. In addition, we found that the modified version of ECOC approach can yield higher prediction accuracy for the cases showing clear patterns.

메탄발효와 퇴비화 공정이 연계된 가축분뇨 처리시설에서 발생되는 악취물질 특성 조사 (Characteristic of Odorous Compounds Emitted from Livestock Waste Treatment Facilities Combined Methane Fermentation and Composting Process)

  • 고한종;김기연;김현태;고문석;히구치 다카시;우메다 미키오
    • Journal of Animal Science and Technology
    • /
    • 제50권3호
    • /
    • pp.391-400
    • /
    • 2008
  • 악취는 이웃주민들로 하여금 민원을 유발시키는 주요 원인이기 때문에 악취관리는 지속가능한 축산과 매우 밀접한 관계가 있다. 본 연구는 메탄발효와 퇴비화 공정이 연계된 가축분뇨 처리시설에서 각 공정별로 기기분석과 직접 관능법을 병행하여 악취 물질의 농도, 악취 강도 및 악취 불쾌도를 측정하고자 수행하였으며, 하계와 동계로 구분하여 처리 공정과 부지경계선에서 각각 암모니아, 황화합물 및 휘발성 저급지방산의 농도를 분석하였다. 높은 외기온에 기인하여 하계의 악취농도가 동계보다 높은 것으로 나타났다. 공정별로는 혼합된 분뇨를 교반하는 퇴비화 공정에서 악취 농도가 가장 높게 검출되었으며, 분뇨 투입조, 퇴비 후숙조, 분뇨 유출조 및 퇴비 선별과 포장 공정의 순으로 악취 농도가 낮았다. 검출된 악취 물질 중 가장 높은 농도는 암모니아로 3.4에서 224.7 ppm의 농도 범위로 분석되었다. 황화합물 중에서는 황화수소가 가장 높은 농도인 2.3 ppm인 것으로 분석되었으며, 대부분의 황화합물 농도가 기존에 보고된 최소감지한계농도를 초과하는 것으로 측정되었다. 또한 아세트산은 휘발성 저급지방산 가운데 51에서 89%로 가장 놓은 비율을 차지하고 있으며, 다음으로는 프로피온산과 부트르산이 각각 1.9에서 35% 및 1.8에서 15%의 비율을 보이는 것으로 나타났다. 처리공정에서 발생되는 주요 악취원인 물질을 예측하고자 각각의 공정에서 측정된 악취물질의 농도를 최소감지한계농도로 나누어 악취농도지수를 계산하였다. 그 결과 퇴비화 공정에서는 황화수소, 암모니아, 황화메틸 및 메틸머캅탄이 악취원인 물질로 밀접한 연관이 있는 것으로 나타났으며, 분뇨 투입조에서는 황화수소, 메틸머캅탄 및 부트르산이 주요 악취물질인 것으로 나타났다.

소비자 감성 분석 기반의 음악 추천 알고리즘 개발 (Development of Music Recommendation System based on Customer Sentiment Analysis)

  • 이승준;서봉군;박도형
    • 지능정보연구
    • /
    • 제24권4호
    • /
    • pp.197-217
    • /
    • 2018
  • 음악은 인간의 감성을 소리로 표현하는 창조적 예술 행위이다. 음악은 사람들의 기분을 우울하게 혹은 기쁘게 변화시킬 수 있다. 따라서 음악을 감상하는 데 있어 감성은 소비자에게 적합한 음악을 찾고 들려주는 데 매우 중요한 요소인데, 다양한 음원 서비스에서 제공하는 추천 알고리즘은 사용자의 기본적인 정보(성별, 나이, 감상 횟수 등)와 사용자의 플레이 기록에 기반한 음악 추천 방식을 주로 사용하고 있다. 본 연구에서는 음악을 감상하는 개인의 감성을 고려하여 각 음원이 가지는 고유의 감성을 기본으로 한 음악 추천 알고리즘을 제안해 보고자 한다. 구체적으로, 사용자들이 자주 듣는 음악과 그렇지 않은 음악을 기준으로 '감정 패턴'을 추출 후 상관관계를 확인하고자 하며, 앞선 결과를 기반으로 사용자들이 원하는 노래에 대한 검색과 사용자 감성 기반 추천 방법을 도출해내보고자 한다. 이를 위해 본 연구에서는 사례기반추론 기법을 이용하여 사람들이 주로 듣는 음악과 비슷한 '감성 패턴'을 갖는 특정한 곡을 추천해주는 알고리즘을 개발하였다. 먼저, 분석에 필요한 감정 형용사를 정리하여 변수화 시키고, 의미 있는 것끼리 묶어 음악 감성지수를 개발하였고, 분석의 대상이 될 음원에 대해 고유의 감성지수 점수를 측정하였다. 마지막으로 도출된 점수의 결과를 통해 유사한 감정 패턴이 나오는 곡들을 유사 곡 리스트로 분류하고 사용자들에게 추천하는 과정을 거친다. 앞선 일련의 과정을 거처 도출된 결과는 음원 추천 시스템뿐만 아니라, 인기 있는 곡과 아닌 곡에 영향을 미치는 변수 도출 및 음원 출시 전, 해당 곡의 스트리밍 수 예측 모형 구축 등 다양한 용도로 사용될 수 있을 것으로 기대한다.

조건부 생성모델을 이용한 강수 패턴에 따른 지하수위 생성 및 이의 활용에 관한 연구 (The Applicability of Conditional Generative Model Generating Groundwater Level Fluctuation Corresponding to Precipitation Pattern)

  • 정지호;정진아;이병선;송성호
    • 자원환경지질
    • /
    • 제54권1호
    • /
    • pp.77-89
    • /
    • 2021
  • 본 연구에서는 Jeong et al. (2020)의 연구에서 수행된 지하수위 변동 패턴의 저차원 특징추출 과정의 문제점을 분석하고, 이에 대한 개선방안이 제안된다. 해당 연구에서는 Denoising autoencoder (DAE)를 이용해 전국의 연 단위 지하수위 변동 자료로부터 저차원 특징이 추출되며, 추출된 자료를 이용해 대수층의 수리 특성값을 예측하는 회귀 모델이 개발되었다. 그러나 특정 지역의 연도별 강수 패턴이 달라질 경우, 지하수위 변동 패턴 및 저차원 특징 또한 달라지며, 이에 따라 동일 지역임에도 불구하고 저차원 특징으로부터 추정되는 수리 특성값이 다양하게 나타날 수 있다. 이러한 문제를 해결하기 위해, 본 연구에서는 조건부 생성 모델인 Conditional variational autoencoder (CVAE)를 이용하였으며, 전국 71개 지역에서 10년 동안 획득된 지하수위 자료와 강수 자료 간 상관관계가 학습되었다. 학습된 모델을 통해 모든 지역에 대해 동일 강수 조건이 적용될 때의 지하수위 자료가 생성되었으며, 생성된 지하수위 자료로부터 저차원 특징이 추출되었다. CVAE를 이용해 동일 강수 조건으로 생성된 지하수위 자료의 저차원 특징과 기존 DAE를 통해 추출된 저차원 특징이 비교되었으며, 그 결과 CVAE를 이용해 추출된 저차원 특징 간 거리가 저차원 공간상에서 보다 가깝게 분포하는 것이 확인되었다. 따라서 제안된 방법을 이용할 경우 대수층 특성에만 영향을 받는 지역별 지하수위 자료 및 저차원 특징이 효과적으로 추출될 수 있으며, 이를 통해 기존 개발된 회귀 모델의 성능이 개선될 수 있을 것으로 판단된다.

일반화 적응 심층 잠재요인 추천모형 (A Generalized Adaptive Deep Latent Factor Recommendation Model)

  • 김정하;이지평;장성현;조윤호
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.249-263
    • /
    • 2023
  • 대표적인 추천 시스템 방법론인 협업 필터링(Collaborative Filtering)에는 이웃기반 방법(Neighbor Methods)과 잠재 요인 모델(Latent Factor model)이라는 두 가지 접근법이 있다. 이중 행렬 분해(Matrix Factorization)를 이용하는 잠재 요인 모델은 사용자-아이템 상호작용 행렬을 두 개의 보다 낮은 차원의 직사각형 행렬로 분해하고 이들의 행렬 곱으로 아이템의 평점(Rating)을 예측한다. 평점 패턴으로부터 추출된 요인 벡터들을 통해 사용자와 아이템 속성을 포착할 수 있기 때문에 확장성, 정확도, 유연성 측면에서 이웃기반 방법보다 우수하다고 알려져 있다. 하지만 평점이 지정되지 않은 아이템에 대해서는 선호도가 다른 개개인의 다양성을 반영하지 못하는 근본적인 한계가 있고 이는 반복적이고 부정확한 추천을 초래하게 된다. 이러한 잠재요인 모델의 한계를 개선하고자 각각의 아이템 별로 사용자의 선호도를 적응적으로 학습하는 적응 심층 잠재요인 모형(Adaptive Deep Latent Factor Model; ADLFM)이 등장하였다. ADLFM은 아이템의 특징을 설명하는 텍스트인 아이템 설명(Item Description)을 입력으로 받아 사용자와 아이템의 잠재 벡터를 구하고 어텐션 스코어(Attention Score)를 활용하여 개인의 다양성을 반영할 수 있는 방법을 제시한다. 하지만 아이템 설명을 포함하는 데이터 셋을 요구하기 때문에 이 방법을 적용할 수 있는 대상이 많지 않은 즉 일반화에 있어 한계가 있다. 본 연구에서는 아이템 설명 대신 추천시스템에서 보편적으로 사용하는 아이템 ID를 입력으로 하고 Self-Attention, Multi-head attention, Multi-Conv1d 등 보다 개선된 딥러닝 모델 구조를 적용함으로써 ADLFM의 한계를 개선할 수 있는 일반화된 적응 심층 잠재요인 추천모형 G-ADLFRM을 제안한다. 다양한 도메인의 데이터셋을 가지고 입력과 모델 구조 변경에 대한 실험을 진행한 결과, 입력만 변경했을 경우 동반되는 정보손실로 인해 ADLFM 대비 MAE(Mean Absolute Error)가 소폭 높아지며 추천성능이 하락했지만, 처리할 정보량이 적어지면서 epoch 당 평균 학습속도는 대폭 향상되었다. 입력 뿐만 아니라 모델 구조까지 바꿨을 경우에는 가장 성능이 우수한 Multi-Conv1d 구조가 ADLFM과 유사한 성능을 나타내며 입력변경으로 인한 정보손실을 충분히 상쇄시킬 수 있음을 보여주었다. 결론적으로 본 논문에서 제시한 모형은 기존 ADLFM의 성능은 최대한 유지하면서 빠른 학습과 추론이 가능하고(경량화) 다양한 도메인에 적용할 수 있는(일반화) 새로운 모형임을 알 수 있다.

인구통계특성 기반 디지털 마케팅을 위한 클릭스트림 빅데이터 마이닝 (Clickstream Big Data Mining for Demographics based Digital Marketing)

  • 박지애;조윤호
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.143-163
    • /
    • 2016
  • 인구통계학적 정보는 디지털 마케팅의 핵심이라 할 수 있는 인터넷 사용자에 대한 타겟 마케팅 및 개인화된 광고를 위해 고려되는 가장 기초적이고 중요한 정보이다. 하지만 인터넷 사용자의 온라인 활동은 익명으로 행해지는 경우가 많기 때문에 인구통계특성 정보를 수집하는 것은 쉬운 일이 아니다. 정기적인 설문 조사를 통해 사용자들의 인구통계특성 정보를 수집할 수도 있지만 많은 비용이 들며 허위 기재 등과 같은 위험성이 존재한다. 특히, 모바일 환경에서는 대부분의 사용자들이 익명으로 활동하기 때문에 인구통계특성 정보를 수집하는 것은 더욱 더 어려워지고 있다. 반면, 인터넷 사용자의 온라인 활동을 기록한 클릭스트림 데이터는 해당 사용자의 인구통계학적 정보에 활용될 수 있다. 특히, 인터넷 사용자의 온라인 행위 특성 중 하나인 페이지뷰는 인구통계학적 정보 예측에 있어서 중요한 요인이 된다. 본 연구에서는 기존 선행 연구를 토대로 클릭스트림 데이터 분석을 통해 인터넷 사용자의 온라인 행위 특성을 추출하고 이를 해당 사용자의 인구통계학적 정보 예측에 사용한다. 또한, 1)의사결정나무를 이용한 변수 축소, 2)주성분분석을 활용한 차원축소, 3)군집분석을 활용한 변수축소의 방법을 제안하고 실험에 적용함으로써 많은 설명변수를 이용하여 예측 모델 생성 시 발생하는 차원의 저주와 과적합 문제를 해결하고 예측 모델의 정확도를 높이고자 하였다. 실험 결과, 범주의 수가 많은 다분형 종속변수에 대한 예측 모델은 모든 설명변수를 사용하여 예측 모델을 생성했을 때보다 본 연구에서 제안한 방법론들을 적용했을 때 예측 모델에 대한 정확도가 향상됨을 알 수 있었다. 본 연구는 클릭스트림 분석을 통해 추출된 인터넷 사용자의 온라인 행위는 해당 사용자의 인구통계학적 정보 예측에 활용 가능하며, 예측된 익명의 인터넷 사용자들에 대한 인구통계학적 정보를 디지털 마케팅에 활용 할 수 있다는데 의의가 있다. 또한, 제안 방법론들을 통해 어느 종속변수에 대해 어떤 방법론들이 예측 모델의 정확도를 개선하는지 확인하였다. 이는 추후 클릭스트림 분석을 활용하여 인구통계학적 정보를 예측할 때, 본 연구에서 제안한 방법론을 사용하여 보다 높은 정확도를 가지는 예측 모델을 생성 할 수 있다는데 의의가 있다.