• 제목/요약/키워드: *-derived sets

검색결과 413건 처리시간 0.028초

국내 육성 벼 품종 입형 관련 특성 분석 (Characterization of Traits Related to Grain Shape in Korean Rice Varieties)

  • 이창민;이건미;백만기;김우재;서정필;정오영;조영찬;박현수;김석만
    • 한국작물학회지
    • /
    • 제65권3호
    • /
    • pp.199-213
    • /
    • 2020
  • 국내 육성 벼 품종의 입형 특성은 협소한 유전적 배경을 가지고 있는 것으로 알려져 있다. 본 연구는 육성품종의 입형 관련 표현형과 유전자형을 분석하여 생태형에 따른 입형 특성과 대립유전자 효과를 파악하고, 자포니카 품종에 도입된 대립유전자의 기원을 확인하고자 수행되었다. 자포니카 225, 흑미 14, 통일형 생태형 33품종 등 272품종에 대해서 현미 길이, 너비, 두께, 장폭비, 천립중의 표현형과 GW2, GS3, qGL3, qSW5, GS5, TGW6, GW7, GW8 등 8개 입형 관련 유전자형을 분석하였다. 자포니카 품종은 중단립종에 단원형, 흑미와 통일형 품종은 중립종에 중원형 입형 특성을 나타냈다. 표현형에 대한 군집분석을 통해 자포니카 품종 대부분으로 구성된 그룹 1, 흑미와 통일형 품종 위주로 구성된 그룹 2, 자포니카 품종이 포함된 그룹 3 등 세 그룹으로 나눌 수 있었다. 그룹 1은 현미 너비와 두께, 그룹 2는 장폭비와 길이, 그룹 3은 천립중에 의해 영향을 많이 받아 구분되며 그룹 1은 중단립종·단원형, 그룹 2는 중립종·중원형, 그룹 3은 장립종·단원형 입형 특성을 나타냈다. 입형 관련 대립유전자형 분석 결과 gw2 (빈도수 1.1%)와 tgw6 (0.4%) 대립유전자는 매우 드물었으며, qgl3와 gw8는 통일형 생태형에서만 존재하였고 자포니카 품종의 qSW5 유전자형은 qsw5_N이 대부분을 차지하였다. 생태형별 대립유전자 조합의 수는 자포니카 7개(Cj1-Cj7), 흑미 3개(Cj_b1-Cj_b3), 통일형 13개(CT1-CT13)로 자포니카에 비해 품종수가 적은 통일형 생태형이 더 다양하였다. 자포니카 품종의 대표 대립유전자 조합은 자포니카 Cj1, 2 (GW2-GS3_C-qGL3-qsw5_N-gs5-TGW6-gw7(GW7)-GW8)로 여기에 gw2, gs3, qSW5, GS5 대립유전자가 도입됨으로써 다양성이 확대되었다. 흑미 품종의 대표 대립유전자 조합은 Cj_b2, 3 (GW2-gs3-qGL3-qsw5_N-gs5-TGW6-gw7(GW7)-GW8)로 자포니카 대표 조합에서 GS3_C가 gs3로 치환된 조합이다. 통일형 생태형은 GW2 유전자만 다형성이 없었고 7개 유전자에서 13개 대립유전자 조합이 확인되었으며 대표조합은 CT3 (GW2-GS3_C-qgl3-qsw5_N-gs5-TGW6-GW7-gw8)이다. 우리나라 대표 품종인 '신동진'의 입형 특성은 자포니카 대립유전자 조합 Cj2에서 gs3가 도입됨으로써 중대립화되었고, gs3는 미국품종 Calrose로부터 유래한 것으로 판단된다. 국내 육성 벼 품종에 대한 입형 관련 표현형과 유전자형 분석 결과는 우리나라 벼 품종의 입형 특성을 다양화하는데 기여할 것으로 기대된다.

경상분지 남동부 일대의 백악기 및 제3기 암류에서 발달하는 단층분절의 분포특성 (Distributional Characteristics of Fault Segments in Cretaceous and Tertiary Rocks from Southeastern Gyeongsang Basin)

  • 박덕원
    • 암석학회지
    • /
    • 제27권3호
    • /
    • pp.109-120
    • /
    • 2018
  • 경상분지 남동부 일대의 백악기 및 제3기 암류에서 발달하는 단층분절에 대한 분포특성을 도출하였다. 선형을 보이는 267조의 단층분절은 광역 지질도 상에서 표시된 곡선의 단층선에서 추출하였다. 첫째, 단층분절에 대한 방향각(${\theta}$)-길이(L)의 도면을 작성하였다. 관계도에서 단층분절의 전반적인 분포형태를 도출하였다. 도면의 분포곡선은 전체 형태에 따라서 4개의 구간으로 구분하였다. 상기 구간의 정점에 해당하는 북북동, 북북서 및 서북서의 방향은 양산, 울산 및 가음 단층계의 방향을 시사한다. 단층분절의 집단은 최대 정점에 해당하는 $N19^{\circ}E$의 방향에 대하여 거의 대칭 분포를 보여 준다. 둘째, 방향각-빈도수(N), 평균 길이(Lm), 총 길이(Lt) 및 밀도(${\rho}$)의 도면을 작성하였다. 관계도에서 상기한 도면의 전 영역을 분포곡선의 분포상에 의하여 19개의 영역으로 구분하였다. 상기한 영역의 정점에 해당하는 방향은 암체에 가해진 대표적인 응력의 방향을 시사한다. 셋째, 18개의 부집단에 대한 길이-누적 빈도수 그래프를 작성하였다. 관계도에서 지수(${\lambda}$)는 시계방향($N10{\sim}20^{\circ}E{\rightarrow}N50{\sim}60^{\circ}E$)과 반시계방향($N10{\sim}20^{\circ}W{\rightarrow}N50{\sim}60^{\circ}W$)으로 갈수록 증가한다. 반면 길이의 분포 폭 및 평균 길이는 감소한다. 서로 다른 진화 특성을 갖는 상기한 부집단에 대한 도면은 진화과정의 한 단면을 나타내고 있다. 넷째, 18개의 그래프에 대한 종합 분포도를 작성하였다. 관계도에서 상기한 그래프를 분포 구역에 따라 5개의 그룹(A~E)으로 분류하였다. 단층분절의 길이는 그룹 E ($N80{\sim}90^{\circ}E{\cdot}N70{\sim}80^{\circ}E{\cdot}N80{\sim}90^{\circ}W{\cdot}N50{\sim}60^{\circ}W{\cdot}N30{\sim}40^{\circ}W{\cdot}N40{\sim}50^{\circ}W$) < D ($N70{\sim}80^{\circ}W{\cdot}N60{\sim}70^{\circ}W{\cdot}N60{\sim}70^{\circ}E{\cdot}N50{\sim}60^{\circ}E{\cdot}N40{\sim}50^{\circ}E{\cdot}N0{\sim}10^{\circ}W$) < C ($N20{\sim}30^{\circ}W{\cdot}N10{\sim}20^{\circ}W$) < B ($N0{\sim}10^{\circ}E{\cdot}N30{\sim}40^{\circ}E$) < A ($N20{\sim}30^{\circ}E{\cdot}N10{\sim}20^{\circ}E$)의 순으로 증가한다. 특히 그래프의 형태는 균등 분포에서 지수 분포로 점차 변화한다. 마지막으로, 단층분절의 길이에 대한 여섯 개 변수의 값을 5개 그룹으로 구분하였다. 여섯 개 변수 중, 평균 길이 및 가장 긴 단층분절의 길이는 그룹 III ($N10^{\circ}W{\sim}N20^{\circ}E$) > IV ($N20{\sim}60^{\circ}E$) > II ($N10{\sim}60^{\circ}W$) > I ($N60{\sim}90^{\circ}W$) > V ($N60{\sim}90^{\circ}E$)의 순으로 감소한다. 그룹 V에 속하는 단층분절의 빈도수, 최장 길이, 총 길이, 평균 길이 및 밀도가 가장 낮은 값을 보여 준다. 5개 그룹 사이의 상기 배열순은 단층분절의 상대적인 생성시기와의 상관성을 시사한다.

CNN을 적용한 한국어 상품평 감성분석: 형태소 임베딩을 중심으로 (Sentiment Analysis of Korean Reviews Using CNN: Focusing on Morpheme Embedding)

  • 박현정;송민채;신경식
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.59-83
    • /
    • 2018
  • 고객과 대중의 니즈를 파악하기 위한 감성분석의 중요성이 커지면서 최근 영어 텍스트를 대상으로 다양한 딥러닝 모델들이 소개되고 있다. 본 연구는 영어와 한국어의 언어적인 차이에 주목하여 딥러닝 모델을 한국어 상품평 텍스트의 감성분석에 적용할 때 부딪히게 되는 기본적인 이슈들에 대하여 실증적으로 살펴본다. 즉, 딥러닝 모델의 입력으로 사용되는 단어 벡터(word vector)를 형태소 수준에서 도출하고, 여러 형태소 벡터(morpheme vector) 도출 대안에 따라 감성분석의 정확도가 어떻게 달라지는지를 비정태적(non-static) CNN(Convolutional Neural Network) 모델을 사용하여 검증한다. 형태소 벡터 도출 대안은 CBOW(Continuous Bag-Of-Words)를 기본적으로 적용하고, 입력 데이터의 종류, 문장 분리와 맞춤법 및 띄어쓰기 교정, 품사 선택, 품사 태그 부착, 고려 형태소의 최소 빈도수 등과 같은 기준에 따라 달라진다. 형태소 벡터 도출 시, 문법 준수도가 낮더라도 감성분석 대상과 같은 도메인의 텍스트를 사용하고, 문장 분리 외에 맞춤법 및 띄어쓰기 전처리를 하며, 분석불능 범주를 포함한 모든 품사를 고려할 때 감성분석의 분류 정확도가 향상되는 결과를 얻었다. 동음이의어 비율이 높은 한국어 특성 때문에 고려한 품사 태그 부착 방안과 포함할 형태소에 대한 최소 빈도수 기준은 뚜렷한 영향이 없는 것으로 나타났다.

고려상표군을 이용한 내구재 시장구조 분석에 관한 연구: 자동차 시장에 대한 탐색적 분석방법 (A Study on the Market Structure Analysis for Durable Goods Using Consideration Set:An Exploratory Approach for Automotive Market)

  • 이서구
    • Asia Marketing Journal
    • /
    • 제14권2호
    • /
    • pp.157-176
    • /
    • 2012
  • 시장구조 분석에서 흔히 사용되는 상표전환 자료는 비내구재 분석에 적절한 방법이 될 수 있으나 자동차 같이 사용연한이 장시간인 내구재의 경우에는 소비자의 상표에 대한 선호도가 변할 수 있어 상표전환 자료의 사용에 문제가 있다. 따라서 경쟁을 잘 포착할 수 있는 다른 접근이 필요하다. 본 연구는 이에 대한 대안으로 상표간 경쟁 자료로써 고려상표군을 이용하여 자동차 시장의 구조를 Latent Class 군집분석을 활용한 탐색적 검증방법으로 분석하였다. 또한 소비자 행동분석에 근거하여 상표간 경쟁의 근간을 이루는 고려상표군 형성에 영향을 미치는 인자들을 밝히는데 중점을 두었다. 미국 자동차 시장을 대상으로 분석한 결과, 시장은 상표 원산지 효과에 의해 구분되었다. 즉, 미국 상표, 유럽 상표, 그리고 아시아 상표 등으로 시장이 구분되었다. 또한 각 시장구조 내 소비자들의 고려상표군 형성에 신뢰성/안전, 이미지/즐거움, 경제성 등의 편익과 성별, 소득 등 개인적 요인이 영향을 미치는 것으로 나타났다.

  • PDF

와파린-리팜핀 병용 시 용량 조절 (Dosage Adjustment before and after Warfarin - Rifampin Combination Therapy)

  • 김동현;김경환;최경희;이광자;이혜숙;손인자;김기봉;이재웅;안혁
    • Journal of Chest Surgery
    • /
    • 제41권3호
    • /
    • pp.354-359
    • /
    • 2008
  • 배경: 와파린은 항응고제로 쓰이는 약물로서 주로 간 대사에 의해 배설되는 약물이다. 리팜핀은 결핵 혹은 심내막염 등에 쓰이는 항생제로 2C9과 3A4를 포함한 CYP계열 효소 유도를 일으키는 대표적인 약물이다. 따라서 두 약물을 병용할 경우 리팜핀의 효소 유도에 의한 와파린 대사율 증가로 와파린의 항응고 효과는 감소한다. 이에 따라 와파린의 적절한 용량 조절이 요구되나 정확한 증량과 감량 정도는 제시되지 못하고 있는 실정이다. 이에 본 연구에서는 와파린 복용 환자 중 리팜핀을 병용하게 된 환자를 대상으로 두 약물의 병용 전후, 상호작용의 정도를 시간 경과에 따라 평가하고, 상호작용에 영향을 미치는 요인을 분석하고 또한 이를 토대로 두 약물의 병용 전후, 임상에서 활용할 수 있는 와파린 용량 결정 방법을 설정하고자 하였다. 대상 및 방법: OO병원 항응고 치료 상담 팀의 상담기록지를 1998년 1월부터 2006년 9월까지 후향적으로 검토하여 리팜핀을 병용하게 된 환자를 대상으로 하였다(n=15). 결과: 리팜핀 병용 전 전체 환자의 평균 INR은 $2.25{\pm}0.52$이며 병용 초기 100일간의 평균 INR은 $1.98{\pm}0.28$이었다. 이 경우 병용 전과 병용 초기의 평균 INR은 유의한 차이가 없었다(paired t-test, p>0.05). 리팜핀 병용 중단 직전 2회 측정한 INR의 평균은 $2.19{\pm}0.34$이고 병용 중단 이후 INR의 평균은 $2.49{\pm}0.43$으로 병용 중단 전과 후의 INR 평균은 유의한 차이를 보였으나(paired t-test, p<0.05)모두 치료유효역 범위 내에 있었다. 결론: 항응고 치료 상담 팀의 용량 조절이 적절하다고 판단하여 항응고 치료 상담 팀의 조절을 근거로 병용 시작 시와 병용 중단시의 와파린 용량조절 수식을 도출해냈다

이단계 군집분석에 의한 농촌관광 편의시설 유형별 소비자 선호 결정요인 (Determinants of Consumer Preference by type of Accommodation: Two Step Cluster Analysis)

  • 박덕병;윤유식;이민수
    • 마케팅과학연구
    • /
    • 제17권3호
    • /
    • pp.1-19
    • /
    • 2007
  • 본 연구에서는 농촌관광 방문객에게 제공되는 편의시설을 유형화하고 어떤 특징을 가진 방문객이 어떤 편의시설을 선호하는지를 규명하기 위한 방법과 그 분석결과를 제시하였다. 이를 위하여 우선 2단계 군집분석법을 사용하여 농촌관광 편의시설을 유형화하였다. 그 다음으로 군집분석에 사용되는 변인이 범주형 변인이 있을 경우 전통적인 군집분석 방법을 적용할 수 없기 때문에 2단계 군집분석을 하였다. 본 연구는 2단계 군집분석법이 범주형 변인으로 측정된 농촌관광의 편의시설을 유형화하는 데 매우 유용하다는 것을 보여 주고 있다. 다중로짓 모형을 사용하여 특정 편의시설 유형을 선호할 확률에 영향을 미치는 농촌관광 방문자의 사회인구학적 특성과 여행특성을 규명하였다. 즉, 다중로짓 모형을 통해 참조항(일반농가형)으로 설정된 편의시설 유형에 비해 특정 편의시설을 선호할 확률에 영향을 미치는 소비자의 특성을 규명할 수 있다는 것이 본 연구의 특징이다.

  • PDF

정상 소아와 간염 환자에서 Transfusion-Transmitted Virus의 감염상태와 유전자형 (Prevalence and Genotypes of Transfusion-Transmitted Virus in Children with Hepatitis and Normal Control)

  • 정주영;한태희;황응수;고재성;서정기
    • Pediatric Gastroenterology, Hepatology & Nutrition
    • /
    • 제8권2호
    • /
    • pp.202-212
    • /
    • 2005
  • 목 적: Transfusion-transmitted virus는 간염과의 연관성이 아직 명확하지 않지만 특정 유전형이 원인불명의 간염 병원체로 작용하거나 다른 간염 바이러스와 중복 감염되어 임상 경과에 영향을 줄 가능성에 대한 연구가 필요하다. 본 연구는 국내 소아 B형 간염, C형 간염 및 원인 불명의 간염 환자의 TTV DNA 양성률과 유전형의 분포를 알아보기 위해 시행하였다. 방 법: 간 기능이 정상인 소아 88명을 대조군으로 하였으며 B형 간염 환자 14명, C형 간염 환아 12명, 2001년 6월부터 2004년 6월까지 인제의대 상계백병원을 방문한 원인 불명의 간염 환자 25명을 대상으로 하였다. 환아의 혈청 검체를 대상으로 N22 시발체를 이용한 PCR과 5'NCR 시발체를 이용한 PCR을 시행하였다. 또한 TLMV DNA 검출을 위한 seminested PCR을 시행 하였다. N22 primer를 이용한 PCR 양성 산물을 대상으로 염기서열의 직접 분석이 시행되었다. 결 과: 1) N22 시발체를 이용한 TTV DNA 양성률은 대조군에서 11.3%, 간염군에서 19.6%였다(p=0.105). B형 간염의 28.5%, C형 간염의 25%, 원인 불명의 간염 24%에서 TTV DNA가 양성이었으며 대조군에 비해 유의한 차이는 없었다. 2) 5'NCR 부위 시발체를 이용한 TTV DNA 양성률은 대조군에서 32.9%, 간염군에서 54.9%였다. B형 간염의 71.4%, C형 간염의 50%, 원인 불명의 간염 48%에서 TTV DNA가 양성이었다. B형 간염 환자군에서 양성률이 대조군에 비해 높았다(p=0.008). 3) 5'NCR 부위 시발체를 이용한 TLMV DNA양성률은 간염 환자군과 정상 대조군에서 각각 29.4% (15/51명), 48.9% (43/88명)였다. B형 간염 21.4% (3/14), C형 간염 16.6% (2/12), 원인 불명의 간염 환자에서 40% (10/25)였다. 4) 염기 서열 분석: N22 시발체를 이용해서 PCR 반응 산물 중 총 29예(간염 환자 8명, 대조군 11명)의 염기서열을 분석한 결과 G1 유전형은 10예(52%)였고 이 중 G1a형이 7예였다. G2 유전형은 3예, G3 유전형은 2예였으며 나머지는 정확한 분류가 되지 않았다. 결 론: 국내 소아에 감염된 TTV 유전형 중 가장 흔한 것은 G1형이었다. TTV DNA 양성률은 대조군과 원인 불명의 간염군 간에 차이는 없었으며, B형 간염군에서 대조군에 비해 높았다.

  • PDF

인체 상피 세포암의 일차 배양을 이용한 방사선 민감도 측정 (In Vitro Intrinsic Radiosensitivity Of Human Squamous Cell Carcinoma in Primary Culture)

  • 최은경;양광모;이병용;장혜숙;김상윤;남주현;유은실;이인철
    • Radiation Oncology Journal
    • /
    • 제12권1호
    • /
    • pp.27-31
    • /
    • 1994
  • 종양의 조직학적 형태에 따라 또 같은 조직의 종양에서도 각 환자에 따라 방사선 치료에 대한 반응 정도에는 많은 차이가 관찰된다. 이러한 방사선 감수성을 예측하는 한 방법으로 각 환자에서 떼어낸 종양조직을 일차 배양하여 방사선 조사에 의한 세포 생존 곡선을 구한뒤 2Gy에서의 생존(SF2)을 얻었다. 방사선 치료가 계획된 두경부 종양과 자궁경부암 환자의 종양 조직을 얻어 기계적인 방법으로 미세절편으로 만든 후 collagenase type IV와 2시간 배양하여 단일 종양세포 혼탁액을 얻었다. Cell adhesive matix로 전처리된 24 well plate에 각 well당 일정수의 세포를 넣어 24시간 배양한뒤 각 열에 0, 1, 2, 3, 4. 6Gy의 방사선을 조사하였다. 13일간 배양후 crystal violet으로 염색한뒤 image analysis system을 이용하여 각 well의 광학밀도를 측정하여 세포 생존을 구한다. Linear quadratic model에 의한 생존 곡선을 얻은 뒤 2Gy에서의 생존율을 구하였다. 배양된 세포가 편평상 피암세포임을 확인하기 위하여 cytokeratin과 epithelial monoclonal 항체를 이용한 Immunocytochemical 염색을 하여 형광 현미경으로 관찰하였다. 5명의 두경부종양 환자와 20명의 자궁경부암 환자의 종양조직을 얻어 실험하여 15명(60$ \% $) 종양의 2Gy 생존을 얻는데 성공하였다. 10명의 일차 배양 실패의 원인은 단일 종양세포 혼탁액에 종양세포가 너무 적었거나 세포 이식후 배양이 잘 자라지 않은 것으로 판정되었다. 15편평 상피암 세포의 SF2의 평균은 0.55$\pm$0.17이었으며 범위는 0.20에서 0.79까지로 같은 편평상피암이라도 각 환자에 따라 SF2 간에 큰 차이를 보이는 것을 알 수 있었다. 이상에서 같은 부위에 생긴 같은 조직 유형의 종양이라도 각 환자마다 SF2 값의 차이가 큰 것으로 보아 방사선 치료의 효과를 예측할 수 있는 한 인자로 SF2 값을 이용할 수 있을 것으로 생각된다.

  • PDF

제3기 결정질 응회암에서 발달하는 미세균열의 길이 분포에 대한 통계적 분석 (Statistical Analysis on Microcrack Length Distribution in Tertiary Crystalline Tuff)

  • 박덕원
    • 암석학회지
    • /
    • 제20권1호
    • /
    • pp.23-37
    • /
    • 2011
  • 제3기 결정질 응회암에서 발달하는 미세균열 모집단의 길이분포에 대한 스케일링 성질을 조사하였다. 15개 방향각 및 5개 그룹 (I~V)에 대한 길이범위의 분포도에서 미세균열의 방향성에 따른 평균길이의 체계적인 변화가 나타난다. 분포도는 거의 남-북방향을 경계로 하여 좌우 대칭형태를 취하는 것이 특징이다. 미세균열의 모집단에 대한 길이-누적빈도 도표의 전 영역은 상관곡선의 분포양상에 의하여 3개 구간으로 구분할 수 있다. 특히, 5개 그룹에 대한 각 도표의 선형의 중앙구간은 멱함수 분포를 지시한다. 5개 그룹에 대한 중앙의 선형구간의 빈도비는 46.6%~67.8T의 범위이다. 한편 각 그룹에 대한 선형의 중앙구간의 기울기는 그룹 V($N60{\sim}90^{\circ}E$, -2.02) > 그룹 IV($N20{\sim}60^{\circ}E$, -1.55) > 그룹 I($N60{\sim}90^{\circ}W$, -1.48), 그룹 II($N10{\sim}60^{\circ}W$, -1.48) > 그룹 III($N10^{\circ}W{\sim}N20^{\circ}E$, -1.06)의 순으로 나타난다. 거의 멱함수의 길이분포를 따르는 부집단(5개 그룹)에서는 지수(-1.06~-2.02)의 범위가 넓다. 5개 그룹간의 이러한 지수의 상대적인 차이는 방향성 효과의 중요성을 강조한다. 또한, 곡선의 하부에서의 기울기의 분리는 보다 긴 미세균열의 급격한 발달을 대변하며, 멱함수 지수의 감소로 반영된다. 특히, 이러한 분포양식은 $N10{\sim}20^{\circ}E,\;N10{\sim}20^{\circ}W$$N60{\sim}70^{\circ}W$의 방향각에 대한 도표에서 볼 수 있다. 이들 3개 방향각은 연구지역 일대에서 발달한 단층의 주방향과 부합한다. 15개 방향각에 대한 길이-누적빈도 도표의 개개 특성을 보여주는 분포도를 작성하였다 상기한 도표들을 3개 그룹(A, B and C)의 범주에 따라 배열함으로서 이들 그룹간 길이-빈도 분포의 차이를 용이하게 도출할 수 있다. 분포도는 미세균열 조들에 대한 개별적인 분리의 중요성을 보여준다. 관계도에서, 보다 짧은 미세균열의 출현빈도는 그룹A > 그룹 B > 그룹 C의 순서를 보인다. 이들 3가지 유형의 분포양상은 미세균열이 성장하는 동안 발생한 과정들에 대한 중요한 정보를 드러낼 수 있다.

불균형 데이터 환경에서 변수가중치를 적용한 사례기반추론 기반의 고객반응 예측 (Response Modeling for the Marketing Promotion with Weighted Case Based Reasoning Under Imbalanced Data Distribution)

  • 김은미;홍태호
    • 지능정보연구
    • /
    • 제21권1호
    • /
    • pp.29-45
    • /
    • 2015
  • 고객반응 예측모형은 마케팅 프로모션을 제공할 목표고객을 효과적으로 선정할 수 있도록 하여 프로모션의 효과를 극대화 할 수 있도록 해준다. 오늘날과 같은 빅데이터 환경에서는 데이터 마이닝 기법을 적용하여 고객반응 예측모형을 구축하고 있으며 본 연구에서는 사례기반추론 기반의 고객반응 예측모형을 제시하였다. 일반적으로 사례기반추론 기반의 예측모형은 타 인공지능기법에 비해 성과가 낮다고 알려져 있으나 입력변수의 중요도에 따라 가중치를 상이하게 적용함으로써 예측성과를 향상시킬 수 있다. 본 연구에서는 프로모션에 대한 고객의 반응여부에 영향을 미치는 중요도에 따라 입력변수의 가중치를 산출하여 적용하였으며 동일한 가중치를 적용한 예측모형과의 성과를 비교하였다. 목욕세제 판매데이터를 사용하여 고객반응 예측모형을 개발하고 로짓모형의 계수를 적용하여 입력변수의 중요도에 따라 가중치를 산출하였다. 실증분석 결과 각 변수의 중요도에 기반하여 가중치를 적용한 예측모형이 동일한 가중치를 적용한 예측모형보다 높은 예측성과를 보여주었다. 또한 고객 반응예측 모형과 같이 실생활의 분류문제에서는 두 범주에 속하는 데이터의 수가 현격한 차이를 보이는 불균형 데이터가 대부분이다. 이러한 데이터의 불균형 문제는 기계학습 알고리즘의 성능을 저하시키는 요인으로 작용하며 본 연구에서 제안한 Weighted CBR이 불균형 환경에서도 안정적으로 적용할 수 있는지 검증하였다. 전체데이터에서 100개의 데이터를 무작위로 추출한 불균형 환경에서 100번 반복하여 예측성과를 비교해 본 결과 본 연구에서 제안한 Weighted CBR은 불균형 환경에서도 일관된 우수한 성과를 보여주었다.