• 제목/요약/키워드: 제거률

검색결과 1,155건 처리시간 0.027초

카테고리 중립 단어 활용을 통한 주가 예측 방안: 텍스트 마이닝 활용 (Stock Price Prediction by Utilizing Category Neutral Terms: Text Mining Approach)

  • 이민식;이홍주
    • 지능정보연구
    • /
    • 제23권2호
    • /
    • pp.123-138
    • /
    • 2017
  • 주식 시장은 거래자들의 기업과 시황에 대한 기대가 반영되어 움직이기에, 다양한 원천의 텍스트 데이터 분석을 통해 주가 움직임을 예측하려는 연구들이 진행되어 왔다. 주가의 움직임을 예측하는 것이기에 단순히 주가의 등락 뿐만이 아니라, 뉴스 기사나 소셜 미디어의 반응에 따라 거래를 하고 이에 따른 수익률을 분석하는 연구들이 진행되어 왔다. 주가의 움직임을 예측하는 연구들도 다른 분야의 텍스트 마이닝 접근 방안과 동일하게 단어-문서 매트릭스를 구성하여 분류 알고리즘에 적용하여 왔다. 문서에 많은 단어들이 포함되어 있기 때문에 모든 단어를 가지고 단어-문서 매트릭스를 만드는 것보다는 단어가 문서를 범주로 분류할 때 기여도가 높은 단어들을 선정하여야 한다. 단어의 빈도를 고려하여 너무 적은 등장 빈도나 중요도를 보이는 단어는 제거하게 된다. 단어가 문서를 정확하게 분류하는 데 기여하는 정도를 측정하여 기여도에 따라 사용할 단어를 선정하기도 한다. 단어-문서 매트릭스를 구성하는 기본적인 방안인 분석의 대상이 되는 모든 문서를 수집하여 분류에 영향력을 미치는 단어를 선정하여 사용하는 것이었다. 본 연구에서는 개별 종목에 대한 문서를 분석하여 종목별 등락에 모두 포함되는 단어를 중립 단어로 선정한다. 선정된 중립 단어 주변에 등장하는 단어들을 추출하여 단어-문서 매트릭스 생성에 활용한다. 중립 단어 자체는 주가 움직임과 연관관계가 적고, 중립 단어의 주변 단어가 주가 상승에 더 영향을 미칠 것이라는 생각에서 출발한다. 생성된 단어-문서 매트릭스를 가지고 주가의 등락 여부를 분류하는 알고리즘에 적용하게 된다. 본 연구에서는 종목 별로 중립 단어를 1차 선정하고, 선정된 단어 중에서 다른 종목에도 많이 포함되는 단어는 추가적으로 제외하는 방안을 활용하였다. 온라인 뉴스 포털을 통해 시가 총액 상위 10개 종목에 대한 4개월 간의 뉴스 기사를 수집하였다. 3개월간의 뉴스 기사를 학습 데이터로 분류 모형을 수립하였으며, 남은 1개월간의 뉴스 기사를 모형에 적용하여 다음 날의 주가 움직임을 예측하였다. 본 연구에서 제안하는 중립 단어 활용 알고리즘이 희소성에 기반한 단어 선정 방안에 비해 우수한 분류 성과를 보였다.

학교급식 및 외식업체에서의 신선편이 농산물 사용실태 및 요구도 평가 (Assessment of Demand and Use of Fresh-Cut Produce in School Foodservice and Restaurant Industries)

  • 손시혜;김주희;김수진;박혜영;김기창;김행란;윤기선
    • 한국식품영양과학회지
    • /
    • 제39권6호
    • /
    • pp.909-919
    • /
    • 2010
  • 본 연구는 전 지역의 학교급식 영양사와 외식업체 종사자를 대상으로 학교급식 및 외식업체에서의 전처리 농산물 식재료의 사용실태와 농산물 이용의 효율을 높이기 위한 요구도에 관하여 설문조사를 실시하였다. 조사대상자의 업종형태에서는 학교급식이 181명(29.8%)이었고, 외식산업은 64명(26.1%)이었다. 학교급식의 운영형태는 148개교(81.8%)가 직영급식으로, 33개교(18.2%)가 위탁급식으로 운영되었으며, 외식업체는 프랜차이즈 레스토랑(45.3%)이 가장 많았다. 식재료 공급업체 선정 시 중요하게 고려하는 요소로는 학교급식 및 외식업체 모두에서 식재료의 품질이 가장 중요한 것으로 나타났고, 2순위로 중요하게 고려하는 요소로는 학교급식의 경우 공급업체의 위생시설(HACCP인증 여부)이 외식산업의 경우 식재료의 가격으로 조사되었다. 학교급식 및 외식업체에서의 전처리 농산물 식재료 구매 시 어려운 점으로는 식재료의 품질 및 신선도 저하가, 검수 시 어려운점으로는 식재료의 품질여부를 육안으로 구분하기 어려움이 전처리 농산물 식재료 사용에 있어서는 식재료의 품질에 가장 큰 비중을 두었다. 또한 전처리 농산물 식재료 조리시 가장 큰 문제점은 학교급식에서는 재세척의 필요성이, 외식업체에서는 일정하지 않은 크기인 것으로 나타났다. 학교급식에서 운영형태에 따른 계약기간으로 직영에서는 1개월이 39.2%로 가장 많은 반면 위탁에서는 1년 이상이 81.8%로 가장 많아 운영형태에 따른 계약기간에서 유의적 차이를 보였다(p<0.05). 전처리 농산물 식재료의 사용 확대 가능성에 대해 급식 및 외식에서 각각 44.4%와 58.1%가 앞으로 계속 사용이 증가할 것이며 전처리 농산물 식재료의 크기 규격화도 과반수 이상이 필요하다고 답하였다. 전처리 농산물 식재료의 위생 상태에 대한 불신으로 학교급식의 96.0%, 외식산업의 78.3%가 개봉 후 다시 세척을 하고 있었으며 위생 상태에 대한 불신이 전처리 농산물 식재료의 가장 중요한 문제점으로 지적되었다. 주로 이용하고 있는 전처리 농산물 식재료의 형태에서는 학교급식과 외식산업 모두 일반농산물을 많이 사용하고 있었고, 전처리 농산물 식재료를 사용하는 주된 용도로는 학교급식과 외식업체 모두 볶음과 무침으로 나타났다. 전처리 식재료의 유통기간 연장을 위해 저온유통과 포장방법에 대한 연구가 요구되어졌으며 또한 향후 식재료의 이용효율을 높이기 위해 학교급식 및 외식업체 모두 포장 개봉 후 갈변 예방법이 필요하다고 하였다. 한편 전처리 농산물 식재료의 처리단계 요구도 조사결과에 따르면 학교급식의 경우 엽채류는 흙먼지제거 단계(36.4%)까지, 외식산업의 경우 다듬기 단계(36.8%)까지 원하였고, 나물류는 학교급식의 경우 40.4%가 데치기 단계까지 원한 반면, 외식업체의 경우 33.3%가 다듬기 단계까지를 원해 업종간 유의적 차이를 보였다(p<0.05). 이상의 결과를 볼 때 학교급식과 외식업체에서는 전처리 농산물 식재료 사용에 대한 요구도는 크지만 공급업체에 대한 불신, 식재료 안전성에 대한 불안감이 사용률을 저하시키고 있었다. 따라서 이러한 문제점들을 개선시키기 위한 대책으로 정부는 대다수의 식재료 공급업체가 중소기업으로 자체적으로 고품질의 안전한 식재료를 생산할 수 있는 인프라가 매우 부족한 점을 감안하여 안전한 식재료를 생산하기 위한 시설 및 공정별 HACCP 모델 개발 등과 같은 연구지원을 강화하여야 할 것이다. 또한 표준화된 식재료가 생산될 수 있도록 전처리 농산물 식재료의 표준규격 및 기준을 제정하고 안전한 식재료 생산을 위한 공정개선 및 소독제의 효과, 유통기한연장, 품질보존 등 다양한 연구가 앞으로 지속적으로 이루어져야 할 것으로 사료되어진다.

인체 전혈 모델을 이용한 세포내 결핵균 살균력에 관한 연구 (Measuring Intracellular Mycobacterial Killing Using a Human Whole Blood Assay)

  • 천선희;송호연;이은희;오희정;강인숙;조지윤;홍영선
    • Tuberculosis and Respiratory Diseases
    • /
    • 제53권5호
    • /
    • pp.497-509
    • /
    • 2002
  • 연구배경 : 대표적 세포내 감염질환인 결핵에 대한 숙주의 방어기전 및 면역반응은 아직도 정확히 이해되지 못하고 있으며 이러한 병리기전을 연구하기 위하여서는 적절한 감염모델이 필요하다. 전혈 (whole blood)은 체액성 면역과 세포성 면역을 모두 포함한 생체의 상태를 반영하므로 다양한 대상에서 면역상태의 차이에 따른 개체간 결핵균 살균력의 차이를 비교 할 수 있는 적절한 모델로 추정된다. 따라서 본 연구의 목적은 인체의 결핵균 전혈 배양모델을 개발하여 궁극적으로 시험관내에서 숙주면역의 정도를 측정하는 대리 표지자를 개발하고자하는 것이다. 방 법 : PPD 양성 정상인을 대상으로 제대혈, 결핵환자, 당뇨 및 폐암환자와 비교하였다. 전혈을 희석하여 결핵균 Mycobacterium avium과 M. tuberculosis $H_{37}Ra$에 낮은 감염률로 감염시키고 $37^{\circ}C$, 5% $CO_2$ 배양기 속의 회전교반기에서 회전시키면서 배양(rotating culture) 하였다. 배양 1 일, 3일 및 4일 뒤 증류수로 긴장저하용해 시킨 후 Middlebrook 7H10/OADC 평판배지에서 결핵균 집락이 형성될 때까지 3-4주간 $37^{\circ}C$, 5% $CO_2$ 배양기에 배양하여 집락수를 계산하였다. 일부실험에서 TNF-${\alpha}$의 분비능을 90%이상 감소시키 기 위하여 methylpredmsolone과 pentoxifylline을 첨가하여 면역조정을 하였으며, CD4+ T-림프구와 CD8+ T-림프구를 magnetic bead에 코팅된 단클론 항체를 사용하여 제거하였다. 결핵균의 수는 용해질 $m{\ell}$ 당 CFU로 계산하였다. 살균력은 ${\Delta}$ log killing ratio로 표시하였다. ${\Delta}$ logKR=$log_{10}$(Final CFU/Initial CFU). 결 과 : 1. 제대혈의 결핵균 살균력이 PPD 양성 대조군에 비하여 다소 감소된 경향을 보였으며, 결핵환자의 결핵균 살균력은 PPD 양성 대조군과 특별한 차이를 보이지 않았다. 또한 당뇨군과 폐암군의 결핵균 살균력도 정상 대조군에 비하여 특별한 차이를 보이지 않았다. 2. Methylprednisolone과 pentoxyfylline을 사용한 면역조정 시에 제대혈, PPD 양성 정상 대조군과 결핵군 모두에서 전혈에서의 결핵균의 살균력이 감소되는 경향을 보였다. 3. CD4+ 및 CD8+ T-림프구 삭제시 log KR가 증가되어 유의하게 결핵균 살균력이 감소되었으며 CD4+ 및 CD8+ T-림프구 동시 삭제시 현저한 상승효과를 보였고 이러한 결과는 Mycobacterium avium보다는 독력이 없는 균인 Mycobacterium tuberculosis $H_{37}Ra$에서 보다 뚜렷하였다. 4. 폐결핵 치료후의 결핵균 살균력은 치료 전과 비교하여 유의하게 ${\Delta}$ logKR가 감소하였으며, 배양 3-4일에도 현저한 결핵균 증식의 억제를 보였다. 결 론 : 인체의 결핵균에 대한 감수성인 개체간의 면역상태를 전혈에서 결핵균 살균력을 통하여 비교할 수는 없었다. 그러나 인체 전혈 모델은 간단하고 임상경과 관찰이 쉬우며 결핵환자에서 치료 전과 후에 현저한 결핵균 살균력의 차이를 보이므로, 최근 결핵연구의 가장 중요한 과제의 하나인 백신 개발에서 그 성과를 판단하는 vaccine trial에 이용할 수 있을 가능성을 시사한다.

캠페인 효과 제고를 위한 자기 최적화 변수 선택 알고리즘 (Self-optimizing feature selection algorithm for enhancing campaign effectiveness)

  • 서정수;안현철
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.173-198
    • /
    • 2020
  • 최근 온라인의 비약적인 활성화로 캠페인 채널들이 다양하게 확대되면서 과거와는 비교할 수 없을 수준의 다양한 유형들의 캠페인들이 기업에서 수행되고 있다. 하지만, 고객의 입장에서는 중복 노출로 인한 캠페인에 대한 피로감이 커지면서 스팸으로 인식하는 경향이 있고, 기업입장에서도 캠페인에 투자하는 비용은 점점 더 늘어났지만 실제 캠페인 성공률은 오히려 더 낮아지고 있는 등 캠페인 자체의 효용성이 낮아지고 있다는 문제점이 있어 실무적으로 캠페인의 효과를 높이고자 하는 다양한 연구들이 지속되고 있다. 특히 최근에는 기계학습을 이용하여 캠페인의 반응과 관련된 다양한 예측을 해보려는 시도들이 진행되고 있는데, 이 때 캠페인 데이터의 다양한 특징들로 인해 적절한 특징을 선별하는 것은 매우 중요하다. 전통적인 특징 선택 기법으로 탐욕 알고리즘(Greedy Algorithm) 중 SFS(Sequential Forward Selection), SBS(Sequential Backward Selection), SFFS(Sequential Floating Forward Selection) 등이 많이 사용되었지만 최적 특징만을 학습하는 모델을 생성하기 때문에 과적합의 위험이 크고, 특징이 많은 경우 분류 예측 성능 하락 및 학습시간이 많이 소요된다는 한계점이 있다. 이에 본 연구에서는 기존의 캠페인에서의 효과성 제고를 위해 개선된 방식의 특징 선택 알고리즘을 제안한다. 본 연구의 목적은 캠페인 시스템에서 처리해야 하는 데이터의 통계학적 특성을 이용하여 기계 학습 모델 성능 향상의 기반이 되는 특징 부분 집합을 탐색하는 과정에서 기존의 SFFS의 순차방식을 개선하는 것이다. 구체적으로 특징들의 데이터 변형을 통해 성능에 영향을 많이 끼치는 특징들을 먼저 도출하고 부정적인 영향을 미치는 특징들은 제거를 한 후 순차방식을 적용하여 탐색 성능에 대한 효율을 높이고 일반화된 예측이 가능하도록 개선된 알고리즘을 적용하였다. 실제 캠페인 데이터를 이용해 성능을 검증한 결과, 전통적인 탐욕알고리즘은 물론 유전자알고리즘(GA, Genetic Algorithm), RFE(Recursive Feature Elimination) 같은 기존 모형들 보다 제안된 모형이 보다 우수한 탐색 성능과 예측 성능을 보임을 확인할 수 있었다. 또한 제안 특징 선택 알고리즘은 도출된 특징들의 중요도를 제공하여 예측 결과의 분석 및 해석에도 도움을 줄 수 있다. 이를 통해 캠페인 유형별로 중요 특징에 대한 분석과 이해가 가능할 것으로 기대된다.

위장관 증세 위주로 발현하는 영유아기 우유 알레르기 질환의 3가지 임상 유형에 관한 고찰 (The Three Types of Clinical Manifestation of Cow's Milk Allergy with Predominantly Intestinal Symptoms)

  • 이정진;이은주;김현희;최은진;황진복;한창호;정혜리;권영대;김용진
    • Pediatric Gastroenterology, Hepatology & Nutrition
    • /
    • 제3권1호
    • /
    • pp.30-40
    • /
    • 2000
  • 목 적: 위장관 증세 위주로 발현하는 우유 알레르기(cow's milk allergy with predominantly gastrointestinal symptoms, CMA-GI)는 유발시험 후 유해반응의 발현시간이 즉각적이지 않아 병력청취를 통하여 우유와 발현 증상의 관련성을 의심하기가 쉽지 않다. 또한, 가벼운 구토, 설사 증상부터 괴사성 장염의 발병처럼 높은 사망률을 보이는 경우까지 임상적 스팩트럼이 다양하며, 감염성 질환 등 타 질환과의 철저한 감별진단이 요구되나 어려운 경우가 많다. 저자들은 CMA-GI를 3가지 임상유형으로 분류하여 진단적 효용성을 높이고, 효율적인 치료계획 수립에 도움을 주고자 본 연구를 시행하였다. 대상 및 방법: 1995년 3월부터 1997년 6월까지 대구효성가톨릭대학병원 소아과에 급, 만성 설사 등 위장관 증세를 주소로 내원하여 우유제거 및 유발시험의 반응을 근거로 CMA-GI로 진단된 30명(남 22명, 여 8명)의 영유아를 대상으로 우유 유발시험에 따른 유해반응의 발현시기 및 양상에 따라 3가지 임상 유형으로 분류하고, 입원당시 임상소견, 유해반응의 양상, 면역학적 검사소견, 소장 생검조직의 형태학적 분석 등을 이용하여 각 유형을 비교 관찰하였다. Quick (Q)형은 우유 유발시험 후 1시간 이내에 두드러기형 발진 등이 발현한 경우로, Slow (S)형은 유해반응이 1시간에서 24시간사이에 발현한 경우로, Quick & Slow (Q&S)형은 Q형과 S형의 증상이 함께 나타나는 경우로 분류하였다. 결 과: 1) 대상환아 30명 중 Q형 5례, S형 20례, Q&S형 5례로, S형의 환아가 가장 많았다. 2) 입원당시 연령은 Q형 $81.4{\pm}67.1$일, S형 $31.9{\pm}12.7$일, Q&S형 $366.0{\pm}65.0$일로 각 유형에 따라 호발 연령의 차이를 보였다(p<0.05). 입원당시 체중은 Q형 10~50백분위수, S형 10백분위수 이하, Q&S형 10~25백분위수로 S형과 다른 유형간에 차이를 보였으며(p<0.05), S형 환아 중 90%에서 3백 분위수 이하로 관찰되었다. 3) 입원당시 말초혈액검사상 백혈구수는 Q형 $5,700{\sim}12,300/mm^3$, S형 $10,000{\sim}33,400/mm^3$, Q&S형 $5,200{\sim}14,900/mm^3$로 S형과 다른 유형간에 차이를 보였다(p<0.05). 입원당시 혈중 알부민치는 Q형 $4.2{\pm}0.4\;g/dl$, S형 $3.0{\pm}0.3\;g/dl$, Q&S형 $4.0{\pm}0.3\;g/dl$로 S형과 다른 유형간에 차이를 보였으며(p<0.05), S형 환아 중 85%에서 혈중 알부민치가 3.5 g/dl 이하였다. 4) 소장 조직생검의 형태학적 분석에서 융모의 높이는 Q형, Q&S형은 정상 대조군과 유의한 차이를 보이지 않았으나, S형에서는 의미있는 감소를 보였으며(p<0.05), 45%에서 아전 융모위축(subtotal villous atrophy), 55%에서 부분(partial) 융모위축의 소견이 보여 전례에서 장병증(enteropathy) 소견이 관찰되었다. 5) 추적 관찰 중 타 음식물에 대한 알레르기의 발현은 S형의 환아군에서는 환아의 연령, 전신 상태의 불안정과 위험성 등 윤리적 측면을 고려하여 유발시험을 시행하지 않았으며, Q형에서도 환아의 연령을 고려하여 다양한 유발시험은 제한하였으나, 대개 우유, 대두유, 이유식 분유, 계란 등 1~2가지의 음식물에 유해 반응을 보이는 것으로 관찰되었다. Q&S형군에서는 연령에 따른 이유 식이의 필요성에 따라 다양한 유발시험을 시행하였으며, 계란, 감자, 새우 등 해산물, 두부, 사과, 당근, 쇠고기, 닭고기 등 환자에 따라 다양한 음식물에 유해반응을 보이는 것으로 관찰되었다. 6) 입원당시 혈중 IgE치, 호산구수, 우유단백 RAST치, 콩단백 RAST치, 피부반응검사는 유형간에 차이를 보이지 않았다. 결 론: 위장관 증세 위주로 발현하는 우유 알레르기는 유발 시험에 따른 유해 반응의 발현 시기 및 양상에 따라 3가지 유형으로 분류될 수 있으며, 이들의 임상소견, 소장생검조직 소견, 면역학적 검사 소견, 타 음식물에 대한 알레르기 발현 유무 등에서 각 유형별로 특징적인 임상 양상을 관찰할 수 있으며, 이들 소견을 비교, 분석하여 감별 진단하는 것이 CMA-GI의 진단 및 치료적 접근에서 효용성이 높을 것으로 판단된다.

  • PDF