• 제목/요약/키워드: engineering technique

검색결과 22,315건 처리시간 0.05초

혼합방법에 따른 순환아스팔트 혼합물의 수분저항성 통계검정 평가 (Statistical Evaluation of Moisture Resistance by Mixing Method of Recycled Asphalt Mixtures)

  • 김성운;김영삼;조영진;김광우
    • 한국건설순환자원학회논문집
    • /
    • 제9권2호
    • /
    • pp.167-176
    • /
    • 2021
  • 순환아스팔트 혼합물은 제조 시 믹서에서 혼합되는 동안 노화된 RAP(회수 아스팔트포장재)을 잘 녹이는 것이 중요하다. 순환아스팔트 혼합물은 모든 재료(RAP, 신규 아스팔트 및 신규 골재)를 동시에 믹서에 넣고 혼합하여 생산한다. 동시 혼합(IM)방법으로 제조된 순환아스팔트 혼합물의 경우 RAP에 포함된 노화된 바인더는 신규 바인더와 혼합되는 동안 적절하게 회생되지 못하기 때문에 동일한 혼합물 내에서 신규 골재 주위에 코팅된 바인더보다 더 높은 산화·노화 수준을 나타내며, 큰 강성을 보인다. 본 연구에서는 RAP의 노화된 바인더를 회생시키기 위해서 단계 혼합(SM) 방법을 적용하였다. 첫 번째 단계에서는 RAP과 신규 아스팔트를 혼합한 다음 두 번째 단계에서는 가열된 신규 골재와 함께 혼합하였다. 혼합 방법에 따른 순환아스팔트 혼합물의 수분저항성 개선효과를 비교하기 위해 간접인장강도(ITS)와 인장강도 비(TSR) 시험을 수행하여 SM 방법과 IM 방법 간에 통계적 t- 테스트를 수행했다. 수분저항성을 평가하기 위해서 세 가지 전처리 조건 즉, -18℃ 동결 후 60℃에서 24 시간 수침, 60℃에서 48 시간 수침 및 60℃에서 72 시간 수침 조건을 적용하였다. SM 방법으로 제조한 순환아스팔트 혼합물의 TSR은 IM 방법에 의한 순환아스팔트 혼합물보다 분명히 높았고, SM 방법의 변동계수는 IM보다 낮았다. 또한 통계적 t-test에 의해 SM 방법의 ITSWET이 α = 0.05 수준에서 IM과 유의하게 다른 것으로 관찰되었다. 또한, SM 방법의 ITSWET은 IM과 비교하여 더 가혹한 조건에서 처리할수록 훨씬 개선된 결과를 나타냈다. 따라서 단계 혼합 방법은 기존의 동시 혼합방법으로 생산된 순환아스팔트 혼합물보다 더 높은 수분저항성을 보이고, 보다 더 우수한 순환아스팔트 혼합물을 생산하기 위한 중요한 혼합 방법임을 확인하였다.

역 원근변환 기법을 이용한 터널 영상유고시스템의 원거리 감지 성능 향상에 관한 연구 (A study for improvement of far-distance performance of a tunnel accident detection system by using an inverse perspective transformation)

  • 이규범;신휴성
    • 한국터널지하공간학회 논문집
    • /
    • 제24권3호
    • /
    • pp.247-262
    • /
    • 2022
  • 국내 200 m 이상 연장의 터널에서는 CCTV 설치가 의무화되어 있으며, 터널 내 돌발 상황을 자동으로 인지한 다음 터널 관리자에게 알릴 수 있는 터널 영상유고시스템의 운영이 권고된다. 여기서 터널 내 설치된 CCTV는 터널 구조물의 공간적인 한계로 인해 낮은 높이로 설치된다. 이에 따라 이동차량과 매우 인접하므로, 이동차량과 CCTV와의 거리에 따른 원근현상이 매우 심하다. 이로 인해, 기존 터널 영상유고시스템은 터널 CCTV로부터 멀리 떨어질수록 차량의 정차 및 역주행, 보행자 출현 및 화재 발생과 같은 터널 내 유고상황을 인지하기 매우 어려우며, 100 m 이상의 거리에서는 높은 유고상황 인지 성능을 기대하기 어려운 것으로 알려져 있다. 이 문제를 해결하기 위해 관심영역 설정 및 역 원근변환(Inverse perspective transform)을 도입하였으며, 이 과정을 통해 얻은 변환영상은 먼 거리에 있는 객체의 크기가 확대된다. 이에 따라 거리에 따라 객체의 크기가 비교적 일정하게 유지되므로, 거리에 따른 객체 인식 성능과 영상에서 보이는 차량의 이동속도 또한 일관성을 유지할 수 있다. 이를 증명하기 위해 본 논문에서는 터널 CCTV의 원본영상과 변환영상을 바탕으로 동일한 조건을 가지는 데이터셋을 각각 제작 및 구성하였으며, 영상 내 차량의 실제 위치의 변화에 따른 겉보기 속도와 객체 크기를 비교하였다. 그 다음 딥러닝 객체인식 모델의 학습 및 추론을 통해 각 영상 데이터셋에 대한 거리에 따른 객체인식 성능을 비교하였다. 결과적으로 변환영상을 사용한 모델은 200 m 이상의 거리에서도 객체인식 성능과 이동차량의 유고상황 인지 성능을 확보할 수 있음을 보였다.

기원후 600년간 한반도 지구 자기장 고영년변화 (Geomagnetic Paleosecular Variation in the Korean Peninsula during the First Six Centuries)

  • 박종규;박용희
    • 지질공학
    • /
    • 제32권4호
    • /
    • pp.611-625
    • /
    • 2022
  • 지구 자기장의 고영년변화(PSV)를 이용하면 시대 미상의 고고학적 유적에 대한 연대측정이 가능하며, 이를 고고지자기 연대측정 기법이라 한다. 고고지자기 연대측정을 위해서는 비쌍극자기장을 반영하는 그 지역의 PSV 모델이 필요하다. 그동안 국내에서는 자료의 부족으로 시험적 한반도 영년변화 곡선(t-KPSV)을 사용하였으나, 이는 서남 일본의 영년변화(JPSV)로부터 수학적인 계산을 사용한 곡선이므로, 비쌍극자기장의 영향을 고려하지 못하여 신뢰성이 부족하다. 이번 연구는 그동안 한반도에서 수행된 고고지자기학적 연구 결과와 이미 발표되어 신뢰할 수 있는 연구 자료를 바탕으로 한반도 삼국 시대(원삼국 시대 포함)에 해당하는 AD 1~600년 동안의 PSV를 분석하여 곡선을 제시하였다. 제시된 PSV 곡선은 전 지구적 지자기 예측 모델과 비교 분석하였으며, 시험적 한반도 고영년변화(t-KPSV) 곡선과도 비교하였다. 선별된 고고지자기 방향 자료는 시료 수(N) ≥ 6개와 높은 신뢰도를 보이는 통계자료(𝛼95 ≤ 7.8°, k ≥ 57.8)를 보였으며, 전국의 16개 지역에서 총 49개의 자료로 구성된다. 수집한 자료의 고고학적 연대는 방사성 탄소연대측정 결과와 고고학적 편년을 사용하였고, 연대 오차는 ±200년 이하의 기준으로 선별하였다. 선별된 자료들은 편각 341.7~20.1°, 복각 43.5~60.3°의 범위에 분포하며, 이동창문기법(moving window method)을 사용하여 과거 600년간 한반도 PSV 곡선인 KPSV0.6k를 제시하였다. 제시된 모델은 기존의 t-KPSV 곡선과 차이를 보이며, 전 지구적 지자기 모델(ARCH3K.1, CALS3K.4, SED3K.1)에 대비한 결과, 모델들과 방향의 변화 경향이 일치하였으며, 특히 ARCH3K.1 모델이 본 연구에서 제시한 KPSV0.6k와 가장 잘 일치하였다. 이러한 결과는 한국과 일본이 지리적으로는 근접해 있으나 비쌍극자기장 영향이 매우 다르게 나타나며, 따라서 이러한 영향이 고려된 전 지구적 모델이 한반도의 영년변화를 보다 잘 나타낼 수 있는 것으로 해석된다. 따라서 고고지자기 연대측정을 위해서 독자적 영년변화 곡선 구축이 필요하며, 보다 정교한 전 지구적 모델을 위해 보다 많은 신뢰성 높은 한반도의 고고지자기 자료 확보가 필요한 것으로 판단된다. 실제 고고학적 유적지를 대상으로 실시한 고고지자기 연대측정 결과, KPSV0.6k와 ARCH3K.1 모델에선 고고학적 편년과 일치하는 연대를 제시하였다.

딥러닝 기법을 이용한 제주도 중제주수역 지하수위 예측 모델개발 (Development of Deep-Learning-Based Models for Predicting Groundwater Levels in the Middle-Jeju Watershed, Jeju Island)

  • 박재성;정지호;정진아;김기홍;신재현;이동엽;정새봄
    • 지질공학
    • /
    • 제32권4호
    • /
    • pp.697-723
    • /
    • 2022
  • 본연구에서는 제주도의 중제주 수역 내에 위치하는 총 12개 지하수 관정에서 미래 30일 기간의 지하수위를 예측할 수 있는 모델을 개발하였다. 예측 모델개발을 위해 시계열 예측에 적합한 딥러닝 기법의 하나인 누적 장단기 메모리(stacked-LSTM) 기법을 이용하였으며, 2001년에서 2022년 동안 관측된 일 단위 강수량, 지하수 이용량 및 지하수위 자료가 예측 모델개발에 활용되었다. 특히, 본 연구에서는 입력자료의 종류 및 과거 자료의 순차 길이에 따라 다양한 모델을 구축하고 성능을 비교함으로써 딥러닝 기반 예측 모델개발에서 고려하여야 할 사항에 대한 검토와 절차를 제시하였다. 예측 모델개발 결과, 강수량, 지하수 이용량 및 과거 지하수위를 모두 입력자료로 활용하는 모델의 예측성능이 가장 뛰어난 것으로 확인되었으며, 입력으로 활용되는 과거 자료의 순차가 길수록 예측의 성능이 향상됨을 확인하였다. 이는 제주도의 깊은 지하수위 심도로 인하여 강수와 지하수 함양 간 지연시간이 길기 때문으로 판단된다. 이뿐만 아니라, 지하수 이용량 자료의 경우, 모든 이용량 자료를 활용하는 것보다 예측하고자 하는 지점의 지하수위에 민감한 영향을 주는 관정을 선별하여 입력자료로 이용하는 것이 예측 모델의 성능 개선에 긍정적 영향을 주는 것을 확인하였다. 본 연구에서 개발된 지하수위 예측 모델은 현재의 강수량 및 지하수 이용량을 기반으로 미래의 지하수위를 예측할 수 있어 미래의 지하수량에 대한 건전성 정보를 제공함에 따라 적정 지하수량 유지를 위한 다양한 관리방안 마련에 도움이 될 것으로 판단된다.

LED 조명의 광원별 최소 분광분포를 사용하여 자연광 색온도를 재현하는 방법 (A Method of Reproducing the CCT of Natural Light using the Minimum Spectral Power Distribution for each Light Source of LED Lighting)

  • 김양수;오승택;임재현
    • 인터넷정보학회논문지
    • /
    • 제24권2호
    • /
    • pp.19-26
    • /
    • 2023
  • 인간은 자연 빛에 적응하고 진화해왔으나 현재는 실내 생활의 비중이 높아짐에 따라 생체리듬 교란의 문제가 유발되었다. 이의 해결을 위해 일출~일몰간 다채롭게 변화하는 자연광의 색온도를 재현하는 조명이 연구되고 있다. 자연광 색온도의 재현을 위해서는 색온도가 다른 다수의 LED 광원을 사용하여 조명을 제작한 후 수백에서 수천 단계의 광원별 인가전류의 조합에 대한 광특성을 측정 및 수집하여 제어지표 DB를 구성하고 광특성 매칭 방법을 통해 조명을 제어하였다. 이러한 제어 방법은 인가전류의 조합 단계를 세밀하게 할수록 많은 시간 및 경제적 비용이 발생한다는 문제가 있다. 이에 본 논문에서는 LED 광원별 최소 분광분포로 보간 및 조합 연산을 수행하여 자연광 색온도를 재현하는 방법을 제안한다. 먼저 색온도가 다른 광원 채널로 구성되고 각 채널별 256단계의 인가전류 제어 기능을 구현한 LED 조명을 대상으로 채널별 5개의 최소 분광분포(Spectral Power Distribution, SPD)를 실측·수집한다. 이후 수집한 SPD를 대상으로 각 채널별 256단계의 SPD를 생성하는 보간 연산을 수행하고, 채널별 SPD의 조합 연산을 통해 LED 조명의 모든 제어 조합에 대한 SPD를 생성한다. 생성된 SPD를 통해 조도와 색온도를 산출하여 제어지표 DB를 구축한 후 매칭 기법을 통해 자연광의 색온도를 재현한다. 성능 평가에서는 실내 권장 조도 기준을 충족하면서도 평균 오차율 0.18%의 범위 내에서 자연광의 시간별 색온도를 제공하였다.

블록 이동용 러그의 안전사용하중 결정에 관한 구조 평가법 (Structural Evaluation Method to Determination Safe Working Load of Block Handling Lugs)

  • 권오현;박주신;서정관
    • 해양환경안전학회지
    • /
    • 제29권4호
    • /
    • pp.363-371
    • /
    • 2023
  • 한 척의 선박을 건조하기 위해서는 다양한 크기의 블록(block)들을 이동 및 탑재해야 한다. 이러한 과정에서 블록의 체결 방법 및 각 조선소 설비 특성에 맞는 다양한 기능에 부합하는 러그를 사용하고 있다. 블록 구조의 중량 및 형태에 따라서 러그의 크기와 형상이 다양하며, 샤클(shackle)이 체결되는 홀 주변에 부족한 강성을 보완하기 위하여 덧판(doubling pad)을 용접하여 구조를 보강한다. 리프팅(lifting) 조건별 러그의 설계를 하는 방법은 보 이론(beam theory)에 의한 수계산 방법과 유한요소해석 모델링을 이용한 구조해석을 수행하고 있다. 해석적 방법의 경우, 요소의 종류와 모델링 방법에 따라서 결과 차이가 발생하여 표준화된 평가법의 정립이 필요한 상황이다. 이러한 모호한 방법론 적용 시 블록의 이동 및 반전(turn-over) 과정 중에서 심각한 안전 문제를 유발할 가능성이 있다. 본 연구에서는 러그의 실제 탑재공정에 따른 구조 응답을 평가할 수 있는 모델링 조건, 평가법을 확정하고자 다양한 변수의 영향을 수치 구조해석을 통하여 비교 및 분석하였다. 러그 홀(hole) 주변 덧판부와 용접 비드(bead)를 표현한 모델링 기법이 가장 실제적인 거동 결과를 주고 있다. 실제 러그와 동일한 조건(용접부 비드만 주재료와 연결)의 모델링에 등가하중을 적용한 결과는 MPC 하중 적용 결과보다 낮은 최종강도를 나타낸다. 더불어 해석 시간 단축을 위해서 2차원 쉘(shell) 요소를 적용한 경우, 덧판 두께를 85% 수준으로 감소시켜서 안전사용하중을 예측할 수 있음을 확인하였다. 논문에서 검토한 다양한 변수의 영향들 결과는 러그 설계 및 안전사용하중 예측에 근거 자료로 활용될 것으로 기대된다.

딥러닝 알고리즘을 이용한 저선량 디지털 유방 촬영 영상의 복원: 예비 연구 (Radiation Dose Reduction in Digital Mammography by Deep-Learning Algorithm Image Reconstruction: A Preliminary Study)

  • 하수민;김학희;강은희;서보경;최나미;김태희;구유진;예종철
    • 대한영상의학회지
    • /
    • 제83권2호
    • /
    • pp.344-359
    • /
    • 2022
  • 목적 깊은 컨볼루션 신경망 기법을 결합한 영상 잡음 제거 알고리즘을 개발하고 이를 응용하여 저선량 유방 촬영 영상으로 유방암을 진단하는 데 그 효능을 조사하고자 한다. 대상과 방법 6명의 유방 영상 전문의가 전향적 연구에 참여하였다. 모든 영상 전문의는 병변 감지를 위해 저선량 영상을 독립적으로 평가하고 정성적 척도를 사용하여 진단 품질을 평가하였다. 영상 잡음 제거 알고리즘을 적용한 후, 동일한 영상 전문의가 병변 감지 가능성과 영상 품질에 대한 평가를 하였다. 임상 적용을 위해 동일한 영상 전문의가 병변 유형과 위치에 대한 합의 결정 후, 저선량 영상, 재구성된 영상, 기존 선량 영상을 무작위 순서로 제시하여 평가하였다. 결과 전 절제 표본의 저선량 영상을 참조로 40% 재구성된 영상에서 병변이 더 잘 인식되었다. 임상 적용단계에서 40% 재구성된 영상과 비교하여, 기존 선량 영상이 해상도(p < 0.001), 석회에 대한 진단 품질(p < 0.001), 유방 종괴, 비대칭, 구조왜곡의 진단 품질(p = 0.037)에 대해 더 높은 평균값을 보였다. 40% 재구성된 영상은 100% 영상과 비교 시 전반적 화질(p = 0.547), 병변의 가시성(p = 0.120), 대조도(p = 0.083)에서 비슷한 성적을 보였으며 유의미한 차이도 보이지 않았다. 결론 깊은 컨볼루션 신경망 기법을 결합한 효과적인 잡음 제거 및 영상 재구성 처리 알고리즘은 유방 촬영의 상당한 선량 감소를 위한 길을 열어 유방암 진단을 가능하게 할 것이다.

인공광 식물공장에서 수경배양액 및 광질 조절이 상추 실생묘 생장에 미치는 영향 (Hydroponic Nutrient Solution and Light Quality Influence on Lettuce (Lactuca sativa L.) Growth from the Artificial Light Type of Plant Factory System)

  • 허정욱;박경훈;홍승길;이재수;백정현
    • 한국환경농학회지
    • /
    • 제38권4호
    • /
    • pp.225-236
    • /
    • 2019
  • 인공광 식물공장에서는 작물을 생산하기 위하여 일반적으로 화학비료 유래 무기성분을 포함하는 배양액을 시용하여 수경재배한다. 본 연구에서는 광질이 상이한 식물공장에서 관행의 무기배양액 일부 또는 전량을 유기배양액으로 대체할 수 있는 폐기 농업부산물 유래 유기배양액을 시용하여 수경재배하고 작물의 생장에 미치는 영향을 검토하였다. 청색, 적색 및 백색 LED를 1:2:1의 비율로 혼합한 혼합LED 및 관행의 형광등 조사 조건에서 적치마와 청치마 상추 실생묘를 35일간 수경재배한 결과, 적치마와 청치마 상추의 생체중 및 전개엽수 증가는 형광등을 조사한 Y구에서 통계적으로 유의하게 증가하였다. 그러나 유·무기 혼합배양액 처리구인 YK 및 YTJ에서는 오히려 혼합LED 조사구에서 증가하였다. 유기배양액 단용 또는 유·무기 혼합배양액 처리시 엽내 SPAD치는 두 실생묘 모두 Y구와 유사하거나 증가하는 경향을 나타내었다. 관행의 무기배양액인 Y구에서 배양액내 구성성분 중 가장 많은 양을 차지하고 있는 무기성분인 NO3-N은 재배 개시일에 약 97 mg/L으로, 적치마와 청치마 상추 실생묘에서 모두 재배기간이 경과함에 따라 감소하는 경향을 보였다. 적치마의 경우 재배종료시 각 처리구별 NO3-N 농도는 형광등 조사시 약 29 mg/L, 혼합LED 조사시 24 mg/L였으며, 청치마의 경우 형광등 조사시 약 26 mg/L, 혼합LED 조사시 47 mg/L로, 초기 투입량 대비 25~48% 정도의 양이 재배종료시까지 흡수되지 않고 남아 있었다. 재배개시일 NH3-N 농도는 Y구3-N 잔여량은 약 13%로 최대값을 나타내었다. 관행의 무기배양액내 질산태질소는 작물체에 흡수되어 생체중, 엽수 증가와 같은 지상부 생장을 좌우하는 주요 성분이지만 재배종료시까지 전량이 흡수되지 않고 남아 있는 것으로 보아 상추 수경재배시 배양액내 질산태질소의 초기 투입량을 조절할 필요성이 대두되었다. 연구결과 농업부산물 유래 유기배양액을 활용하여 적치마와 청치마 상추를 수경재배할 경우 유기배양액 단용보다 유·무기 혼합배양액 시용으로 유기배양액내 부족한 질소 성분을 무기질소로 보충할 수 있어 무기성분 사용량 저감이 기대된다. 또한 상추 실생묘의 양적생장 추이와 달리 엽내 색소합성이 관행 무기배양액보다 특정 유기배양액 단용 또는 혼용에 의해 유의하게 증가하는 것으로 보아 작물체내 물질합성량, 유기배양액 사용기간 및 재이용 등 유기배양액의 화학적 특성 변화에 대한 연구가 필요할 것으로 판단된다.

UV 공정을 이용한 N-Nitrosodimethylamine (NDMA) 광분해 및 부산물 생성에 관한 연구: 박스-벤켄법 실험계획법을 이용한 통계학적 분해특성평가 및 반응모델 수립 (A study on the Degradation and By-products Formation of NDMA by the Photolysis with UV: Setup of Reaction Models and Assessment of Decomposition Characteristics by the Statistical Design of Experiment (DOE) based on the Box-Behnken Technique)

  • 장순웅;이시진;조일형
    • 대한환경공학회지
    • /
    • 제32권1호
    • /
    • pp.33-46
    • /
    • 2010
  • 본 연구는 광분해 산화공정으로 난분해성 물질인 N-Nitrosodimethylamine (NDMA)인 제거 및 부산물 생성 특성을 파악하기 위한 3개의 독립변수 (자외선 강도($X_1:\;1.5{\sim}4.5\;mW/cm^2$, 초기 NDMA 농도($X_2:\;100{\sim}300\;uM$), pH(X3:3~9))와 4개의 종속변수(NDMA 제거율($Y_1$), dimethylamine (DMA) 생성농도($Y_2$), dimethylformamide (DMF) 생성농도($Y_3$) 및 $NO_2$-N 생성농도($Y_4$))로 구성된 박스-벤켄 설계를 이용한 실험계획을 적용시켜 예측 모델과 광분해 산화 최적조건을 수립하였다. 실험결과 2시간 광분해 후 NDMA는 거의 완전히 제거되었으며 DMA, DMF와 $NO_2$-N은 NDMA 광분해와 동시에 부산물로 생성되었다. 광분해 최적의 조건을 얻기 위해 정준분석을 수행하여 최적 점 (반응값, 독립변수 조건)과 예측반응모델을 수립한 결과, 다음과 같은 결과를 얻었다 ($Y_1=117+21X_1-0.3X_2-17.2X_3+{2.43X_1}^2+{0.001X_2}^2+{3.2X_3}^2-0.08X_1X_2-1.6X_1X_3-0.05X_2X_3$ ($R^2$ = 96%, Adjusted $R^2$ = 88%)와 99.3% ($X_1:\;4.5\;mW/cm^2$, $X_2:\;190\;uM$, $X_3:\;3.2$), $Y_2=-101+18.5X_1+0.4X_2+21X_3-{3.3X_1}^2-{0.01X_2}^2-{1.5X_3}^2-0.01X_1X_2-0.07X_1X_3-0.01X_2X_3$ ($R^2$= 99.4%, 수정 $R^2$ = 95.7%)와 35.2 uM ($X_1:\;3\;mW/cm^2$, $X_2:\;220\;uM$, $X_3:\;6.3$), $Y_3=-6.2+0.2X_1+0.02X_2+2X_3-{0.26X_1}^2-{0.01X_2}^2-{0.2X_3}^2-0.004X_1X_2+0.1X_1X_3-0.02X_2X_3$ ($R^2$= 98%, 수정 $R^2$ = 94.4%)와 3.7 uM ($X_1:\;4.5\;mW/cm^2$, $X_2:\;290\;uM$, $X_3:\;6.2$), $Y_4=-25+12.2X_1+0.15X_2+7.8X_3+{1.1X_1}^2+{0.001X_2}^2-{0.34X_3}^2+0.01X_1X_2+0.08X_1X_3-3.4X_2X_3$ ($R^2$= 98.5%, 수정 $R^2$ = 95.7%)와 74.5 uM ($X_1:\;4.5\;mW/cm^2$, $X_2:\;220\;uM$, $X_3:\;3.1$). 반응표면분석법 중 하나인 박스-벤켄법은 UV 광분해에 의한 NDMA 분해 및 부산물 생성에 대한 통계학적 및 수학적인 결과 및 최적의 운전조건을 제시하였다. 예측모델의 검정을 통하여 박스-벤켄법은 매우 높은 신뢰성을 보였다.

다중 최소 임계치 기반 빈발 패턴 마이닝의 성능분석 (Performance Analysis of Frequent Pattern Mining with Multiple Minimum Supports)

  • 양흥모;윤은일
    • 인터넷정보학회논문지
    • /
    • 제14권6호
    • /
    • pp.1-8
    • /
    • 2013
  • 거대한 데이터베이스로부터 중요하고 의미 있는 정보를 찾아내기 위해 데이터 마이닝 기법들이 사용되며, 패턴 마이닝은 이러한 데이터 마이닝을 위한 중요한 기법 중에 하나이다. 패턴 마이닝은 거대 데이터베이스로부터 유용한 패턴을 찾아내는 기법이며, 패턴 마이닝 분야 중에 하나인 빈발 패턴 마이닝은 데이터베이스에서 최소 임계치 이상의 빈도수를 가지는 빈발 패턴을 마이닝 한다. 전통적인 빈발 패턴 마이닝은 전체 데이터베이스에 대한 단일 최소 임계치를 기반으로 중요 빈발 패턴을 마이닝 한다. 단일 최소 임계치 모델은 데이터베이스 내 모든 아이템이 동일한 특성을 가진다고 암묵적으로 가정한다. 그러나 실제 응용에서는 각 아이템들이 개별적인 특성을 가지고 있을 수 있으며, 따라서 이를 반영한 패턴 마이닝 기법이 요구된다. 데이터베이스 내 아이템들의 이러한 특성이 반영되지 않은 빈발 패턴 마이닝 모델에서, 중요한 희귀 아이템이 포함된 패턴을 마이닝 하기 위해서는 낮은 최소 임계치를 설정해야 한다. 그러나 너무 낮은 최소 임계치는 의미 없는 아이템들을 포함하는 수많은 패턴을 야기한다. 반대로 높은 최소 임계치는 희귀 아이템이 포함된 패턴을 마이닝 하지 못하는 희귀 아이템 문제라 불리는 딜레마가 발생한다. 이러한 문제의 해결을 위한 초기 연구들은 아이템 빈도수에 따라 데이터를 몇 개의 블록으로 분할하거나 관련 희귀 아이템들을 하나의 그룹으로 만드는 방법을 사용한 근사적 접근법을 제안하였다. 그러나 이러한 기법들은 근사적 방법의 적용에 의해 모든 희귀 패턴을 포함한 빈발 패턴을 마이닝 하지 못한다. 다중 최소 임계치를 고려한 패턴 마이닝 모델은 아이템들의 개별적인 특성을 반영하여 희귀 아이템 문제를 해결하기 위해 제안되었다. 다중 최소 임계치 기반의 빈발 패턴 마이닝 모델에서 각 아이템은 MIS (Minimum Item Support)라고 불리는 개별 최소 임계치를 가지며, 아이템들의 데이터베이스 내 빈도수를 기반으로 계산된다. 다중 최소 임계치 모델은 MIS를 통해 수많은 의미 없는 패턴을 생성하지 않고도 손실 없이 모든 희귀 빈발 패턴을 찾아낸다. 한편, 빈발 패턴을 마이닝 하는 과정에서 후보 패턴들이 생성되며, 단일 최소 임계치 모델에서는 각 후보 패턴의 빈도수가 유일한 최소 임계치와 비교된다. 따라서, 희귀 아이템 문제가 발생할 뿐만 아니라 후보 패턴을 구성하는 아이템들의 특성이 고려되지 않는다. 다중 최소 임계치 모델에서는 이 문제를 다루기 위해 후보 패턴을 구성하는 아이템들의 MIS 값 중에서 가장 작은 MIS 값을 해당 후보 패턴의 최소 임계치로 설정하여 패턴 내 아이템들의 특성을 반영한다. 이를 적용하여 효율적으로 희귀 빈발 패턴을 마이닝 하기 위해 트리 구조 기반의 알고리즘은 빈도수 내림차순으로 트리 내 아이템들을 정렬하는 단일 최소 임계치 모델과는 달리 MIS 내림차순으로 아이템들을 정렬하여 마이닝을 수행한다. 본 논문에서는 다중 최소 임계치 기반의 빈발 패턴 마이닝 알고리즘에 대한 특성을 살펴보고, 일반 단일 임계치 기반 알고리즘과의 성능평가를 수행한다. 성능평가는 실행 속도, 메모리 사용량, 그리고 확장성의 관점에서 수행된다. 성능평가 결과, 다중 최소 임계치 기반의 빈발 패턴 마이닝 알고리즘은 희귀 빈발 패턴을 포함한 모든 빈발 패턴을 단일 임계치 기반의 빈발 패턴 마이닝 알고리즘보다 더 빠른 속도로 마이닝 하였으며, 각 아이템의 최소 임계치 정보를 위한 추가적인 메모리를 필요로 하였다. 또한, 비교 알고리즘들은 좋은 확장성 결과를 보였다.