• 제목/요약/키워드: Automatically Generating

검색결과 292건 처리시간 0.024초

고객 온라인 구매후기를 활용한 추천시스템 개발 및 적용 (An Online Review Mining Approach to a Recommendation System)

  • 조승연;최지은;이규현;김희웅
    • 경영정보학연구
    • /
    • 제17권3호
    • /
    • pp.95-111
    • /
    • 2015
  • 추천시스템은 과거 구매행동을 통해 사용자가 향후 구매할 것이라 예상되는 제품을 자동으로 검색하여 제공하는 시스템이다. 이러한 추천시스템은 여러 전자상거래 업체에서 도입하고 있으며, 사용자의 편의성 및 수익에 긍정적인 영향을 미치고 있다. 하지만 사용자가 어떠한 기준을 가지고 제품을 평가하는지, 어떠한 요소가 구매 의사 결정에 영향을 미치는지는 반영할 수 없다는 한계가 있다. 이에 본 연구에서는 사용자가 직접 작성한 구매후기를 통해, 사용자 별 제품 평가요소를 활용할 수 있는 추천 모형 알고리즘을 개발하였다. 토픽 모델링을 활용하여 사용자들의 구매후기를 분석하였으며, 이러한 후기의 특성이 반영된 커널과 평가 점수가 반영된 커널 등을 함께 활용하여 다중 커널 학습 기반의 추천 모형을 개발하였다. 또한, 이러한 모형을 BestBuy 사례에 적용하여 검증하였다. 검증 결과, 기존 협업적 필터링 알고리즘보다 다중 커널 학습에 의한 추천 모형의 정확도가 우수하였고, 구매후기의 유사성을 반영하였기에, 사용자가 어떠한 요소를 평가하는지를 확인할 수 있었다. 또한, 기존 협업적 필터링 알고리즘보다 다양한 제품에 대한 추천이 가능함을 확인할 수 있었다. 본 연구는 토픽 모델링과 커널 학습 기반을 사용한 융합적인 추천모형으로서, 온라인 추천시스템의 새로운 방법을 제안한다.

심층 신경망을 이용한 탄성파 속도 모델 구축 사례 분석 (Case Analysis of Seismic Velocity Model Building using Deep Neural Networks)

  • 조준현;하완수
    • 지구물리와물리탐사
    • /
    • 제24권2호
    • /
    • pp.53-66
    • /
    • 2021
  • 속도 모델 구축은 탄성파 탐사 자료처리에서 필수적인 절차이다. 주시 토모그래피나 속도 분석과 같은 기존 기법들은 하나의 속도 모델을 예측하는 데 계산 시간이 오래 걸리며 역산 결과의 품질이 전문가의 판단에 크게 의존한다. 전파형 역산 또한 초기 속도 모델에 크게 의존한다는 문제가 있다. 최근 심층 신경망 기법이 복잡하고 비선형적인 문제를 푸는데 적용되는 사례가 많아지면서 널리 보급되고 있다. 이 논문에서는 심층 신경망 기법을 이용한 탄성파 속도 모델 구축 사례들을 각 연구에 사용한 신경망에 따라 분류하며 조사하였다. 또한 훈련용 인공 속도 모델 생성 사례도 포함하였다. 심층 신경망은 대량의 데이터로부터 신경망을 훈련함으로써 모델 매개변수를 자동으로 최적화한다. 따라서 기존 기법들에 비해 역산 결과에 사람의 판단이 개입될 여지가 적으며 훈련을 마친 후 하나의 속도 모델을 예측하는 비용은 무시할 수 있다. 또한, 심층 신경망은 전파형 역산과 달리 초기 속도 모델이 필요하지 않다. 여러 연구에서 계산 비용뿐만 아니라 역산 결과에서도 심층 신경망 기법이 뛰어난 성과를 달성하는 것을 보여주었다. 연구 결과들을 바탕으로 속도 모델 구축에 사용된 심층 신경망 기법의 특징에 대해 분석하고 논의하였다.

IFC를 이용한 IndoorGML 데이터 자동 생성에 관한 연구 - Primal Space를 중심으로 - (A Study of IndoorGML Automatic Generation using IFC - Focus on Primal Space -)

  • 남상관;장한메;강혜영;최현상;이지영
    • 한국측량학회지
    • /
    • 제38권6호
    • /
    • pp.623-633
    • /
    • 2020
  • 사람들이 실내공간에서 소비하는 시간이 증가함에 따라, 실내공간을 대상으로 하는 서비스들에 대한 수요가 지속적으로 증가하고 있다. 실내공간정보 서비스를 제공하기 위해서는 실내공간정보를 구축하는 것이 우선적으로 이루어져야 하며 본 연구에서는 기 구축되어 있는 BIM (Building Information Management) 데이터로부터 실내공간정보 국제표준 데이터인 IndoorGML을 생성하는 방법을 제안하였는데 대표적인 BIM 데이터 자료인 IFC (Industry Foundation Class) 데이터를 IndoorGML로 변환하기 위하여 IFC 객체들의 특성을 조사하고, IndoorGML로 변환이 필요한 객체들을 선별하였으며 실내공간의 표현과 내부통행에 제약을 주는 객체로 구분하였다. 또한 개발된 변환도구를 이용하여 빔서버(BIMserver) 깃헙(github)에서 제공하는 데이터 셋 일부와 서울시립대학교 21세기관 IFC모델을 IndoorGML의 PrimalSpaceFeatures 데이터로 구축하는 실험을 수행하였다. 각각의 IFC 데이터를 IndoorGML로 변환한 결과 기하정보를 손실 없이 IndoorGML문서가 생성되었으며, IndoorGML이 가지고 있는 특징인 NavigableBoundary가 정확하게 생성되는 결과를 보였다. 추후, 다양한 형태의 IfcStair 객체를 변환하는 방법에 대한 추가적인 연구가 필요하며, 프라이멀 스페이스(PrimalSpace) 데이터를 이용하여 듀얼 스페이스(DualSpace) 데이터인 MultiLayeredGraph를 자동 생성하는 방법에 대한 개발이 필요하다.

Reproducing Summarized Video Contents based on Camera Framing and Focus

  • Hyung Lee;E-Jung Choi
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권10호
    • /
    • pp.85-92
    • /
    • 2023
  • 본 논문에서는 장편의 드라마나 영화에서 스토리 기반의 축약된 요약본을 자동으로 제작하기 위한 방법을 제안한다. 촬영 단계에서 황금분할을 고려한 공간감 있는 프레임 구성과 내용 전달 차원에서 시청자들의 시선을 집중시키기 위한 관심 대상에 대한 초점을 기본 전제로 했다. 이에 적정한 프레임들을 추출하기 위한 방법을 고려하기 위해서 기존의 씬(scene) 및 숏(shot) 검출에 대한 연구, 초점과 관련된 블러 정도를 파악하는 연구들에서 활용되었던 요소 기술들을 활용했다. 유튜브에서 공유되는 영상을 프레임 단위로 변환한 후 프레임별로 특징을 추출하기 위한 영역으로 프레임 전체 영역과 3개의 부분 영역으로 구분했고, 해당 영역별로 각각 라플라시안 연산자와 FFT를 적용한 결과들을 비교하여 상대적으로 일관성 있고 강건한 FFT를 선택했다. 프레임 전체에 대한 계산값과 3개 영역의 계산값들을 비교하여 상대적으로 선명한 영역을 확인할 수 있는 조건을 기반으로 대상 프레임을 선별했다. 이렇게 선별된 결과를 토대로 숏 내에서 프레임들의 연속성을 확보하기 위해 오프라인 변화점 탐지기법을 적용한 결과와 접목시켜 최종 프레임들을 추출했고, 이를 기반으로 편집결정리스트를 구성하였으며, F1-스코어 75.9%를 갖는 62.77%로 축약된 요약본을 제작했다.

능동모양모델 알고리듬을 위한 삼차원 모델생성 기법 (Three-dimensional Model Generation for Active Shape Model Algorithm)

  • 임성재;정용연;호요성
    • 대한전자공학회논문지SP
    • /
    • 제43권6호
    • /
    • pp.28-35
    • /
    • 2006
  • 통계적 데이터를 이용하여 모양 변이가 가능한 능동모양모델(Active Shape Model, ASM)은 이차원 영상의 분할 및 인식에 성공적으로 사용되고 있다. 삼차원 모델 기반 기법은 객체 경계의 인식 및 묘사(delineating)를 위한 더욱 현실적인 모양 억제력(constraint)을 갖는다는 점에서 이차원 모델 기반 기법에 비해 좋은 결과를 가져온다. 그러나 삼차원 모델 기반 기법을 위해서는 분할된 객체들의 집합인 훈련(training) 데이터로부터 삼차원 모양모델을 생성하는 것이 가장 중요하고 필수적인 단계이며, 현재까지도 커다란 도전 과제로 남아있다. 삼차원 모양모델 생성에서 가장 중요한 단계는 포인트 분산모델(PDM)을 생성하는 것이다. PDM 생성을 위해서는 상응하는 특징점(landmark)을 모든 훈련 데이터의 대응하는 위치에서 선택해야 한다. 그러나 현재까지 많이 사용되는 특징점의 수동 선택 기법은 시간이 많이 소비되며, 많은 오류를 발생한다. 본 논문에서는 삼차원 통계적 모양모델의 생성을 위한 새로운 자동 기법을 제안한다. 주어진 삼차원 훈련 모양 데이터에서, 삼차원 모델은 다음 방법에 의해 생성된다. 1) 훈련 모양 데이터의 거리 변환(distance transform)으로부터 평균(mean) 모양 생성, 2) 평균 모양에서 자동적으로 특징점을 선택하기 위한 사면체(tetrahedron) 기법 사용, 3) 거리 표식(distance labeling) 기법을 통한 각 훈련 모양에서 특징점의 전파(propagating). 본 논문에서는 50명의 복부 CT 영상으로부터 간(liver)을 위한 삼차원 모델을 생성하고, 평가를 위i괘 정확성과 밀집도(compactness)를 조사한다. 기존의 삼차원 모델 생성 기법들은 객체의 모양과 기하학적 및 위상학적으로 심각한 제한을 갖지만, 본 논문에서 제안한 기법은 위와 같은 제한 없이 어느 데이터 집합에도 적용할 수 있다.3mW이며, 시제품 ADC의 칩 면적은 $0.47mm^2$ 이다. 각각 56dB, 65dB이고, 전력 소모는 1.2V 전원 전압에서 각각 4.8mW, 2.4mW이며 제작된 ADC의 칩 면적은 $0.8mm^2$이다.quential scan) 알고리즘과 성능을 비교한다. 실험결과, 제안된 알고리즘은 순차 검색에 비하여 최대 13.2배까지 성능이 향상되었으며, 인덱스의 개수 k가 증가함에 따라 검색 성능도 함께 증가하였다.라서 보다 안전성과 효율성이 뛰어난 2차 대사물질을 찾아내는 연구와 아울러 방제기능이 있는 물질의 생합성경로를 구명하고 대사공학적으로 이용하므로 병해충에 저항성이 있고 잡초 방제효과를 갖는 형질전환 식물을 육성하는 연구가 지속적으로 이루어져야 할 것이다.{\sim}83.8%$ 범위(範圍)를 차지 하였다. 5) 칼슘 섭취량(攝取量)은 권장량 500 mg 에 비(比)하여 양구지역(楊口地域) 아동(兒童)이 $282.4{\sim}355.0mg$이었고 여주지역(麗州地域) 아동(兒童)이 $284.6{\sim}429.0mg$ 이었다. 6) 철(鐵) 섭취량(攝取量)은 권장량 10mg에 비(比)하여 양구지역(楊口地域) 아동(兒童)이 $6.0{\sim}12.1mg$ 범위(範圍)이었고 여주지역(麗州地域) 아동(兒童)이 $6.4{\sim}16.7mg$ 범위(範圍)로 상당수의 아동(兒童)이 권장량에 미달(未達) 되었다. 7) 비터민 A 섭취량(攝取量)은 양구지역(楊口地域)이 $703.4{\sim}1495.6\;IU$ 범위(範圍)이었고 여주지역(麗州地域) 아동(兒童)이 $750.5{\sim}1521.2\;IU$ 범위(範圍)로서 ${\beta}-carotene$으로서의 권장량 5100 I.U,에 비(比)하여 매우 부족되었다

조선 전기 자동물시계의 주전(籌箭) 연구 (A STUDY ON THE JUJEON OF AUTOMATIC CLEPSYDRA IN EARLY JOSEON DYNASTY)

  • 윤용현;김상혁;민병희;오경택
    • 천문학논총
    • /
    • 제36권3호
    • /
    • pp.65-78
    • /
    • 2021
  • Jagyeokru, an automatic striking water clock described in the Sejong Sillok (Veritable Records of King Sejong) is essentially composed of a water quantity control device and a time-signal device, with the former controlling the amount or the flow rate of water and the latter automatically informing the time based on the former. What connects these two parts is a signal generating device or a power transmission device called the 'Jujeon' system, which includes a copper rod on the float and ball-racked scheduled plates. The copper products excavated under Gongpyeong-dong in Seoul include a lot of broken plate pieces and cylinder-like devices. If some plate pieces are put together, a large square plate with circular holes located in a zigzag can be completed, and at the upper right of it is carved 'the first scheduled plate (一箭).' Cylinder-like devices generally 3.8 cm in diameter are able to release a ball, and have a ginkgo leaf-like screen fixed on the inner axis and a bird-shaped hook of which the leg fixes another axis and the beak attaches to the leaf side. The lateral view of this cylinder-like device appears like a trapezoid and mounts an iron ball. The function of releasing a ball agrees with the description of Borugak Pavilion, where Jagyeokru was installed, written by Kim Don (1385 ~ 1440). The other accounts of Borugak Pavilion's and Heumgyeonggak Pavilion's water clocks describe these copper plates and ball releasing devices as the 'Jujeon' system. According to the description of Borugak Pavilion, a square wooden column has copper plates on the left and right sides the same height as the column, and the left copper plate has 12 drilled holes to keep the time of a 12 double-hours. Meanwhile, the right plate has 25 holes which represent seasonal night 5-hours (Kyeong) and their 5-subhours (Jeom), not 12 hours. There are 11 scheduled plates for seasonal night 5-hours made with copper, which are made to be attached or detached as the season. In accordance with Nujutongui (manual for the operation of the yardstick for the clepsydra), the first scheduled plate for the night is used from the winter solstice (冬至) to 2 days after Daehan (大寒), and from 4 days before Soseol (小雪) to a day before the winter solstice. Besides the first scheduled plate, we confirm discovering a third scheduled plate and a sixth scheduled plate among the excavated copper materials based on the spacing between holes. On the other hand, the width of the scheduled plate is different for these artifacts, measured as 144 mm compared to the description of the Borugak Pavilion, which is recorded as 51 mm. From this perspective, they may be the scheduled plates for the Heumgyeonggak Ongru made in 1438 (or 1554) or for the new Fortress Pavilion installed in Changdeokgung palace completed in 1536 (the 31st year of the reign of King Jungjong) in the early Joseon dynasty. This study presents the concept of the scheduled plates described in the literature, including their new operating mechanism. In addition, a detailed model of 11 scheduled plates is designed from the records and on the excavated relics. It is expected that this study will aid in efforts to restore and reconstruct the automatic water clocks of the early Joseon dynasty.

GOCI-II를 활용한 단기 연안지형변화 모니터링 가능성 평가 연구 (A Study on the Possibility of Short-term Monitoring of Coastal Topography Changes Using GOCI-II)

  • 이진교;김근용;유주형
    • 대한원격탐사학회지
    • /
    • 제37권5_2호
    • /
    • pp.1329-1340
    • /
    • 2021
  • 해양과 육상사이의 전이지대인 조간대는 인위적 활동과 자연적 교란에 의해 다양한 변화가 빠르게 일어나 지속적인 모니터링이 필요하다. 원격탐사 방법을 활용한 연안지형변화 모니터링은 조간대 접근성에 대한 한계를 극복하고, 조간대의 장기적인 지형변화를 관측하는데 효과적인 것으로 평가된다. 원격탐사를 이용한 기존 연안지형 모니터링연구는 대부분 Landsat 위성시리즈와 Sentinel 위성 영상 분석을 통해 수행되었다. 본 연구는 GOCI-II(천리안 해양위성 2호)영상에서 NDWI 지수를 이용해 수륙경계선을 추출한 후 다양한 조위에 따른 경기만 일대 조간대 면적 변화를 파악하고 짧은 기간 동안 DEM제작과 지형고도변화 관측의 유용성에 대해 살펴보았다. 2020년 10월 8일부터 2021년 8월 16일까지 경기만 일대에서 획득된 영상은 GOCI-II 249장, Sentinel-2A/B 39장, Landsat 8 OLI는 7장이었다. 조간대 DEM을 제작할 경우, Sentinel과 Landsat 영상은 최소 3개월에서 1년 이상의 자료수집이 필요했지만, GOCI-II 위성은 단 하루의 자료를 이용해서 조위에 따른 경기만 일대 조간대 DEM생성이 가능하였고 조간대 노출빈도 계산을 통해 지형고도변화도 관측하였다. GOCI-II 위성을 활용해 연안지형변화를 관측시 짧은 주기의 높은 시간해상도로 지형 변화를 조기 감지하고 부족한 공간해상도는 고해상도의 다중복합자료를 이용해 정밀하게 보간하여 활용하는 방안이 좋을 것으로 생각된다. 향후, 위 결과들을 바탕으로 연구 영역을 확대하고, 자동 분석 및 탐지 가능한 기술 개발을 통해 한반도 연안의 최신 지형도와 연안관리에 필요한 정보를 빠르게 제공 가능할 것으로 기대된다.

매장 문화재 공간 분포 결정을 위한 지하투과레이더 영상 분석 자동화 기법 탐색 (Automated Analyses of Ground-Penetrating Radar Images to Determine Spatial Distribution of Buried Cultural Heritage)

  • 권문희;김승섭
    • 자원환경지질
    • /
    • 제55권5호
    • /
    • pp.551-561
    • /
    • 2022
  • 지구물리탐사기법은 매장 문화재 조사에 필요한 높은 해상도의 지하 구조 영상 생성과 매장 유구의 정확한 위치 결정하는 데 매우 유용하다. 이 연구에서는 경주 신라왕경 중심방의 고해상도 지하투과레이더 영상에서 유구의 규칙적인 배열이나 선형 구조를 자동적으로 구분하기 위하여 영상처리 기법인 영상 특징 추출과 영상분할 기법을 적용하였다. 영상 특징 추출의 대상은 유구의 원형 적심과 선형의 도로 및 담장으로 캐니 윤곽선 검출(Canny edge detection)과 허프 변환(Hough Transform) 알고리듬을 적용하였다. 캐니 윤곽선 검출 알고리듬으로 검출된 윤곽선 이미지에 허프 변환을 적용하여 유구의 위치를 탐사 영상에서 자동 결정하고자 하였으나, 탐사 지역별로 매개변수를 달리해서 적용해야 한다는 제약이 있었다. 영상 분할 기법의 경우 연결요소 분석 알고리듬과 QGIS에서 제공하는 Orfeo Toolbox (OTB)를 이용한 객체기반 영상분석을 적용하였다. 연결 요소 분석 결과에서, 유구에 의한 신호들이 연결된 요소들로 효과적으로 인식되었지만 하나의 유구가 여러 요소로 분할되어 인식되는 경우도 발생함을 확인하였다. 객체기반 영상분석에서는 평균이동(Large-Scale Mean-Shift, LSMS) 영상 분할을 적용하여 각 분할 영역에 대한 화소 정보가 포함된 벡터 레이어를 우선 생성하였고, 유구를 포함하는 영역과 포함하지 않는 영역을 선별하여 훈련 모델을 생성하였다. 이 훈련모델에 기반한 랜덤포레스트 분류기를 이용해 LSMS 영상분할 벡터 레이어에서 유구를 포함하는 영역과 그렇지 않은 영역이 자동 분류 될 수 있음을 확인하였다. 이러한 자동 분류방법을 매장 문화재 지하투과레이더 영상에 적용한다면 유구 발굴 계획에 활용가능한 일관성 있는 결과를 얻을 것으로 기대한다.

위성영상의 방사적 특성을 고려한 구름 탐지 방법 개발 (Development of Cloud Detection Method Considering Radiometric Characteristics of Satellite Imagery)

  • 서원우;강홍기;윤완상;임평채;이수암;김태정
    • 대한원격탐사학회지
    • /
    • 제39권6_1호
    • /
    • pp.1211-1224
    • /
    • 2023
  • 구름은 광학위성을 이용한 국토 관측 및 재난 대응, 변화 탐지 등 지표의 현상을 관측하는데 있어 많은 어려운 문제를 야기한다. 구름의 존재는 영상 처리 단계 뿐만 아니라 최종적으로는 데이터의 품질에 영향을 미치므로 이를 반드시 식별하고 제거하는 과정이 필요하다. 따라서 본 연구에서는 위성영상 내 구름의 분광패턴에 가장 근접한 화소를 탐색 및 추출해 최적의 임계값을 선정하고 임계값을 바탕으로 구름 산출물을 제작하는 일련의 과정을 자동으로 수행하는 새로운 구름 탐지 기법을 개발하고자 하였다. 구름 탐지 기법은 크게 세 단계로 구성된다. 첫 번째 단계에서는 Digital Number (DN) 단위 영상을 대기상층 반사율 단위로 변환하는 과정을 수행한다. 두 번째 단계에서는 대기상층 반사율 영상을 이용하여 Hue-Value-Saturation (HSV) 변환 및 삼각형 임계 처리, 최대우도 분류 등의 전처리를 적용하고 각 영상별로 초기 구름 마스크 생성을 위한 임계값을 결정한다. 세번째 후처리 단계에서는 생성된 초기 구름 마스크에 포함된 노이즈를 제거하고 구름 경계 및 내부를 개선한다. 구름 탐지를 위한 실험 자료로 구름의 공간적, 계절적 분포의 다양성을 보여주는 4~11월 시기에 한반도 지역에서 촬영된 국토위성 L2G 영상을 사용하였다. 제안 방법의 성능을 검증하기 위해 단일 임계화 방법으로 생성된 결과를 비교하였다. 실험 결과, 제안 방법은 기존 방법과 비교하여 전처리 과정을 통해 각 영상의 방사학적 특성을 고려할 수 있어 보다 정확하게 구름을 검출할 수 있었다. 또한, 구름 개체를 제외한 나머지 밝은 물체(판넬식 지붕, 콘크리트 도로, 모래 등)의 영향을 최소화하는 결과를 보여주었다. 제안 방법은 기존 방법 대비 F1-score 기준으로 30% 이상의 개선된 결과를 보여주었으나 눈이 포함된 특정 영상에서 한계점이 있었다.

클라우드 환경에서 MongoDB 기반의 비정형 로그 처리 시스템 설계 및 구현 (Design and Implementation of MongoDB-based Unstructured Log Processing System over Cloud Computing Environment)

  • 김명진;한승호;최운;이한구
    • 인터넷정보학회논문지
    • /
    • 제14권6호
    • /
    • pp.71-84
    • /
    • 2013
  • 컴퓨터 시스템 운용 간에 발생하는 많은 정보들이 기록되는 로그데이터는 컴퓨터 시스템 운용 점검, 프로세스의 최적화, 사용자 최적화 맞춤형 제공 등 다방면으로 활용되고 있다. 본 논문에서는 다양한 종류의 로그데이터들 중에서 은행에서 발생하는 대용량의 로그데이터를 처리하기 위한 클라우드 환경 하에서의 MongoDB 기반 비정형 로그 처리시스템을 제안한다. 은행업무간 발생하는 대부분의 로그데이터는 고객의 업무처리 프로세스 간에 발생하며, 고객 업무 프로세스 처리에 따른 로그데이터를 수집, 저장, 분류, 분석하기 위해서는 별도로 로그데이터를 처리하는 시스템을 구축해야만 한다. 하지만 기존 컴퓨팅환경 하에서는 폭발적으로 증가하는 대용량 비정형 로그데이터 처리를 위한 유연한 스토리지 확장성 기능, 저장된 비정형 로그데이터를 분류, 분석 처리할 수 있는 기능을 구현하기가 매우 어렵다. 이에 따라 본 논문에서는 클라우드 컴퓨팅 기술을 도입하여 기존 컴퓨팅 인프라 환경의 분석 도구 및 관리체계에서 처리하기 어려웠던 비정형 로그데이터를 처리하기 위한 클라우드 환경기반의 로그데이터 처리시스템을 제안하고 구현하였다. 제안한 본 시스템은 IaaS(Infrastructure as a Service) 클라우드 환경을 도입하여 컴퓨팅 자원의 유연한 확장성을 제공하며 실제로, 로그데이터가 장기간 축적되거나 급격하게 증가하는 상황에서 스토리지, 메모리 등의 자원을 신속성 있고 유연하게 확장을 할 수 있는 기능을 포함한다. 또한, 축적된 비정형 로그데이터의 실시간 분석이 요구되어질 때 기존의 분석도구의 처리한계를 극복하기 위해 본 시스템은 하둡 (Hadoop) 기반의 분석모듈을 도입함으로써 대용량의 로그데이터를 빠르고 신뢰성 있게 병렬 분산 처리할 수 있는 기능을 제공한다. 게다가, HDFS(Hadoop Distributed File System)을 도입함으로써 축적된 로그데이터를 블록단위로 복제본을 생성하여 저장관리하기 때문에 본 시스템은 시스템 장애와 같은 상황에서 시스템이 멈추지 않고 작동할 수 있는 자동복구 기능을 제공한다. 마지막으로, 본 시스템은 NoSQL 기반의 MongoDB를 이용하여 분산 데이터베이스를 구축함으로써 효율적으로 비정형로그데이터를 처리하는 기능을 제공한다. MySQL과 같은 관계형 데이터베이스는 복잡한 스키마 구조를 가지고 있기 때문에 비정형 로그데이터를 처리하기에 적합하지 않은 구조를 가지고 있다. 또한, 관계형 데이터베이스의 엄격한 스키마 구조는 장기간 데이터가 축적되거나, 데이터가 급격하게 증가할 때 저장된 데이터를 분할하여 여러 노드에 분산시키는 노드 확장이 어렵다는 문제점을 가지고 있다. NoSQL은 관계형 데이터베이스에서 제공하는 복잡한 연산을 지원하지는 않지만 데이터가 빠르게 증가할 때 노드 분산을 통한 데이터베이스 확장이 매우 용이하며 비정형 데이터를 처리하는데 매우 적합한 구조를 가지고 있는 비관계형 데이터베이스이다. NoSQL의 데이터 모델은 주로 키-값(Key-Value), 컬럼지향(Column-oriented), 문서지향(Document-Oriented)형태로 구분되며, 제안한 시스템은 스키마 구조가 자유로운 문서지향(Document-Oriented) 데이터 모델의 대표 격인 MongoDB를 도입하였다. 본 시스템에 MongoDB를 도입한 이유는 유연한 스키마 구조에 따른 비정형 로그데이터 처리의 용이성뿐만 아니라, 급격한 데이터 증가에 따른 유연한 노드 확장, 스토리지 확장을 자동적으로 수행하는 오토샤딩 (AutoSharding) 기능을 제공하기 때문이다. 본 논문에서 제안하는 시스템은 크게 로그 수집기 모듈, 로그 그래프생성 모듈, MongoDB 모듈, Hadoop기반 분석 모듈, MySQL 모듈로 구성되어져 있다. 로그 수집기 모듈은 각 은행에서 고객의 업무 프로세스 시작부터 종료 시점까지 발생하는 로그데이터가 클라우드 서버로 전송될 때 로그데이터 종류에 따라 데이터를 수집하고 분류하여 MongoDB 모듈과 MySQL 모듈로 분배하는 기능을 수행한다. 로그 그래프생성 모듈은 수집된 로그데이터를 분석시점, 분석종류에 따라 MongoDB 모듈, Hadoop기반 분석 모듈, MySQL 모듈에 의해서 분석되어진 결과를 사용자에게 웹 인터페이스 형태로 제공하는 역할을 한다. 실시간적 로그데이터분석이 필요한 로그데이터는 MySQL 모듈로 저장이 되어 로그 그래프생성 모듈을 통하여 실시간 로그데이터 정보를 제공한다. 실시간 분석이 아닌 단위시간당 누적된 로그데이터의 경우 MongoDB 모듈에 저장이 되고, 다양한 분석사항에 따라 사용자에게 그래프화해서 제공된다. MongoDB 모듈에 누적된 로그데이터는 Hadoop기반 분석모듈을 통해서 병렬 분산 처리 작업이 수행된다. 성능 평가를 위하여 로그데이터 삽입, 쿼리 성능에 대해서 MySQL만을 적용한 로그데이터 처리시스템과 제안한 시스템을 비교 평가하였으며 그 성능의 우수성을 검증하였다. 또한, MongoDB의 청크 크기별 로그데이터 삽입 성능평가를 통해 최적화된 청크 크기를 확인하였다.