• 제목/요약/키워드: Log Clustering

검색결과 73건 처리시간 0.025초

웹 정보 검색 이력을 이용한 사용자 의도 자동 추출 (Automatic Extract User Intention from Web Search Log)

  • 박기남;정순영;서태원;지혜성;이태민;임희석
    • 컴퓨터교육학회논문지
    • /
    • 제12권6호
    • /
    • pp.21-32
    • /
    • 2009
  • 본 논문은 사용자가 정보 욕구를 정확하게 질의어로 입력하고, 원하는 정보가 검색될 수 있도록 지원하기 위한 사용자 의도 자동추출과 이를 이용한 인텐션 맵 구축 방법을 제안한다. 제안하는 방법은 동일한 검색어를 입력한 사용자들의 검색 이력 데이터를 이용하여 사용자 의도 자질을 선정하고, 클러스터링 알고리즘과 사용자 의도 추출 알고리즘을 이용하여 사용자 의도를 추출하였다. 추출된 사용자 의도는 지식표상 이론에 근거한 인텐션 맵으로 표현하였다. 제안한 인텐션 맵의 효용성 분석을 위하여 현재 국내 상용 검색엔진에서 제공받은 2,600개의 사용자 검색 이력 데이터를 이용하였다. 실험결과 인텐션 맵을 이용한 정보검색이 일반 검색엔진을 이용 할 때 보다 통계적으로 유의미한 만족도를 나타내었다.

  • PDF

논제 부정 Access에 대한 Firewall의 과제와 대책

  • 변성준;서정석;최원석
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2000년도 추계학술대회 E-Business와 정보보안
    • /
    • pp.227-238
    • /
    • 2000
  • Firewall은 다양한 부정Access의 방지책으로서 확실히 유효한 수단이지만 이 Firewall은 사용자로부터 지시된 설정을 충실히 실행하는 것으로 설정 오류, 소프트웨어의 정지, 허가된 룰을 악용한 침입 등 반드시 사용자가 바라는 작용을 무조건적 상태에서 보증해 주는 것은 아니다. 따라서 사용자는 도입 후 에도 운용시에 Access log를 감시하고 본래의 Security Policy에 반하는 행위를 매일 매일 체크하지 않으면 안될 상황에 처해 있다. 본 연구는 이러한 부정Access에 대한 이와 같은 Firewall의 현상에 대한 과제 중에서 "부정Access를 어떻게 하면 일찍, 정확히 체크할 수 있는가\ulcorner"라는 주제를 선택하여 Firewall의 한계와 그 대응책을 실제로 부정Access를 시험해 보는 것으로 검증하기로 하였다. 실험결과에서 (1)Port Scan이나 전자메일 폭탄(서비스정지공격)등은 Firewall로 방지하는 것은 불가능하거나 혹은 Checking이 곤란하다. (2)공격마다 로그 수집을 했음에도 관계없이 Firewall의 로그는 번잡하므로 단시간에 사태의 발견이 대단히 곤란하다고 하는 Firewall의 한계를 인식하였다. 그리고 그 대책으로서 우리는 체크 툴의 유효성에 착안하여 조사한 결과, 결국 무엇이 부정Access인가에 대해서는 어디까지나 이용하는 측이 판단하여 Firewall 상에 설정하지 않으면 안되지만 체크 툴은 이 부정Access 정보를 데이터베이스로서 갖고 있음으로써 '무엇이 부정Access인가'를 이용자 대신에 판단하고 툴에 따라서는 설정을 자동적으로 변경하여 부정 Access의 저지율을 향상시킨다. 이처럼 체크 툴은 Firewall의 수비능력을 보강하는 위치에 있다고 생각할 수 있다.다. 4 장에서는 3장에서 제기한 각각의 문제점에 대해 RAD 의 관점에 비추어 e-business 시스템의 단기개발을 실현하기 위한 고려사항이나 조건 해결책을 제안한다. 본 논문이 지금부터 e-business 를 시작하려고 하는 분, e-business 시스템의 개발을 시작하려고 하는 분께 단기간의 e-business 실현을 위한 하나의 지침이 된다면 다행이겠다.formable template is used to optimize the matching. Then, clustering the similar shapes by the distance between each centroid, papaya can be completely detected from the background.uage ("Association of research for algorithm of calculating machine (1992)"). As a result, conventional NN and CNN were available for interpolation of sampling data. Moreover, when nonlinear intensity is not so large under the field condition of small slope, interpolation performance of CNN was a little not so better than NN. However, when nonlinear intensity is large under the field condition of large slope, interpolation performance of CNN was relatively better than NN.콩과 자연 콩이 성분 분석에서 차이를

  • PDF

벡터오차수정모형과 다변량 GARCH 모형을 이용한 코스피200 선물의 헷지성과 분석 (Hedging effectiveness of KOSPI200 index futures through VECM-CC-GARCH model)

  • 권동안;이태욱
    • Journal of the Korean Data and Information Science Society
    • /
    • 제25권6호
    • /
    • pp.1449-1466
    • /
    • 2014
  • 본 논문에서는 기초자산의 선물을 이용하는 헷지 전략을 연구하였다. 최적헷지비율을 구하기 위한 전통적인 방법으로 회귀분석이 사용되고 있으나, 현물과 선물 사이에 존재하는 장기균형관계와 금융 시계열 자료의 분산에 존재하는 변동성 군집현상 등의 특징을 설명하지 못하는 한계가 있다. 이를 극복하기 위해 코스피200 지수와 선물 자료에 대해 평균모형으로 벡터오차수정모형을 적합하고, 분산모형으로 다변량 GARCH 모형을 적합하여 분산-공분산 행렬을 추정하고, 이를 통해 최적헷지비율을 구하는 방법을 연구하였다. 실증분석 결과에 의하면 시장이 안정적일 때에는 회귀분석을 사용해도 큰 차이가 없지만, 시장이 불안정해지고 변동성이 커지는 구간에서는 벡터오차수정모형과 다변량 GARCH 모형을 이용하는 경우에 헷지성과가 월등히 좋아지는 결과를 얻을 수 있었다.

Expression profiling of cultured podocytes exposed to nephrotic plasma reveals intrinsic molecular signatures of nephrotic syndrome

  • Panigrahi, Stuti;Pardeshi, Varsha Chhotusing;Chandrasekaran, Karthikeyan;Neelakandan, Karthik;PS, Hari;Vasudevan, Anil
    • Clinical and Experimental Pediatrics
    • /
    • 제64권7호
    • /
    • pp.355-363
    • /
    • 2021
  • Background: Nephrotic syndrome (NS) is a common renal disorder in children attributed to podocyte injury. However, children with the same diagnosis have markedly variable treatment responses, clinical courses, and outcomes, suggesting molecular heterogeneity. Purpose: This study aimed to explore the molecular responses of podocytes to nephrotic plasma to identify specific genes and signaling pathways differentiating various clinical NS groups as well as biological processes that drive injury in normal podocytes. Methods: Transcriptome profiles from immortalized human podocyte cell line exposed to the plasma of 8 subjects (steroid-sensitive nephrotic syndrome [SSNS], n=4; steroid-resistant nephrotic syndrome [SRNS], n=2; and healthy adult individuals [control], n=2) were generated using microarray analysis. Results: Unsupervised hierarchical clustering of global gene expression data was broadly correlated with the clinical classification of NS. Differential gene expression (DGE) analysis of diseased groups (SSNS or SRNS) versus healthy controls identified 105 genes (58 up-regulated, 47 down-regulated) in SSNS and 139 genes (78 up-regulated, 61 down-regulated) in SRNS with 55 common to SSNS and SRNS, while the rest were unique (50 in SSNS, 84 genes in SRNS). Pathway analysis of the significant (P≤0.05, -1≤ log2 FC ≥1) differentially expressed genes identified the transforming growth factor-β and Janus kinase-signal transducer and activator of transcription pathways to be involved in both SSNS and SRNS. DGE analysis of SSNS versus SRNS identified 2,350 genes with values of P≤0.05, and a heatmap of corresponding expression values of these genes in each subject showed clear differences in SSNS and SRNS. Conclusion: Our study observations indicate that, although podocyte injury follows similar pathways in different clinical subgroups, the pathways are modulated differently as evidenced by the heatmap. Such transcriptome profiling with a larger cohort can stratify patients into intrinsic subtypes and provide insight into the molecular mechanisms of podocyte injury.

Clinical comparison of marginal fit of ceramic inlays between digital and conventional impressions

  • Franklin Guillermo Vargas-Corral;Americo Ernesto Vargas-Corral;Miguel Angel Rodríguez Valverde;Manuel Bravo;Juan Ignacio Rosales Leal
    • The Journal of Advanced Prosthodontics
    • /
    • 제16권1호
    • /
    • pp.57-65
    • /
    • 2024
  • PURPOSE. The aim of this stuldy was to compare the clinical marginal fit of CAD-CAM inlays obtained from intraoral digital impression or addition silicone impression techniques. MATERIALS AND METHODS. The study included 31 inlays for prosthodontics purposes of 31 patients: 15 based on intraoral digital impressions (DI group); and 16 based on a conventional impression technique (CI group). Inlays included occlusal and a non-occlusal surface. Inlays were milled in ceramic. The inlay-teeth interface was replicated by placing each inlay in its corresponding uncemented clinical preparation and taking interface impressions with silicone material from occlusal and free surfaces. Interface analysis was made using white light confocal microscopy (WLCM) (scanning area: 694 × 510 ㎛2) from the impression samples. The gap size and the inlay overextension were measured from the microscopy topographies. For analytical purposes (i.e., 95-%-confidence intervals calculations and P-value calculations), the procedure REGRESS in SUDAAN was used to account for clustering (i.e., multiple measurements). For p-value calculation, the log transformation of the dependent variables was used to normalize the distributions. RESULTS. Marginal fit values for occlusal and free surfaces were affected by the type of impression. There were no differences between surfaces (occlusal vs. free). Gap obtained for DI group was 164 ± 84 ㎛ and that for CI group was 209 ± 104 ㎛, and there were statistical differences between them (p = .041). Mean overextension values were 60 ± 59 ㎛ for DI group and 67 ± 73 ㎛ for CI group, and there were no differences between then (p = .553). CONCLUSION. Digital impression achieved inlays with higher clinical marginal fit and performed better than the conventional silicone materials.

인터넷 게시판 질문 분류를 위한 인터랙티브 접근방법에 관한 연구 (An Interactive Approach to Categorize Questions on the Internet BBSs)

  • Jae-Kwang Lee;Seong-Ho Noh;Ok-Hyun Ryou
    • 한국전자거래학회지
    • /
    • 제8권3호
    • /
    • pp.177-195
    • /
    • 2003
  • 전통적인 고객지원방법에서는 콜 센터와 서비스 센터가 고객의 질문과 요구 사항을 접수하고 응대하는 기능을 담당해왔다. 최근 인터넷의 급속한 확산에 따라 전화, 우편, 방문 등의 전통적인 고객과의 의사소통수단이 전자우편과 인터넷 게시판과 같은 웹기반의 고객지원시스템으로 전환되고 있다. 인터넷 게시판은 기본적으로 고객의 질문에 관리자가 응답하는 시스템이므로 고객이 응답을 받는데 시간이 걸리는 제약이 있다. 이러한 시간적 제약을 해결하기 위하여 고객이 인터넷을 통하여 고객지원시스템에 접속하여 미리 구축된 지식 데이터베이스로부터 원격에서 질문에 대한 응답을 받을 수 있도록 공통적인 질문과 응답을 FAQ와 같은 형태를 제공한다. 그리고, 인터넷 게시판에 다양한 내용과 형태의 질문이 혼재되어 사용됨으로써 응답과 관리상의 어려움이 많다. 따라서 질문들을 체계적으로 분류하여 FAQ를 만들고, 인터넷 게시판의 관리작업을 지원하기 위한 도구의 필요성이 대두되고 있다. 본 연구에서는 키워드와 키워드들간의 친밀도를 이용하여 벡터형태로 표현한 질문들간의 유사 도를 계산하여 질문들을 클러스터링 하는 방법을 제안한다. 제안한 방법은 기본적으로 자동으로 질문들을 분류하지만, 내용이 애매모호한 질문의 경우 사용자가 상호작용을 통하여 사용자의 판단을 받아들일 수 있도록 개발되었다. 그리고, 제안한 방법의 성능을 평가하기 위하여 프로토타입 시스템을 개발하고 제한된 상황하에서 실험을 수행하였다.

  • PDF

조선 산업에서 프로세스 마이닝을 이용한 블록 조립 프로세스의 계획 및 실적 비교 분석 (Comparison between Planned and Actual Data of Block Assembly Process using Process Mining in Shipyards)

  • 이동하;박재훈;배혜림
    • 한국전자거래학회지
    • /
    • 제18권4호
    • /
    • pp.145-167
    • /
    • 2013
  • 본 논문에서는 조선 산업에서 블록 조립 작업에 대한 계획 프로세스와 실적 프로세스를 비교하는 방법을 제안한다. 제안한 방법은 계획과 실적 데이터 기반으로 프로세스 마이닝 기법을 이용하여 프로세스 모델을 도출하고 비교 분석을 수행하는데, 분석 절차는 1) 데이터 전처리, 2) 분석 수준의 정의, 3) 조립 블록 군집화, 4) 군집별 프로세스 모델 도출, 5) 계획과 실적 프로세스 모델 비교, 다섯 단계로 구성된다. 단계 5에서는 프로세스 모델, 작업, 프로세스 인스턴스, 모델 적합도와 같은 다양한 관점에서 계획과 실적의 프로세스를 비교할 것을 제안하고, 각 관점별 비교 인자들을 정의한다. 특히, 적합도 관점에서는 교차 적합도를 정의하여, 도출된 프로세스 모델에 대해 자신의 데이터에 대한 적합도뿐만 아니라, 상대 데이터(계획 모델의 경우 실적 데이터, 실적 모델의 경우 계획 데이터)에 대한 적합도를 계산하고 비교 분석할 것을 제안한다. 제안한 방법의 효용성은 세계 최고 수준의 국내 조선 업체의 블록 조립 계획 시스템과 블록 조립 모니터링 시스템의 실제 데이터를 이용하여 사례 연구를 통해 설명하고 검증하였다.

프로세스 마이닝을 활용한 온라인 교육 오픈 플랫폼 내 학습 패턴 분석 방법 개발 (Toward understanding learning patterns in an open online learning platform using process mining)

  • 김태영;김효민;조민수
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.285-301
    • /
    • 2023
  • 비대면 교육의 중요성 및 필요에 따른 수요가 증가함에 따라 국내외 온라인 교육 오픈 플랫폼이 활성화되고 있다. 본 플랫폼은 대학 등 교육 전문기관과 달리 학습자의 자율성이 높은 특징을 가지며 이에 따라 개인화된 학습 도구를 지원하기 위한 학습 행동 데이터의 분석 연구가 중요시 되고 있다. 실제적인 학습 행동을 이해하고 패턴을 도출하기 위하여 프로세스 마이닝이 다수 활용되었지만 온라인 교육 플랫폼과 같이 자기 관리형(Self-regulated) 환경에서의 학습 로그를 기반한 사례는 부족하다. 또한, 대부분 프로세스 모델 도출 등의 모델 관점에서의 접근이며 분석 결과의 실제적인 적용을 위한 개별 패턴 및 인스턴스 관점에서의 방법 제시는 미흡하다. 본 연구에서는 온라인 교육 오픈 플랫폼 내 학습 패턴을 파악하기 위하여 프로세스 마이닝을 활용한 분석 방법을 제시한다. 학습 패턴을 다각도로 분석하기 위하여 모델, 패턴, 인스턴스 관점에서의 분석 방법을 제시하며, 프로세스 모델 발견, 적합도 검사, 군집화 기법, 예측 알고리즘 등 다양한 기법을 활용한다. 본 방법은 국내 오픈 교육 플랫폼 내 기계학습 관련 강좌의 학습 로그를 추출하여 분석하였다. 분석 결과 온라인 강의의 특성에 맞게 비구조화된 프로세스 모델을 도출할 수 있었으며 구체적으로 한 개의 표준 학습 패턴과 세 개의 이상 학습 패턴으로 세분화할 수 있었다. 또한, 인스턴스별 패턴 분류 예측 모델을 도출한 결과 전체 흐름 중 초기 30%의 흐름을 바탕으로 예측하였을 때 0.86의 분류 정확도를 보였다. 본 연구는 프로세스 마이닝을 활용하여 학습자의 패턴을 체계적으로 분석한다는 점에서 기여점을 가진다.

Association between High Diffusion-Weighted Imaging-Derived Functional Tumor Burden of Peritoneal Carcinomatosis and Overall Survival in Patients with Advanced Ovarian Carcinoma

  • He An;Jose AU Perucho;Keith WH Chiu;Edward S Hui;Mandy MY Chu;Siew Fei Ngu;Hextan YS Ngan;Elaine YP Lee
    • Korean Journal of Radiology
    • /
    • 제23권5호
    • /
    • pp.539-547
    • /
    • 2022
  • Objective: To investigate the association between functional tumor burden of peritoneal carcinomatosis (PC) derived from diffusion-weighted imaging (DWI) and overall survival in patients with advanced ovarian carcinoma (OC). Materials and Methods: This prospective study was approved by the local research ethics committee, and informed consent was obtained. Fifty patients (mean age ± standard deviation, 57 ± 12 years) with stage III-IV OC scheduled for primary or interval debulking surgery (IDS) were recruited between June 2016 and December 2021. DWI (b values: 0, 400, and 800 s/mm2) was acquired with a 16-channel phased-array torso coil. The functional PC burden on DWI was derived based on K-means clustering to discard fat, air, and normal tissue. A score similar to the surgical peritoneal cancer index was assigned to each abdominopelvic region, with additional scores assigned to the involvement of critical sites, denoted as the functional peritoneal cancer index (fPCI). The apparent diffusion coefficient (ADC) of the largest lesion was calculated. Patients were dichotomized by immediate surgical outcome into high- and low-risk groups (with and without residual disease, respectively) with subsequent survival analysis using the Kaplan-Meier curve and log-rank test. Multivariable Cox proportional hazards regression was used to evaluate the association between DWI-derived results and overall survival. Results: Fifteen (30.0%) patients underwent primary debulking surgery, and 35 (70.0%) patients received neoadjuvant chemotherapy followed by IDS. Complete tumor debulking was achieved in 32 patients. Patients with residual disease after debulking surgery had reduced overall survival (p = 0.043). The fPCI/ADC was negatively associated with overall survival when accounted for clinicopathological information with a hazard ratio of 1.254 for high fPCI/ADC (95% confidence interval, 1.007-1.560; p = 0.043). Conclusion: A high DWI-derived functional tumor burden was associated with decreased overall survival in patients with advanced OC.

스캔통계량 분석을 통한 상수도 누수 및 수질 민원 발생 클러스터 탐색 (Cluster exploration of water pipe leak and complaints surveillance using a spatio-temporal statistical analysis)

  • 이주원;김은주;남숙현;황태문
    • 상하수도학회지
    • /
    • 제37권5호
    • /
    • pp.261-269
    • /
    • 2023
  • In light of recent social concerns related to issues such as water supply pipe deterioration leading to problems like leaks and degraded water quality, the significance of maintenance efforts to enhance water source quality and ensure a stable water supply has grown substantially. In this study, scan statistic was applied to analyze water quality complaints and water leakage accidents from 2015 to 2021 to present a reasonable method to identify areas requiring improvement in water management. SaTScan, a spatio-temporal statistical analysis program, and ArcGIS were used for spatial information analysis, and clusters with high relative risk (RR) were determined using the maximum log-likelihood ratio, relative risk, and Monte Carlo hypothesis test for I city, the target area. Specifically, in the case of water quality complaints, the analysis results were compared by distinguishing cases occurring before and after the onset of "red water." The period between 2015 and 2019 revealed that preceding the occurrence of red water, the leak cluster at location L2 posed a significantly higher risk (RR: 2.45) than other regions. As for water quality complaints, cluster C2 exhibited a notably elevated RR (RR: 2.21) and appeared concentrated in areas D and S, respectively. On the other hand, post-red water incidents of water quality complaints were predominantly concentrated in area S. The analysis found that the locations of complaint clusters were similar to those of red water incidents. Of these, cluster C7 exhibited a substantial RR of 4.58, signifying more than a twofold increase compared to pre-incident levels. A kernel density map analysis was performed using GIS to identify priority areas for waterworks management based on the central location of clusters and complaint cluster RR data.