• 제목/요약/키워드: Pattern Processing

검색결과 2,352건 처리시간 0.024초

휴리스틱 진화에 기반한 효율적 클러스터링 알고리즘 (An Efficient Clustering Algorithm based on Heuristic Evolution)

  • 류정우;강명구;김명원
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권1_2호
    • /
    • pp.80-90
    • /
    • 2002
  • 클러스터링이란 한 군집에 포함된 데이터들 간의 유사한 성질을 갖도록 데이터들을 묶는 것으로 패턴인식, 영상처리 등의 공학 분야에 널리 적용되고 있을 뿐만 아니라, 최근 많은 관심의 대상이 되고 있는 데이터 마이닝의 주요 기술로서 활발히 응용되고 있다. 클러스터링에 있어서 K-means나 FCM(Fuzzy C-means)와 같은 기존의 알고리즘들은 지역적 최적해에 수렴하는 것과 사전에 클러스터 개수를 미리 결정해야 하는 문제점을 개선하였으며, 클러스터링의 특성을 분산도와 분리도로 정의하였다. 분산도는 임의의 클러스터의 중심으로부터 포함된 데이터들이 어느 정도 흩어져 있는지를 나타내는 척도인 반면, 분리도는 임의의 데이터와 모든 클러스터 중심간의 거리의 비율로서 얻어지는 소속정도를 고려하여 클러스터 중심간의 거리를 나타내는 척도이다. 이 두 척도를 이용하여 자동으로 적절한 클러스터 개수를 결정하게 하였다. 또한 진화알고리즘의 문제점인 탐색공간의 확대에 따른 수행시간의 증가는 휴리스틱 연산을 적용함으로써 크게 개선하였다. 제안한 알고리즘의 성능 및 타당성을 보이기 위해 이차원과 다차원 실험데이타를 사용하여 실험한 결과 제안한 알고리즘의 성능이 우수함을 나타내었다.

국제입찰정보 통합시스템의 설계 및 구현 (The Integration System for International Procurement Information Processing)

  • 윤종완;이종우;박찬영
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제8권1호
    • /
    • pp.71-81
    • /
    • 2002
  • 현존하는 상업용 웹 정보검색 시스템들이 전문성을 갖추지 못하고 있는 이유가 검색된 분야별 정보를 통합하고 가공하는 능력이 부족하기 때문이다. 따라서, 단순 검색이 아닌 실제 사용자가 원하는 웹상의 의미정보를 추출하고 가공/통합하는 정보통합시스템의 필요성이 대두되었다. 본 논문에서는 분산된 이질의 웹사이트들에서 제공되는 특정분야의 정보를 추출 및 통합하는 정보통합시스템(TIC: Target Information collector)을 구현하고, 구현된 시스템의 평가결과를 제시한다. 본 논문에서 대상으로 설정한 정보 영역은 국제입찰정보이다. 국제입찰정보는 전 세계 국가의 정부에서 필요로 하는 조달물품 및 서비스에 대한 공개 입찰자료이다. 본 논문에서는 전 세계의 국제입찰 정보 제공 원천 사이트에서 공통 특성 정보를 자동 추출하기 위해 HTML 태그간 패턴을 사용한 정보위치지정 방법을 사용하였으며, 정보추출 및 통합을 위한 프레임워크 설계를 통해 큰 부담 없이 모든 원천사이트별 정보추출 및 통합 코드를 작성할 수 있었다. 또한, 구현된 TIC을 약 8개월 동안 운영한 결과 매우 단순한 기법을 사용하고도 거의 대부분의 중복정보가 제거된 고품질의 국제입찰정보를 수집할 수 있음을 확인하였다. 본 논문이 기여하는 바는 특정 범주에 속하는 공통정보를 추출 및 통합/가공하는 데에 필요한 시스템 프레임워크를 제시했다는 점이다.

이동통신 네트워크 트래픽 모델을 위한 도시 지역 이동통신 트래픽 특성 분석 (Analysis of Network Traffic with Urban Area Characteristics for Mobile Network Traffic Model)

  • 윤영현
    • 정보처리학회논문지C
    • /
    • 제10C권4호
    • /
    • pp.471-478
    • /
    • 2003
  • 오래 전부터 이동통신 서비스를 위한 통신 프로토콜이나 기능 요소들의 성능을 평가하기 위해서는 분석적 방법, 시뮬레이션 및 평가적 방법이 이용되어 왔다. 이중 시뮬레이션을 통한 평가 방법은 시스템 내부 구성 요소들의 연관 관계가 매우 복잡한 시스템을 테스트하는데 유용하게 사용되고 있으며, 이를 위해서는 이동통신 통화 특성을 반영하는 텔레트래픽 모델을 제시하고 있어야 한다. 텔레트래픽 모델은 일반적으로 트래픽 소스 모델과 네트워크 트랙픽 모델로 구성되어 있으며, 본 네트워크 트래픽 모델을 정의하기 위해 요구되는 실제 기지국 통화량 자료를 수집하고 분석한 결과를 제공하기 위한 것이다. 본 논문에서는 서울시를 상업, 주거, 준공업, 그리고 녹지 지역으로 되어 있는 도시계획 용도지역으로 구분하고, 여기에 설치되어 있는 기지국으로부터 실제 데이터를 시간대별로 수집하였다. 수집된 자료를 이용하여 각 지역별 기지국의 시간대별 통화량 분포와 최대 및 최소 발생 호 수 등을 제시하였다. 분석 결과는 보다 더 정확한 이동통신 네트워크 트래픽 모델을 정의하거나, 기존 이동통신 시뮬레이션 과정에서의 입력 자료로 사용할 수 있다.

효과적인 추천과 세분화를 위한 트랜잭션 기반 여러 형태 사용자 프로파일의 구축 (The Construction of Multiform User Profiles Based on Transaction for Effective Recommendation and Segmentation)

  • 고재진;안형근
    • 정보처리학회논문지D
    • /
    • 제13D권5호
    • /
    • pp.661-670
    • /
    • 2006
  • 쉽게 접할 수 있는 정보의 양이 증가하고 전자상거래가 발전함에 따라, 드넓은 정보공간을 축소하기 위하여 추천과 SDI 시스템과 같은 정보 필터링 시스템이 사용되어지게 되었으며, 이에 따라 사용자들은 그들의 요구와 취향에 가장 적합한 정보들을 바로 접근할 수 있게 되었다. 지금까지 다양한 정보 필터링 방법들이 추천시스템을 지원하기 위해 제안되었다. 최근에는 새로운 정보교환 표준으로 떠오르고 있는 XML 문서를 필터링 하는 시스템들에 있어서도 다른 접근 방법을 요구하고 있다. 따라서, 본 논문에서 제안하는 시스템은 XML이 가진 구조 정보를 이용하여 여러 형태의 사용자 프로파일을 생성하는 방법을 제안한다. 시스템은 구매와 같은 트랜잭션이 발생하기 전에 사용자 구매 패턴을 분석하기 위해서 필요한 프로파일을 운영자가 직접 정의하는 운영자 프로파일과 이를 적용한 사용자 프로파일의 두 부분으로 구성된다. 운영자 프로파일은 DTD로부터 선택된 항목을 이용하여 DTD를 따르는 문서내의 특정부분을 가리킬 수 있도록 만들어진다. 제안하는 시스템은 사용자의 구매 행위에 적응력을 가질 수 있도록 보다 정확한 사용자 프로파일을 구축하고, 이와 같은 사용자 프로파일을 기반으로 사용자에게 불필요한 검색과정 없이 필요한 상품 정보를 제공할 수 있도록 한다.

의료보험 다빈도 상병과 1차진료 의사에 관한 연구 (A Study on the Most Frequent Diseases of Health Insurance Program and the Primary Care Physicians in Korea)

  • 김철환;문옥륜
    • 보건행정학회지
    • /
    • 제3권1호
    • /
    • pp.124-145
    • /
    • 1993
  • General practitioners, internists, pediatricians, and family physicians are classified as so-called primary care physicians in the United States. We carried out this study for the purpose of answering the following question; "Who are the primary care physicians in Korea\ulcorner" We analyzed the 663, 154 claims which were drawn from the health insurance processing file made during the period of one month, April 1992 on the basis of systemic random sampling technique. The 663, 154 cases were matched with the doctor's file registered at the National Federation Medical Insurance by using the indivisual physician code number and analyzed according to the kind of specialty. If we follow the Geyman's definition of primary care physician in the United States, this study shows that they can take care of 43.2% of the total private clinic's claims in Korea. Provided that general practitioners and family physicians are considered the same way as in the United Kingdom, they could with only 8.3% of the total claims in Korea. The most frequent diseases are those which rank first to 46th in the total private clinic's claims. The proportion of the most frequent diseases was highest for pediatricians(90.4%) and followed by internists(81.4%), otolaryngologists(78.7%) and family physicians(76.5%). The proportion of the most frequent diseases in the most common 46 diseases was highest for radiologists(80.4%) and the next was as follows : general practitioners(78.3%), family physicians(67.4%), and internists(67.4%). We classified the most common 20 diseases of each specialty into 17 categories of ICD-9 and compared it with those of general practitioners. The specialists who had managed a similar disease pattern to those of general practitioners were identified as anesthesiologists, family physicians, general surgeons, and internists. Some specialists practicing at private clinics managed the diseases which were not quite appropriate for their specialties. After we evaluated each specialty by the most common diseases, the most frequent diseases, and the most frequent 20 diseases of each specialty in terms of the 17 categories of ICD-9, a tentative assumption is made that the primary physicians in the Republic of Korea are general practitioners, anesthesiologists, family physicians, internists, and general surgeons. This study has concluded that the categories of the primary care physicians are so diverse that their roles and distributions are distorted accordingly. Vigorous health policy efforts in correcting the malcomposition need to be made for the better provision of primary health care in Korea. in Korea.

  • PDF

맵리듀스기반 워크플로우 빅-로그 클러스터링 기법 (A MapReduce-Based Workflow BIG-Log Clustering Technique)

  • 진민혁;김광훈
    • 인터넷정보학회논문지
    • /
    • 제20권1호
    • /
    • pp.87-96
    • /
    • 2019
  • 본 논문에서는 분산 워크플로우 실행 이벤트 로그를 수집하고 분류하기 위한 사전 처리 도구로서 맵-리듀스기반 클러스터링 기법을 제안한다. 특히 우리는 볼륨, 속도, 다양성, 진실성 및 가치와 같은 BIG 데이터의 5V 속성에 만족하고 잘 충족되어 있기 때문에 분산 워크플로우 실행 이벤트 로그를 특별히 워크플로우 빅-로그(Workflow BIG-Logs)라고 정의한다. 이 논문에서 개발하는 클러스터링 기술은워크플로우 빅-로그를 기반으로 하는 특정 워크플로 프로세스 마이닝 및 분석 알고리즘의 사전 처리 단계에 적용하기 위한 목적으로 고안된 것이다. 즉, 맵리듀스(Map-Reduce) 프레임워크를 워크플로우 빅-로그 처리 플랫폼으로 사용하고, IEEE XES 표준 데이터 형식을 지원하며, 결국 본 연구에서 개발중에 있는 구조적 정보제어넷기반 워크플로우 프로세스 마이닝 알고리즘인 ${\rho}$-알고리즘의 사전 처리 단계 전용으로 사용되도록 구현된 것이다. 보다 자세하게 말하자면, 워크플로우 빅-로그의 클러스터링 패턴은 단위업무액티버티 기반 클러스터링 패턴과 단위업무 수행자 기반 클러스터링 패턴으로 분류되는데, 특별히 단위업무 액티버티 패턴의 하나인 시간적 워크케이스 패턴과 그의 발생 건수를 재발견하는 맵리듀스 기반 클러스터링 알고리즘을 설계하고 구현하고자 한다. 마지막으로, 우리는 BPI 챌린지에서 공개한 워크플로우 실행 이벤트 로그 데이터세트에 대해 일련의 실험을 수행함으로써 제안된 클러스터링 기법의 기술적 타당성을 검증한다.

지문 인증을 이용한 보안 토큰 시스템 구현 (Implementation of A Security Token System using Fingerprint Verification)

  • 문대성;길연희;안도성;반성범;정용화;정교일
    • 정보보호학회논문지
    • /
    • 제13권4호
    • /
    • pp.63-70
    • /
    • 2003
  • 급속한 정보화 및 인터넷의 발달로 인해 네트워크를 통한 정보의 교류가 활발해지고 온라인 뱅킹 등 전자상거래와 관련된 산업의 규모가 커지면서 정확한 개인 인증에 대한 요구가 그 어느 때 보다도 커지고 있다. 이러한 환경에서 가장 일반적인 인증수단으로 사용되고 있는 PM(Personal Identification Number) 또는 패스워드 방식은 유출 및 망각의 위험이 상존하므로, 이런 문제를 해결할 수 있는 생체 인증에 관한 연구가 활발히 진행되고 있다. 특히, 생체 인증 시스템의 보안 수준을 좀더 향상시키기 위해서 생체 정보의 저장뿐만 아니라 인증까지도 사용자가 휴대 할 수 있는 보안 토큰(스마트카드, USB 토큰) 내부에서 수행하는 연구가 진행되고 있다. 그러나, 보안 토큰의 제한된 하드웨어 자원(메모리. CPU)때문에 기존의 생체 인증 알고리즘으로는 동작이 불가능하다. 본 논문에서는 206MHz StrongARM CPU, 16MBytes Flash Memory 및 1MBytes RAM의 하드웨어 자원을 가지는 지문 인증 보안 토큰 시스템 구현에 대하여 기술하고, 이러한 보안 토큰 시스템에서 수행이 경량화시킨 지문 인증 알고리즘의 성능을 분석하였다. 실험결과, 본 논문에서 제안한 지문 인증 알고리즘은 6.8KBytes의 메모리를 사용하여 1.7%의 EER(Equal Error Rate)을 제공할 수 있음을 확인하였다.

LANDSAT 위성사진을 활용한 한강하구 산남습지 인근 하안선 변화 연구 (Study of Riverline Change around Sannam Wetland in the Hangang River Estuaty using LANDSAT Image Processing)

  • 윤석준;이삼희;장창환
    • 한국습지학회지
    • /
    • 제23권2호
    • /
    • pp.154-162
    • /
    • 2021
  • 하구둑 없이 자연적으로 열린 한강하구는 한강, 임진강, 예성강의 흐름과 서해의 조류가 만나는 곳이기 때문에 하도수리적인 '작용(impact)-응답(response)' 구조가 복잡하다. 민간인 통제 구간에서도 군부대 통제 하에 극히 제한된 장소와 시간에만 접근 조사가 가능하다. 2020년에는 8월 홍수에 유실된 지뢰 발견, 코로나-19 확산에 따른 관계기관 대면 접촉 제약 등의 이유로 현장 조사에 어려움이 있었다. 이러한 상황을 토대로 비대면, 비접촉 하안선 변화 조사 방법의 필요성이 제기되었다. 이의 대응 연구 수단으로써 공간 정보 분석 프로그램인 QGIS를 기반으로 미국 USGS가 운영하는 LANDSAT의 위성사진을 수집하여 영상처리 후 복잡한 하천지형 변화 양상을 분석하는 방법을 택하였다. 연구대상은 한강하구 산남습지 인근으로 설정하였다. 결과적으로 장기적 관점에서는 산남습지를 기준으로 하류에서는 침식 영향이 큰 것으로 나타났으며, 상류에서는 미미한 퇴적 현상이 나타났다. 위성사진 오차를 고려한다면 하천관리 측면에서는 과거 하천측량 자료를 바탕으로 비교 검토해볼 때 거의 변화가 없는 것으로 평가되면서 이 방법의 유효성이 입증되었다. 산남습지 인근 지역은 포괄적인 시간 관점에서 볼 때 조석 영향이 상류로부터 유입되는 흐름의 영향보다 큰 것으로 나타났다. 즉 조류에 의한 응답(사주의 거동 양상) 구조의 패턴 변화가 한강하구 인근의 하천시설물의 피해 유발에 더 작용하고 있는 것으로 판단된다. 따라서 향후 이를 감안한 적절한 하천관리 방안이 모색되어야 할 것이다.

부분 방전의 안전도 평가를 위한 예측 모델 설계 (A Study on the Design of Prediction Model for Safety Evaluation of Partial Discharge)

  • 이수일;고대식
    • Journal of Platform Technology
    • /
    • 제8권3호
    • /
    • pp.10-21
    • /
    • 2020
  • 부분 방전 현상은 배전반, 트랜스포머, 스위치 기어 등 고압전력기기에서 많이 발생한다. 부분 방전은 절연체의 수명을 단축하고 절연파괴를 가져오게 되고 이로 인해 정전사고 등 대형피해가 발생하게 된다. 부분 방전 현상은 제품 내부에서 발생하는 경우와 표면에서 발생하는 여러 가지 유형을 가지고 있다. 본 논문에서는 부분 방전 현상에 대한 패턴 및 발생할 확률을 예측할 수 있는 예측 모델을 설계하는 것이다. 설계된 모델을 분석하기 위하여 부분 방전 현상을 발생시키는 시뮬레이터를 활용하여 각각의 부분 방전 유형에 대한 학습 데이터를 UHF 센서를 통하여 수집하였다. 본 논문에서 설계된 예측 모델은 딥 러닝 중 CNN을 기반으로 설계를 하였으며 학습을 통하여 모델을 검증하였다. 설계된 모델에 대한 학습을 위하여 5,000개의 훈련데이터를 만들었으며 훈련데이터의 형태는 UHF센서에서 입력되는 3차원의 원시데이터를 2차원 데이터로 전 처리하여 모델에 대한 입력데이터로 사용하였다. 실험결과, 학습을 통하여 설계된 모델에 대한 정확도는 0.9972의 정확도를 갖는 것을 알 수 있었으며 데이터를 2차원 이미지로 만들어 학습한 경우 보다 그레이 스케일 이미지 형태로 만들어 학습한 경우가 제안된 모델에 대해 정확도가 높음을 알 수 있었다.

  • PDF

SDN과 허니팟 기반 동적 파라미터 조절을 통한 지능적 서비스 거부 공격 차단 (Blocking Intelligent Dos Attack with SDN)

  • 윤준혁;문성식;김미희
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제11권1호
    • /
    • pp.23-34
    • /
    • 2022
  • 네트워크 기술의 발달로 그 적용 영역 또한 다양해지면서 다양한 목적의 프로토콜이 개발되고 트래픽의 양이 폭발적으로 증가하게 되었다. 따라서 기존의 전통적인 스위칭, 라우팅 방식으로는 네트워크 관리자가 망의 안정성과 보안 기준을 충족하기 어렵다. 소프트웨어 정의 네트워킹(SDN)은 이러한 문제를 해결하기 위해 제시된 새로운 네트워킹 패러다임이다. SDN은 네트워크 동작을 프로그래밍하여 효율적으로 네트워크를 관리할 수 있도록 한다. 이는 네트워크 관리자가 다양한 여러 양상의 공격에 대해서 유연한 대응을 할 수 있는 장점을 가진다. 본 논문에서는 SDN의 이러한 특성을 활용하여 SDN 구성 요소인 컨트롤러와 스위치를 통해 공격 정보를 수집하고 이를 기반으로 공격을 탐지하는 위협 레벨 관리 모듈, 공격 탐지 모듈, 패킷 통계 모듈, 플로우 규칙 생성기를 설계하여 프로그래밍하고 허니팟을 적용하여 지능형 공격자의 서비스 거부 공격(DoS)을 차단하는 방법을 제시한다. 제안 시스템에서 공격 패킷은 수정 가능한 플로우 규칙에 의해 허니팟으로 빠르게 전달될 수 있도록 하였으며, 공격 패킷을 전달받은 허니팟은 이를 기반으로 지능적 공격의 패턴을 분석하도록 하였다. 분석 결과에 따라 지능적 공격에 대응할 수 있도록 공격 탐지 모듈과 위협 레벨 관리 모듈을 조정한다. 제안 시스템을 실제로 구현하고 공격 패턴 및 공격 수준을 다양화한 지능적 공격을 수행하고 기존 시스템과 비교하여 공격 탐지율을 확인함으로써 제안 시스템의 성능과 실현 가능성을 보였다.