• Title/Summary/Keyword: 부분자료 추출

Search Result 270, Processing Time 0.026 seconds

A Korean Morphological Analyzer CBKMA and A Index Word Extractor CBKMA/IX (한국어 형태소 분석기 CBKMA와 색인어 추출기 CBKMA/IX)

  • Kim, Nam-Churl;Seo, Young-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 1999.10d
    • /
    • pp.50-59
    • /
    • 1999
  • 본 논문은 한국어 형태소 분석기 CBKMA와 이 CBKMA를 이용한 색인어 추출기 CBKMA/IX를 소개하고, 각각의 특징들에 대해서 설명한다. CBKMA는 음절 정보를 이용하는 분석 알고리즘과, 효율적인 사전구성을 이용한 형태소 분석기로서, 과다한 분석 후보의 생성을 줄임으로써 처리 속도를 향상시켰다. 수행시 필요로 하는 컴퓨터 자원은 Main Memory 약 4Mb정도로, 작은 규모의 시스템에서도 수행이 가능한 특징을 갖는다. CBKMA/IX는 CBKMA의 형태소 분석 기능을 이용하는 색인어 자동 추출기로서, 처리 속도 향상을 위하여 대분류 수준의 품사 태그만을 이용한다. 또한 CBKMA의 분석 기능에 색인어 추출을 위해 불용어 사전, 사용자 키워드 사전 처리 부분과, 복합명사와 미등록어 분석 부분 및 한자어, 일본어 등에 대한 처리를 강화시켰다. 특히 비소설류 자료의 분석시 좋은 성능을 발휘한다.

  • PDF

수치지도 제작을 위한 지형ㆍ지물의 경계추출

  • 박운용;차성렬;이동락;김용석
    • Proceedings of the Korean Society of Surveying, Geodesy, Photogrammetry, and Cartography Conference
    • /
    • 2003.10a
    • /
    • pp.433-437
    • /
    • 2003
  • 고해상도 위성영상을 이용하여 수치표고모델(DEM) 및 정사영상을 제작해서 수치지도의 갱신 및 지형공간정보체계의 자료기반으로써 활용할 수 있다. 본 연구에서는 Sobel 연산자를 이용하여 경계추출을 행한 후 스크린 디지타이징 방법으로 경계선을 추출하였다 이렇게 추출된 벡터자료와 기존수치지도와의 중첩을 통해서 건물, 도로, 임야의 평균위치오차를 분석해 보았다. 평균위치오차가 공공측량의 작업규정에 대한 1 : 5,000 수치지도 제작의 허용오차범위에는 들지 못하였지만, 특정 부분의 지형·지물의 경우에는 수정, 보완이 가능한 것으로 나타났다. 그리고, 산악지역 보다는 도심지에서의 경계추출이 뚜렷하기 때문에 위치정밀도가 향상됨을 알 수 있었다.

  • PDF

Nonlinear Feature Extraction using Class-augmented Kernel PCA (클래스가 부가된 커널 주성분분석을 이용한 비선형 특징추출)

  • Park, Myoung-Soo;Oh, Sang-Rok
    • Journal of the Institute of Electronics Engineers of Korea SC
    • /
    • v.48 no.5
    • /
    • pp.7-12
    • /
    • 2011
  • In this papwer, we propose a new feature extraction method, named as Class-augmented Kernel Principal Component Analysis (CA-KPCA), which can extract nonlinear features for classification. Among the subspace method that was being widely used for feature extraction, Class-augmented Principal Component Analysis (CA-PCA) is a recently one that can extract features for a accurate classification without computational difficulties of other methods such as Linear Discriminant Analysis (LDA). However, the features extracted by CA-PCA is still restricted to be in a linear subspace of the original data space, which limites the use of this method for various problems requiring nonlinear features. To resolve this limitation, we apply a kernel trick to develop a new version of CA-PCA to extract nonlinear features, and evaluate its performance by experiments using data sets in the UCI Machine Learning Repository.

A Study on Efficiency of the Cut-off Systematic Sampling (절사계통추출법의 효율성에 관한 연구)

  • 이계오;최정배;석영우
    • The Korean Journal of Applied Statistics
    • /
    • v.14 no.1
    • /
    • pp.111-120
    • /
    • 2001
  • Either systematic sampling or stratified sampling is usually applied to the business conditions survey when companies don't have much difference in their size. But the cutoff systematic sampling is an efficient method when only a few companies are so large that the total of them almost equals to the total of whole companies. Throughout this paper, three estimators of total and their variance estimations depending on three kinds of sampling schemes are discussed, and are compared with them via their variances. It is proved that the cut-off systematic sampling is most efficient by using a real data of the logging business conditions survey.

  • PDF

System Design for Effective Data Collection and Analysis (효율적인 정보 추출을 위한 자료 집계 및 분석 시스템의 설계 및 구현 방안)

  • Cho, Kwang-Hyun;Park, Hee-Chang
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 2006.04a
    • /
    • pp.307-315
    • /
    • 2006
  • Distributing information on the internet is common in our daily life. In the past, e-mail has been the primary choice of exchanging information. But instant messengers are gaining popularity abroad and domestically because of their immediate responses. Instant messaging has become the fastest growing communication technology in recent years. Instant messaging is effectively a chat room of two people. Users that have accounts with the same provider are able to send messages via computer in real time. Instant messaging has exploded into the business world as companies utilize the technology for everything from interoffice communication to client/customer communication. In this paper, we propose a system design for effective data collection and statistical analysis.

  • PDF

Recognition of Passport Image Using Removing Noise Branches and Enhanced Fuzzy ART (잡영 가지 제거 알고리즘과 개선된 퍼지 ART를 이용한 여권 코드 인식)

  • Lee, Sang-Soo;Jang, Do-Won;Kim, Kwang-Baek
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • v.9 no.2
    • /
    • pp.377-382
    • /
    • 2005
  • 본 논문에서는 출입국자 관리의 효율성과 체계적인 출입국 관리를 위하여 여권 코드를 자동으로 인식하는 방법을 제안한다. 여권 이미지는 기울어진 상태로 스캔 되어 획득되어질 수도 있으므로 기울기 보정은 문자 분할 및 인식에 있어 매우 중요하다. 따라서 본 논문에서는 여권 영상을 스미어링한 후, 추출된 문자열 중에서 가장 긴 문자열을 선택하고 이 문자열의 좌측과 우측 부분의 두께 중심을 연결하는 직선과 수평선과의 기울기를 이용하여 여권 영상에 대한 각도 보정을 수행한다. 여권 코드 추출은 소벨 연산자와 수평 스미어링, 8방향 윤관선 추적 알고리즘을 적용하여 여권 코드의 문자열 영역을 추출하고, 추출된 여권 코드 문자열 영역에 대해 반복 이진화 방법을 적용하여 코드의 문자열 영역을 이진화 한다, 이진화된 문자열 영역에 대해 여권 코드의 인식율을 높이기 위하여 잡영 가지 제거 알고리즘을 적용하여 개별 문자의 잡영을 제거한 후에 개별 코드를 추출하며, CDM 마스크를 적용하여 추출된 개별코드를 복원한다. 추출된 개별코드는 개선된 퍼지 ART 알고리즘을 제안하여 인식에 적용한다. 실제 여권 영상을 대상으로 실험한 결과, CDM 마스크를 이용하여 추출된 개별 코드를 개선된 퍼지 ART 알고리즘을 적용하여 인식한 방법보다 잡영 제거 알고리즘과 CDM 마스크를 적용하여 개선된 퍼지 ART 알고리즘으로 개별 코드를 인식하는 것이 효율적인 것을 확인하였다. 그리고 기존의 퍼지 ART 알고리즘을 이용하여 개별 코드를 인식하는 경우보다 본 논문에서 제안한 개선된 퍼지 ART 알고리즘을 이용하여 개별 코드를 인식하는 경우가 서로 다른 패턴들이 같은 클러스터로 분류되지 않아 인식 성능이 개선되었다.생산하고 있다. 또한 이러한 자료를 바탕으로 지역통계 수요에 즉각 대처할 수 있다. 더 나아가 이와 같은 통계는 전 국민에 대한 패널자료이기 때문에 통계적 활용의 범위가 방대하다. 특히 개인, 가구, 사업체 등 사회 활동의 주체들이 어떻게 변화하는지를 추적할 수 있는 자료를 생산함으로써 다양한 인과적 통계분석을 할 수 있다. 행정자료를 활용한 인구센서스의 이러한 특징은 국가의 교육정책, 노동정책, 복지정책 등 다양한 정책을 정확한 자료를 근거로 수립할 수 있는 기반을 제공한다(Gaasemyr, 1999). 이와 더불어 행정자료 기반의 인구센서스는 비용이 적게 드는 장점이 있다. 예를 들어 덴마크나 핀란드에서는 조사로 자료를 생산하던 때의 1/20 정도 비용으로 행정자료로 인구센서스의 모든 자료를 생산하고 있다. 특히, 최근 모든 행정자료들이 정보통신기술에 의해 데이터베이스 형태로 바뀌고, 인터넷을 근간으로 한 컴퓨터네트워크가 발달함에 따라 각 부처별로 행정을 위해 축적한 자료를 정보통신기술로 연계${cdot}$통합하면 막대한 조사비용을 들이지 않더라도 인구센서스자료를 적은 비용으로 생산할 수 있는 근간이 마련되었다. 이렇듯 행정자료 기반의 인구센서스가 많은 장점을 가졌지만, 그렇다고 모든 국가가 당장 행정자료로 인구센서스를 대체할 수 있는 것은 아니다. 행정자료로 인구센서스통계를 생산하기 위해서는 각 행정부서별로 사용하는 행정자료들을 연계${cdot}$통합할 수 있도록 국가사회전반에 걸쳐 행정 체제가 갖추어져야 하기 때문이다. 특히 모든 국민 개개인에 관한 기본정보, 개인들이 거주하며 생활하는 단위인 개별 주거단위에 관한 정보가 행정부에 등록되어

  • PDF

A Study on Computer Forensics Technology (컴퓨터 포렌식스 기술에 관한 연구)

  • 홍성욱;서영선;송정환
    • Proceedings of the Korea Institutes of Information Security and Cryptology Conference
    • /
    • 2003.12a
    • /
    • pp.523-532
    • /
    • 2003
  • 컴퓨터 포렌식스(Computer Forensics)란 컴퓨터 범죄자료가 법적 증거물로써 제출될 수 있도록 증거의 확인, 복사, 분석 등 일련의 행위를 하는 것을 말한다. 컴퓨터에서 각종 증거자료를 추출하기 위해서는 컴퓨터 특성 이해와 고도의 보안기술을 갖추지 않으면 실제로 증거자료가 존재함에도 불구하고 그냥 간과해 버릴 수도 있다. 본 논문에서는 컴퓨터 범죄를 소개하고 컴퓨터 포렌식스의 소요 기술을 분류하며, 컴퓨터 포렌식스 기술에서 중요한 부분을 차지하고 있는 삭제된 파일 복구기술에 대하여 고찰한다.

  • PDF

Building Boundary Extraction of Airborne LIDAR data by Image-Based and Point-Based Data Analysis (영상 및 점기반 자료처리에 의한 항공 라이다 자료의 건물경계추출)

  • Kim, Eui-Myoung
    • Journal of Korean Society for Geospatial Information Science
    • /
    • v.17 no.1
    • /
    • pp.43-52
    • /
    • 2009
  • LIDAR data, as the source of the 3D information of buildings, are used many modeling fields such as three-dimensional city models in urban planning and the visibility analysis of buildings. This study suggests a methodology, that is characterized by combining image-based and point-based process, for minimizing the user's intervention and automatically extracting building boundary only using the LIDAR data. Image processing methodology is firstly used to separate building and non-building regions from LIDAR data. Moreover, building regions are then classified main roof into remaining parts by the statistical analysis of height values, and the remaining parts are processed separately. Through the experimental results of study areas which exist many types of buildings, for example, apartment-type, stair-type, complex-type, etc. Approximately 90% building boundaries are automatically extracted by the proposed methodology.

  • PDF

Estimating Facial Feature Position with Matched Filters (Matched Filter를 이용한 얼굴 특징점 위치추출)

  • 황인택;최광남
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.565-567
    • /
    • 2003
  • 이 논문은 Matched Filter 기술을 사용해 얼굴 특징점 위치를 추출하는 연구에 대해서 기술한다. 기본 목표는 얼굴의 서로 다른 8개( 양쪽 눈과 눈썹, 머리선, 코, 입, 턱 )의 부분을 구분할 수 있는 필터들을 개발하는 것이다. 이런 Matched Filter는 Fourier 역변환을 사용해 훈련영상(Training Image)으로부터 얻을 수 있다. 실험평가는 베른대학의 얼굴 데이터베이스에 근거한다. 우리는 여기서 다양한 얼굴의 방향성에 효과적으로 적용할 수 있도록 하는 훈련 영상자료가 무엇인지 알 수 있다. 그리고 안경을 썼을 때 얼굴을 인식할 수 있는 가장 좋은 방법도 알아본다.

  • PDF

Extraction of 3D Road Centerline Using Video Camera (비디오 카메라를 이용한 3차원 도로중심선 추출)

  • 이종출;서동주;김성호;강윤성
    • Proceedings of the Korean Association of Geographic Inforamtion Studies Conference
    • /
    • 2004.03a
    • /
    • pp.543-550
    • /
    • 2004
  • 컴퓨터의 발전에 따라 현재 제4세대 수치사진측량의 활용도가 광범위하게 진행되고 있다. 특히 비디오동영상을 이용하여 실용적이며, 비전문가들도 활용할 수 있는 부분들이 증가하고 있다. 이러한 현시점에서 국가산업의 중추적인 시설물 도로분야에서 도로안전진단과 유지관리목적으로 도로정보획득 및 도로정보수집에 많은 연구를 하고 있다. 따라서, 본 연구에서는 실용성, 경제성이 있는 비전문가용인 디지털비디오 동영상을 이용하여 도로중심선의 3차원 위치정보를 추출하여 도로정보화사업의 기본적인 자료로 제공되리라 판단된다.

  • PDF