• 제목/요약/키워드: 부분자료 추출

검색결과 270건 처리시간 0.051초

한국어 형태소 분석기 CBKMA와 색인어 추출기 CBKMA/IX (A Korean Morphological Analyzer CBKMA and A Index Word Extractor CBKMA/IX)

  • 김남철;서영훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1999년도 제11회 한글 및 한국어 정보처리 학술대회 및 제1회 형태소 분석기 및 품사태거 평가 워크숍
    • /
    • pp.50-59
    • /
    • 1999
  • 본 논문은 한국어 형태소 분석기 CBKMA와 이 CBKMA를 이용한 색인어 추출기 CBKMA/IX를 소개하고, 각각의 특징들에 대해서 설명한다. CBKMA는 음절 정보를 이용하는 분석 알고리즘과, 효율적인 사전구성을 이용한 형태소 분석기로서, 과다한 분석 후보의 생성을 줄임으로써 처리 속도를 향상시켰다. 수행시 필요로 하는 컴퓨터 자원은 Main Memory 약 4Mb정도로, 작은 규모의 시스템에서도 수행이 가능한 특징을 갖는다. CBKMA/IX는 CBKMA의 형태소 분석 기능을 이용하는 색인어 자동 추출기로서, 처리 속도 향상을 위하여 대분류 수준의 품사 태그만을 이용한다. 또한 CBKMA의 분석 기능에 색인어 추출을 위해 불용어 사전, 사용자 키워드 사전 처리 부분과, 복합명사와 미등록어 분석 부분 및 한자어, 일본어 등에 대한 처리를 강화시켰다. 특히 비소설류 자료의 분석시 좋은 성능을 발휘한다.

  • PDF

수치지도 제작을 위한 지형ㆍ지물의 경계추출

  • 박운용;차성렬;이동락;김용석
    • 한국측량학회:학술대회논문집
    • /
    • 한국측량학회 2003년도 추계학술발표회 논문집
    • /
    • pp.433-437
    • /
    • 2003
  • 고해상도 위성영상을 이용하여 수치표고모델(DEM) 및 정사영상을 제작해서 수치지도의 갱신 및 지형공간정보체계의 자료기반으로써 활용할 수 있다. 본 연구에서는 Sobel 연산자를 이용하여 경계추출을 행한 후 스크린 디지타이징 방법으로 경계선을 추출하였다 이렇게 추출된 벡터자료와 기존수치지도와의 중첩을 통해서 건물, 도로, 임야의 평균위치오차를 분석해 보았다. 평균위치오차가 공공측량의 작업규정에 대한 1 : 5,000 수치지도 제작의 허용오차범위에는 들지 못하였지만, 특정 부분의 지형·지물의 경우에는 수정, 보완이 가능한 것으로 나타났다. 그리고, 산악지역 보다는 도심지에서의 경계추출이 뚜렷하기 때문에 위치정밀도가 향상됨을 알 수 있었다.

  • PDF

클래스가 부가된 커널 주성분분석을 이용한 비선형 특징추출 (Nonlinear Feature Extraction using Class-augmented Kernel PCA)

  • 박명수;오상록
    • 전자공학회논문지SC
    • /
    • 제48권5호
    • /
    • pp.7-12
    • /
    • 2011
  • 본 논문에서는 자료패턴을 분류하기에 적합한 특징을 추출하는 방법인, 클래스가 부가된 커널 주성분분석(class-augmented kernel principal component analysis)를 새로이 제안하였다. 특징추출에 널리 이용되는 부분공간 기법 중, 최근 제안된 클래스가 부가된 주성분분석(class-augmented principal component analysis)은 패턴 분류를 위한 특징을 추출하기 위해 이용되는 선형분류분석(linear discriminant analysis)등에 비해 정확한 특징을 계산상의 문제 없이 추출할 수 있는 기법이다. 그러나, 추출되는 특징은 입력의 선형조합으로 제한되어 자료에 따라 적절한 특징을 추출하기 어려운 경우가 발생한다. 이를 해결하기 위하여 클래스가 부가된 주성분분석에 커널 트릭을 적용하여 비선형 특징을 추출할 수 있는 새로운 부분공간 기법으로 확장하고, 실험을 통하여 성능을 평가하였다.

절사계통추출법의 효율성에 관한 연구 (A Study on Efficiency of the Cut-off Systematic Sampling)

  • 이계오;최정배;석영우
    • 응용통계연구
    • /
    • 제14권1호
    • /
    • pp.111-120
    • /
    • 2001
  • 하나의 업종에 대한 경영실태조사에서 모집단을 구성하는 기업체들의 규모가 큰 차이가 없다고 판단되면 계통추출법이나 층화확률추출법을 주로 적용할 수 있으나 일부기업체의 합계가 모총계의 상당히 큰 부분을 차지하는 경우에는 절사계통추출법이 효율적이다. 본고에서는 위 세 가지 추출법에 의한 모총계 추정량과 모총계 추정량의 분산의 추정법을 살펴보고, 세 가지 추출법을 비교하여 절사계통추출법의 효율성을 실제 자료인 벌목업 경영실태 조사자료를 통해서 입증하였다.

  • PDF

효율적인 정보 추출을 위한 자료 집계 및 분석 시스템의 설계 및 구현 방안 (System Design for Effective Data Collection and Analysis)

  • 조광현;박희창
    • 한국데이터정보과학회:학술대회논문집
    • /
    • 한국데이터정보과학회 2006년도 PROCEEDINGS OF JOINT CONFERENCEOF KDISS AND KDAS
    • /
    • pp.307-315
    • /
    • 2006
  • 현대 사회에 있어서 신속하고 정확한 정보는 곧 수익증대의 중요한 요소로 자리 잡고 있으며 사회발전이 가속화 될수록 더욱 다양한 정보가 산출되고 있다. 그로인하여 광범위하게 분산되어 있는 정보의 추출은 매우 중요한 부분으로 부각되고 있다. 하지만 기존의 자료 집계 방법은 분산되어 있는 자료를 수집하기 위한 시간이 많이 소요되고 수집된 자료의 확인과정 및 통합 과정 또한 많은 시간이 소요되어 현대의 수많은 정보를 효율적으로 수용하지 못하고 있다. 이에 본 논문에서는 광범위하게 분산되어 있는 자료들에 대하여 효율적인 정보 추출을 제공할 수 있는 자료 집계 및 분석 시스템의 설계 및 구현 방안에 대하여 연구하고자 한다.

  • PDF

잡영 가지 제거 알고리즘과 개선된 퍼지 ART를 이용한 여권 코드 인식 (Recognition of Passport Image Using Removing Noise Branches and Enhanced Fuzzy ART)

  • 이상수;장도원;김광백
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2005년도 추계종합학술대회
    • /
    • pp.377-382
    • /
    • 2005
  • 본 논문에서는 출입국자 관리의 효율성과 체계적인 출입국 관리를 위하여 여권 코드를 자동으로 인식하는 방법을 제안한다. 여권 이미지는 기울어진 상태로 스캔 되어 획득되어질 수도 있으므로 기울기 보정은 문자 분할 및 인식에 있어 매우 중요하다. 따라서 본 논문에서는 여권 영상을 스미어링한 후, 추출된 문자열 중에서 가장 긴 문자열을 선택하고 이 문자열의 좌측과 우측 부분의 두께 중심을 연결하는 직선과 수평선과의 기울기를 이용하여 여권 영상에 대한 각도 보정을 수행한다. 여권 코드 추출은 소벨 연산자와 수평 스미어링, 8방향 윤관선 추적 알고리즘을 적용하여 여권 코드의 문자열 영역을 추출하고, 추출된 여권 코드 문자열 영역에 대해 반복 이진화 방법을 적용하여 코드의 문자열 영역을 이진화 한다, 이진화된 문자열 영역에 대해 여권 코드의 인식율을 높이기 위하여 잡영 가지 제거 알고리즘을 적용하여 개별 문자의 잡영을 제거한 후에 개별 코드를 추출하며, CDM 마스크를 적용하여 추출된 개별코드를 복원한다. 추출된 개별코드는 개선된 퍼지 ART 알고리즘을 제안하여 인식에 적용한다. 실제 여권 영상을 대상으로 실험한 결과, CDM 마스크를 이용하여 추출된 개별 코드를 개선된 퍼지 ART 알고리즘을 적용하여 인식한 방법보다 잡영 제거 알고리즘과 CDM 마스크를 적용하여 개선된 퍼지 ART 알고리즘으로 개별 코드를 인식하는 것이 효율적인 것을 확인하였다. 그리고 기존의 퍼지 ART 알고리즘을 이용하여 개별 코드를 인식하는 경우보다 본 논문에서 제안한 개선된 퍼지 ART 알고리즘을 이용하여 개별 코드를 인식하는 경우가 서로 다른 패턴들이 같은 클러스터로 분류되지 않아 인식 성능이 개선되었다.생산하고 있다. 또한 이러한 자료를 바탕으로 지역통계 수요에 즉각 대처할 수 있다. 더 나아가 이와 같은 통계는 전 국민에 대한 패널자료이기 때문에 통계적 활용의 범위가 방대하다. 특히 개인, 가구, 사업체 등 사회 활동의 주체들이 어떻게 변화하는지를 추적할 수 있는 자료를 생산함으로써 다양한 인과적 통계분석을 할 수 있다. 행정자료를 활용한 인구센서스의 이러한 특징은 국가의 교육정책, 노동정책, 복지정책 등 다양한 정책을 정확한 자료를 근거로 수립할 수 있는 기반을 제공한다(Gaasemyr, 1999). 이와 더불어 행정자료 기반의 인구센서스는 비용이 적게 드는 장점이 있다. 예를 들어 덴마크나 핀란드에서는 조사로 자료를 생산하던 때의 1/20 정도 비용으로 행정자료로 인구센서스의 모든 자료를 생산하고 있다. 특히, 최근 모든 행정자료들이 정보통신기술에 의해 데이터베이스 형태로 바뀌고, 인터넷을 근간으로 한 컴퓨터네트워크가 발달함에 따라 각 부처별로 행정을 위해 축적한 자료를 정보통신기술로 연계${cdot}$통합하면 막대한 조사비용을 들이지 않더라도 인구센서스자료를 적은 비용으로 생산할 수 있는 근간이 마련되었다. 이렇듯 행정자료 기반의 인구센서스가 많은 장점을 가졌지만, 그렇다고 모든 국가가 당장 행정자료로 인구센서스를 대체할 수 있는 것은 아니다. 행정자료로 인구센서스통계를 생산하기 위해서는 각 행정부서별로 사용하는 행정자료들을 연계${cdot}$통합할 수 있도록 국가사회전반에 걸쳐 행정 체제가 갖추어져야 하기 때문이다. 특히 모든 국민 개개인에 관한 기본정보, 개인들이 거주하며 생활하는 단위인 개별 주거단위에 관한 정보가 행정부에 등록되어

  • PDF

컴퓨터 포렌식스 기술에 관한 연구 (A Study on Computer Forensics Technology)

  • 홍성욱;서영선;송정환
    • 한국정보보호학회:학술대회논문집
    • /
    • 한국정보보호학회 2003년도 동계학술대회
    • /
    • pp.523-532
    • /
    • 2003
  • 컴퓨터 포렌식스(Computer Forensics)란 컴퓨터 범죄자료가 법적 증거물로써 제출될 수 있도록 증거의 확인, 복사, 분석 등 일련의 행위를 하는 것을 말한다. 컴퓨터에서 각종 증거자료를 추출하기 위해서는 컴퓨터 특성 이해와 고도의 보안기술을 갖추지 않으면 실제로 증거자료가 존재함에도 불구하고 그냥 간과해 버릴 수도 있다. 본 논문에서는 컴퓨터 범죄를 소개하고 컴퓨터 포렌식스의 소요 기술을 분류하며, 컴퓨터 포렌식스 기술에서 중요한 부분을 차지하고 있는 삭제된 파일 복구기술에 대하여 고찰한다.

  • PDF

영상 및 점기반 자료처리에 의한 항공 라이다 자료의 건물경계추출 (Building Boundary Extraction of Airborne LIDAR data by Image-Based and Point-Based Data Analysis)

  • 김의명
    • 대한공간정보학회지
    • /
    • 제17권1호
    • /
    • pp.43-52
    • /
    • 2009
  • 라이다 자료는 건물에 대한 3차원 정보를 제공하고 있는 자료원으로서 도시계획을 위한 3차원 모형화와 건물의 가시권 분석과 같은 다양한 모형화에 이용되고 있다. 본 연구에서는 라이다 자료만을 이용하여 영상처리기법과 점자료처리기법에 기반하여 사용자의 개입을 최소화하면서 자동으로 건물을 추출할 수 있는 기법을 제안하였다. 입력된 라이다 자료를 이용하여 건물영역과 비건물영역을 분리하기 위하여 먼저 영상처리기법을 적용하였다. 또한 건물영역은 높이값에 대한 통계분석을 통해서 건물의 주옥상면과 남아있는 부분으로 구분하여 자료처리를 수행하였다. 아파트형, 계단형, 복합형 등의 다양한 유형의 건물이 존재하는 연구대상지역의 실험을 통해서 본 연구에서 제안한 자료처리기법을 적용하여 약 90%의 건물을 자동으로 추출할 수 있었다.

  • PDF

Matched Filter를 이용한 얼굴 특징점 위치추출 (Estimating Facial Feature Position with Matched Filters)

  • 황인택;최광남
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.565-567
    • /
    • 2003
  • 이 논문은 Matched Filter 기술을 사용해 얼굴 특징점 위치를 추출하는 연구에 대해서 기술한다. 기본 목표는 얼굴의 서로 다른 8개( 양쪽 눈과 눈썹, 머리선, 코, 입, 턱 )의 부분을 구분할 수 있는 필터들을 개발하는 것이다. 이런 Matched Filter는 Fourier 역변환을 사용해 훈련영상(Training Image)으로부터 얻을 수 있다. 실험평가는 베른대학의 얼굴 데이터베이스에 근거한다. 우리는 여기서 다양한 얼굴의 방향성에 효과적으로 적용할 수 있도록 하는 훈련 영상자료가 무엇인지 알 수 있다. 그리고 안경을 썼을 때 얼굴을 인식할 수 있는 가장 좋은 방법도 알아본다.

  • PDF

비디오 카메라를 이용한 3차원 도로중심선 추출 (Extraction of 3D Road Centerline Using Video Camera)

  • 이종출;서동주;김성호;강윤성
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2004년도 GIS/RS 공동 춘계학술대회 논문집
    • /
    • pp.543-550
    • /
    • 2004
  • 컴퓨터의 발전에 따라 현재 제4세대 수치사진측량의 활용도가 광범위하게 진행되고 있다. 특히 비디오동영상을 이용하여 실용적이며, 비전문가들도 활용할 수 있는 부분들이 증가하고 있다. 이러한 현시점에서 국가산업의 중추적인 시설물 도로분야에서 도로안전진단과 유지관리목적으로 도로정보획득 및 도로정보수집에 많은 연구를 하고 있다. 따라서, 본 연구에서는 실용성, 경제성이 있는 비전문가용인 디지털비디오 동영상을 이용하여 도로중심선의 3차원 위치정보를 추출하여 도로정보화사업의 기본적인 자료로 제공되리라 판단된다.

  • PDF