• 제목/요약/키워드: 고유정보

검색결과 2,054건 처리시간 0.028초

고유 명사 출현 패턴을 이용한 색인의 성능 향상에 관한 연구 (Improving Indexing Performance by using Occurrence Pattern Information of Proper Nouns)

  • 정래정;김준태
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1996년도 제8회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.68-72
    • /
    • 1996
  • 본 논문에서는 고유 명사 출현 패턴 정보와 부가 정보를 이용한 미등록 고유 명사의 색인 방법을 제안한다. 정보 검색 시스템에서 고유 명사의 처리는 정확하고 의미 있는 색인을 위해 매우 중요하다. 본 논문은 형태소 분석 결과에 고유 명사 출현 패턴과 패턴 부가 정보를 사용하여 인명, 기관명, 회사명 등의 고유 명사 추출의 정확도를 높이는 방법을 제시한다. 총 827개의 인명과 기관 및 회사명을 포함하고 있는 조선일보 경제면 기사 100개 7416 어절에 대하여 본 시스템으로 실험한 결과, 인명의 경우 89%의 정확률을 보였다. 본 논문에서 제시한 출현 패턴과 고유 명사의 부가 정보를 적용했을 때 단순한 형태소 분석 결과에 비하여 고유 명사 추출 오류가 크게 개선되었다.

  • PDF

규칙 기반의 기계학습을 통한 고유명사의 추출과 분류 (Extraction and Classification of Proper Nouns by Rule-based Machine Learning)

  • 노태길;이상조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.170-172
    • /
    • 2000
  • 고유명사를 추출하고 그 범주를 파악할 수 있다면, 이는 정보 추출이나 정보 검색, 문서 요약과 같은 분야에 도움을 줄 수 있다. 본 논문에서는 고유명사를 추출하고 그 범주를 찾는 방법을 제시한다. 고유명사가 태깅된 코퍼스로부터, 고유명사의 내부와 주변에 반복적으로 나타나는 실마리들을 규칙 기반으로 학습한다. 이를 통하여 고유명사를 찾고 그 범주를 정한다. 구현한 시스템은 경제기사 코퍼스에서 4가지 범주로 고유명사를 추출하고 분류함에 있어 79.8%의 재현율과 92.9%의 정확률, 그리고 F 평가치에서 85.8의 성능을 보인다.

  • PDF

고유명사의 범주에 관한 연구 (A Study on the Scope of Proper Names)

  • 박은경
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2001년도 제8회 학술대회 논문집
    • /
    • pp.17-22
    • /
    • 2001
  • 고유명사의 개념과 판별, 분류체계에 대한 고찰을 통하여 모호했던 고유명사의 기본적인 범주를 분명하게 하였다. 또한, 이러한 분류체계를 바탕으로 문헌정보학에서 고유명사를 색인 및 검색어로 처리할 때 고려 해야할 점에 대해 논하였다.

  • PDF

SVM을 이용한 중국어 고유명사 식별에서의 자질 선택 (Feature Selection for Chinese Named Entity Recognition using SVM)

  • 김풍;나승훈;강인수;리금희;김동일;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.90-95
    • /
    • 2004
  • "고유명사 식별"은 사전에 등록되어 있지 않은 고유명사를 찾아내고 분류하는 과정으로 주로 인명, 지명, 조직 명을 처리 대상으로 한다. 처리할 데이터는 점점 많아지고 고유명사는 수시로 생겨나기 때문에 고유명사 식별은 정보검색, 질의응답, 기계번역시스템의 핵심 기술 중의 하나로 부각되었다. 고유명사 식별에 있어 정확률과 더불어 식별속도와 식별모듈의 크기가 시스템의 성능에 미치는 문제도 쟁점이 되고 있다. 본 논문에서는 SVM과 자질선택을 결합한 다양한 실험을 통하여 중국어 고유명사의 식별 효율을 높이는 방법을 연구하였다.

  • PDF

새로운 도트형 프린트 워터마크 패턴의 생성 및 부호화 기법 (Technique for production and encoding of New dot-type Print Watermark Pattern)

  • 이부형
    • 한국산학기술학회논문지
    • /
    • 제10권5호
    • /
    • pp.979-984
    • /
    • 2009
  • 본 논문에서는 2차원 인쇄물의 고유정보 즉, 텍스트, 도형 및 기호 등에 대응하는 음성, 영상 및 기타정보를 출력시킬 수 있도록 하기 위한 새로운 방법의 도트형 프린트 워터마크 생성 방법 및 부호화 기법을 제안하였다. 프린트 워터마크는 인쇄물의 고유정보에 대응하여 고유정보위에 다시 인쇄되는 특정마크로서 고유정보의 특성을 훼손하지 않으면서 음성, 또는 영상정보와 연결시키는 중간 매개 역할을 한다. 제안한 도트형 프린트 워터마크 패턴은 $0.4mm^2$의 면적 내에 $16{\times}16$의 행렬구조를 가지며, 256개의 원소(element) 중 23개의 위치에 도트가 인쇄된다. 인쇄되는 도트의 크기는 0.02mm고 매우 작아 가시화되지 않는다. 23개의 위치는 2진수 비트 위치와 매핑 되어 800만개 정도의 인쇄물 고유정보를 표현할 수 있으며, 도트가 인쇄되는 위치에 따라 쉽게 2진수로 부호화할 수 있다는 특징을 갖는다. 또한 실험을 통해 제안한 프린트 워터마크 패턴이 자체 제작된 인식장치에 의해 쉽게 인식됨을 보였다.

실용영어에서 고유명사 일치를 위한 자료구조 (Efficient Data Structures of Coreference Resolution for Proper Names)

  • 김종선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.207-209
    • /
    • 1998
  • 고유명사가 문장속에서 다시 언급될때는 여러 가지 변형된 형태로 나타난다. 즉 같은 의미의 이름으로 사용되면서 서로 다른 이름 형태를 갖게 된다. 이러한 경향은 coreference 처리를 어렵게 만든다. 본 논문에서는 고유명사의 coreference와 의미상으로 인식되지 않은 고유명사의 식별에 이용될 수 있는 효율적인 자료구조를 제시한다.

  • PDF

시점 기반 고유공간을 이용한 얼굴 인식 (Face Recognition Using View-based EigenSpaces)

  • 김일정;차의영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.458-460
    • /
    • 1998
  • 본 논문은 주성분 분석으로 시점 기반 고유얼굴(view-based eigenface)을 생성하고, 그에 기반한 얼굴 인식을 수행하고자 한다. 주성분 분석을 통한 고유얼굴 생성은 얼굴 인식의 어려운 문제 중 하나인 특징 선택과 추출이라는 문제를 해결해 준다. 또한 얼굴 표정이나 방향의 변화에도 인식률이 저하되는 것을 방지할 수 있다. 얼굴 영상을 특징공간(고유공간)으로 변환할 때, 원 얼굴영상의 정보를 최대한으로 나타낼 수 있는 최적의 고유치 개수 선택은 얼굴 데이터베이스의 크기와 인식 속도에 영향을 끼친다. 따라서 본 논문에서는 고유치 개수를 고유치의 누적기여율을 이용해서 구한다. 이는 64$\times$64(=4096)차원의 원 얼굴 영상을 5~7차원으로 표현 가능하게 하였다. 그리고, 각 얼굴 방향에 따라 특징공간을 분리해서 생성함으로써 얼굴 방향의 변화에 따라 오인식률을 줄였다. 축소된 차원과 분리된 특징공간은 메모리 사용과 인식속도의 향상에 기여한다. 본 논문에서 얼굴의 인식은 Mahalanobis distance와 재구성 오차율을 고려해서 이루어졌다. 실험은 개인당 세가지 다른 방향을 가지는 얼굴 영상을 이용하여 이루어졌고, 실험결과, 약 93%의 인식률을 보여주었다.

  • PDF

발 고유 변인 측정을 위한 발 형상 추출 시스템 설계 (Design of a foot shape extraction system for foot parameter measurement)

  • 윤정록;김회민;김운용;전성국
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.421-422
    • /
    • 2020
  • 발 고유 변인 측정 및 데이터의 수집은 소비자의 발 건강을 위한 신발 제작을 위하여 필요하다. 신발의 설계 지표 또한 개정의 필요성이 제시되고 있어 발 고유 변인 측정의 및 데이터 획득에 관한 연구의 필요성이 증대되고 있다. 본 논문에서는 발 형태의 데이터 값을 산출하여 사용자에게 적합한 맞춤형 인솔 및 신발을 제작하고, 신발의 설계 지표를 산출하기 위하여 발 고유 변인의 데이터 값을 자동으로 측정이 가능한 발 고유 변인 산출이 가능한 발 형상 추출 시스템에 대해 서술한다. 이를 위해 사용자의 발 고유 변인 측정을위한 스캐닝 스테이지를 설계 및 제작하고, 3대의 깊이 카메라를 설치하였다. 잡음 및 배경을 제거하기 위해 가우시안 배경 모델링으로 전경 영역을 분리하여 발 점군 데이터를 획득 한 후, Euclidean transformation을 통해 각 점군 데이터를 정합한다. 실험 결과에서는 획득된 발 형상 점군 데이터와 접지면 형상 및 발 변인 추출 결과를 보여준다.

  • PDF

패턴 학습을 이용한 고유명사 추출 (Proper Noun Extraction Using Pattern Learning)

  • 김현준;김정화;강승식;우종우;윤보현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2001년도 가을 학술발표논문집 Vol.28 No.2 (2)
    • /
    • pp.184-186
    • /
    • 2001
  • 본 논문은 고유명사를 활용하여 특정 정보를 좀더 효율적으로 추출하기 위한 연구이며, Named Entity의 한 범주인 사람 이름에 대하여 어휘 사전이나 실마리 사전의 사용 없이 초기에 주어지는 몇 개의 인칭 명사들을 태그가 부착되지 않은 코퍼스에 적용시켜 고유명사 추출을 위한 패턴을 학습하고, 그 패턴을 적용하여 새로운 고유명사를 생성해 내는 작업을 통해 인칭 명사들을 효율적으로 추출할 수 있는 방법을 제안한다.

  • PDF

3D 점군 데이터에서의 발 고유 변인 검출 시스템 설계 (Design of foot parameter measurement system in 3D Point cloud)

  • 윤정록;김운용;김회민;전성국
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.695-696
    • /
    • 2021
  • 최근 다양한 연령층과 직업군들 사이에서 기능성 신발에 대한 관심이 증대되고 있다. 그러나 기능성 신발 및 맞춤형 신발은 높은 가격대와 긴 제작 시간이 필요하다. 이러한 문제점은 3D 스캐너 도입으로 해결이 가능하나, 정확한 발 형상 측정이 가능한 3D 스캐너는 고가의 장비이기 때문에 매장별 보급이 어렵다. 본 논문은 기능성 신발의 보급을 위하여 저가형 3D 스캐너에서 정확한 발 고유 변인을 측정할 수 있는 시스템에 대해 서술한다. 이를 위해 이를 위해 저가형 Depth Camera를 이용한 저가형 3D 스캐너의 발 형상 3D 점군 데이터를 2차원으로 변형하고, 발 형태를 감싸는 최소 사각형(Min Area Rect)를 형성하여 발 안쪽점 및 발 가쪽점을 추정한다. 생성된 최소 사각형과 발 안쪽점 및 발 가쪽점 등은 발 고유 변인 측정의 기준이 된다. 실험 결과에서는 측정 기준을 이용하여 발 고유 변인인 발 길이, 발 너비, 발꿈치 너비, 발꿈치에서 발안쪽점 및 발 가쪽점 길이 등 5가지 고유 변인을 측정하는 것을 보여준다.

  • PDF