• 제목/요약/키워드: 자동추출

검색결과 2,631건 처리시간 0.039초

GIS를 이용한 공시지가 토지특성 자동추출에 관한 연구 (A Study on Auto-extract of Land Character of Public Land Price by GIS)

  • 박수홍;홍성언;김현석
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2003년도 공동 춘계학술대회 논문집
    • /
    • pp.486-492
    • /
    • 2003
  • 개별공시지가는 현재 자동화 산정 프로그램인 ALPA(Automatic Land Price Appraisal System)에 의해 지가를 산정하고 있다. 그러나 자동화 시스템은 지가를 자동적으로 산출한다는 장점이 있지만 지가의 계산만이 가능하고, 토지특성의 자동 추출에 관한 기능의 부재와 비교 표준지에 대한 취사 선택기능이 없는 등 정확도나 효율성 면에서 많은 문제점을 드러내고 있다. 이러한 문제점에 기인하여, 현재 개별공시지가를 조사ㆍ산정하는데 1년에 약 400억 소요되어 엄청난 국가예산이 소요되고 있다. 또한, 실무자들의 현장 조사와 수작업에 의한 토지특성 조사ㆍ기재로 인하여 개별공시지가 검증과정에서 발견되는 오류 필지의 상당 부분이 토지특성조사 착오로 나타나고 있어 토지특성 조사의 객관성과 정확성이 결여되고 있다. 따라서, 객관적이고 정확한 토지 특성조사와 효율적으로 공시지가를 자동 산정하기 위해서는 토지특성을 정확하게 자동으로 추출할 수 있는 방법론이 시급한 실정이다. 본 연구에서는 토지특성 조사 중 객관성과 정확도 측면에서 가장 문제가 되고 있는 필지의 형상특성과 항(방위)특성에 대해 GIS 소프트웨어인 ArcGIS와 Window기반의 Visual Basic을 이용하여 토지특성을 자동 추출할 수 있는 시스템 프로토타입을 구현하였다. 그리고, 자동 추출된 토지특성을 현행 토지특성과 비교ㆍ분석을 통하여 정확도와 효율성을 제시하고자 한다.

  • PDF

자동문헌분류를 위한 대표색인어 추출에 관한 연구 (A Study on the Feature Selection for Automatic Document Categorization)

  • 황재영;이응봉
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2003년도 제10회 학술대회 논문집
    • /
    • pp.55-64
    • /
    • 2003
  • 인터넷 학술정보자원이 급증하고 있는 가운데 자동문헌분류에 대한 관심과 필요성도 늘어가고 있다. 자동문헌분류에 관한 실험은 전처리 단계인 대표색인어 추출과 추출된 대표색인어의 분류성능 평가 실험으로 구분 할 수 있는데, 본 연구에서는 우선 대표색인어 추출을 위해 다양한 대표색인어(자질) 추출 방법에 따른 색인어 성능평가 실험 및 최적의 대표색인어 개수 선정 실험을 수행하였다.

  • PDF

영상 처리를 이용한 건축물의 크랙 자동 검출 시스템 (Automatic Cracks Detection System of Concrete Buildings Using Image Processing)

  • 조동욱;윤미희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.759-762
    • /
    • 2002
  • 본 논문에서는 건축물의 안전 진단에 최우선 요소로 고려되는 크랙(Crack : 갈라진 틈)을 영상 처리에 의해 자동 검출하고 크랙의 여러 가지 특징들을 자동으로 추출하는 방법에 대해 제안하고자 한다. 이는 우선 카메라로 입력한 건축불의 영상에서 전처리과정을 통해 잡음제거를 행하고 이에 경계 추출과 세선화 과정을 통해 크랙의 영역을 검출한다. 이후 크랙들의 특징을 추출하기 위해 크랙들을 분할하며 분할된 크랙들에 대해 곡선 적합을 통해 크랙들의 방향과 길이 등과 같은 특징들을 추출해 낸다. 본 논문에서 개발코자 하는 시스템은 크랙들의 특징들을 자동으로 추출해 냄으로써 기초적인 건축물의 안전 진단을 자동으로 행하는 시스템이 되리라 여겨진다.

  • PDF

자동 음차표기를 이용한 영-한 음차표기 대역쌍의 자동 추출 (An Algorithm for extracting English-Korean Transliteration pairs using Automatic I-K Transliteration)

  • 오종훈;배선미;최기선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.928-930
    • /
    • 2004
  • 지금까지 기계번역과 교차언어 정보검색 등과 같은 자연언어응용에서 사용되는 번역지식을 자동으로 구축하는 연구가 활발히 진행되어 왔다. 번역지식을 자동으로 구축하는 연구는 대역사전에 등재되어 있지 않은 미등록어에 대한 대역정보를 문서에서 자동으로 획득하는 것을 목표로 한다. 최근에는 이러한 미등록어 중 음차표기 번역지식에 대한 연구가 활발히 진행되고 있다. 음차표기는 주로 영어 단어를 발음에 기반하여 비영어권의 언어로 표기하는 것을 의미한다. 음차표기된 단어들은 새로운 개념을 나타내는 신조어가 많기 때문에 사전에 등재되어 있지 않온 경우가 많다. 따라서 효과적인 번역지식 구축을 위해서는 이러한 음차표기 번역지식을 자동으로 획득하는 것은 매우 중요하다. 본 논문에서는 영-한 음차표기 대역쌍을 문서에서 자동으로 추출하는 알고리즘을 제안한다. 본 논문의 기법은 한국어 음차표기의 인식, 영-한 자동음차표기, 한국어 음차표기와 자동음차표기된 영어단어간의 음성적 유사도 비교를 통하여 음차표기 대역쌍을 추출한다. 본 논문의 기법은 약 93%의 정확률과 68%의 재현율을 나타내었다.

  • PDF

딥러닝 언어 모델을 이용한 연구보고서의 참고문헌 자동추출 연구 (Automatic Extraction of References for Research Reports using Deep Learning Language Model)

  • 한유경;최원석;이민철
    • 정보관리학회지
    • /
    • 제40권2호
    • /
    • pp.115-135
    • /
    • 2023
  • 본 연구는 단행본, 학술지, 보고서 등 다양한 종류의 발간물로 구성된 연구보고서의 참고문헌 데이터베이스를 효율적으로 구축하기 위한 것으로 딥러닝 언어 모델을 이용하여 참고문헌의 자동추출 성능을 비교 분석하고자 한다. 연구보고서는 학술지와는 다르게 기관마다 양식이 상이하여 참고문헌 자동추출에 어려움이 있다. 본 연구에서는 참고문헌 자동추출에 널리 사용되는 연구인 메타데이터 추출과 더불어 참고문헌과 참고문헌이 아닌 문구가 섞여 있는 환경에서 참고문헌만을 분리해내는 원문 분리 연구를 통해 이 문제를 해결하였다. 자동 추출 모델을 구축하기 위해 특정 연구기관의 연구보고서 내 참고문헌셋, 학술지 유형의 참고문헌셋, 학술지 참고문헌과 비참고문헌 문구를 병합한 데이터셋을 구성했고, 딥러닝 언어 모델인 RoBERTa+CRF와 ChatGPT를 학습시켜 메타데이터 추출과 자료유형 구분 및 원문 분리 성능을 측정하였다. 그 결과 F1-score 기준 메타데이터 추출 최대 95.41%, 자료유형 구분 및 원문 분리 최대 98.91% 성능을 달성하는 등 유의미한 결과를 얻었다. 이를 통해 비참고문헌 문구가 포함된 연구보고서의 참고문헌 추출에 대한 딥러닝 언어 모델과 데이터셋 유형별 참고문헌 구축 방향을 제안하였다.

디지털 보청기의 자동 보정 파라미터 추출 (Auto fitting Parameter Extraction for Digital Hearing Aids)

  • 석수영;정호열;정현열
    • 한국멀티미디어학회논문지
    • /
    • 제3권5호
    • /
    • pp.495-505
    • /
    • 2000
  • 본 논문에서는 난청환자의 청각손실로부터 디지털 보청기의 보정 파라미터를 자동적으로 추출하는 방법을 제안하고 이를 이용한 자동보정시스템을 구현한다. 디지털 보청기의 보정 파라미터는 난청환자의 청각 특성 오디오그램으로부터 자동으로 추출하였으며, 추출된 보정 파라미터는 실제 GM3036 디지털 보청기를 이용하여 보정 시스템으로 구현되었으며, 각 파라미터는 이론적인 2cc 출력에 근접하도록 테이블화 하였다. 제안한 자동 보정 시스템을 적용하여 검사기로부터 출력을 검증하였고, 50명에게 사용하게 한후 만족돌르 조사한 결과 자동 보정 시스템의 유효성을 확인할 수 있었다.

  • PDF

기계학습 기술을 활용한 화학분야 특허문서의 조성/물성 정보 자동추출 방법 연구 (A Study on the Automatic Extraction of Fomulation and Properties in Chemical Field Patent Document by Using Machine Learning Technology)

  • 김홍기;이하영;박진우
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2019년도 제60차 하계학술대회논문집 27권2호
    • /
    • pp.277-280
    • /
    • 2019
  • 본 논문에서는 화학분야 특허 문서에 존재하는 도표(TABLE) 데이터를 인공지능 기술을 활용하여 자동으로 추출하고 정형화된 형태로 가공하는 방법을 제안한다. 특허 문서에서 도표 데이터는 실시예에서 실험결과나 비교결과를 간결하고 가시적으로 표현하기 위하여 주로 사용되나, 셀의 속성을 정의하는 헤더부분과 수치가 표현되는 값 부분의 경계가 모호하여 구조화하는데 어려움이 있다. 본 논문에서 제안하는 방법은 소량의 학습데이터를 구축하고 기계학습을 통해 도표에 존재하는 셀의 속성을 예측하고, 예측된 속성을 토대로 조성과 물성 정보를 자동으로 구분하여 추출하는 방법을 제시한다. 제시된 방법을 활용하여 화학 분야 조성물 특허의 도표데이터에 시뮬레이션 결과 각 항목별 98.17%의 속성 예측 정확도를 나타내었으며 기존 규칙기반 연구보다 작업난이도, 예측정확도에서 우수한 성과를 보인다.

  • PDF

생물학 관련 문헌으로부터 상호작용 정보 자동 추출 (Automatic Extraction of protein-protein interaction information from biological literature)

  • 정의헌;김민경;박현석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.808-810
    • /
    • 2003
  • 본 논문에서는 생물학 관련 문서에서 단백질 간의 상호작용을 추출하는 방법에 대한 전반적인 기술 동향을 소개하고, 현재 구현된 상호작용 정보 자동추출 시스템의 연구 결과에 대해 기술한다. 일반적으로 이미 알려진 단백질들의 관계를 추출함에 있어서는 단백질의 이름에 대한 특성 구분과 표현의 의미적 해석등에 NLP 기법을 사용하여, 사용자 정의에 따른 룰을 생성하는 방법과 데이터 마이닝 기법을 적용하여, 단백질간의 관계를 자동적으로 추출하는 방법, 또한 위의 이 두가지 방법을 병행하는 방법이 현재 연구되고 있다. 이 논문에서는 자연언어처리 기법과 머신러닝 기법(SVM)을 이용하여, 단백질간의 상호작용에 관한 일반 생물 정보 문헌에서 추출하고, 그 성능을 테스트 해 보겠다.

  • PDF

천연색 항공영상을 이용한 지형요소 반자동 추출에 관한 연구 (A Study on Semi-automatic Feature Extraction Using False Color Aerial Image)

  • 김감래;김경록;전호원
    • 한국측량학회지
    • /
    • 제19권2호
    • /
    • pp.109-115
    • /
    • 2001
  • 최근 수치사진측량시스템의 도입으로 수치정사영상의 활용도가 높아지고 있으며, 이에 따라 수치정사영상으로부터 지형지물의 반자동 또는 자동 추출에 관한 연구가 대두되고 있지만, 최근 많은 연구보고서에 의하면 흑백항공사진에서의 지형지물을 판단하거나 속성인식에 한계가 있음을 알 수 있다. 본 연구에서는 천연색 항공사진 영상을 흑백항공사진 영상과 비교, 분석하여 천연색 항공사진 영상의 특성을 분석하였으며, 반자동으로 지형요소를 추출하는 알고리즘을 개발하였고, 추출한 지형요소를 국립지리원에서 제작하는 1:5,000 수치지형도와 비교하여 반자동으로 추출가능한 지형요소를 분석하였다. 이러한 결과를 토대로 천연색 항공사진영상을 이용한 지형요소 추출 가능성과 지형요소 추출시 문제점을 분석하였고, 향후 연구에 대한 방안을 제시하였다.

  • PDF

FastText 와 BERT 를 이용한 자동 용어 추출 (FastText and BERT for Automatic Term Extraction)

  • 최규현;나승훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.612-616
    • /
    • 2021
  • 자연어 처리의 다양한 task 들을 잘 수행하기 위해서 텍스트 내에서 적절한 용어를 골라내는 것은 중요하다. 텍스트에서 적절한 용어들을 자동으로 추출하기 위해 다양한 모델들을 학습시켜 용어의 특성을 잘 반영하는 n 그램을 추출할 수 있다. 본 연구에서는 기존에 존재하는 신경망 모델들을 조합하여 자동 용어 추출 성능을 개선할 수 있는 방법들을 제시하고 각각의 결과들을 비교한다.

  • PDF