• 제목/요약/키워드: 공간 지식 추출

검색결과 86건 처리시간 0.036초

공간데이타 마이닝을 위한 효율적인 그리드 셀 기반 공간 클러스터링 알고리즘 (An Efficient Grid Cell Based Spatial Clustering Algorithm for Spatial Data Mining)

  • 문상호;이동규;서영덕
    • 정보처리학회논문지D
    • /
    • 제10D권4호
    • /
    • pp.567-576
    • /
    • 2003
  • 대용량의 공간데이터베이스로부터 암시적이고 유용한 지식을 자동적으로 추출하는 공간데이터 마이닝은 데이타 양이 급격히 증가하면서 필요성이 더욱 증대되고 있다. 공간데이터 마이닝에서 데이타를 분석하여 유사한 그룹으로 분류하는 공간 클러스터링은 매우 중요한 분야이다. 기존 연구에서 공간 클러스터링을 위한 여러 가지 알고리즘들이 제시되었지만, 다음과 같은 문제점들이 있다. 먼저 클러스터링을 위하여 객체들 간의 거리론 기반으로 하므로 데이타 양이 많아질수록 계산 비용이 커진다. 또한, 메모리 상주 데이타를 대상으로 하므로 대용량의 데이타인 경우에 효율이 떨어진다. 본 논문에서는 공간데이터 마이닝을 위하여 그리드 셀을 기반으로 한 효율적인 공간 클러스터링 방법을 제시한다. 이 클러스터링에서는 기존 공간 클러스터링 기법들의 문제점을 해결하는데 중점을 둔다. 세부적으로 공간 클러스터링의 효율성을 높이기 위하여 클러스터링시에 발생하는 비용(계산량)을 감소시키는 것이다. 이를 위해서 공간지역성을 보장하는 대표적인 공간분할 방법인 그리드 셀을 기반으로 한 공간 클러스터링 기법을 제시한다.

개념패턴과 통계정보를 이용한 한국어 미지격의 구문관계 결정 방법 (Resolution of Ambiguous Grammatical Functions of Korean Using Conceptual Patterns and Statistical Information)

  • 이휘봉;강인수;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.261-266
    • /
    • 1998
  • 본 논문은 보조사로 인해 야기되는 한국어 미지격의 구문관계 중의성 해소를 위한 새로운 기법을 제안한다. 기존의 연구는 수작업으로 얻어진 동사의 의미적 선택 제약을 사용하는 방식과 단어 간의 공기패턴과 빈도를 어휘 레벨에서 추출하여 중의성을 해소하는 방식으로 나뉠 수 있다. 본 논문은 말뭉치에서 어휘 레벨이 아닌 개념패턴과 격의 분포 값을 자동으로 추출하여 미지격의 구문관계를 결정한다. 개념패턴과 용언의 격 분포 정보를 적용하여 구문분석 단계에서 실험한 결과, 본 논문이 제안한 방법은 92%의 미지격 결정 정확율을 보였다. 개념패턴은 지식의 저장공간을 줄이고 격 결정 범위를 확장할 수 있기에 범용 구문분석 시스템으로의 확장을 가능하게 한다.

  • PDF

온톨로지 기반 시맨틱 블로그 모델의 OWL 변환 및 관심 블로그 커뮤니티 추천 기법 (A Method for Converting OSEM to OWL and Recommending Interest Blog Communities)

  • 허영화;양경아;양재동;최완
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권5호
    • /
    • pp.385-389
    • /
    • 2009
  • 최근 블로그 사용이 급증하면서 방대한 양의 블로그 자원으로부터 적합한 자원을 추출하여 사용자에게 제공하기 위한 연구들이 시도되었다. 이들 연구 중 OSEM(Ontology-based Semantic Blog Model)은 블로그 공간(Blogosphere) 내 지식베이스를 효과적으로 모델링하기 위해 이를 온톨로지로 정의한 모델이다. OSEM을 시맨틱 웹 환경에서 활용하기 위해 본 논문에서는 매핑 기법을 적용하여 OSEM의 지식베이스를 OWL로 변환하고, OWL로 변환된 온톨로지에 SWRL 추론과 SPARQL 질의를 적용하여 블로그 사용자에게 유용한 관심 커뮤니티를 추천하는 기법을 제안한다. 제안 기법은 OSEM 내 지식베이스를 OWL로 변환함으로써 시맨틱 웹 환경에서의 공유와 재사용을 가능하게 하고, 제안한 추론 기법을 적용하여 사용자 관점의 관심 블로그 커뮤니티 추천을 가능하도록 한다.

어휘 정보와 구문 패턴에 기반한 단일 클래스 분류 모델 (One-Class Classification Model Based on Lexical Information and Syntactic Patterns)

  • 이현구;최맹식;김학수
    • 정보과학회 논문지
    • /
    • 제42권6호
    • /
    • pp.817-822
    • /
    • 2015
  • 관계 추출은 질의응답 및 지식확장 등에 널리 사용될 수 있는 주요 정보추출 기술이다. 정보추출에 관한 기존 연구들은 관계 범주가 수동으로 부착된 대용량의 학습 데이터를 필요로 하는 지도 학습모델을 기반으로 이루어져 왔다. 최근에는 학습 데이터 구축을 위한 인간의 노력을 줄이기 위해 원거리 감독법이 제안되었다. 그러나 원거리 감독법은 분류 문제를 해결하는데 필수적인 부정 학습 데이터를 수집하기 어렵다는 단점이 있다. 이러한 원거리 감독법의 단점을 극복하기 위해 본 논문에서는 부정 데이터 없이 학습이 가능한 단일 클래스 분류 모델을 제안한다. 입력 데이터로부터 긍정 데이터를 선별하기 위해서 제안 모델은 벡터 공간 상에서 어휘 정보와 구문 패턴에 기반한 유사도 척도를 사용하여 입력 데이터가 내부 범주에 속하는지 그렇지 않은지 판단한다. 실험에서 제안 모델은 대표적인 단일 클래스 분류 모델인 One-class SVM보다 높은 성능(0.6509 F1-점수, 0.6833 정밀도)을 보였다.

과학 수업의 혼성공간에서 드러나는 중학생의 지식자본 및 교수학습 특성: 7학년 생명 영역을 중심으로 (Funds of Knowledge and Features of Teaching and Learning in the Hybrid Space of Middle School Science Class: Focus on 7th grade Biology)

  • 이민주;김희백
    • 한국과학교육학회지
    • /
    • 제34권8호
    • /
    • pp.731-744
    • /
    • 2014
  • 학습자가 가진 문화와 자원을 수업의 중심 자원으로 이끌어내고자 하는 노력은, 학습자에게 보다 호응할 수 있는 교수학습을 모색하는 연구자들에게 중요한 단초를 제공할 수 있다. 본 연구에서는 과학수업의 혼성적 공간에서 학습자들이 드러내는 지식자본으로는 어떤 것이 있는지 살펴보고, 이같은 지식자본이 자발적 과정을 통해 수업 상황으로 유입되고, 수업의 핵심적 자원으로 작용하려면 어떠한 교수적 지원이 뒷받침되어야 하는지 알아보고자 하였다. 이를 위하여 7학년 '주변의 생물', '식물과 영양' 단원에서의 실제 수업 상황에서 5개월에 걸친 참여관찰을 수행하였고, 학습자의 지식자본이 가장 활발하게 부상하는 수업을 추출하였으며, 근거이론에 기반한 지속적 비교분석법을 이용하여 수집된 자료를 범주화 하였다. 연구 결과, 학생의 지식자본은 가정, 지역공동체, 또래문화, 대중문화 등의 4가지 기반에서 근거한 것으로 범주화할 수 있었으며, 특히 또래문화와 관련된 지식자본이 학습자의 보다 활발한 발화 및 참여를 촉진하는 것으로 드러났다. 또 이와 같은 지식자본이 수업 상황으로 보다 적극적으로 유입되기 위해서는 혼성적 수업 환경의 제공과 더불어 유입된 지식자본의 보편성, 지식자본의 공유와 확장, 그리고 지식의 공동 구성 및 공유라고 하는 실행공동체의 지향이 필요함을 알 수 있었다. 본 연구에서는 이 같은 교수학습적 특성에 기반하여, 학습자가 가진 '잠재적 수업자원'으로서의 지식자본을 어떻게 '실질적인 수업의 자원'으로 끌어올릴 수 있을 것인지에 대한 교육적 함의를 제시하였다. 학습자의 지식자본을 기반으로 한 수업은 전통적인 수업에서 점점 소외되고 있는 다양한 비참여자들을 포함하여 학습자들을 보다 적극적으로 수업으로 초대할 수 있는 발판이 되어준다. 또한 학습자의 삶에서 비롯된 경험과 과학 지식의 혼성적 상호작용을 통하여 지식의 공동 구성을 가능하게 하며, 보다 유의미한 학습 경험으로 자리 잡을 수 있게 한다는 데 그 의의가 있다.

퍼지지식베이스에서의 효율적인 정보검색을 위한 규칙생성 및 근사추론 알고리듬 설계 (Rule Generation and Approximate Inference Algorithms for Efficient Information Retrieval within a Fuzzy Knowledge Base)

  • 김형수
    • 디지털콘텐츠학회 논문지
    • /
    • 제2권2호
    • /
    • pp.103-115
    • /
    • 2001
  • 본 논문은 퍼지지식베이스에서 러프 집합과 요인공간이론을 적용하여 최소 결정규칙 생성과 근사추론 연산을 수행하는 두 개의 알고리듬을 제안한다. 최소 결정규칙의 생성은 속성요인에 관련한 상관분석과 베이지안 정리를 응용한 데이터의 분류기법과 리덕트에 의해 수행된다. 이 결정규칙으로 이루어진 최소지식 베이스의 탐색공간에서 소속함수와 t-norm의 합성 연산을 정의한 근사추론 방식에 의해 특정 객체를 검색한다. 본 연구의 러프와 퍼지연산 모듈을 수행하는 제안 알고리듬 기법을 객체및 속성수를 증가시키는 시뮬레이션을 통해 다른 검색이론 및 합성연산 방식과 비교하였다. 그 결과 다른 제 방법보다 본 연구에서 제안하는 기법이 특정 객체를 추출하기 위한 검색연산 시간에 있어 보다 빠르게 검색됨을 입증하였다.

  • PDF

정보공유공간의 품질 측정지표 개발에 관한 탐색적 연구 (An Exploratory Study of Developing a Measurement Tool for the Quality of Information Commons)

  • 박지홍;기선아
    • 한국문헌정보학회지
    • /
    • 제46권4호
    • /
    • pp.5-25
    • /
    • 2012
  • 본 연구는 정보공유공간의 품질 측정지표 개발을 위한 설문항목 개발을 목적으로 하였다. 정보공유공간은 도서관 이용자들이 다양한 교육, 연구, 문화 활동을 경험할 수 있는 물리적, 기술적, 지적 공간으로, 최근 도서관 이용자간의 지식 공유와 상호관계를 장려하기 위하여 인기를 얻고 있다. 또한 정보공유공간은 협업활동, 학습, 휴식을 위한 공간을 제공하는데, 이러한 장점과 유용성에도 불구하고 명확히 정보공유공간의 품질에 대한 측정도구가 없다. 여기에서는 도서관 이용자의 정보공유공간에 관한 인식과 정보공유공간에 대한 인지된 품질에 영향을 미치는 요소들을 추출하기 위하여 심층면담, 선행연구 대조 및 사전조사를 수행하였다. 선행연구와 설문 초기 아이템은 분류와 클러스터링을 통하여 데이터 내의 주요 개념이 도출되었다. 그 후 사전조사를 통하여 예비 설문문항의 타당도가 검증되었다. 연구의 의의는 도서관 서비스 품질평가에 대한 연구의 영역을 확장시키고 이용의도를 고려한 새로운 평가 체계를 제시한 점이다.

뉴스 비디오의 내용기반 검색을 위한 자동 인덱싱 (Automatic Indexing for the Content-based Retrieval of News Video)

  • 양명섭;유철중;장옥배
    • 한국정보처리학회논문지
    • /
    • 제5권5호
    • /
    • pp.1130-1139
    • /
    • 1998
  • 본 논문은 내용에 기반한 뉴스 비디오의 인덱싱과 검색을 위한 통합된 해결책을 제안한다. 핸재 일반적인 비디오의 자동 인덱싱은 불가능하지만 뉴스 비디오와 같은 구조가 명확한 경우는 가능하다. 이러한 뉴스의 구조화된 지식을 이용하여 키 프레임들을 자동 추출하기 위해서 제안된 우리의 모델은 뉴스사건 분할, 자막 인식, 검색 브라우저 모듈로 구성되어 있다. 첫 번째로 뉴스사건의 분할 모듈은 얼굴인식에 기반하여 사건의 중심인 앵커 장면을 인식하고 앵커 장면의 공간적 정보를 이용하여 뉴스사건을 분할한다. 다음으로 뉴스아이콘을 추출한다. 자막인식 모듈은 먼저 자막의 특성을 이용하여 자막 프레임을 검출하고 분리병합 방법을 이용하여 문자열을 추출한다. 다음으로 문자인식기(OCR)를 이용하여 문자인식을 한다. 마지막으로 검색 브라우저 모듈은 다양한 검색 방법이 가능하도록 하였다.

  • PDF

맵 인터페이스와 지식처리를 활용한 지역관련정보 통합검색 시스템 (An Integrated Region-Related Information Searching System applying of Map Interface and Knowledge Processing)

  • 신진주;서경석;장용희;권용진
    • Spatial Information Research
    • /
    • 제18권4호
    • /
    • pp.129-140
    • /
    • 2010
  • Google, NAVER와 같은 대형포털에서 지도 기반의 다양한 서비스를 제공함에 따라, 지역관련 정보를 얻으려는 사용자들의 관심과 요구 또한 증가하고 있다. 하지만, 대형포털의 서비스들은 특정 지역에 대한 상세정보가 충분하지 않고 관련 정보를 획득하는 과정이 반복되는 번거로움이 존재하기 때문에, 사용자가 특정 지역의 관련 정보를 자세하고 종합적이며 손쉽게 획득할 수 있도록 지원하는 시스템이 필요하다. 본 논문에서는 사용자의 지역정보 획득에 유용한 시스템의 구축을 위해, 맵 인터페이스와 지식처리를 활용한 시스템 모델을 제안한다. 제안한 모델은 '지역정보 웹 문서 Layer', '고유지역키워드 Layer', '맵 인터페이스 Layer'의 3-Layer로 구성된다. 이 모델을 기반으로 한 지역관련정보 통합검색 시스템은 (l) 특정 지역의 대표 키워드 추출 (2) 관련 웹 페이지 수집 (3) 연관 키워드 집합 추출 및 키워드간의 연관도 계산 (4) 사용자 인터페이스 구축의 4단계 과정을 거쳐 구현한다. 구체적으로 고양시 지역을 대상으로 한 시스템의 구축을 통해 제안한 모델과 유사도 행렬을 이용한 지역정보의 지식처리 알고리즘, 사용자의 검색 편의를 돕는 UI 등의 타당성을 검증하였다. 본 시스템은 단순히 개별 '정보'로 존재하는 지역정보들을 융합하고, 새로운 '지식'을 생산 및 체계화하여 사용자들에게 제공해준다. 이를 통해 사용자는 다양하고 상세한 지역정보를 제공받을 수 있고 관련 정보도 쉽게 얻을 수 있다.

Neuro-Fuzzy와 유전자알고리즘을 이용한 수위 예측에 관한 연구 (Study on Water Stage Prediction using Neuro-Fuzzy with Genetic Algorithm)

  • 여운기;서영민;지홍기
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2011년도 학술발표회
    • /
    • pp.382-382
    • /
    • 2011
  • 최근의 극심한 기상이변으로 인하여 발생되는 유출량의 예측에 관한 사항은 치수 이수는 물론 방재의 측면에서도 역시 매우 중요한 관심사로 부각되고 있다. 강우-유출 관계는 유역의 수많은 시 공간적 변수들에 의해 영향을 받기 때문에 매우 복잡하여 예측하기 힘든 요소이며, 과거에는 추계학적 예측모형이나 확정론적 예측모형 혹은 경험적 모형 등을 사용하여 유출량을 예측하였으나 최근에는 인공신경망과 퍼지모형 그리고 유전자 알고리즘과 같은 인공지능기반의 모형들이 많이 사용되고 있다. 하지만 유출량을 예측하고자 할 때 학습자료 및 검정자료로써 사용되는 유출량은 수위-유량 관계곡선식으로부터 구하는 경우가 대부분으로 이는 이렇게 유도된 유출량의 경우 오차가 크기 때문에 그 신뢰성에 문제가 있을 것으로 판단된다. 따라서 본 논문에서는 수위를 직접 예측함으로써 이러한 오차의 문제점을 극복 하고자 한다. Neuro-Fuzzy 모형은 과거자료의 입 출력 패턴에서 정보를 추출하여 지식으로 보유하고, 이를 근거로 새로운 상황에 대한 해답을 제시하도록 하는 인공지능분야의 학습기법으로 인간이 과거의 경험과 훈련으로 지식을 축적하듯이 시스템의 입 출력에 의하여 소속함수를 최적화함으로서 모형의 구조를 스스로 조직화한다. 따라서 수학적 알고리즘의 적용이 어려운 강우와 유출관계를 하천유역이라는 시스템에서 발생된 신호체계의 입 출력패턴으로 간주하고 인간의 사고과정을 근거로 추론과정을 거쳐 수문계의 예측에 적용할 수 있을 것이다. 유전자 알고리즘은 적자생존의 생물학 원리에 바탕을 둔 최적화 기법중의 하나로 자연계의 생명체 중 환경에 잘 적응한 개체가 좀 더 많은 자손을 남길 수 있다는 자연선택 과정과 유전자의 변화를 통해서 좋은 방향으로 발전해 나간다는 자연 진화의 과정인 자연계의 유전자 메커니즘에 바탕을 둔 탐색 알고리즘이다. 즉, 자연계의 유전과 진화 메커니즘을 공학적으로 모델화함으로써 잠재적인 해의 후보들을 모아 군집을 형성한 뒤 서로간의 교배 혹은 변이를 통해서 최적 해를 찾는 계산 모델이다. 이러한 유전자 알고리즘은 전역 샘플링을 중심으로 한 수법으로 해 공간상에서 유전자의 개수만큼 복수의 탐색점을 설정할 뿐만 아니라 교배와 돌연변이 등으로 좁아지는 탐색점 바깥의 영역으로 탐색을 확장할 수 있기 때문에 지역해에 빠질 위험성이 크게 줄어든다. 따라서 예측과 패턴인식에 강한 뉴로퍼지 모형의 해 탐색방법을 유전자 알고리즘을 사용한다면 보다 정확한 해를 찾는 것이 가능할 것으로 판단된다. 따라서 본 논문에서는 선행우량 및 상류의 수위자료로부터 하류의 단시간 수위예측에 관해 연구하였으며, 이를 위해 유전자 알고리즘을 이용항여 소속함수를 최적화 시키는 형태의 Neuro-Fuzzy모형에 대하여 연구하였다.

  • PDF