• 제목/요약/키워드: Frequent Structure Extraction

검색결과 13건 처리시간 0.032초

그래프마이닝을 활용한 빈발 패턴 탐색에 관한 연구 (A Methodology for Searching Frequent Pattern Using Graph-Mining Technique)

  • 홍준석
    • Journal of Information Technology Applications and Management
    • /
    • 제26권1호
    • /
    • pp.65-75
    • /
    • 2019
  • As the use of semantic web based on XML increases in the field of data management, a lot of studies to extract useful information from the data stored in ontology have been tried based on association rule mining. Ontology data is advantageous in that data can be freely expressed because it has a flexible and scalable structure unlike a conventional database having a predefined structure. On the contrary, it is difficult to find frequent patterns in a uniformized analysis method. The goal of this study is to provide a basis for extracting useful knowledge from ontology by searching for frequently occurring subgraph patterns by applying transaction-based graph mining techniques to ontology schema graph data and instance graph data constituting ontology. In order to overcome the structural limitations of the existing ontology mining, the frequent pattern search methodology in this study uses the methodology used in graph mining to apply the frequent pattern in the graph data structure to the ontology by applying iterative node chunking method. Our suggested methodology will play an important role in knowledge extraction.

TID 리스트 테이블을 이용한 연관 규칙 탐사 (Association Rule Discovery using TID List Table)

  • 채덕진;황부현
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권3호
    • /
    • pp.219-227
    • /
    • 2005
  • 본 논문에서는 데이타베이스를 단 한번 스캔하여 빈발 항목집합들을 생성할 수 있는 효율적인 알고리즘을 제안한다. 빈발 항목집합은 어떤 트랜잭션이 접근하는 항목 집합의 부분집합이다. 각 항목에 대하여 그 항목을 접근하는 트랜잭션들에 관한 정보를 가지고 있다면, 동일한 트랜잭션 식별자를 갖는 항목들만을 추출함으로써 빈발 항목집합들을 생성할 수 있다 본 논문에서 제안하는 방법은 한 번의 데이타베이스 스캔으로 각 항목마다 접근하는 트랜잭션 식별자를 저장할 수 있는 자료 구조를 생성하며, 동시에 해쉬 기법을 이용하여 2-빈발 항목집합들을 생성한다. 3-빈발 항목집합부터는 이 자료 구조와 각 항목에 대한 트랜잭션 식별자를 비교함으로써 간단히 빈발 항목집합들을 찾아낼 수 있다. 제안하는 알고리즘은 한 번의 데이타베이스 스캔만으로 빈발 항목집합들을 효율적으로 생성할 수 있다.

트리거 기반 XML 빈발 구조 추출 (Frequent Structure Extraction of XML based on Trigger)

  • 황정희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2011년도 추계학술발표대회
    • /
    • pp.1179-1180
    • /
    • 2011
  • 유비쿼터스 컴퓨팅 환경에서 무한의 연속적으로 전송되는 데이터에 대한 처리가 요구되고 있다. 본 논문에서는 연속적이고 빠르게 발생하는 스트림 데이터로부터 유용한 정보를 발견하기 위한 기반 연구로써 트리거를 이용한 슬라이딩 윈도우 기반의 XML 빈발 구조 추출 방법을 제안한다.

스트리밍 XML 데이터의 빈발 구조 마이닝 (Mining of Frequent Structures over Streaming XML Data)

  • 황정희
    • 정보처리학회논문지D
    • /
    • 제15D권1호
    • /
    • pp.23-30
    • /
    • 2008
  • 유비쿼터스 환경에서 상황정보 인식 분야를 연구하면서 가장 밑바탕에서 기초가 될 수 있는 것은 인터넷 기술과 XML(Extensible Markup Language)이다. 인터넷을 통한 통신에서 XML 데이터의 사용이 일반화되고 있으며 데이터의 형태는 연속적이다. 그리고 XML 스트림 데이터에 대한 질의를 처리하기 위한 방안들이 제시되고 있다. 이 논문에서는 스트림 데이터에 대한 질의처리를 효율적으로 수행하기 위한 기반연구로써 XML을 레이블의 순서화된 트리로 모델링하여 온라인 환경에서 빈발한 구조를 추출하는 마이닝 방법을 제안한다. 즉, 지속적으로 입력되는 XML 데이터의 구조를 트리로 모델링하고 각각의 트리를 하나의 트리 집합의 구조로 표현하여 현재 윈도우 시점에서 빈발한 구조를 정확하고 빠르게 추출하는 방법을 제시한다. 제시하는 방법은 XML의 질의 처리 및 색인 구성의 기초 자료로 활용될 수 있다.

준구조화된 정보소스에 대한 지식기반의 Wrapper 학습 에이전트 (A Knowledge-based Wrapper Learning Agent for Semi-Structured Information Sources)

  • 서희경;양재영;최중민
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권1_2호
    • /
    • pp.42-52
    • /
    • 2002
  • 정보추출은 한 문서에서 그 문서의 중심적 의미를 나타내는 특정 구성요소를 인식하여 추출하는 작업이다. 기존의 정보추출 시스템은 대부분 정보추출 규칙인 wrapper를 수동으로 구성하여 적용하였기 때문에 추출의 정확성은 높지만 유연성, 확장성, 효율성의 측면에서 문제점이 발생하였다. Wrapper를 자동으로 생성하는 일부 연구에서도 도메인 지식의 획득과 표현의 어려움, 그리고 여러 정보소스 사이에 나타나는 문서형태의 구조적 이질성 때문에 정확한 정보추출이 이루어지지 못했다. 본 논문에서는 이러한 이질적이고 복잡한 형태의 실세계 정보소스로부터의 정확한 정보추출을 추구하는 정보추출 에이전트인 XTROS를 제안한다. XTROS는 도메인 지식을 이용하여 준구조화된 형태의 정보소스에서 제공하는 문서를 분석하고 학습하여 wrapper들을 자동으로 생성하고, 이 wrapper들을 모두 XML 문서의 형태로 구성하는 새로운 표현기법을 제시함으로써 도메인 지식표현의 용이성과 wrapper 해석기 구현의 간결함, XML이 지닌 이식성 등을 최대한 활용하고자 하였다. Wrapper의 정보추출 규칙은 도메인 지식과 샘플 문서를 이용하여 자동으로 생성된다. 정보추출 규칙을 자동으로 생성하는 알고리즘의 핵심은 도메인 지식을 바탕을 샘플 문서의 각 논리 라인에 의미를 부여하고 이 논리 라인 의미의 나열로부터 반복되는 패턴을 찾아내는 것이다. 이 패턴의 위치와 구조를 XML 문서로 표현한 것이 wrapper가 된다. XTROS 시스템을 부동산 매물정보를 제공하는 다수의 실제 웹 정보소스에 대해서 테스트한 결과 이질성과 복잡성을 가진 대부분의 정보소스로부터 정확한 wrapper 생성과 정보추출이 가능하였다.

라벨 트리 데이터의 빈번하게 발생하는 정보 추출 (Frequently Occurred Information Extraction from a Collection of Labeled Trees)

  • 백주련;남정현;안성준;김응모
    • 인터넷정보학회논문지
    • /
    • 제10권5호
    • /
    • pp.65-78
    • /
    • 2009
  • 트리 데이터로부터 유용한 정보들을 추출하는 가장 일반적인 방식은 빈번하게 자주 발생하는 서브트리 패턴들을 얻는 것이다. XML 마이닝, 웹 사용 마이닝, 바이오인포매틱스, 네트워크 멀티캐스트 라우팅 등 빈번 트리 패턴 마이닝은 여러 다양한 영역에서 광범위하게 이용되고 있기 때문에, 해당 패턴들을 추출하기 위한 많은 알고리즘들이 제안되어 왔다. 하지만, 현재까지 제안된 대부분의 트리 마이닝 알고리즘들은 여러 가지 심각한 문제점들을 내포하고 있는데 이는 특히 대량의 트리 데이터 집합을 대상으로 했을 때는 더 심각해진다. 주요하게 발생하는 문제점들로는, (1) 계층적 트리 구조의 데이터 모델링, (2) 후보군 유지를 위한 고비용 계산, (3) 반복적인 입력 데이터 집합 스캔, (4) 높은 메모리 의존성이 대표적이다. 이런 문제점들을 발생하게 하는 주요 원인은, 대부분의 기존 알고리즘들이 apriori 방식에 근거하고 있다는 점과 후보군 생성과 빈발 횟수 집계에 anti-monotone 원리를 적용한다는 점에 기인한다. 언급한 문제들을 해결하기 위해, 본 저자들은 apriori 방식 대신 pattern-growth 방식을 기반으로 하며, 빈번 서브트리 추출 대신 최대 빈번 서브트리 추출을 목적으로 한다. 이를 통해 제안된 방법은, 빈번하지 않은 서브트리들을 제거하는 과정 자체를 배제할 뿐만 아니라, 후보군 트리들을 생성하는 과정 또한 전혀 수행하지 않음으로써 전체 마이닝 과정을 상당히 개선한다.

  • PDF

하악 제3대구치가 하악 우각부 골절에 미치는 영향 (THE INFLUENCE OF MANDIBULAR THIRD MOLAR ON MANDIBULAR ANGLE FRACTURE)

  • 조성필;이재훈;김철환
    • Maxillofacial Plastic and Reconstructive Surgery
    • /
    • 제28권1호
    • /
    • pp.49-57
    • /
    • 2006
  • Mandibular fractures have higher incidence rate compared to facial bone fractures because of relatively prominent form. Specially, mandibular angle fractures were known as common fracture site because of morphological anatomic structure. The mandibular third molar appears to be the most frequent impacted tooth. The mandibular third molar have influence on mandibular angle fractures according to it's eruption state. Also, the mandibular angle fracture including the third molar may influence on post operative infection whether the third molar is in impacted or extracted state when reduction of fracture site is operated. The presence or absence and degree of impaction of the mandibular third molar were assessed for each patient and were related to the occurrence of the mandibular angle fracture. The extraction or non extraction of the mandibular third molar were related to the occurrence of the post operative infection in the reduction of mandibular angle fractures. In the presence of mandibular third molar, the possibility of mandibular angle fractures were relatively common. When viewing the mandibular third molar at occlusal plane, the possibility of mandibular angle fractures were high in the class C group. The possibility of mandibular angle fractures were high in the mesial angulation and partial impaction. There was a statistically significant difference(P<0.05). In complete erupted mandibular third molar, the possibility of post operative infection occurs quite often, but there was no statistical significant difference(P>0.05). In the extracted or non extracted of mandibular third molar, the post operative infection showed no statistical significant difference(P>0.05). With the results mentioned above, mandibular third molar was significantly more susceptible to mandibular angle fracture. In the reduction of mandibular angle fracture, it was recommended that mandibular third molar should be extracted especially in case of pericoronitis, periodontitis and other infections.

의존 구문 분석을 이용한 질의 기반 정답 추출 (Query-based Answer Extraction using Korean Dependency Parsing)

  • 이도경;김민태;김우주
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.161-177
    • /
    • 2019
  • 질의응답 시스템은 크게 사용자의 질의를 분석하는 방법인 질의 분석과 문서 내에서 적합한 정답을 추출하는 방법인 정답 추출로 이루어지며, 두 방법에 대한 다양한 연구들이 진행되고 있다. 본 연구에서는 문장의 의존 구문 분석 결과를 이용하여 질의응답 시스템 내 정답 추출의 성능 향상을 위한 연구를 진행한다. 정답 추출의 성능을 높이기 위해서는 문장의 문법적인 정보를 정확하게 반영할 필요가 있다. 한국어의 경우 어순 구조가 자유롭고 문장의 구성 성분 생략이 빈번하기 때문에 의존 문법에 기반한 의존 구문 분석이 적합하다. 기존에 의존 구문 분석을 질의응답 시스템에 반영했던 연구들은 구문 관계 정보나 구문 형식의 유사도를 정의하는 메트릭을 사전에 정의해야 한다는 한계점이 있었다. 또 문장의 의존 구문 분석 결과를 트리 형태로 표현한 후 트리 편집 거리를 계산하여 문장의 유사도를 계산한 연구도 있었는데 이는 알고리즘의 연산량이 크다는 한계점이 존재한다. 본 연구에서는 구문 패턴에 대한 정보를 사전에 정의하지 않고 정답 후보 문장을 그래프로 나타낸 후 그래프 정보를 효과적으로 반영할 수 있는 Graph2Vec을 활용하여 입력 자질을 생성하였고, 이를 정답 추출모델의 입력에 추가하여 정답 추출 성능 개선을 시도하였다. 의존 그래프를 생성하는 단계에서 의존 관계의 방향성 고려 여부와 노드 간 최대 경로의 길이를 다양하게 설정하며 자질을 생성하였고, 각각의 경우에 따른 정답추출 성능을 비교하였다. 본 연구에서는 정답 후보 문장들의 신뢰성을 위하여 웹 검색 소스를 한국어 위키백과, 네이버 지식백과, 네이버 뉴스로 제한하여 해당 문서에서 기존의 정답 추출 모델보다 성능이 향상함을 입증하였다. 본 연구의 실험을 통하여 의존 구문 분석 결과로 생성한 자질이 정답 추출 시스템 성능 향상에 기여한다는 것을 확인하였고 해당 자질을 정답 추출 시스템뿐만 아니라 감성 분석이나 개체명 인식과 같은 다양한 자연어 처리 분야에 활용 될 수 있을 것으로 기대한다.

nDSM 및 도로망 추출 기법을 적용한 도심지 건물 변화탐지 (Urban Building Change Detection Using nDSM and Road Extraction)

  • 장영재;오재홍;이창노
    • 한국측량학회지
    • /
    • 제38권3호
    • /
    • pp.237-246
    • /
    • 2020
  • 최근 고해상도 영상을 지원하는 위성들이 다양화되면서 도심지에 대한 DSM (Digital Surface Model) 생성 및 업데이트가 가능해지고 있다. 그에 따라 고해상도 DSM을 이용해 건물 단위의 변화탐지가 가능해지면서 DSM을 활용한 건물 변화탐지 기법들이 다양하게 연구되고 있다. 기본적으로 DSM을 활용한 건물 변화탐지를 위해서는 스테레오 위성영상을 이용한 두 시기에 대한 DSM의 생성이 필요하며, 생성된 DSM의 표고값 차이를 이용해 변화를 탐지하는 D-DSM (Differential DSM) 방법이 일반적으로 사용된다. 그러나 D-DSM을 이용하는 기법은 두 DSM 간의 수직오차가 클 경우 건물의 변화를 탐지하기 위한 최소 수직좌표의 임계치를 정밀하게 적용하기에 어려움이 있다. 따라서 본 연구에서는 DTM (Digital Terrain Model)의 높이를 기준표고로 지정하고 구조물의 높이만을 표현하는 nDSM (Normalized DSM)을 기반으로 D-nDSM (Differential nDSM)을 생성하고 모폴로지 필터링을 거쳐 변화탐지를 진행하여 표고 오차에 따른 변화탐지의 오류를 줄이고자 하였다. 또한 도로변 건물의 추출 정밀도 향상을 위해 nDSM에서 도심지의 도로망을 추출하는 방안을 제시해 D-nDSM기법에 적용하였다. 도시 변화지역을 대상으로 두 시기의 스테레오 영상을 이용하여 실험을 진행하였고, D-DSM을 이용한 변화탐지기법과 D-nDSM기법, 도로선형을 추출해 D-nDSM에 적용한 탐지방법 등을 비교하여 결과를 얻었다. 단순 D-DSM을 이용한 기법에서 수직 임계치에 따라 약 30~55%의 정확도를 얻어낼 수 있었다. 또한 D-nDSM 기법의 적용시 59%의 정확도를 얻었으며, 노이즈 필터링의 과정을 거쳐 77.9%의 정확도를 얻었다, 최종적으로 대상지의 도로 선형을 추출해 적용하여 87.2%의 전체 정확도를 얻을 수 있었다.

최근 5년간 구강악안면 감염 환자의 임상통계학적 연구 (A CLINICOSTASTICAL STUDY OF ORAL AND MAXILLOFACIAL INFECTED PATIENTS FOR THE LAST 5 YEARS)

  • 장소정;이용근;안융;임대호;백진아;신효근
    • Journal of the Korean Association of Oral and Maxillofacial Surgeons
    • /
    • 제32권5호
    • /
    • pp.401-409
    • /
    • 2006
  • Infections of the oral and maxillofacial region are one of the most common conditions for which a patient presents to a maxillofacial surgeons. Although these infections can arise from a variety of source, dental disease is the most common etiology. So, odontogenic infection are frequently encountered in the practice of oral and maxillofacial surgery. These infections often respond to antimicrobial chemotherapy or surgical intervention, such as extraction of teeth, incision and drainage through clinical features. But, odontogenic infections have the potential to spread via the fascial spaces in the head and neck region, and, they spread to cavernous sinus, deep musculofascial space and other vital structure. We have undertaken clinical studies on infections in the oral and maxillofacial regions by analyzing retrospectively hospitalized patients in the Dept. of Oral and Maxillofacial Surgery, Chonbuk National University Hospital past 5 years from 2000 to 2004. And, the patients' age, sex, medical history, causes of the infection, surgical intervention, and other clinical parameters were reviewed. The obtained results were as follows : 1. The most frequent cause of oral and maxillofacial infection was odontogenic. And in the odontogenic cause, dental caries was the most common cause (47.2%). 2. The most common fascial space involved was the submandibular space (15.7%), followed by the buccal space (14.8%). 3. 60.4% of all patients required surgical drainage of the abscess, endodontic treatment or tooth extraction or periodontal treatment with drainage. 4. The most causative organism isolated from the pus culture were streptococcus viridans (53.9%). 5. Underlying medical problems were found in 136 patients (41.9%), the most common being hypertension (27.9%) and diabetes (14.7%).