• 제목/요약/키워드: Relation extraction

검색결과 326건 처리시간 0.026초

데이터베이스 시스템에서 디지털 포렌식 조사를 위한 체계적인 데이터 추출 기법 연구 (Research of organized data extraction method for digital investigation in relational database system)

  • 이동찬;이상진
    • 정보보호학회논문지
    • /
    • 제22권3호
    • /
    • pp.565-573
    • /
    • 2012
  • 기업의 탈법, 비리 등 부정행위를 조사할 경우 인사, 회계, 물류, 생산 등의 업무데이터(Business Data)의 확보가 필요하다. 다수의 기업들은 분산된 업무 데이터를 데이터베이스(Database)화하여 통합적으로 관리하고 있기 때문에 디지털 포렌식 조사를 위하여 데이터베이스에 대한 체계적인 업무데이터 추출기법 연구가 중요하다. 일반적인 정보체계 환경에서 데이터베이스는 상위 어플리케이션 및 대용량 파일 서버와 통합된 정보체계 내의 부분적 형태로 존재한다. 또한 사용자가 입력한 원시 업무 데이터는 정규화 과정을 거친 테이블 설계에 의해 하나 이상의 테이블에 분산되어 저장된다. 기존 데이터베이스 구조 분석에 관한 연구들은 데이터베이스의 최적화와 시각화를 위하여 테이블 간 연관관계 분석이 가장 중요한 연구대상이었다. 그러나 원시 업무데이터를 획득해야 하는 디지털 포렌식 관점의 연구는 테이블 간 연관관계 시각화보다 데이터의 해석이 더 중요한 연구대상이다. 본 논문에서는 데이터베이스 내부에서 미리 정의된 테이블 간 연관관계 분석기술뿐만 아니라 도메인 전문 지식(domain knowledge)을 활용한 체계화된 분석절차를 제시하여 데이터베이스에 저장된 원시 업무 데이터 구조를 분석하고 사건관련 데이터를 추출할 수 있는 분석방안을 제안한다.

Bi-LSTM-CRF 앙상블 모델을 이용한 한국어 공간 정보 추출 (Korean Spatial Information Extraction using Bi-LSTM-CRF Ensemble Model)

  • 민태홍;신형진;이재성
    • 한국콘텐츠학회논문지
    • /
    • 제19권11호
    • /
    • pp.278-287
    • /
    • 2019
  • 공간 정보 추출은 자연어 텍스트에 있는 정적 및 동적인 공간 정보를 공간 개체와 그들 사이의 관계로 명확히 표시하여 추출하는 것을 말한다. 이 논문은 2단계 양방향 LSTM-CRF 앙상블 모델을 사용하여 한국어 공간 정보를 추출할 수 있는 심층 학습 방법을 제안한다. 또한 공간 개체 추출과 공간 관계 속성 추출을 통합한 모델을 소개한다. 한국어 공간정보 말뭉치(Korean SpaceBank)를 사용하여 실험한 결과 제안한 심층학습 방법이 기존의 CRF 모델보다 우수함을 보였으며, 특히 제안한 앙상블 모델이 단일 모델보다 더 우수한 성능을 보였다.

Utilizing Various Natural Language Processing Techniques for Biomedical Interaction Extraction

  • Park, Kyung-Mi;Cho, Han-Cheol;Rim, Hae-Chang
    • Journal of Information Processing Systems
    • /
    • 제7권3호
    • /
    • pp.459-472
    • /
    • 2011
  • The vast number of biomedical literature is an important source of biomedical interaction information discovery. However, it is complicated to obtain interaction information from them because most of them are not easily readable by machine. In this paper, we present a method for extracting biomedical interaction information assuming that the biomedical Named Entities (NEs) are already identified. The proposed method labels all possible pairs of given biomedical NEs as INTERACTION or NO-INTERACTION by using a Maximum Entropy (ME) classifier. The features used for the classifier are obtained by applying various NLP techniques such as POS tagging, base phrase recognition, parsing and predicate-argument recognition. Especially, specific verb predicates (activate, inhibit, diminish and etc.) and their biomedical NE arguments are very useful features for identifying interactive NE pairs. Based on this, we devised a twostep method: 1) an interaction verb extraction step to find biomedically salient verbs, and 2) an argument relation identification step to generate partial predicate-argument structures between extracted interaction verbs and their NE arguments. In the experiments, we analyzed how much each applied NLP technique improves the performance. The proposed method can be completely improved by more than 2% compared to the baseline method. The use of external contextual features, which are obtained from outside of NEs, is crucial for the performance improvement. We also compare the performance of the proposed method against the co-occurrence-based and the rule-based methods. The result demonstrates that the proposed method considerably improves the performance.

상악 제 2대구치 발치를 동반한 II급 부정교합의 치료 (TREATMENT OF CLASS II MALOCCLUSIONS WITH UPPER SECOND MOLAR EXTRACTION)

  • 문성철;장영일;양원식
    • 대한치과교정학회지
    • /
    • 제23권1호
    • /
    • pp.123-136
    • /
    • 1993
  • The purpose of this report is to present the successful improvement of occlusal relationship and facial esthetics in class II division 1 malocclusion with severe labioversion of upper anterior teeth and severe overjet, and in class II malocclusion with infraversion of bilateral maxillary canines by MEAW mechanics, which enables us to get effective distal on mass movement of maxillary dentition, with upper second molar extraction. After treatment, there were natural contact points at canine and premolar regions, normal occlusal relation-ship and treatment results, satisfied the gnathologic concept, in this 2 cases. Compared with the routine treatment with premolar extraction, the treatment time and patients' discomfort were reduced. And the MEAW mechanics, which enables us to get effective distal on mass movement of maxillary dentition, resulted in reduction of the treatment time and getting the good treatment results. Consequently, the majot concerns in orthodontic treatment are appropriate diagnosis and treatment plan, so, the application of second molar extraction with appropriate case analysis and diagnosis is very helpful to orthodontic treatment.

  • PDF

토양 중 중금속의 식물유효도 평가를 위한 단일추출법 비교 (Comparison of Single Extractions for Evaluation of Heavy Metal Phytoavailability in Soil)

  • 서병환;임가희;김계훈;김장억;허장현;김원일;김권래
    • 한국환경농학회지
    • /
    • 제32권3호
    • /
    • pp.171-178
    • /
    • 2013
  • BACKGROUND: Consensus of heavy metal phytoavailability in soils needs to be introduced for soil management protocols in relation to safer food production in the contaminated agricultural soils. For this, setting up the method for evaluation of metal phytoavailability in soil is an essential prerequisite. METHODS AND RESULTS: The current study was carried to select a proper single extraction method for determination of phytoavailable metal concentration in soil. Two extraction methods were examined including 1 M $NH_4NO_3$ extraction and 0.01 M $Ca(NO_3)_2$ extraction methods using 142 soil samples collected from the agricultural soils nearby abandoned mining area in Korea. Corelation analysis was conducted between phytoavailable metal concentrations and soil properties potentially influencing on the metal phytoavailability. Both methods showed similar significance (p<0.001) in correlation with soil properties such as soil pH. However, higher correlation coefficients between phytoavailable metal concentrations and soil properties were observed when used $Ca(NO_3)_2$ extraction rather than using $NH_4NO_3$ extraction. CONCLUSION(S): It appeared that 0.01 M $Ca(NO_3)_2$ extraction was better option for determination of phytoavailable metals in soils and further study to test the efficiency of this method is required in combination with plant uptake.

향신재료를 이용한 Oleoresin제조에 관한 연구 3. 마늘 Oleoresin의 속성제조 (Studies on Oleoresin Product from Spices 3. Rapid Processing of Garlic Oleoresin)

  • 배태진;강훈이;김현주;최옥수;하봉석
    • 한국식품영양과학회지
    • /
    • 제22권1호
    • /
    • pp.73-77
    • /
    • 1993
  • This study was intended to investigate the effects of solvents, particle size of a sample, sample to solvent ratio, temperature and time on the extraction of garlic oleoresin. Among eleven solvents used for oleoresin extraction from garlic, the optimal solvent was methyl alcohol. The most appropriate particle size of garlic, extracting temperature and mixing ratio of garlic to methyl alcohol were 20mesh, $25^{\circ}C$ and 1 to 3(w/w), respectively. On the basis of yield in oleoresin extraction, optimum extracting time was about 4 hours. The yield of oleoresin under the above-mentioned conditions was 21.3%. "L" and "b" as color appearance were decreased, whereas "a"was increased slightly during 60 days storage at 5$^{\circ}C$, $25^{\circ}C$ and 4$0^{\circ}C$. Changes in the pyruvate content showed close relation to pH value. During storage pyruvate content of garlic oleoresin was decreased as increasing storage temperature.

  • PDF

Conceptual Extraction of Compound Korean Keywords

  • Lee, Samuel Sangkon
    • Journal of Information Processing Systems
    • /
    • 제16권2호
    • /
    • pp.447-459
    • /
    • 2020
  • After reading a document, people construct a concept about the information they consumed and merge multiple words to set up keywords that represent the material. With that in mind, this study suggests a smarter and more efficient keyword extraction method wherein scholarly journals are used as the basis for the establishment of production rules based on a concept information of words appearing in a document in a way in which author-provided keywords are functional although they do not appear in the body of the document. This study presents a new way to determine the importance of each keyword, excluding non-relevant keywords. To identify the validity of extracted keywords, titles and abstracts of journals about natural language and auditory language were collected for analysis. The comparison of author-provided keywords with the keyword results of the developed system showed that the developed system was highly useful, with an accuracy rate as good as up to 96%.

과학기술 핵심개체 인식기술 통합에 관한 연구 (A Study on the Integration of Recognition Technology for Scientific Core Entities)

  • 최윤수;정창후;조현양
    • 정보관리학회지
    • /
    • 제28권1호
    • /
    • pp.89-104
    • /
    • 2011
  • 대용량 문서에서 정보를 추출하는 작업은 정보검색 분야뿐 아니라 질의응답과 요약 분야에서 매우 유용하다. 정보추출은 비정형 데이터로부터 정형화된 정보를 자동으로 추출하는 작업으로서 개체명 인식, 전문용어 인식, 대용어 참조해소, 관계 추출 작업 등으로 구성된다. 이들 각각의 기술들은 지금까지 독립적으로 연구되어왔기 때문에, 구조적으로 상이한 입출력 방식을 가지며, 하부모듈인 언어처리 엔진들은 특성에 따라 개발 환경이 매우 다양하여 통합 활용이 어렵다. 과학기술문헌의 경우 개체명과 전문용어가 혼재되어 있는 형태로 구성된 문서가 많으므로, 기존의 연구결과를 이용하여 접근한다면 결과물 통합과정의 불편함과 처리속도에 많은 제약이 따른다. 본 연구에서는 과학기술문헌을 분석하여 개체명과 전문용어를 통합 추출할 수 있는 기반 프레임워크를 개발한다. 이를 위하여, 문장자동분리, 품사태깅, 기저구인식 등과 같은 기반 언어 분석 모듈은 물론 이를 활용한 개체명 인식기, 전문용어 인식기를 개발하고 이들을 하나의 플랫폼으로 통합한 과학기술 핵심개체 인식 체계를 제안한다.

그래프 구조를 이용한 카테고리 구조로부터 상하위 관계 추출 (Graph-based ISA/instanceOf Relation Extraction from Category Structure)

  • 최동현;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권6호
    • /
    • pp.464-469
    • /
    • 2010
  • 상하위 관계 자동 추출은 분류체계를 자동 구축하는 데 있어서 핵심적인 내용이며, 이렇게 자동으로 구축된 분류 체계는 정보 추출과 같은 여러 가지 분야에 있어서 중요하게 사용된다. 본 논문에서는 카테고리 구조로부터 상하위 관계를 추출하는 방식에 대하여 제안한다. 본 논문에서는 판별하고자 하는 카테고리 구조뿐만이 아닌, 그와 관련된 다른 카테고리 구조까지 고려하여 카테고리 이름에 나타난 토큰들간의 수식 그래프를 구축한 후, 그래프 분석 알고리즘을 통하여 각 카테고리 구조가 상하위 관계일 가능성에 대한 점수를 매긴다. 실험 결과, 본 알고리즘은 기존의 연구로 상하위 관계임을 판별할 수 없었던 일부 카테고리 구조에 대하여 성공적으로 상하위 관계인지를 판별하였다.

관계 추출에서 사전학습 언어모델의 방향성 예측 분석 (Directional Predictive Analysis of Pre-trained Language Models in Relation Extraction)

  • 허윤아;오동석;강명훈;손수현;소아람;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.482-485
    • /
    • 2021
  • 최근 지식 그래프를 확장하기 위해 많은 연구가 진행되고 있다. 지식 그래프를 확장하기 위해서는 relation을 기준으로 entity의 방향성을 고려하는 것이 매우 중요하다. 지식 그래프를 확장하기 위한 대표적인 연구인 관계 추출은 문장과 2개의 entity가 주어졌을 때 relation을 예측한다. 최근 사전학습 언어모델을 적용하여 관계 추출에서 높은 성능을 보이고 있지만, entity에 대한 방향성을 고려하여 relation을 예측하는지 알 수 없다. 본 논문에서는 관계 추출에서 entity의 방향성을 고려하여 relation을 예측하는지 실험하기 위해 문장 수준의 Adversarial Attack과 단어 수준의 Sequence Labeling을 적용하였다. 또한 관계 추출에서 문장에 대한 이해를 높이기 위해 BERT모델을 적용하여 실험을 진행하였다. 실험 결과 관계 추출에서 entity에 대한 방향성을 고려하지 않음을 확인하였다.

  • PDF