• 제목/요약/키워드: extraction of specific

검색결과 666건 처리시간 0.028초

NLP기반 NER을 이용해 소셜 네트워크의 조직 구조 탐색을 위한 협력 프레임 워크 (A Collaborative Framework for Discovering the Organizational Structure of Social Networks Using NER Based on NLP)

  • 프랭크 엘리호데;양현호;이재완
    • 인터넷정보학회논문지
    • /
    • 제13권2호
    • /
    • pp.99-108
    • /
    • 2012
  • 방대한 양의 데이터로부터 정보추출의 정확도를 향상시키기 위한 많은 방법이 개발되어 왔다. 본 논문에서는NER(named entity recognition), 문장 추출, 스피치 태깅과 같은 여러 가지의 자연어 처리 작업을 통합하여 텍스트를 분석하였다. 데이터는 도메인에 특화된 데이터 추출 에이전트를 사용하여 웹에서 수집한 텍스트로 구성하였고, 위에서 언급한 자연어 처리 작업을 사용하여 비 구조화된 데이터로부터 정보를 추출하는 프레임 워크를 개발하였다. 조직 구조의 탐색을 위한 택스트 추출 및 분석 관점에서 연구의 성능을 시뮬레이션을 통해 분석하였으며, 시뮬레이션 결과, 정보추출에서 MUC 및 CoNLL과 같은 다른 NER 분석기 보다 성능이 우수함을 보였다.

Distributed Information Extraction in Wireless Sensor Networks using Multiple Software Agents with Dynamic Itineraries

  • Gupta, Govind P.;Misra, Manoj;Garg, Kumkum
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제8권1호
    • /
    • pp.123-144
    • /
    • 2014
  • Wireless sensor networks are generally deployed for specific applications to accomplish certain objectives over a period of time. To fulfill these objectives, it is crucial that the sensor network continues to function for a long time, even if some of its nodes become faulty. Energy efficiency and fault tolerance are undoubtedly the most crucial requirements for the design of an information extraction protocol for any sensor network application. However, most existing software agent based information extraction protocols are incapable of satisfying these requirements because of static agent itineraries and large agent sizes. This paper proposes an Information Extraction protocol based on Multiple software Agents with Dynamic Itineraries (IEMADI), where multiple software agents are dispatched in parallel to perform tasks based on the query assigned to them. IEMADI decides the itinerary for an agent dynamically at each hop using local information. Through mathematical analysis and simulation, we compare the performance of IEMADI with a well known static itinerary based protocol with respect to energy consumption and response time. The results show that IEMADI provides better performance than the static itinerary based protocols.

Comparative Study of Knowledge Extraction on the Industrial Applications

  • Woo, Young-Kwang;Bae, Hyeon;Kim, Sung-Shin;Woo, Kwang-Bang
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2003년도 ICCAS
    • /
    • pp.1338-1343
    • /
    • 2003
  • Data is the expression of the language or numerical values that show some characteristics. And information is extracted from data for the specific purposes. The knowledge is utilized as information to construct rules that recognize patterns and make decisions. Today, knowledge extraction and application of the knowledge are broadly accomplished to improve the comprehension and to elevate the performance of systems in several industrial fields. The knowledge extraction could be achieved by some steps that include the knowledge acquisition, expression, and implementation. Such extracted knowledge can be drawn by rules. Clustering (CU, input space partition (ISP), neuro-fuzzy (NF), neural network (NN), extension matrix (EM), etc. are employed for expression the knowledge by rules. In this paper, the various approaches of the knowledge extraction are examined by categories that separate the methods by the applied industrial fields. Also, the several test data and the experimental results are compared and analysed based upon the applied techniques that include CL, ISP, NF, NN, EM, and so on.

  • PDF

생의학 분야 키워드 추출 모델에 대한 비교 연구 (Comparative Study of Keyword Extraction Models in Biomedical Domain)

  • 이동희;권순찬;장백철
    • 인터넷정보학회논문지
    • /
    • 제24권4호
    • /
    • pp.77-84
    • /
    • 2023
  • 생명 공학 및 의학 분야의 논문 수 증가에 따라 문헌 속에서 중요한 정보를 빠르게 찾아 대응하기 위한 키워드 추출의 필요성이 대두되고 있다. 본 논문에서는 생의학 분야에서의 키워드 추출에 대한 다양한 비지도 학습 기반 모델 및 BERT 기반 모델의 성능을 종합적으로 비교하였다. 실험 결과 생의학 분야에 특화된 데이터로 학습된 BioBERT 모델이 가장 높은 성능을 보였다. 이를 통해 생의학 분야의 키워드 추출 연구에서 적절한 실험 환경을 구성하고 다양한 모델을 비교 분석하여, 향후 연구에 필요한 정확하고 신뢰할 수 있는 정보를 제공하였다. 이뿐만 아니라, 다른 분야에서도 키워드 추출에 대한 비교적인 기준과 유용한 지침을 제공할 수 있을 것이라 기대한다.

육하원칙 정보에 기반한 홈비디오 키프레임 추출 (Keyframe Extraction from Home Videos Using 5W and 1H Information)

  • 장철훈;조성현;이승용
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제19권2호
    • /
    • pp.9-18
    • /
    • 2013
  • 본 논문에서는 육하원칙 정보를 기반으로 홈비디오에서 키프레임을 추출하는 방법을 제시한다. 키프레임 추출방법이란 비디오에서 중요하다고 생각되는 특정 프레임만을 선출하여 비디오를 요약하는 방법이다. 홈비디오의 경우 그 주제가 다양하여 특별한 가정을 통한 정보 추출이 어렵고, 주로 인물이 비디오의 중심이 되기 때문에 인물의 행동을 중심으로 요약을 수행하여야 한다. 본 논문에서는 인물의 얼굴, 인물의 행동, 전체 배경 정보를 분석하여 인물 중심의 보편적인 요약 기준인 육하원칙의 주요 정보를 추출한다. 추가적으로 비디오의 매 프레임의 블러 크기를 측정하여 이용함으로써 프레임별로 얼마나 많은 정보를 포함하고 있는지 측정하고, 가장 많은 정보를 포함한 프레임을 키프레임으로 선출한다. 사용자 실험을 통해 사용자가 홈비디오에서 여러 개의 키프레임을 선택할 경우, 기존의 방법보다 사용자의 선택과 유사함을 확인할 수 있다.

파이프라인을 지원하는 ASIP 합성 시스템의 설계 (Design of a cosynthesis system for pipelined application-specific instruction processors)

  • 현민호;이석근;박창욱;황선영
    • 한국통신학회논문지
    • /
    • 제22권3호
    • /
    • pp.444-453
    • /
    • 1997
  • This paper presents the prototype design of hardware/software cosynthesis system for pipelined application-specific instruction processors. Taking application programs in VHDL as inputs, the proposed system generates a pipelined instruction-set processor and the instruction sequences running on the generated machine. The design space of datapath and controller is defined by the architectural templates embedded in the system. Generating the intyermediate code adequate for parallelism analysis and extraction, the system converts it into assembly codes. Experimental results show the effectiveness of the proposed system.

  • PDF

WorldView-2 위성영상의 분광지수를 이용한 개체 추출 연구 (A Study on the Feature Extraction Using Spectral Indices from WorldView-2 Satellite Image)

  • 김혜진;김용일;이병길
    • 한국측량학회지
    • /
    • 제33권5호
    • /
    • pp.363-371
    • /
    • 2015
  • 개체 추출은 원격탐사 분야의 주된 연구분야 중 하나로, 고해상도 위성영상의 활용도가 높아짐에 따라 보다 세밀하고 특정적인 개체를 추출할 수 있게 되었다. 기존의 화소 기반의 영상 처리 기법들은 고해상도 위성영상의 분광 및 기하학적인 다양성과 복잡성을 제대로 반영하기 어렵기 때문에 근래에는 영상분할 기술을 기반으로 하는 많은 연구가 진행되고 있다. 그런데 단순히 RGB 밴드 영상에 한 가지 영상분할 기법을 적용하는 것으로는 다양한 분광 특성과 형태를 갖는 여러 대상 개체들을 추출하는데 한계가 있다. 지표면의 피복의 종류를 식별하고, 상태를 모니터링 하는데 효과적인 분광지수는 개체 추출 과정에 효율적으로 이용할 수 있다. 본 연구에서는 영상분할 기술을 기반으로 하여 분광지수를 이용한 보다 효과적인 개체 추출 기술을 제안하고자 하였다. 다양한 종류의 개체를 추출하기 위하여 의사결정 트리 분류 기술을 사용하였으며 고해상도 위성인 WorldView-2의 8밴드 다중분광 영상을 이용한 실험을 통해 각 대상 개체를 추출하기에 적합한 분광지수들을 선택하고 이의 효용성을 평가해보고자 하였다. 그 결과, 건물, 도로, 나지, 식생, 수계, 그림자의 6개 클래스에 대한 개체들을 선택적으로 분류할 수 있었고, 식생지수를 비롯한 다양한 분광지수들이 각 개체의 종류를 선별해내는데 효과적으로 사용될 수 있음을 확인하였다.

Purification and Biochemical Analysis of Rice Bran Lipase Enzyme

  • Kim, Young Hee
    • Journal of Plant Biotechnology
    • /
    • 제6권1호
    • /
    • pp.63-67
    • /
    • 2004
  • A simple procedure for the extraction of the lipolytic enzyme from rice bran has been developed. High activity of lipolytic enzyme was obtained by first defatting the rice bran to remove lipid components with various extraction conditions. Then, after rove cycles of aqueous extraction, rice bran lipolytic enzyme was purified using micro- and ultrafiltration apparatus. Lipolytic enzyme activity was estimated by its hydrolytic action of tributyrin. The result indicated that the standard activity curve of butyric acid showed that the potential rice bran enzyme is a hydrolytic lipase enzyme. In addition, it showed higher lipolytic activity and specific enzyme activity with further purification by micro- and ultrafiltration. The size of rice bran lipase enzyme was identified through 15 % SDS-PAGE. The molecular weight of the rice bran lipase enzyme was 41 kDa.

Extracting meeting location from seminar and conference announcement in English

  • Kim, Anatoliy;Choi, Dong-Hyun;Choi, Key-Sun
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.258-261
    • /
    • 2011
  • Living in the age of information people face problems related to information overload. Information is easy to produce, store and distribute through various communication channels, one of which is emails. With the appearance of the mobile devices, such as smart phones and tabs, people can have access to email inbox at any moment of time from everywhere. In this paper we present information extraction system with a specific goal of extracting meeting location from the announcement of seminar or conference. We apply a machine learning method (conditional random fields, CRF), train the system using annotated corpus of seminar and conference announcements and validate results by applying various extracted correction rules and patterns. Furthermore, we normalize extracted location, and reference using geo-coding databases, OpenStreetMap and Wikipedia resources to determine real geographical coordinates.

쌀겨로부터 lipase 효소의 정제 및 생화학적인 분석 (Purification and Biochemical Analysis of Rice Bran Lipase Enzyme)

  • 김영희
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2004년도 추계학술대회
    • /
    • pp.299-301
    • /
    • 2004
  • A simple procedure for the extraction of the lipolytic enzyme from rice bran has been developed. High activity of lipolytic enzyme was obtained by first defatting the rice bran to remove lipid components with various extraction conditions. Then, after five cycles of aqueous extraction, rice bran lipolytic enzyme was purified using micro- and ultrafiltration apparatus. Lipolytic enzyme activity was estimated by its hydrolytic action of tributyrin. The result indicated that the standard activity curve of butyric acid showed that the potential rice bran enzyme is a hydrolytic lipase enzyme. In addition, it showed higher lipolytic activity and specific enzyme activity with further purification by micro- and ultrafiltration.

  • PDF