• 제목/요약/키워드: Topic Label

검색결과 23건 처리시간 0.016초

An Active Co-Training Algorithm for Biomedical Named-Entity Recognition

  • Munkhdalai, Tsendsuren;Li, Meijing;Yun, Unil;Namsrai, Oyun-Erdene;Ryu, Keun Ho
    • Journal of Information Processing Systems
    • /
    • 제8권4호
    • /
    • pp.575-588
    • /
    • 2012
  • Exploiting unlabeled text data with a relatively small labeled corpus has been an active and challenging research topic in text mining, due to the recent growth of the amount of biomedical literature. Biomedical named-entity recognition is an essential prerequisite task before effective text mining of biomedical literature can begin. This paper proposes an Active Co-Training (ACT) algorithm for biomedical named-entity recognition. ACT is a semi-supervised learning method in which two classifiers based on two different feature sets iteratively learn from informative examples that have been queried from the unlabeled data. We design a new classification problem to measure the informativeness of an example in unlabeled data. In this classification problem, the examples are classified based on a joint view of a feature set to be informative/non-informative to both classifiers. To form the training data for the classification problem, we adopt a query-by-committee method. Therefore, in the ACT, both classifiers are considered to be one committee, which is used on the labeled data to give the informativeness label to each example. The ACT method outperforms the traditional co-training algorithm in terms of f-measure as well as the number of training iterations performed to build a good classification model. The proposed method tends to efficiently exploit a large amount of unlabeled data by selecting a small number of examples having not only useful information but also a comprehensive pattern.

비정형 Security Intelligence Report의 정형 정보 자동 추출 (An Automatically Extracting Formal Information from Unstructured Security Intelligence Report)

  • 허윤아;이찬희;김경민;조재춘;임희석
    • 디지털융복합연구
    • /
    • 제17권11호
    • /
    • pp.233-240
    • /
    • 2019
  • 사이버 공격을 예측하고 대응하기 위해서 수많은 보안 기업 회사에서는 공격기법의 특성, 수법 유형을 빠르게 파악하고, 이에 대한 Security Intelligence Report(SIR)들을 배포한다. 하지만 각 기업에서 배포하는 SIR들은 방대하며, 형식이 맞춰져 있지 않다. 본 논문은 대량의 비정형한 SIR들에서 정보를 추출하는데 소요되는 시간을 줄이고 효율적으로 파악하기 위해 SIR들에 대해 정형화하고 주요 정보를 추출하기 위해 5가지 분석기술이 적용된 프레임워크를 제안한다. SIR들의 데이터는 정답 라벨이 없기 때문에 비지도 학습방식을 통해 키워드 추출, 토픽 모델링, 문서 요약, 유사문서 검색 총 4가지 분석기술을 제안한다. 마지막으로 SIR들에서 위협 정보 추출하기 위해 데이터를 구축하였으며, 개체명 인식 기술에 적용하여 IP, Domain/URL, Hash, Malware에 속하는 단어를 인식하고 그 단어가 어떤 유형에 속하는지 판단하는 분석기술을 포함한 총 5가지 분석기술이 적용된 프레임워크를 제안한다.

허니버터아몬드 사건으로 본 포장디자인의 상표로서의 식별력 - 대법원 2020.5.14. 선고 2019후11787 판결 (Study on the Identification of Packaging Design as a Trademark by Analyzing so-called Honey Butter Almond case)

  • 함선혜
    • 한국콘텐츠학회논문지
    • /
    • 제21권3호
    • /
    • pp.645-652
    • /
    • 2021
  • 이 논문에서는 상품의 포장디자인이 단순히 도안에 불과한 것이 아닌 상표로서의 식별력을 가질 수 있음을 인정하여 화제가 되었던 일명 '허니버터아몬드 판결'을 분석하였다. 위 판결에서는 다툼의 대상이 된 등록상표의 식별력 여부와 선사용상표와의 유사성 여부가 쟁점이 되었다. 우선 다툼의 대상이 된 등록상표의 식별력과 관련하여, 법원은 포장 전면 도형 부분의 표현 방법과 전체적인 구도 등의 특수성이 흔히 사용되는 표현 방식과 구분되는 이상 해당 도안은 출처의 식별표지로서 기능할 수 있다고 하였고 특히 과자 등 저관여 제품에서는 포장 전면 도형을 통해 출처를 식별하는 것이 일반적이라는 점도 이를 뒷받침한다는 등의 이유로 해당 등록상표의 식별력을 인정하였다. 한편 선사용상표(과자 '허니버터칩')와는 그 호칭 및 관념상 차이가 있어 그 지배적 인상이 유사하다고 보기 어렵다고 하였다. 위 판결은 상품의 포장디자인도 그 구도와 표현 방식의 독특성을 통해 상표로서의 식별력을 획득할 수 있다고 보아 포장 도안의 상품 표지로서의 기능을 인정한 데 의의가 있다. 다만 독점부당성을 부인하면서도 그에 대한 구체적 설명은 다소 부족하다는 점은 아쉬운 부분이다.