• Title/Summary/Keyword: 개체효과

Search Result 907, Processing Time 0.024 seconds

An Effect of Semantic Relatedness on Entity Disambiguation: Using Korean Wikipedia (개체중의성해소에서 의미관련도 활용 효과 분석: 한국어 위키피디아를 사용하여)

  • Kang, In-Su
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.25 no.2
    • /
    • pp.111-118
    • /
    • 2015
  • Entity linking is to link entity's name mentions occurring in text to corresponding entities within knowledge bases. Since the same entity mention may refer to different entities according to their context, entity linking needs to deal with entity disambiguation. Most recent works on entity disambiguation focus on semantic relatedness between entities and attempt to integrate semantic relatedness with entity prior probabilities and term co-occurrence. To the best of my knowledge, however, it is hard to find studies that analyze and present the pure effects of semantic relatedness on entity disambiguation. From the experimentation on Korean Wikipedia data set, this article empirically evaluates entity disambiguation approaches using semantic relatedness in terms of the following aspects: (1) the difference among semantic relatedness measures such as NGD, PMI, Jaccard, Dice, Simpson, (2) the influence of ambiguities in co-occurring entity mentions' set, and (3) the difference between individual and collective disambiguation approaches.

Automatic Construction of a Named Entity Dictionary for Named Entity Recognition (개체명 인식을 위한 개체명 사전 자동 구축)

  • Jeon, Wonpyo;Song, Yeongkil;Choi, Maengsik;Kim, Harksoo
    • Annual Conference on Human and Language Technology
    • /
    • 2013.10a
    • /
    • pp.82-85
    • /
    • 2013
  • 개체명 인식기에 대한 연구에서 개체명 사전은 필수적으로 필요하다. 그러나 공개된 개체명 사전은 거의 없기 때문에, 본 논문에서는 디비피디아의 데이터로부터 개체명을 효과적으로 추출하여 자동으로 구축할 수 있는 방법을 제안한다. 제안 방법은 엔트리의 '이름'과 '분류' 정보를 사용한다. 엔트리의 '이름'은 개체명으로 사용하고, 엔트리의 '분류'는 각 개체명 클래스와의 상호정보량을 계산하여 엔트리와 개체명 클래스 사이의 점수를 계산한다. 이렇게 계산된 점수를 이용하여 개체명과 개체명 클래스를 매핑한다. 그 결과 76.7%의 평균 정확률을 보였다.

  • PDF

How to Use Effective Dictionary Feature for Deep Learning based Named Entity Recognition (딥러닝 기반의 개체명 인식을 위한 효과적인 사전 자질 사용 방법)

  • Kim, Hong-Jin;Kim, Hark-Soo
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.293-296
    • /
    • 2019
  • 개체명 인식은 입력 문장에서 인명, 지명, 기관명, 날짜, 시간과 같이 고유한 의미를 갖는 단어들을 찾아 개체명을 부착하는 기술이다. 최근 개체명 인식기는 형태소 단위나 음절 단위의 입력을 사용하는 연구가 주로 진행되고 있다. 그러나 형태소 단위 개체명 인식은 미등록어를 처리하지 못하는 문제점이 존재하고 음절 단위 개체명 인식은 단어의 의미를 제대로 반영하지 못하는 문제점이 존재한다. 본 논문에서는 이 문제점을 보완하기 위해 품사 정보를 활용한 음절 단위 개체명 인식기를 제안한다. 또한 개체명 인식 성능에 큰 영향을 미치는 개체명 사전 자질을 더 효과적으로 사용할 수 있는 방법을 제안하며 이 방법을 사용했을 때 기존의 방법보다 향상된 개체명 인식 성능(F1-score 0.8576)을 보였다.

  • PDF

Effects of Transplantation on Selected Local Populations for Hizikia Cultivation (톳 양식에 있어서 지역종들의 이식효과)

  • 노경환;황은경;손철현
    • Journal of Aquaculture
    • /
    • v.13 no.2
    • /
    • pp.101-105
    • /
    • 2000
  • To select a suitable seed for aquaculture, four strains of Hizikia fusiformis, collected from Haenam, Wando, Yosu, Chungmu and Pusan, were cultured under similar conditions at Wando, southern coast of Korea from December, 1993 to July, 1994. A comparative study on the monthly growth rate of these plants indicated that the maximum growth was attained by Yosu strain in May but the others in June-July. At the harvest time in May, Yosu strain yielded a maximum of 15.8 kg/$m^2$ of culture rope, while that of Pusan a minimum of 1.5 kg/$m^2$.

  • PDF

Answer Extraction Using Named Entity Feedback in Question Answering System (질의 응답 시스템에서 개체 피드백을 이용한 정답 추출)

  • 나승훈;강인수;이상율;이종혁
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.676-678
    • /
    • 2002
  • 질의 응답 시스템(Question Answering: QA)에서 정답 유형 부류(Answer Type Taxonomy: ATT)란 사용자 질문 분석을 위한 미 부류 체계를 의미하는 것으로, ATT의 크기가 클수록 시스템의 성능은 높아진다. ATT를 확장하기 위해서는, 개체(Named Entity)에 의미 범주를 결정하는 개체 분류기(Named Entity Tagger의 분류 체계가 세분되어야 하는데, 기존의 개체 분류기는 한문서 내에서 그 개체의 분류를 시도하기 때문에, 분류를 위한 문맥 정보의 양이 부족하여, 정확하고 상세한 분류를 기대하기 힘들다. 본 논문에서는 동일 개체에 대한 문맥 정보를 수집하기 위해, 그 개체가 나타나는 다른 문서들을 검색하는 개체 피드백 Named Enti쇼 Feedback)이라는 기법을 사용한다. 개체가 상세히 분류됨에 따라 ATT도 확장될 수 있었으며, 이렇게 확장된 ATT상에서의 정답 추출은 baseline보다 약 7%정도의 성능 향상을 보여, 개체 피드백의 효과를 확인할 수 있었다.

  • PDF

Bio-Equivalence Analysis using Linear Mixed Model (선형혼합모형을 활용한 생물학적 동등성 분석)

  • An, Hyungmi;Lee, Youngjo;Yu, Kyung-Sang
    • The Korean Journal of Applied Statistics
    • /
    • v.28 no.2
    • /
    • pp.289-294
    • /
    • 2015
  • Linear mixed models are commonly used in the clinical pharmaceutical studies to analyze repeated measures such as the crossover study data of bioequivalence studies. In these models, random effects describe the correlation between repeated outcomes and variance-covariance matrix explain within-subject variabilities. Bioequivalence analysis verifies whether a 90% confidence interval for geometric mean ratio of Cmax and AUC between reference drug and test drug is included in the bioequivalence margin [0.8, 1.25] performed using linear mixed models with period, sequence and treatment effects as fixed and sequence nested subject effects as random. A Levofloxacin study is referred to for an example of real data analysis.

A Non-morphological Approach for DBpedia URI Spotting within Korean Text (한국어 텍스트의 개체 URI 탐지: 품사 태깅 독립적 개체명 인식과 중의성 해소)

  • Kim, Youngsik;Hahm, Younggyun;Kim, Jiseong;Hwang, Dosam;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.100-106
    • /
    • 2014
  • URI spotting (탐지) 문제는 텍스트에 있는 단어열 중에서 URI로 대표되는 개체(entity)에 해당되는 것을 탐지하는 것이다. 이 문제는 두 개의 작은 문제를 순차적으로 해결하는 과제이다. 즉, 첫째는 어느 단어열이 URI에 해당하는 개체인가를 인식하는 것이고, 둘째는 개체 중의성 해소 문제로서 파악된 개체가 복수의 URI에 해당할 수 있는 의미적 모호성이 있을 때 그 URI중 하나를 선택하여 모호성을 해소하는 것이다. 이 논문은 디비피디아 URI를 대상으로 한다. URI 탐지 문제는 개체명 인식 문제와 비슷하나, URI(예를 들어 디비피디아 URI, 즉 Wikipedia 등재어)에 매핑될 수 있는 개체로 한정되므로 일반적인 개체명 인식 문제에서 단어열의 품사열이 기계학습의 자질로 들어가는 방법론과는 다른 자질을 사용할 수 있다. 이 논문에서는 한국어 텍스트를 대상으로 한국어 디비피디아 URI 탐지문제로서 SVM을 이용한 개체경계 인식 방법을 제시하여, 일반적 개체명 인식에서 나타나는 품사태거의 오류파급효과를 없애고자 한다. 또한 개체중의성 해소 문제는 의미모호성이 주변 문장들의 토픽에 따라 달라지므로, LDA를 활용하며 이를 영어 디비피디아 URI탐지에서 쓰인 방법들과 비교한다.

  • PDF

Studies on the Efficiency of Selection of Some Agronomic Characteristics in Accelerating Generations of Hybrid-Rice Population (수도육종년한단축법에 있어서 몇가지 형질의 선발효과에 관한 연구)

  • Chea-Yun Cho
    • KOREAN JOURNAL OF CROP SCIENCE
    • /
    • v.20
    • /
    • pp.27-62
    • /
    • 1975
  • These studies were aimed at clarifying whether or not selecting agronomic characteristics of hybrid-rice populations under greenhouse conditions was useful. The selection of two quantitative characteristics, culm length and heading date, and two qualitative characteristics, shattering and awnedness, was very effective, but the flag leaf length and the exsertion of panicle was not consistent, varying from one cross to another.

  • PDF

Species Adaptive Evolution Method for Evolvable Hardware (진화 하드웨어를 위한 종 적응 진화방법)

  • 반창봉;전호병;박창현;심귀보
    • Proceedings of the Korean Institute of Intelligent Systems Conference
    • /
    • 2000.11a
    • /
    • pp.111-114
    • /
    • 2000
  • 종의 분화는 생명체의 다양성을 유지하며, 좀더 환경에 적합한 생명체를 탄생시킨다. 본 논문에서는 이러한 종의 분화 개념을 도입한다. 개체군의 각 개체들이 돌연변이를 통하여 자손을 생성하고, 그 중 일부가 분화하여 다음 세대의 개체를 이룬다. 각 개체들은 돌연변이에 의해 결정되는 일정한 해밍 공간 내외를 탐색공간으로 하고, 분화를 통하여 유효한 탐색공간을 점차 넓혀 탐색공간 전체에 대한 효율적인 탐색을 수행한다. 돌연변이를 통한 진화 방법으로 진화 하드웨어에 적용할 경우 내부구조의 변경이 적어 빠른 탐색효과를 갖을 수 있다. 제안된 알고리즘을 2개의 최적화 문제에 적용하여 그 유용성을 확인한다.

  • PDF

An Efficient Genetic Algorithm with Partial Evaluation by Clustering (개체 클러스터링을 이용한 효율적인 국소 평가 유전자 알고리즘)

  • 김희수;조성배
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.6-8
    • /
    • 2000
  • 유전자 알고리즘을 적용하는 문제의 경우 일반적으로 집단의 크기를 가능한 한 크게 유지시킴으로써 최적의 해가 찾아지도록 한다. 그러나 개체 평가 비용이 상대적으로 큰 몇몇 특정한 문제의 경우 집단의 크기가 커지면 심각한 문제가 되기도 한다. 이러한 이유로 본 논문에서는 클러스터링 기법을 이용한 국소 평가 유전자 알고리즘을 제안하였다. 이 방법은 집단을 몇 개의 클러스터로 나누고 각각의 대표 개체를 평가한 후 나머지 개체들의 적합도 값은 간접적인 계산에 의해 얻어내는 방법으로, 적은 수의 평가만으로도 상대적으로 큰 집단을 유지시키는 효과를 얻을 수 있다. 일반적인 유전자 알고리즘과의 성능 비교를 통해 제안된 알고리즘이 효율적이었음을 알 수 있었다.

  • PDF