• 제목/요약/키워드: 개체효과

검색결과 904건 처리시간 0.023초

개체중의성해소에서 의미관련도 활용 효과 분석: 한국어 위키피디아를 사용하여 (An Effect of Semantic Relatedness on Entity Disambiguation: Using Korean Wikipedia)

  • 강인수
    • 한국지능시스템학회논문지
    • /
    • 제25권2호
    • /
    • pp.111-118
    • /
    • 2015
  • 개체 링킹은 텍스트에 출현하는 개체 표현을 위키피디아 등의 지식베이스 항목으로 연결하는 작업이다. 동일한 개체 표현을 공유하는 서로 다른 개체들의 존재로 인해 개체 링킹에서는 개체 표현의 중의성을 해소할 필요가 있다. 개체 중의성 해소를 위한 최근 연구에서는 공기 개체 의미관련도를 중심으로 개체 출현 선험 확률와 공기 용어 정보 등을 결합하는 시도들이 주류를 형성하고 있다. 그러나 의미관련도의 왕성한 활용에도 불구하고 의미관련도 기반 방법이 개체중의성해소에 미치는 순수 효과를 분석 제시한 연구는 찾기 힘들다. 이 연구는 NGD, PMI, Jaccard, Dice, Simpson 등 서로 다른 의미관련도 지표의 차이, 공기개체집합 내 중의성 정도의 차이, 개별적/집단적 중의성해소 방식의 차이의 세 가지 관점에서 의미관련도 기반 개체중의성해소 방법들을 한국어 위키피디아 데이터를 사용하여 실험적으로 평가한 결과를 제시한다.

개체명 인식을 위한 개체명 사전 자동 구축 (Automatic Construction of a Named Entity Dictionary for Named Entity Recognition)

  • 전원표;송영길;최맹식;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.82-85
    • /
    • 2013
  • 개체명 인식기에 대한 연구에서 개체명 사전은 필수적으로 필요하다. 그러나 공개된 개체명 사전은 거의 없기 때문에, 본 논문에서는 디비피디아의 데이터로부터 개체명을 효과적으로 추출하여 자동으로 구축할 수 있는 방법을 제안한다. 제안 방법은 엔트리의 '이름'과 '분류' 정보를 사용한다. 엔트리의 '이름'은 개체명으로 사용하고, 엔트리의 '분류'는 각 개체명 클래스와의 상호정보량을 계산하여 엔트리와 개체명 클래스 사이의 점수를 계산한다. 이렇게 계산된 점수를 이용하여 개체명과 개체명 클래스를 매핑한다. 그 결과 76.7%의 평균 정확률을 보였다.

  • PDF

딥러닝 기반의 개체명 인식을 위한 효과적인 사전 자질 사용 방법 (How to Use Effective Dictionary Feature for Deep Learning based Named Entity Recognition)

  • 김홍진;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.293-296
    • /
    • 2019
  • 개체명 인식은 입력 문장에서 인명, 지명, 기관명, 날짜, 시간과 같이 고유한 의미를 갖는 단어들을 찾아 개체명을 부착하는 기술이다. 최근 개체명 인식기는 형태소 단위나 음절 단위의 입력을 사용하는 연구가 주로 진행되고 있다. 그러나 형태소 단위 개체명 인식은 미등록어를 처리하지 못하는 문제점이 존재하고 음절 단위 개체명 인식은 단어의 의미를 제대로 반영하지 못하는 문제점이 존재한다. 본 논문에서는 이 문제점을 보완하기 위해 품사 정보를 활용한 음절 단위 개체명 인식기를 제안한다. 또한 개체명 인식 성능에 큰 영향을 미치는 개체명 사전 자질을 더 효과적으로 사용할 수 있는 방법을 제안하며 이 방법을 사용했을 때 기존의 방법보다 향상된 개체명 인식 성능(F1-score 0.8576)을 보였다.

  • PDF

톳 양식에 있어서 지역종들의 이식효과 (Effects of Transplantation on Selected Local Populations for Hizikia Cultivation)

  • 노경환;황은경;손철현
    • 한국양식학회지
    • /
    • 제13권2호
    • /
    • pp.101-105
    • /
    • 2000
  • 본 연구는 톳 양식에 사용되는 종묘의 지역 개체군간의 생장 차이를 분석하기 위하여 1993년 11월에 전남 완도, 해남, 여수, 경남 충무 및 부산 등 5개 지역에서 채집된 유체를 완도의 동일 양식장에 이식하여 생장의 차이와 개체군간의 유사도를 분석하였다. 엽체의 최대생장 시기는 여수 개체군이 5월, 완도.충무.해남 개체군이 6월 그리고 부산 개체군이 7월로 나타났으며, 체장은 여수 개체군이 최대 117.5cm, 완도 개체군이 최대 88.7cm, 충무 개체군이 45.5cm, 해남 개체군이 41.8cm 및 부산 개체군이 59.3cm로 나타났다. 단위 m당 생산량은 여수 개체군에서 최대 15.8 kg/m 로 최고치를 나타내었으며 부산 개체군에서 1.5kg/m로 가장 낮았다. 지역 개체군별 생장률은 여수 개체군이 0.0137로 가장 높았으며 해남 개체군에서 0.0073으로 가장 낮게 나타났다. 지역 개체군별 유사도는 19.2%의 유사도 수준에서 각각 여수 완도 개체군 및 해남.부산.충무 개체군의 두 그룹으로 구분되었다.

  • PDF

질의 응답 시스템에서 개체 피드백을 이용한 정답 추출 (Answer Extraction Using Named Entity Feedback in Question Answering System)

  • 나승훈;강인수;이상율;이종혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.676-678
    • /
    • 2002
  • 질의 응답 시스템(Question Answering: QA)에서 정답 유형 부류(Answer Type Taxonomy: ATT)란 사용자 질문 분석을 위한 미 부류 체계를 의미하는 것으로, ATT의 크기가 클수록 시스템의 성능은 높아진다. ATT를 확장하기 위해서는, 개체(Named Entity)에 의미 범주를 결정하는 개체 분류기(Named Entity Tagger의 분류 체계가 세분되어야 하는데, 기존의 개체 분류기는 한문서 내에서 그 개체의 분류를 시도하기 때문에, 분류를 위한 문맥 정보의 양이 부족하여, 정확하고 상세한 분류를 기대하기 힘들다. 본 논문에서는 동일 개체에 대한 문맥 정보를 수집하기 위해, 그 개체가 나타나는 다른 문서들을 검색하는 개체 피드백 Named Enti쇼 Feedback)이라는 기법을 사용한다. 개체가 상세히 분류됨에 따라 ATT도 확장될 수 있었으며, 이렇게 확장된 ATT상에서의 정답 추출은 baseline보다 약 7%정도의 성능 향상을 보여, 개체 피드백의 효과를 확인할 수 있었다.

  • PDF

선형혼합모형을 활용한 생물학적 동등성 분석 (Bio-Equivalence Analysis using Linear Mixed Model)

  • 안형미;이영조;유경상
    • 응용통계연구
    • /
    • 제28권2호
    • /
    • pp.289-294
    • /
    • 2015
  • 생동성 시험과 같은 임상약리학분야의 연구는 일반적으로 한 개체 내에서 반복하여 측정된 자료구조를 사용하므로 선형혼합모형을 이용하여 분석하는 것이 보편적이다. 이러한 모형에서 랜덤효과는 개체 내 관측 자료 사이의 상관관계를 설명하고, 공분산행렬은 개체-내 변동을 설명한다. 생동성 분석은 두 약물의 약동학적 변수인 Cmax와 AUC의 기하평균비에 대한 90% 신뢰구간이 동등성 한계인 [0.8, 1.25] 범위에 드는지 알아보는 분석으로, 고정효과에는 시기, 순서군, 치료효과를, 랜덤효과에는 개체효과를 가지는 선형혼합모형을 이용하여 분석한다. 이러한 분석이 적용된 실제 예를 살펴보기 위하여 레보플록사신 연구의 자료를 활용하였다.

한국어 텍스트의 개체 URI 탐지: 품사 태깅 독립적 개체명 인식과 중의성 해소 (A Non-morphological Approach for DBpedia URI Spotting within Korean Text)

  • 김영식;함영균;김지성;황도삼;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.100-106
    • /
    • 2014
  • URI spotting (탐지) 문제는 텍스트에 있는 단어열 중에서 URI로 대표되는 개체(entity)에 해당되는 것을 탐지하는 것이다. 이 문제는 두 개의 작은 문제를 순차적으로 해결하는 과제이다. 즉, 첫째는 어느 단어열이 URI에 해당하는 개체인가를 인식하는 것이고, 둘째는 개체 중의성 해소 문제로서 파악된 개체가 복수의 URI에 해당할 수 있는 의미적 모호성이 있을 때 그 URI중 하나를 선택하여 모호성을 해소하는 것이다. 이 논문은 디비피디아 URI를 대상으로 한다. URI 탐지 문제는 개체명 인식 문제와 비슷하나, URI(예를 들어 디비피디아 URI, 즉 Wikipedia 등재어)에 매핑될 수 있는 개체로 한정되므로 일반적인 개체명 인식 문제에서 단어열의 품사열이 기계학습의 자질로 들어가는 방법론과는 다른 자질을 사용할 수 있다. 이 논문에서는 한국어 텍스트를 대상으로 한국어 디비피디아 URI 탐지문제로서 SVM을 이용한 개체경계 인식 방법을 제시하여, 일반적 개체명 인식에서 나타나는 품사태거의 오류파급효과를 없애고자 한다. 또한 개체중의성 해소 문제는 의미모호성이 주변 문장들의 토픽에 따라 달라지므로, LDA를 활용하며 이를 영어 디비피디아 URI탐지에서 쓰인 방법들과 비교한다.

  • PDF

수도육종년한단축법에 있어서 몇가지 형질의 선발효과에 관한 연구 (Studies on the Efficiency of Selection of Some Agronomic Characteristics in Accelerating Generations of Hybrid-Rice Population)

  • 조재연
    • 한국작물학회지
    • /
    • 제20권
    • /
    • pp.27-62
    • /
    • 1975
  • 본연구는 13개 교배조합을 공시하고 온실재배조건에서도 비교적 식별이 편리하며 또한 측정이 용이한 간장, 출수기, 묘출도 및 지엽장등 4개 양적형질과 탈립성 및 망등 2개의 질적형질을 대상으로 선발을 가하고 그 효과를 비교검토하였다. 본연구는 작물시험장의 온실과 시험답에서 1971년부터 1973년에 걸쳐 수행되었는데 그 얻어진 결과를 요약하면 다음과 같다. 1. 수도잡종의 온실세대촉진과정에서 간장이나 출수기와 같이 유전력이 높은 양적형질을 대상으로 하는 선발은 그 효과가 매우 명확하였으나 추출도 및 지엽장과 같이 유전력이 비교적 낮은 형질의 선발효과는 공시조합에 따라 상이하였지만 일반적으로 낮았다. 또한 탈립성 및 망등 질적형질에 있어서도 선발효과는 인정되었는데 우성형질을 선발할 때 더욱 현저하였다. 2. 장간개체보다는 단간개체를 선발할 때, 그리고 양친품종의 간장차가 큰 조합에서 그 효과는 보다 현저하였다. 3. 간장의 실제유전획득량과 기대유전획득량간에는 일반적으로 상당한 차이가 있었는데 이는 재배조건이 포장과 온실로 각각 상이한데서 기인된 것으로 짐작되었다. 4. 통일/Tetep와 IR 24/Tetep과 같이 단간대장간조합에서의 간장유전력은 69~96%로 높았는데 YR 52/IR 24와 Toride 2/수원 224와 같은 단간대단간조합에서는 14~89%의 비교적 낮은 유전력을 나타내었다. 5. 통일/Tetep와 IR 24/Tetep양조합의 간장유전은 비교적 단순한 것으로 판단되었으나 YR 52/IR 24와 Toride 2/수원 224양조합의 경우에는 연속분리로 정규분포곡선을 나타내므로서 주동인자이외에 미동인자의 존재를 예측할 수 있었다. 6. 출수기를 대상으로 하는 선발은 조생집단에서 2~4일의 유전획득량을 얻었으며 만생집단에서는 1~4일의 만생화 차이를 관찰하였다. 2개선발은 1회선발에 비하여 그 효과가 다소 높았다. 7. 출수기의 유전력은 83~96%로 대단히 높았으며 단순인자에 의하여 좌우되기 보다는 여러개의 인자가 복합적으로 작용하는 것으로 나타났으며 만생은 조생에 대하여 우성으로 나타났다. 8. 추출도에 대한 선발효과는 교배조합에 따라 상이하였다. 양친품종간의 추출도차이가 비교적 큰 IR 1325/Chukei 314조합에서는 그 효과가 인정되었으나 양친품종의 추출상태가 비슷한 Chukei 314/수원 224조합에서는 선발효과가 적었다. 9. 추출도는 여러개의 유전인자에 의하여 지배되는 것으로 나타났으며 rm 유전력은 IR 1325/Chukei 314조합에서는 63~95% 비교적 높았으나 Chukei 314/수원 224조합의 경우에는 무시할 정도의 유전력을 보여주었다. 10. F$_2$집단에서 지엽장의 유전력은 산도/수원 224조합에서 55% 그리고 이의 역교잡인 수원 224/산도조합에서 26%로 낮았다. 11. 지엽장에 대해 선발했을 때 산도/수원 224조합에서는 집단에 따라 그 효과가 인정되었으나 이의 역교잡에서는 전혀 무의미하였다. 따라서 지엽장은 환경요인의 영향이 큰 것으로 미루어 초기세대 선발대상형질로서는 적합하지 않다고 보았다. 12. 탈립성은 비탈립성에 대하여 우성으로 작용하고 비교적 단순유전을 하는 것으로 추정되었다. 13. 탈립성을 대상으로 선발하는 경우 그 효과는 확실하였으며 탈립집단에서 선발의 효과는 더욱 명확하였다. 14. 유망은 무망에 대하여 우성으로 작용하며 관여인자수는 2쌍이상으로 추정되었다. 15. 망에 대한 선발은 유효했으나 유망개체의 선발효과가 무망개체선발의 경우보다 높았다. 그리고 무망개체를 선발할 때에는 1회보다 2회가 더 효과적이었다.

  • PDF

진화 하드웨어를 위한 종 적응 진화방법 (Species Adaptive Evolution Method for Evolvable Hardware)

  • 반창봉;전호병;박창현;심귀보
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2000년도 추계학술대회 학술발표 논문집
    • /
    • pp.111-114
    • /
    • 2000
  • 종의 분화는 생명체의 다양성을 유지하며, 좀더 환경에 적합한 생명체를 탄생시킨다. 본 논문에서는 이러한 종의 분화 개념을 도입한다. 개체군의 각 개체들이 돌연변이를 통하여 자손을 생성하고, 그 중 일부가 분화하여 다음 세대의 개체를 이룬다. 각 개체들은 돌연변이에 의해 결정되는 일정한 해밍 공간 내외를 탐색공간으로 하고, 분화를 통하여 유효한 탐색공간을 점차 넓혀 탐색공간 전체에 대한 효율적인 탐색을 수행한다. 돌연변이를 통한 진화 방법으로 진화 하드웨어에 적용할 경우 내부구조의 변경이 적어 빠른 탐색효과를 갖을 수 있다. 제안된 알고리즘을 2개의 최적화 문제에 적용하여 그 유용성을 확인한다.

  • PDF

개체 클러스터링을 이용한 효율적인 국소 평가 유전자 알고리즘 (An Efficient Genetic Algorithm with Partial Evaluation by Clustering)

  • 김희수;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.6-8
    • /
    • 2000
  • 유전자 알고리즘을 적용하는 문제의 경우 일반적으로 집단의 크기를 가능한 한 크게 유지시킴으로써 최적의 해가 찾아지도록 한다. 그러나 개체 평가 비용이 상대적으로 큰 몇몇 특정한 문제의 경우 집단의 크기가 커지면 심각한 문제가 되기도 한다. 이러한 이유로 본 논문에서는 클러스터링 기법을 이용한 국소 평가 유전자 알고리즘을 제안하였다. 이 방법은 집단을 몇 개의 클러스터로 나누고 각각의 대표 개체를 평가한 후 나머지 개체들의 적합도 값은 간접적인 계산에 의해 얻어내는 방법으로, 적은 수의 평가만으로도 상대적으로 큰 집단을 유지시키는 효과를 얻을 수 있다. 일반적인 유전자 알고리즘과의 성능 비교를 통해 제안된 알고리즘이 효율적이었음을 알 수 있었다.

  • PDF