• 제목/요약/키워드: 단어중의성해소

검색결과 65건 처리시간 0.021초

부트스트래핑 알고리즘을 이용한 한국어 격조사의 의미역 결정 (Bootstrapping for Semantic Role Assignment of Korean Case Marker)

  • 김병수;이용훈;나승훈;김준기;이종혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (B)
    • /
    • pp.4-6
    • /
    • 2006
  • 본 논문은 자연언어처리에서 문장의 서술어와 그 서술어가 가지는 명사 논항들 사이의 문법관계를 의미 관계로 사상하는 즉 논항이 서술어에 대해 가지는 역할을 정하는 문제를 다루고 있다. 의미역 결정은 단어의 의미 중의성 해소와 함께 자연언어의 의미 분석의 핵심 문제 중 하나이며 반드시 해결해야 하는 매우 중요한 문제 중 하나이다. 본 연구에서는 언어학적으로 유용한 자원인 세종전자사전을 이용하여 용언격틀사전을 구축하고 격틀 선택 방법으로 의미역을 결정한 후. 결정된 의미역들에 대한 확률 정보를 확률 모델에 적용하여 반복적으로 학습하는 부트스트래핑(Bootstrapping) 알고리즘을 사용하였다. 실험 결과, 기본 모델에 대해 10% 정도의 성능 향상을 보였다.

  • PDF

영한 기계 번역에서 미가공 텍스트 데이터를 이용한 대역어 선택 중의성 해소 (Target Word Selection Disambiguation using Untagged Text Data in English-Korean Machine Translation)

  • 김유섭;장정호
    • 정보처리학회논문지B
    • /
    • 제11B권6호
    • /
    • pp.749-758
    • /
    • 2004
  • 본 논문에서는 미가공 말뭉치 데이터를 활용하여 영한 기계번역 시스템의 대역어 선택 시 발생하는 중의성을 해소하는 방법을 제안한다. 이를 위하여 은닉 의미 분석(Latent Semantic Analysis : LSA)과 확률적 은닉 의미 분석(Probabilistic LSA : PLSA)을 적용한다. 이 두 기법은 텍스트 문단과 같은 문맥 정보가 주어졌을 때, 이 문맥이 내포하고 있는 복잡한 의미 구조를 표현할 수 있다 본 논문에서는 이들을 사용하여 언어적인 의미 지식(Semantic Knowledge)을 구축하였으며 이 지식은 결국 영한 기계번역에서의 대역어 선택 시 발생하는 중의성을 해소하기 위하여 단어간 의미 유사도를 추정하는데 사용된다. 또한 대역어 선택을 위해서는 미리 사전에 저장된 문법 관계를 활용하여야 한다. 본 논문에서는 이러한 대역어 선택 시 발생하는 데이터 희소성 문제를 해소하기 위하여 k-최근점 학습 알고리즘을 사용한다. 그리고 위의 두 모델을 활용하여 k-최근점 학습에서 필요한 예제 간 거리를 추정하였다. 실험에서는, 두 기법에서의 은닉 의미 공간을 구성하기 위하여 TREC 데이터(AP news)론 활용하였고, 대역어 선택의 정확도를 평가하기 위하여 Wall Street Journal 말뭉치를 사용하였다. 그리고 은닉 의미 분석을 통하여 대역어 선택의 정확성이 디폴트 의미 선택과 비교하여 약 10% 향상되었으며 PLSA가 LSA보다 근소하게 더 좋은 성능을 보였다. 또한 은닉 공간에서의 축소된 벡터의 차원수와 k-최근점 학습에서의 k값이 대역어 선택의 정확도에 미치는 영향을 대역어 선택 정확도와의 상관관계를 계산함으로써 검증하였다.젝트의 성격에 맞도록 필요한 조정만을 통하여 품질보증 프로세스를 확립할 수 있다. 개발 된 패키지의 효율적인 활용이 내조직의 소프트웨어 품질보증 구축에 투입되는 공수 및 어려움을 줄일 것으로 기대된다.도가 증가할 때 구기자 열수 추출 농축액은 $1.6182{\sim}2.0543$, 혼합구기자 열수 추출 농축액은 $1.7057{\sim}2.1462{\times}10^7\;J/kg{\cdot}mol$로 증가하였다. 이와 같이 구기자 열수 추출 농축액과 혼합구기자 열수 추출 농축액의 리올리지적 특성에 큰 차이를 나타내지는 않았다. security simultaneously.% 첨가시 pH 5.0, 7.0 및 8.0에서 각각 대조구의 57, 413 및 315% 증진되었다. 거품의 열안정성은 15분 whipping시, pH 4.0(대조구, 30.2%) 및 5.0(대조구, 23.7%)에서 각각 $0{\sim}38.0$$0{\sim}57.0%$이었고 pH 7.0(대조구, 39.6%) 및 8.0(대조구, 43.6%)에서 각각 $0{\sim}59.4$$36.6{\sim}58.4%$이었으며 sodium alginate 첨가시가 가장 양호하였다. 전체적으로 보아 거품안정성이 높은 것은 열안정성도 높은 경향이며, 표면장력이 낮으면 거품형성능이 높아지고, 비점도가 높으면 거품안정성 및 열안정성이 높아지는 경향이 있었다.protocol.eractions between application agents that are developed using different

계층적 검색 의도와 웹 자원을 활용한 2계층 구조의 서브토픽 마이닝 (Subtopic Mining of Two-level Hierarchy Based on Hierarchical Search Intentions and Web Resources)

  • 김세종;이종혁
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권2호
    • /
    • pp.83-88
    • /
    • 2016
  • 서브토픽 마이닝은 입력 질의에서 나타날 수 있는 검색 의도들의 중의성 해소 및 보다 명확한 의도 전달을 위해 관련 서브토픽들을 연관성, 선호도, 다양성을 고려하여 추출 및 순위화하는 것을 말한다. 본 논문은 웹 자원의 활용에 대한 기존 연구의 한계점을 명시하고, 이를 극복하기 위해 계층적 검색 의도와 웹 자원을 기반으로 한 2계층 구조의 서브토픽 마이닝 방법론을 제안한다. 우리는 서브토픽 마이닝 평가 대회에서 제공한 웹 문서 및 각 자원의 특성을 고려하여 제 2계층 서브토픽들을 추출, 확장 및 재순위화하고, 넓은 검색 의도를 가진 서브토픽 내의 단어들은 제 1계층 서브토픽들을 구성하는데 활용하였다. 본 방법론은 관련 평가 대회에서 최고 성능을 보인 기존 연구들의 결과들과 비교했을 때, 대부분의 평가 척도에서 높은 성능을 보였다.

한영 기계번역에서 결정 트리 학습에 의한 한국어 부사격 조사의 의미 중의성 해소 (Decision Tree based Disambiguation of Semantic Roles for Korean Adverbial Postpositions in Korean-English Machine Translation)

  • 박성배;장병탁;김영택
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권6호
    • /
    • pp.668-677
    • /
    • 2000
  • 한국어는 격조사에 의해 구문 역할이 결정되고 하나의 조사가 여러 개의 의미를 가지는 특징이 있다. 특히, 부사격 조사는 그 의미의 다양성으로 인해서 한영 기계 번역에서의 조사 번역을 어렵게 만든다. 본 논문에서는 부사격 조사가 가질 수 있는 의미격을 24개의 클래스로 분류한 후, 50만 어절 크기의 말뭉치에서 추출한 학습 예제와 결정 트리 추론(decision tree induction)을 통해 부사격 조사의 의미격 결정 규칙을 학습하였다. 결정 트리 추론 시 나타날 수 있는 학습 예제의 부족 문제는 단어 클래스를 사용함으로써 해결하였다. 실험 결과, 6개의 부사격 조사에 대해서 평균적으로 76.2%의 정확도를 보였으며, 이는 가장 많이 나타나는 의미격을 부사격 조사의 의미격으로 결정하는 방법에 비해 26.0%의 정확도 향상을 의미한다.

  • PDF

무순 추출물의 생리활성 효과

  • 한진희;문혜경;김종국;김귀영;강우원
    • 한국식품저장유통학회:학술대회논문집
    • /
    • 한국식품저장유통학회 2003년도 춘계총회 및 제22차 학술발표회
    • /
    • pp.98-98
    • /
    • 2003
  • 무순에는 비타민 C가 많이 들어 있어 겨울철 비타민 공급원뿐만 아니라 디아스타제라는 효소가 들어 있어 소화를 촉진시키는 역할을 한다. 그 외에도 거담제 및 건위제 작용을 하고 음주로 인한 토혈해소, 천식에도 좋아 약용하기도 한다. 본 연구에서는 이용가치는 적지만 농가 소득증대에 기여 할 수 있으며 소화를 촉진시키는 무순, 또는 무싹기름이라고 일컬어지는 무순을 추출용매에 따라 생리활성 효과 분석하고 영양학적 가치가 가장 높은 시기의 무순을 선택함으로써 올바른 섭취의 기초자료를 마련하고 그 기능성을 확인하여 기능성 식품소재 및 기능성 화장품 소재로써의 활용을 검토하고자 하고자 한다. 무순을 4일, 8일, 12일에 따라 incubator에 배양하여 시기별로 채취하여 동결건조 한 후 70% Ethanol, 80% Methanol, 75% acetone, 열수로 환류 추출한 후 시료로 사용하였다. 각 용매 추출물에 대해 DPPH free radical 소거능 실험에서는 acetone 추출물에서 89.18%로 가장 높은 전자공여능을 나타냈으며 각각의 추출용매에서 성장 4일과 12일의 무순에서 높은 전자공여능을 보였다. 아질산염 소거능에서는 pH 1.2의 조건에서 가장 높은 아질산염 소거능을 보였고, 열수 추출물에서 89.70%로 가장 높은 소거능을 보였다. pH 4.2조건에서는 열수추출물의 소거능이 가장 좋았고, pH 6.0 조건에서는 가장 낮은 소거능을 보였으며, Ethanol 과 Methanol 추출물에서 23.55∼37.41%의 소거능을 보였다. SOD유사활성은 성장 8일에서 모두 낮은 활성을 보였으며, 성장 4일과 성장 12일의 무순에서는 큰 차이를 보이지 않았지만, Methanol 추출물중 성장 12일에서 27.41%의 SOD유사활성을 보였다.ic acid는 28.8∼51.7 mg%, 미강에서 321.4∼438.4 mg% 범위로 나타났다. 현미, 백미 및 미강에 함유된 총 폴리페놀의 함량을 표준 페놀화합물로 카테친을 사용하고 비색법에 의하여 측정하였을 때 오대 현미의 폴리페놀 함량은 78.4 mg%, 남평 현미 88.8 mg% 였다. 도정한 백미 중의 총 폴리페놀 함량은 30.3∼56.9 mg%, 미강이 541.5∼472.6 mg%의 범위였다. 이상과 같이 쌀에는 phenolic acid 및 총 폴리페놀이 상당량 함유되어 있으며 특히 배유보다는 강층에 많이 존재하므로 이들 성분의 효율적인 이용을 위한 쌀의 섭취방안이 필요한 것으로 나타났다. 유의적인 상관관계를 나타내고 있어 백편의 조직감은 Compression force 와 Work ratio로 대치할 수 있을 것이라고 사료된다. 수분함량은 기계적 검사보다 관능검사와 더욱 높은 상관관계를 나타냈다.내었다. 항균활성이 우수한 생약재를 농도별로 활성을 조사한 결과, 물 추출물과 10% Ethanol 추출물 모두 낮은 농도에서도 우수한 항균활성을 나타내었다.취와 함께 점질성 갈변물질이 생성되었다. 이와 같은 결과로 볼 때, BAAG의 처리는 BAAC의 경우보다 가격은 저렴하면서도 항균력은 우수한 천연 항균복합제재로써 농산물 식품원료에 적용하여 선도유지 기간을 연장할 수 있는 효과를 기대할 수 있었다. 과일 등의 포장제로서 이용할 가능성을 확인하였다.로 [-wh] 겹의문사는 복수 의미를 지닐 수 없 다. 그러면 단수 의미는 어떻게 생성되는가\ulcorner 본 논문에서는 표면적 형태에도 불구하고 [-wh]의미의 겹의문사는 병렬적 관계의 합성어가 아니라 내부구조를 지니지 않은 단순한 단어(minimal $X^{0}$ elem

  • PDF