• 제목/요약/키워드: 엔트로피 모델

검색결과 154건 처리시간 0.022초

ACE 관계 추출과 특징화 과정에서 성능 향상을 위한 새로운 방법(1) (A New Method for Improving Performance in ACE Relation Detect ion and Characterization)

  • 김경덕;김석환;이근배;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2005년도 제17회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.1-6
    • /
    • 2005
  • 텍스트 기반 문서의 급증으로 인해 정보 추출 기술이 더욱 중요해지고 있다 특히 최근에 활발한 연구가 진행되고 있는 개체 간 관계 추출 기술은 정보검색과 질의응답 등 많은 분야에 걸쳐 활용될 수 있는 기술이다 본 논문은 기존의 자질 기반 관계 추출 시스템의 재현율을 향상시키기 위해 WHISK 알고리즘을 도입한 시스템에 관한 것이다. WHISK 알고리즘은 문장으로부터 관계에 참여하는 개체 쌍을 추출하는 규칙을 자동으로 학습한다. 그리고 시스템은 최대 엔트로피 모델을 이용하여 WHISK에 의해 추출된 개체 쌍에 적합한 관계 유형을 파악해 낸다. 본 논문은 시스템에 사용된 WHISK 알고리즘과 최대 엔트로피 모델에 대해서 알아보고, 실제로 WHISK 알고리즘을 도입하여 관계를 가지는 개체 쌍을 추출하여 문제를 해결했을 때 어느 정도의 성능 향상이 있는지 알아본다.

  • PDF

최대 엔트로피 모델을 이용한 한국어 명사구 추출 (Korean Noun Phrase Identification using Maximum Entropy Method)

  • 강인호;전수영;김길창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2000년도 제12회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.127-132
    • /
    • 2000
  • 본 논문에서는 격조사의 구문적인 특성을 이용하여, 수식어까지 포함한 명사구 추출 방법을 연구한다. 명사구 판정을 위해 연속적인 형태소열을 문맥정보로 사용하던 기존의 방법과 달리, 명사구의 처음과 끝 그리고 명사구 주변의 형태소를 이용하여 명사구의 수식 부분과 중심 명사를 문맥정보로 사용한다. 다양한 형태의 문맥정보들은 최대 엔트로피 원리(Maximum Entropy Principle)에 의해 하나의 확률 분포로 결합된다. 본 논문에서 제안하는 명사구 추출 방법은 먼저 구문 트리 태깅된 코퍼스에서 품사열로 표현되는 명사구 문법 규칙을 얻어낸다. 이렇게 얻어낸 명사구 규칙을 이용하여 격조사와 인접한 명사구 후보들을 추출한다. 추출된 각 명사구 후보는 학습 코퍼스에서 얻어낸 확률 분포에 기반하여 명사구로 해서될 확률값을 부여받는다. 이 중 제일 확률값이 높은 것을 선택하는 형태로 각 격조사와 관계있는 명사구를 추출한다. 본 연구에서 제시하는 모델로 실험을 한 결과 평균 4.5개의 구를 포함하는 명사구를 추출할 수 있었다.

  • PDF

엔트로피 지수를 이용한 기계학습 기반의 배터리의 건강 상태 예측 알고리즘 (Machine Learning Based State of Health Prediction Algorithm for Batteries Using Entropy Index)

  • 김상진;임현근;장병훈;우성민
    • 전기전자학회논문지
    • /
    • 제26권4호
    • /
    • pp.531-536
    • /
    • 2022
  • 배터리를 효율적으로 관리하기 위해서는 배터리의 건강 상태와 잔여 수명을 정확하게 추정하고 관리하는 것이 중요하다. 배터리는 같은 종류여도 설비용량 및 전압 등의 특성이 다르며 학습용 모델을 위한 배터리와 모델을 통한 예측을 위한 배터리가 서로 다를 경우에는 정확도 측정에 한계가 있다. 본 논문에서는 전압의 분포와 방전 시간을 이용한 엔트로피 지수를 일반화하고 4개의 배터리를 각각 1개씩 교차적으로 훈련 집합과 테스트 집합으로 정의하여 기계학습의 선형회귀 분석을 통하여 배터리의 건강 상태를 예측하는 방법을 제안하였다. 제안된 방법은 평균 절대값 퍼센트 오차를 이용하여 95% 이상의 높은 정확도를 나타내었다.

신경망 기반 비디오 압축을 위한 레이턴트 정보의 방향 이동 및 보상 (Latent Shifting and Compensation for Learned Video Compression)

  • 김영웅;김동현;정세윤;최진수;김휘용
    • 방송공학회논문지
    • /
    • 제27권1호
    • /
    • pp.31-43
    • /
    • 2022
  • 전통적인 비디오 압축은 움직임 예측, 잔차 신호 변환 및 양자화를 통한 하이브리드 압축 방식을 기반으로 지금까지 발전해왔다. 최근 인공 신경망을 통한 기술이 빠르게 발전함에 따라, 인공 신경망 기반의 이미지 압축, 비디오 압축 연구 또한 빠르게 진행되고 있으며, 전통적인 비디오 압축 코덱의 성능과 비교해 높은 경쟁력을 보여주고 있다. 본 논문에서는 이러한 인공 신경망 기반 비디오 압축 모델의 성능을 향상시킬 수 있는 새로운 방법을 제시한다. 기본적으로는 기존 인공 신경망 기반 비디오 압축 모델들이 채택하고 있는 변환 및 복원 신경망과 엔트로피 모델(Entropy model)을 이용한 율-왜곡 최적화(Rate-distortion optimization) 방법을 사용하며, 인코더 측에서 디코더 측으로 압축된 레이턴트 정보(Latent information)를 전송할 때 엔트로피 모델이 추정하기 어려운 정보의 값을 이동시켜 전송할 비트량을 감소시키고, 손실된 정보를 추가로 전송함으로써 손실된 정보에 대한 왜곡을 보정한다. 이러한 방법을 통해 기존의 인공 신경망 기반 비디오 압축 기술인 MFVC(Motion Free Video Compression) 방법을 개선하였으며, 실험 결과를 통해 H.264를 기준으로 계산한 BDBR (Bjøntegaard Delta-Bitrate) 수치(%)로 MFVC(-14%) 보다 두 배 가까운 비트량 감축(-27%)이 가능함을 입증하였다. 제안된 방법은 MFVC 뿐 아니라, 레이턴트 정보와 엔트로피 모델을 사용하는 신경망 기반 이미지 또는 비디오 압축 기술에 광범위하게 적용할 수 있다는 장점이 있다.

최대 엔트로피 분포를 이용한 퍼지 관측데이터의 분석법에 관한 연구 (An Analysis of Fuzzy Survey Data Based on the Maximum Entropy Principle)

  • 유재휘;유동일
    • 한국컴퓨터정보학회논문지
    • /
    • 제3권2호
    • /
    • pp.131-138
    • /
    • 1998
  • 통상 통계적인 데이터 해석에서 취급되는 데이터는 확정된 값으로서 통계 처리를실시한다. 그러나 복잡˙대규모화하는 현대의 시스템에 있어서는 정확하게 측정된 데이터만을 취급하는 것은 곤란하며 인간의 주관적인 판단에 따른 데이터를 수집하는 경우가 발생하게 된다. 본 연구에서는 이러한 인간의 주관적인 판단에 따른 데이터를 퍼지 관측 데이터로하여(언어 변수에 의해 Membership 함수를 정의한다.) 최대 엔트로피 원리를 이용한 새로운 분석 방법을 제안한다. 또한 보다 현실적인 상황 아래 시뮬레이션을 실시함으로서 제안모델의 유효성을 검증한다.

  • PDF

Digital Library를 위한 텍스타일 프린트 디자인의 이미지 유사성 평가 (Similarity Evaluation on Images of Textile Print Design for Digital Library)

  • 이채정;김주용
    • 감성과학
    • /
    • 제10권4호
    • /
    • pp.631-637
    • /
    • 2007
  • 이미지의 유사성을 결정하는 요인을 톤(tone), 즉 명도와 채도로 결정하여 정보 엔트로피를 계산하여 상관 계수를 계산하였다. 이미지의 톤을 알아보기 위해 영상정보의 색 공간을 RGB color space에서 HSI color space로 전환하였다. 이후 유사성을 판단하기 위해 이미지의 전체 픽셀수가 아닌 엔트로피 값의 범위에 따라 전체 70%의 픽셀 또는 이미지를 가장 많이 구성하는 세 가지 톤의 픽셀 수에 의해 결정되었다. 'Romantic'이라는 인간의 감성으로 판단된 18개의 영상정보를 선정하여 위의 모델을 적용, 이미지 유사성을 판단하였다.

  • PDF

상호 재학습 방법을 이용한 화자 의도 분류 (Speakers' Intention Classification using a Mutual Retraining Method)

  • 이현정;선충녕;김학수;서정연
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.157-159
    • /
    • 2012
  • 화자의 의도를 결정하는 문제는 대화 시스템에서 핵심적인 부분이다. 기존의 연구에서는 모델의 간소화를 위해 화자의 의도를 화행과 개념이라는 두 요소로 분리하여 분석하였다. 하지만 두 요소는 서로 밀접하게 관련되어 있기 때문에 모델의 간소화는 의도 분석 성능 저하의 원인이 되었다. 이런 문제점을 해결하기 위해 본 논문에서는 화자 의도 분류를 위한 재학습 방법을 제안한다. 제안된 방법은 화자의 의도를 분석하기 위해 화행 분류 모델과 개념열 분석 모델로 분리하여 분석한다. 학습 단계에서 화행 분류 모델은 개념열 분류 결과를 입력으로 사용하고 개념열 역시 마찬가지로 적용하였다. 목적 지항 대화를 대상으로 한 실험에서 제안된 시스템은 화자 의도 분류에서 최대엔트로피 모델과 지지 벡터 기계의 성능을 효과적으로 향상시켰다.

  • PDF

벡터와 신경망 모델에서 데이터 퓨전 기법을 이용한 정보검색의 효율성 향상 (Improving the Effectiveness of Information Retrieval Using Data Fusion Method in the Vector and Neural Network Model)

  • 최성환
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2001년도 제8회 학술대회 논문집
    • /
    • pp.137-142
    • /
    • 2001
  • 본 논문에서는 벡터모델과 신경망 모델을 이용하여 데이터 퓨전의 관점에서 다중증거로서 가중치, 문헌분리가, 엔트로피, 공기유사도를 적절히 결합하여 질의를 확장하는 방법을 제안한다. 실험결과 코사인 정규화 가중치 알고리즘, 문서길이 정규화 가중치 알고리즘과 결합하여 질의를 확장하는 것이 정규화시키지 않고 단순히 문헌빈도와 역문헌빈도의 조합을 이용한 가중치 알고리즘과 결합했을 때 보다 평균 정확률 향상이 더 높게 나타났다. 또한 다양한 공기기반 유사도를 이용하여 질의확장을 한 결과 벡터모델과 신경망 모델에서 코사인 공기유사도에 기반하여 질의확장한 경우가 다른 공기유사도에 비해 더 좋은 성능을 보였다.

  • PDF

Stop-start wave condition에서 연속류 모델의 개발 -단속연속류 모델에 유한한 가속도를 도입하는 방법-

  • 박지영;박창호
    • 대한교통학회:학술대회논문집
    • /
    • 대한교통학회 1998년도 제34회 추계 학술발표회
    • /
    • pp.295-295
    • /
    • 1998
  • 고속도로에서 교통류의 특성에 파악하여 교통류의 특성을 파악하여 동적행태로 교통상황을 분석하고 효과적인 제어전략, 시뮬레이션, 그리고 기하구조 개선등의 효율적이고 실용적인 적용을 위해서는 교통류의 정확한 모사가 필요하다. 시공간으로 표현되는 상태방정식을 포함하는 거시적 시뮬레이션 모델에 사용되는 연속류 모델은 이러한 교통류 특성을 모사하는데 적절하다. Lighthill과 Whitham(1955), Richard(1956)에 의해 일계도함수의 형태를 가지는 단순모델이 제시된 이후 모델의 결점을 보완하기 위해 많은 고계도 모델이 제시되었지만 고계도 모델이 가진 이론적인 결점에 대해서는 여러 연구들이 제시되어 있다. 또한 고계도 모델은 운동량 방정식의 유도, 정산, 구현의 어려움으로 널리 사용되기 힘들다는 단점을 가지고 있다. 만일 적절히 구현할 수 있다면 적용이 간단한 단순모델로도 보다 정확한 교통류 상황 모사가 가능하다. Ansorge는 혼잡교통류상황을 보다 정확하게 모사하기 위해 단순모델에 엔트로피 조건을 결합시킨 모델을 제시했다. Bui는 이 제안된 모델이 적절한 시뮬레이션 결과를 나타낸다는 것을 밝혔다. 그러나 이 모델은 차량의 재가속이 이루어지는 교통상황-stop-start wave의 경우 비현실적인 값을 가진다. 엔트로피조건에 의해 구해진 해는 실제보다 과다한 교통량을 추정하게 되는데 이런 결과는 위와 같은 교통상황에서 중요한 요소로 작용하는 가속효과가 무시되고 있기 때문이다. 따라서 본 연구에서는 stop-start wave 조건에서 가속도에 경계치를 부여하여 교통류율을 상한경계조건을 제시함으로써 교통상황에 맞는 교통류율을 산정하는 방법에 대해 제안하고자 한다.환승이라는 특정대안변수(Specific alternative variable)를 첨가하여 그것이 수단선택에 미치는 영향을 분석한다. 또한, 대중교통의 속성을 가지고 있는 지하철과 버스를 하나의 대안으로 묶어서 효용함수를 구한 다음 다시 승용차, 택시, 대중교통을 독립된 대안으로 두고 모형을 정립하는 NESTED LOGIT모형으로 파라메타를 추정하여 대중교통의 효용에 관해 분석·비교하였다. 본 논문에 이용된 자료는 공항을 이용하는 이용객들을 대상으로 직접 설문·면접조사한 자료이며 대상 교통수단은 승용차, 택시, 지하철, 버스로 설정하였다. 결과 적응형 알고리즘이 개개인의 최단시간 경로를 제공하는 사용자 평형 경로안내전략에 비해 교통혼잡도와 정체시간의 체류정도에 따라 3%에서 10%까지 전체통행시간을 절약할 수 있다는 결론을 얻었다.출발참, 구성대외개방선면축심, 실현국제항선적함접화국내항반적전항, 형성다축심복사식항선망; 가강기장건설, 개피포동제이국제기장건설, 괄응포동개발경제발전적수요. 부화개시일은 각 5월 26일과 5월 22일이었다. 11. 6월 중순에 애벌레를 대상으로 처리한 Phenthoate EC가 96.38%의 방제가로 약효가 가장 우수하였고 3월중순 및 4월중순 월동후 암컷을 대상으로 처리한 Machine oil, Phenthoate EC 및 Trichlorfon WP는 비교적 약효가 낮았다.>$^{\circ}$E/$\leq$30$^{\circ}$NW 단열군이 연구지역 내에서 지하수 유동성이 가장 높은 단열군으로 추정된다. 이러한 사실은 3개 시추공을 대상으로 실시한 시추공 내 물리검층과 정압주입시험에서도 확인된다.. It was result

  • PDF

GloVe와 최대 엔트로피 모델을 이용한 한국어 문장 분류 시스템 (Korean Sentence Classification System Using GloVe and Maximum Entropy Model)

  • 박일남;최동현;신명철;김응균
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.522-526
    • /
    • 2018
  • 본 연구는 수많은 챗봇이 생성될 수 있는 챗봇 빌더 시스템에서 저비용 컴퓨팅 파워에서도 구동 가능한 가벼운 문장 분류 시스템을 제안하며, 미등록어 처리를 위해 워드 임베딩 기법인 GloVe를 이용하여 문장 벡터를 생성하고 이를 추가 자질로 사용하는 방법을 소개한다. 제안한 방법으로 자체 구축한 테스트 말뭉치를 이용하여 성능을 평가해본 결과 최대 93.06% 성능을 보였으며, 자체 보유한 CNN 모델과의 비교 평가 결과 성능은 2.5% 낮지만, 모델 학습 속도는 25배, 학습 시 메모리 사용량은 6배, 생성된 모델 파일 크기는 302배나 효율성 있음을 보였다.

  • PDF