• 제목/요약/키워드: 역 공학

검색결과 2,078건 처리시간 0.031초

레벨 기반의 유사도 계산을 이용한 PropBank 의미역과 Sejong 의미역 간의 자동 변환 (Automatic Transformation of Semantic Roles between PropBank and Sejong using Similarity Estimation based on Tree Level)

  • 윤영신;석미란;김유섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.221-224
    • /
    • 2014
  • 의미 표지 부착 작업은 구문 표지 부착된 문장의 술어-논항 구조를 파악하여 논항에 적절한 의미역을 부착하는 과정이다. 이 작업을 통하여 생성되는 의미 표지 부착 말뭉치는 의미역 결정에 있어서 절대적으로 필요한 자원이 된다. 의미 표지 부착 말뭉치로는 세계적으로 PropBank가 널리 활용되고 있는데 이를 한국어에 적용시키기 위해서는 PropBank 의미역과 Sejong 의미역 간의 자동 변환이 필요하다. 이전에 제안되었던 이종 의미역 간의 자동변환 방법에서는 명사 계층의 구조 정보를 반영하지 않았다는 문제점이 있었다. 본 논문에서는 이러한 문제점을 보강하기 위하여 명사 계층구조를 반영하여 한국어 PropBank 의미역을 Sejong 의미역으로 자동 변환하는 방법을 제안한다. 제안하는 방법은 PropBank와 Sejong의 맵핑관계 중에서 1:N으로 맵핑되는 PropBank 의미역을 기준으로 명사 계층구조에서 변환 대상 의미역을 가지고 있는 단어와 변환 후보 의미역을 가진 단어들의 개념번호를 뽑아 두 단어 간의 거리를 측정한다. 그리고 레벨 당 가중치를 주어 유사도 계산을 하여 유사도가 적은 값으로 의미역을 자동 변환한다. 본 논문에서 제안하는 방법은 0.8의 성능을 보인다.

  • PDF

한국어 의미역 결정을 위한 Korean PropBank 확장 및 도메인 적응 기술 적용 (Extending Korean PropBank for Korean Semantic Role Labeling and Applying Domain Adaptation Technique)

  • 배장성;오준호;황현선;이창기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2014년도 제26회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.44-47
    • /
    • 2014
  • 한국어 의미역 결정(Semantic Role Labeling)은 주로 기계 학습에 의해 이루어지며 많은 말뭉치 자원을 필요로 한다. 그러나 한국어 의미역 결정 시스템에서 사용되는 Korean PropBank는 의미역 부착 말뭉치와 동사 격틀이 영어 PropBank의 1/8 수준에 불과하다. 따라서 본 논문에서는 한국어 의미역 결정 시스템을 위해 의미역 부착 말뭉치와 동사 격틀을 확장하여 Korean PropBank를 확장 시키고자 한다. 의미역 부착 말뭉치를 만드는 일은 많은 자원과 시간이 소비되는 작업이다. 본 논문에서는 도메인 적응 기술을 적용해보고 기존의 학습 데이터를 활용하여, 적은 양의 새로운 학습 말뭉치만을 가지고 성능 하락을 최소화 할 수 있는지 실험을 통해 알아보고자 한다.

  • PDF

한국어 의미역 결정을 위한 자질 정보 확장 (Expansion of Feature Information for Korean Semantic Role Labeling)

  • 조병철;석미란;김유섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.184-186
    • /
    • 2015
  • 의미역 결정은 주어진 술어와 의존 관계에 있는 여러 논항들과 그 술어간의 의미 관계를 결정하는 것이다. 의미역 결정은 보통 대량의 말뭉치를 이용하여 분류의 관점에서 문제를 해결하고자 한다. 본 논문에서는 한국어 구문 표지 부착된 말뭉치에 구축한 의미역 표지 부착 말뭉치 10,000 문장을 이용한 자동 의미역 결정 방법을 제안한다. 특히, 한국어는 그 특성상 조사와 어미가 문법 관계뿐만 아니라 의미 관계 설정에도 매우 중요한 역할을 하기 때문에 기존의 의미역 결정 연구에서 미비했던 부분인 조사와 어미 정보를 개선하여 새로운 자질 (features) 로 설계하여 의미역 결정을 시도하였다. 기존의 다른 언어에서의 의미역 결정 연구에서 사용된 자질에 본 논문에서 제시된 접사 정보에 기반한 자질을 추가하게 되면 약 77.9%의 F1 점수를 얻을 수 있었는데, 이는 기존 연구에 비하여 약 10% 포인트 향상된 결과이다.

  • PDF

광대역 음성부호화기를 위한 매칭퍼슈잇 알고리즘과 CELP 방법을 이용한 고대역 부호화 방법 (Highband Coding Method Using Matching Pusuit Estimation and CELP Coding for Wideband Speech Coder)

  • 정규혁;안영욱;김종학;신재현;서상원;황인관;이인성
    • 한국음향학회지
    • /
    • 제25권1호
    • /
    • pp.21-29
    • /
    • 2006
  • 본 논문에서는 대역분활 광대역 음성부호화기와 이를 위한 고대역 부호화 방법과 구조를 제안한다. 제안하는 광대역 음성부호화기는 광대역 입력 음성신호를 저대역 신호 (OHz-4kHz)와 고대역 신호 (4kHz-8kHz)로 나눈다. 저대역 신호는 G.729 Annex E로 부호화하고, 고대역 신호는 4kbps의 전송률로 제안하는 방법으로 압축된다. 고대역 신호는 LPC 분석 후 신호특성에 따라 모드를 분류된다. stationary 모드에서는 매칭퍼슈잇 알고리즘과 CELP 방법으로 부호화하는 다단계 구조의 혼합 여기신호모델이 적용되며, nonstationary 모드에서는 CELP 방법으로 부호화된다. 제안한 광대역 음성부호화기의 성능을 주관적 방법으로 G.722 48kbps SB-ADPCM, G.722.2 12.85kbps ACELP와 비교를 하였다. 제안한 부호화기는 G.722보다 나은 성능을 보이고, G.722.2보다 나쁘지 않은 성능을 가지는 것을 확인하였다.

뉴럴 전이 기반 한국어 의존 파싱 & 의미역 결정 통합 모델 (Neural transition-based joint models for dependency Parsing and semantic role labeling of Korean)

  • 민진우;나승훈;신종훈;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.343-346
    • /
    • 2018
  • 기존의 의미역 결정은 먼저 구문 분석을 수행한 후에 해당 구문 분석 결과를 이용해 의미역 결정 테스크에 적용하는 파이프라인 방식으로 진행한다. 이러한 방식의 학습을 두 번 연이어 진행하기 때문에 시간이 오래 걸리고 또한 구문 파싱과 의미 파싱에 대해 서로 영향을 주지 못하는 단점이 존재하였다. 본 논문에서는 의존 파싱과 의미역 파싱을 동시에 진행하도록 전이 액션을 확장한 의존 파싱 & 의미역 결정 통합 모델을 제안하고 실험 결과, Korean Prop Bank 의미역 결정 데이터 셋에서 파이프라인 방식 전이 기반 방식을 사용한 모델보다 논항 인식 및 분류(AIC) 성능에서 F1 기준 0.14% 높은 결과을 보인다.

  • PDF

ExoBrain을 위한 한국어 의미역 가이드라인 및 말뭉치 구축 (Korean Proposition Bank Guidelines for ExoBrain)

  • 임수종;권민정;김준수;김현기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.250-254
    • /
    • 2015
  • 본 논문은 한국어 의미역을 정의하고, 기계학습에 기반하여 한국어 의미역 인식 기술을 개발할 때 필요한 학습 말뭉치를 구축할 때 지켜야할 가이드라인을 제시하고자 한다. 한국어 의미역 정의는 전세계적으로 널리 쓰이고 있는 Proposition Bank를 따르면서, 한국어의 특성을 반영하였다. 또한 정의된 의미역 및 태깅 가이드라인에 따라 반자동 태깅 툴을 이용하여 말뭉치를 구축하였다.

  • PDF

CRFs 기반의 한국어 의미역 결정 (Korean Sematic Role Labeling Using CRFs)

  • 박태호;차정원
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.11-14
    • /
    • 2015
  • 의미역 결정은 서술어와 논항들 사이의 의미 관계를 결정하는 문제이다. 의미역 결정을 위해 구구조 정보와 의존 구조 정보 등의 다양한 자질에 대한 실험이 있었다. 논항은 구문 구조에서 얻을 수 있는 서술어와 논항 관계에 많은 영향을 받지만 구문 구조가 변경되어도 변하지 않는 논항의 의미로 인해 의미역 결정에 어려운 점이 있다. 본 논문에서는 한국어 의미역 결정 문제를 위해 Korean Propbank 말뭉치와 직접 구축한 의미역 말뭉치를 학습 말뭉치로 사용하였다. 본 논문에서는 이전에 연구된 구문 정보와 그 외의 자질들에 대한 성능을 검증하였다. 본 논문에서 제시하는 자질들의 성능을 검증하기 위해 CRF를 사용하였고, 제시된 새로운 자질을 사용하여 논항의 인식 및 분류에서 76.25%(F1)의 성능을 보였다.

  • PDF

하천단면 자료가 유량 및 수질 모의에 미치는 영향 분석 (Impact of channel cross-section data on flow and water quality simulation)

  • 한정호;이서로;금동혁;임경재;김종건
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2017년도 학술발표회
    • /
    • pp.221-221
    • /
    • 2017
  • 본 연구에서는 국내는 물론 전 세계적으로 널리 사용되고 있는 SWAT 모형을 대상으로 하천 단면 관련 입력변수가 유량 및 수질 모의에 미치는 영향을 분석하였다. 본 연구에서는 남한강 상류 충주댐 유역을 연구대상지역으로 연구를 진행하였으며, 충주댐 유역 내 소유역 중에서 국립환경과학원에서 국내 하천을 대상으로 구축한 한국형 Reach File(KRF) 내 실측 하천단면 정보가 존재하는 소유역에 대하여 실측 하천단면 정보를 적용하였다. 또한 본 연구를 위해 사용자가 구축한 소유역별 하천단면 정보 입력 자료를 통해 수문 및 수질 모의가 가능하도록 기존 SWAT 모형의 엔진 소스코드를 개선하였다. 유역 최종 유출구와 KRF의 실측 하천단면 정보를 적용한 소유역의 유량과 수질(유사량)에 대해서 실측 하천단면 정보 적용 전과 후의 모의 결과를 비교한 결과 유역 최종 유출구에서는 유량 및 유사량 모두 큰 변화는 나타나지 않았다. 이는 전체 유역 중 실제 하천단면 정보를 적용한 소유역의 비중이 작기 때문으로 판단되었다. 하지만 하천단면 정보를 적용한 소유역에서는 유량 및 유사량 모두 적용 전/후 차이가 나타났다. 특히 저유량 부분에서의 유사량이 큰 변화를 나타냈다. 하지만 본 연구에서 실측 하천단면 정보를 적용한 소유역은 유량 및 수질관측소가 위치하지 않는 미계측 유역으로써 실제 유량 및 수질 모의 정확도 향상 여부에 대한 평가가 불가능하였다. 따라서 향후 유량 또는 수질 관측이 이뤄지고 있는 계측 유역을 대상으로 실제 모형 모의 정확도 향상 여부에 대한 분석이 필요할 것으로 판단된다.

  • PDF

다중 미지변수를 고려한 다층지반 역해석 (Back Analysis Method for Material Properties of Multi-layers Ground Considering Multiple Unknown Variables)

  • 김세진;김문겸;원종화;김정수
    • 한국지반공학회논문집
    • /
    • 제25권9호
    • /
    • pp.93-100
    • /
    • 2009
  • 본 연구에서 역해석에 이용한 직접법은 실제 변위와 목적함수의 차이를 최소화하고 미지변수를 보정하는 최적화가 핵심 과정이다. 연구과정이 복수의 지층을 단계별로 역해석하여 각 지반의 미지변수를 역해석하기 때문에 지층 간 미지변수의 간섭 효과를 최소화 할 수 있는 추가적인 최적화가 필요하다. 따라서 효율적이고 정확한 최적화를 위해서 목적함수의 편미분 계산과정이 없이 최적해를 구할 수 있는 직접탐색법(direct search method)을 사용하였다. 본 연구의 목적은 지하구조체가 포함된 지층을 상부와 하부의 지층으로 모형화하고, 다중 미지변수를 역해석하는 기법을 개발하는 데에 목적을 둔다. 또한 단계별 역해석된 미지변수의 상호 간섭 오차를 최소화하기 위해서 반복 역해석을 실시하고, 실제 존재하는 터널에 대하여 적용성에 대해 검토하였다. 그 결과, 단층 모형화보다 다층 모형화 결과가 실제 지하구조물거동을 정확히 나타냈으며 다층 경계부에 위치한 지하구조물의 다층지반 모형화를 통한 역해석이 유효함을 확인하였다.

대한민국 동해 해역에서 광대역 OFDM 통신 성능 분석 (Wideband OFDM Communication Performance Analysis in the East Sea of Korea)

  • 채광영;조천치;멍판진;차민혁;이호준;고학림;임태호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.1234-1236
    • /
    • 2023
  • 광대역(Wideband) 통신은 신호 대역폭이 채널의 상관 대역폭(Coherence Bandwidth)를 크게 초과하는 시스템을 나타낸다. 이때, 큰 대역폭을 갖을수록 반송 주파수대역과 사용대역의 최대 및 최소 주파수 간 차이가 커지며, 통신 시스템이 겪는 채널의 주파수 선택적 페이딩 또한 커지게 된다. 수중에서 광대역 통신을 성능을 확인하기 위한 실험을 수행하였다. 실험환경으로는 송·수신기 간 수평 이격거리는 약 10m, 수직 이격거리는 약 190m로 설정하였다. 광대역 신호의 성능을 확인하기 위하여 14kHz와 30kHz의 주파수 대역과 협대역신호와의 비교를 위해 16kHz와 4kHz 대역폭 등 파라메타를 달리하여 설정하였다. x축을 Repetition Freq.와 Repetition Time의 조합으로 설정하였으며, y축을 BER(Bit Error Rate)로 성능결과를 나타내었다.