• 제목/요약/키워드: 유사성 모델

검색결과 1,753건 처리시간 0.036초

필지단위 유출 및 유사 산정 모델 자동 검보정 툴 개발 (Development of Auto-calibration tool for Runoff and Sediment evaluation Model)

  • 금동혁;최재완;신동석;천세억;임경재
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2012년도 학술발표회
    • /
    • pp.72-72
    • /
    • 2012
  • 고랭지 지역 등에서 매년 집중강우로 인하여 많은 양의 토양유실이 발생되고, 이로 인한 탁수 사태가 장기화되면서 많은 환경 및 사회적 문제가 발생되고 있다. 환경부에서는 2007년 고탁수 발생지역을 비점오염원 특별 관리지역으로 지정하고 전 방위적인 비점오염 저감 노력을 수행하고 있다. 최근 환경부와 농림부에서는 농업지역의 비점오염원 저감을 위해 필지단위 BMP를 적용하고, 저감효과를 모니터링하고 있으며, 2011년도에는 BMP 적용에 따른 삭감효과를 평가할 수 있는 모델이 개발되었다. 하지만 모델을 이용하여 정확한 BMP 적용에 따른 삭감효과를 산정하기 위해서는 필지에서 발생되는 유출량 및 유사량에 대한 검보정이 수행되어야한다. 그러나 기 개발된 삭감효과 산정모델은 사용자가 유출량 및 유사량에 대한 검보정을 수동으로 실시하기 때문에 검보정 과정 중 사용자의 주관적인 경향이 모델 변수 선정에 영향을 미칠 수 있어 비효율적이다. 정확성 및 객관성을 확보한 검보정 수행을 위해서는 반드시 자동 검보정 툴 개발이 필요하다. 이에 본 연구에서는 Parasol 방법을 이용하여 삭감효과 산정모델의 자동 검보정 툴을 개발하고 적용성을 평가하였다. Parasol 방법은 최적화 및 불확실성 분석방법으로, 원격 토지 표면 모델링 토양 침식, 지하 수문학과 같은 유역 모델 보정 및 수문학의 다른 분야에서 많이 사용되고 있는 SEC-UA 알고리즘을 사용하여 매개변수들을 자동 변환하고, 목적함수로 SSQ를 이용하여 최적매개변수를 찾아낸다.

  • PDF

딥러닝 알고리즘을 이용한 유사 판례 매칭 데이터셋 구축 방안 연구 (A Study on the building Dataset of Similar Case Matching in Legal Domain using Deep Learning Algorithm)

  • 강예지;강혜린;박서윤;장연지;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.72-76
    • /
    • 2021
  • 판례는 일반인 또는 법률 전문가가 사건에 참조하기 위해 가장 먼저 참고할 수 있는 재판의 선례이다. 하지만 이러한 판례의 유용성에도 불구하고 현 대법원 판례 검색 시스템은 판례 검색에 용이하지 않다. 왜냐하면 법률 전문 지식이 없는 일반인은 검색 의도에 부합하는 검색 결과를 정확히 도출하는 데 어려움이 있으며, 법률 전문가는 검색에 많은 시간과 비용이 들게 되기 때문이다. 이미 해외에서는 유사 케이스 매칭 데이터셋을 구축하여 일반인과 전문가로 하여금 유사 판례 검색을 용이하게 할 뿐만 아니라 여러 자연어 처리 태스크에도 활용하고 있다. 하지만 국내에는 법률 AI와 관련하여 오직 법률과 관련한 세부 태스크 수행에 초점을 맞춘 연구가 많으며, 리소스로서의 유사 케이스 매칭 데이터셋은 구축되어 있지 않다. 이에 본 논문에서는 리소스로서의 판례 데이터셋을 위해 딥러닝 알고리즘 중 문서의 의미를 반영할 수 있는 Doc2Vec 임베딩 모델과 SBERT 임베딩 모델을 적용하여 판례 문서 간 유사도를 측정·비교하였다. 그 결과 SBERT 모델을 통해 도출된 유사 판례가 문서 간 내용적 유사성이 높게 나타났으며, 이를 통해 SBERT 모델을 이용하여 유사 판례 매칭 기초 데이터셋을 구축하였다.

  • PDF

SWAT 모델을 이용한 용담댐 유역 유사량 모의 (Modelling of sediment yields of Yongdam basin using SWAT model)

  • 이근상;김유리;예령;이을래
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2009년도 학술발표회 초록집
    • /
    • pp.934-938
    • /
    • 2009
  • 금강상류유역에 위치한 용담다목적댐은 2001년에 준공되어 전북지역과 서해안 산업 개발지역에 공급하고 있다. 용담댐 하류유역에 관한 연구는 많이 진행되고 있지만, 상류유역에 관한 연구는 그 수가 미비하여 본 연구에서는 SWAT 모델을 이용하여 용담댐 상류유역에 대한 유출량과 유사량을 기측정된 자료와 비교 검토함으로써, 적정성을 평가하고자 한다. 본 연구에서는 준 분포형 강우-유출 모델인 SWAT 모델을 이용하여 용담댐유역에 대한 유출량과 유사량을 산정하였다. 모형을 구축하고자 DEM과 토지이용도, 토양도를 사용하여, 총 208개의 HRU를 생성하였으며, 천천과 동향 수위국 및 용담댐에 대해서 월유출량을 Calibration 결과는 천천의 EI와 $R^2$는 각각 0951과 0.952이며, 동향의 EI와 $R^2$는 각각 0.868과 0.869로 나타났으며, 용담댐의 EI와 $R^2$는 각각 0.938과 0.964로 나타났다. 월 유사량에 대한 천천의 EI와 $R^2$는 각각 0.943과 0.947이며, 동향의 EI와 $R^2$는 각각 0.759과 0.772으로 나타났다. 이로서, 본 연구에서는 용담댐 상류유역에 대한 하천유입량과 유사량의 변화를 기구축된 자료와 비교 검토한 결과 SWAT 모델이 용담댐 상류유역의 유출특성을 잘 반영하는 것으로 나타나, 향후 용담댐 하천 유입량과 유사량 변화를 예측하는데에 많은 도움이 될 것으로 판단된다.

  • PDF

예외적 원소의 재배치를 고려한 그룹테크놀로지 접근방법 (A heuristic approach solving the bottleneck machine problem in group technology manufacturing systems)

  • 조문수;정병희;윤창원
    • 제어로봇시스템학회논문지
    • /
    • 제3권5호
    • /
    • pp.503-510
    • /
    • 1997
  • 기존에 있는 그룹테크놀로지의 방법들은 기계와 부품간의 공정유사성이나 그밖의 다른 정의의 유사성을 갖고 한 가지 정도의 알고리즘이나 수학적인 모델로써 해를 구했으나 그 해들은 실질적으로 현대 산업의 생산시스템이나 자동화에서 풀어나가야 하는 기계들의 병목현상을 풀어나가는 직접적인 접근방법을 제시하지 못했다. 따라서 본 연구에서는 새로운 기계간 유사성의 개발과 그래프이론을 응용한 알고리즘 그리고 수학적인 모델을 동시에 응용해서 병목현상을 초래하는 예외적인 원소의 재배치를 효과적이고 쉬운방법으로 제시하였다.

  • PDF

바이오 마커와 질병 용어의 단어 표현 분석 (Word Representation Analysis of Bio-marker and Disease Word)

  • 윤영신;남경민;김유섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.165-168
    • /
    • 2015
  • 기계학습 기반의 자연어처리 모듈에서 중요한 단계 중 하나는 모듈의 입력으로 단어를 표현하는 것이다. 벡터의 사이즈가 크고, 단어 간의 유사성의 개념이 존재하지 않는 One-hot 형태와 대조적으로 유사성을 표현하기 위해서 단어를 벡터로 표현하는 단어 표현 (word representation/embedding) 생성 작업은 자연어 처리 작업의 기계학습 모델의 성능을 개선하고, 몇몇 자연어 처리 분야의 모델에서 성능 향상을 보여 주어 많은 관심을 받고 있다. 본 논문에서는 Word2Vec, CCA, 그리고 GloVe를 사용하여 106,552개의 PubMed의 바이오메디컬 논문의 요약으로 구축된 말뭉치 카테고리의 각 단어 표현 모델의 카테고리 분류 능력을 확인한다. 세부적으로 나눈 카테고리에는 질병의 이름, 질병 증상, 그리고 난소암 마커가 있다. 분류 능력을 확인하기 위해 t-SNE를 이용하여 2차원으로 단어 표현 결과를 맵핑하여 가시화 한다.

  • PDF

확률적 정보 검색 모델에서의 유사 적합성 피드백 실험 (Experiments on Pseudo Relevance Feedback in Probabilistic Information Retrieval Model)

  • 조봉현;이창기;안주희;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2001년도 제13회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.183-190
    • /
    • 2001
  • 본 논문은 확률기반 자연어 검색 시스템 POSNIR/E를 이용한 여러 가지 유사 적합성 피드백 방법들이 검색 시스템의 성능 향상에 기여할 수 있는 정도를 보여주고, 확률 기반 정보 검색 시스템에 적합한 유사 적합성 피드백 수행 방법을 제시한다. POSNIR/E는 한국어 자연어 검색 시스템, POSNIR를 기반으로 만들어진 영어 자연어 검색 시스템이다. 이 시스템은 성능 향상을 위한 질의 확장의 방법으로 검색 단계에서 유사 적합성 피드백을 사용한다. 검색 단계에서 영어 태거에 의해 태깅된 사용자 질의로부터 질의어를 추출하고 초기 검색을 수행한다. 유사 적합성 피드백을 위하여 초기 검색 결과 중 상위 5개의 문서에 나타나는 키워드를 중요도에 따라 내림차순 정렬하여 상위 10개의 키워드를 초기 질의어에 확장한다. 이렇게 확장된 질의어로 최종 검색을 수행한다. TREC 평가용 테스트 컬렉션 WT10g와 TREC-9의 질의 적합문서 집합을 이용하여 여러 가지 TSV 함수를 사용하여 검색 성능을 평가 하였다. 실험 결과 유사 적합성 피드백을 사용할 경우 TSV 함수에 확률 모델의 CF 요소 뿐만 아니라 TF 요소 등을 적용 시킬 경우 성능 향상에 기여할 수 있음을 알 수 있었다. 또한 색인어와 검색어로 단일어 뿐만 아니라 복합어도 사용할 경우 성능이 향상됨을 알 수 있다.

  • PDF

딥러닝 모델을 이용한 비전이미지 내의 대상체 분류에 관한 연구 (A Study on The Classification of Target-objects with The Deep-learning Model in The Vision-images)

  • 조영준;김종원
    • 한국산학기술학회논문지
    • /
    • 제22권2호
    • /
    • pp.20-25
    • /
    • 2021
  • 본 논문은 Deep-learning 기반의 검출모델을 이용하여 연속적으로 입력되는 비디오 이미지 내의 해당 대상체를 의미별로 분류해야하는 문제에 대한 구현방법에 관한 논문이다. 기존의 대상체 검출모델은 Deep-learning 기반의 검출모델로서 유사한 대상체 분류를 위해서는 방대한 DATA의 수집과 기계학습과정을 통해서 가능했다. 대상체 검출모델의 구조개선을 통한 유사물체의 인식 및 분류를 위하여 기존의 검출모델을 이용한 분류 문제를 분석하고 처리구조를 변경하여 개선된 비전처리 모듈개발을 통해 이를 기존 인식모델에 접목함으로써 대상체에 대한 인식모델을 구현하였으며, 대상체의 분류를 위하여 검출모델의 구조변경을 통해 고유성과 유사성을 정의하고 이를 검출모델에 적용하였다. 실제 축구경기 영상을 이용하여 대상체의 특징점을 분류의 기준으로 설정하여 실시간으로 분류문제를 해결하여 인식모델의 활용성 검증을 통해 산업에서의 활용도를 확인하였다. 기존의 검출모델과 새롭게 구성한 인식모델을 활용하여 실시간 이미지를 색상과 강도의 구분이 용이한 HSV의 칼라공간으로 변환하는 비전기술을 이용하여 기존모델과 비교 검증하였고, 조도 및 노이즈 환경에서도 높은 검출률을 확보할 수 있는 실시간 환경의 인식모델 최적화를 위한 선행연구를 수행하였다.

어휘판단 과제 시 보이는 언어현상의 계산주의적 모델 설계 및 구현 (Design and Implementation of Computational Model Simulating Language Phenomena in Lexical Decision Task)

  • 박기남;임희석;남기춘
    • 컴퓨터교육학회논문지
    • /
    • 제9권2호
    • /
    • pp.89-99
    • /
    • 2006
  • 본 논문은 인지신경과학의 연구 방법으로 주로 사용되는 어휘판단과제LDT:ILexical decision task) 시 보이는 언어현상을 모사할 수 있는 계산주의 모델(computational model)을 제안한다. 제안하는 모델은 LDT 시 언어와 독립적으로 관찰되는 언어현상인 빈도효과, 어휘성효과, 단어유사성효과, 시각적쇠퇴효과, 의미점화효과, 그리고 반복점화효과 등을 모사할 수 있도록 설계되었다. 실험결과, 제안한 모델은 통계적으로 유의미하게 빈도효과, 어휘성 효과, 단어유사성 효과, 시각적 쇠퇴효과 그리고 의미점화 효과를 모사할 수 있었으며, LDT 시 인간 피험자와 유사한 양상의 수행 양식을 보였다.

  • PDF

다중 레이블 분류 작업에서의 Coarse-to-Fine Curriculum Learning 메카니즘 적용 방안 (Applying Coarse-to-Fine Curriculum Learning Mechanism to the multi-label classification task)

  • 공희산;박재훈;김광수
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.29-30
    • /
    • 2022
  • Curriculum learning은 딥러닝의 성능을 향상시키기 위해 사람의 학습 과정과 유사하게 일종의 'curriculum'을 도입해 모델을 학습시키는 방법이다. 대부분의 연구는 학습 데이터 중 개별 샘플의 난이도를 기반으로 점진적으로 모델을 학습시키는 방안에 중점을 두고 있다. 그러나, coarse-to-fine 메카니즘은 데이터의 난이도보다 학습에 사용되는 class의 유사도가 더욱 중요하다고 주장하며, 여러 난이도의 auxiliary task를 차례로 학습하는 방법을 제안했다. 그러나, 이 방법은 혼동행렬 기반으로 class의 유사성을 판단해 auxiliary task를 생성함으로 다중 레이블 분류에는 적용하기 어렵다는 한계점이 있다. 따라서, 본 논문에서는 multi-label 환경에서 multi-class와 binary task를 생성하는 방법을 제안해 coarse-to-fine 메카니즘 적용을 위한 방안을 제시하고, 그 결과를 분석한다.

  • PDF

문장구조 유사도와 단어 유사도를 이용한 클러스터링 기반의 통계기계번역 (Integrated Clustering Method based on Syntactic Structure and Word Similarity for Statistical Machine Translation)

  • 김한경;나휘동;이금희;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.44-49
    • /
    • 2009
  • 통계기계번역에서 도메인에 특화된 번역을 시도하여 성능향상을 얻는 방법이 있다. 이를 위하여 문장의 유형이나 장르에 따라 클러스터링을 수행한다. 그러나 기존의 연구 중 문장의 유형 정보와 장르에 따른 정보를 동시에 사용한 경우는 없었다. 본 논문에서는 문장 사이의 문법적 구조 유사성으로 문장을 유형별로 분류하는 새로운 기법을 제시하였고, 단어 유사도 정보로 문서의 장르를 구분하여 기존의 두 기법을 통합하였다. 이렇게 분류된 말뭉치에서 추출한 모델과 전체 말뭉치에서 추출된 모델에서 보간법(interpolation)을 사용하여 통계기계번역의 성능을 향상하였다. 문장구조의 유사성과 단어 유사도 계산을 위하여 각각 커널과 코사인 유사도를 적용하였으며, 두 유사도를 적용하여 말뭉치를 분류하는 과정은 K-Means 알고리즘과 유사한 기계학습 기법을 사용하였다. 이를 일본어-영어의 특허문서에서 실험한 결과 최선의 경우 약 2.5%의 상대적인 성능 향상을 얻었다.

  • PDF