• 제목/요약/키워드: 모델의 다양성

검색결과 5,933건 처리시간 0.041초

에세이 자동 평가 모델 성능 향상을 위한 데이터 증강과 전처리 (Data Augmentation and Preprocessing to Improve Automated Essay Scoring Model)

  • 고강희;김도국
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.327-332
    • /
    • 2023
  • 데이터의 품질과 다양성은 모델 성능에 지대한 영향을 끼친다. 본 연구에서는 Topic을 활용한 데이터 전처리와 BERT 기반 MLM, T5, Random Masking을 이용한 증강으로 데이터의 품질과 다양성을 높이고자 했으며, 이를 KoBERT 기반 에세이 자동 평가 모델에 적용했다. 데이터 전처리만 진행했을 때, Quadratic Weighted Kappa Score(QWK)를 기준으로 모델이 에세이의 모든 평가 항목에 대해 베이스라인보다 더욱 높은 일치도를 보였으며 평가항목별 일치도의 평균을 기준으로 0.5368029에서 0.5483064(+0.0115035)로 상승했다. 여기에 제안하는 증강 방식을 추가 할 경우 MLM, T5, Random Masking 모두 성능 향상 효과를 보였다. 특히, MLM 데이터 증강 방식을 추가로 적용하였을 때 최종적으로 0.5483064에서 0.55151645(+0.00321005)으로 상승해 가장 높은 일치도를 보였으며, 에세이 총점으로 QWK를 기준으로 성능을 평가하면 베이스라인 대비 0.4110809에서 0.4380132(+0.0269323)로의 성능 개선이 있었다.

  • PDF

시뮬레이터 구축을 위한 2축2타선박의 조종운동 수학모델에 관한 연구 (A Study On Mathematical Model of Manoeuvring Motions of Twin-propeller Twin-rudder Ship for Construction of Real-time Ship-handling Simulator)

  • 손경호;김용민
    • 해양환경안전학회:학술대회논문집
    • /
    • 해양환경안전학회 2001년도 춘계학술발표대회
    • /
    • pp.53-77
    • /
    • 2001
  • 선박의 항행안전의 문제가 중요시됨에 따라 선박조종시뮬레이터에 의한 안전성 검토의 필요성이 크게 인식되고 있다. 또한 조종성능을 향상시킬 목적으로 다양한 선종이 출현하고 있고, 이에 따라 선박조종시뮬레이터의 개발에 있어서 선박의 데이터베이스는 필수적이라고 할 수 있다. 따라서 선종에 따른 수학모델을 각각 선박조종시뮬레이터에 적용시킴으로써 다양성이라는 가상현실의 잇점을 한층 부각시킬 수 있다. 본 연구에서는 우수한 추진성능을 목적으로 한 2축2타선박을 대상으로 조종운동 수학모델을 정식화하였다. 구체적으로 항만내에서의 저속시 조종운동을 구현할 수 있는 수학모델에 대해서 검토하였으며, 선체·프로펠러·타의 상호간섭에 대해서도 고려하였다. 또한, 수치시뮬레이션을 수행함으로써 2축2타선박의 기본적인 조종성능을 확인할 수 있었다.

  • PDF

A Study on the Efficacy of Edge-Based Adversarial Example Detection Model: Across Various Adversarial Algorithms

  • Jaesung Shim;Kyuri Jo
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권2호
    • /
    • pp.31-41
    • /
    • 2024
  • 딥러닝 모델(Deep Learning Model)은 컴퓨터 비전(Computer Vision) 분야의 이미지(Image) 분류 및 객체 탐지와 같은 작업에서 뛰어난 성과를 보이며, 실제 산업 현장에서 다양하게 활용되고 있다. 최근 다양한 알고리즘(Algorithm)의 적대적 예제를 이용하여 딥러닝 모델의 취약성을 지적하며, 강건성 향상 방안을 제시하는 연구들이 활발하게 진행되고 있다. 적대적 예제는 오분류를 유도하기 위해 작은 노이즈(Noise)가 추가된 이미지로서, 딥러닝 모델을 실제 환경에 적용 시 중대한 위협이 될 수 있다. 본 논문에서는 다양한 알고리즘의 적대적 예제를 대상으로 에지 학습 분류 모델의 강건성 및 이를 이용한 적대적 예제 탐지 모델의 성능을 확인하고자 하였다. 강건성 실험 결과, FGSM(Fast Gradient Sign Method) 알고리즘에 대하여 기본 분류 모델이 약 17%의 정확도를 보였으나, 에지(Edge) 학습 모델들은 60~70%대의 정확도를 유지하였고, PGD(projected gradient descent)/DeepFool/CW(Carlini-Wagner) 알고리즘에 대해서는 기본 분류 모델이 0~1%의 정확도를 보였으나, 에지 학습 모델들은 80~90%의 정확도를 유지하였다. 적대적 예제 탐지 실험 결과, FGSM/PGD/DeepFool/CW의 모든 알고리즘에 대해서 91~95%의 높은 탐지율을 확인할 수 있었다. 본 연구를 통하여 다양한 적대적 알고리즘에 대한 방어 가능성을 제시함으로써, 컴퓨터 비전을 활용하는 여러 산업 분야에서 딥러닝 모델의 안전성 및 신뢰성 제고를 기대한다.

유역 건전성평가를 위한 InVest-Habitat quality 모형의 적용 (Application of InVest-Habitat Quality Model for Assessing Watershed Health)

  • 이지완;박종윤;우소영;이용관;김성준
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2021년도 학술발표회
    • /
    • pp.451-451
    • /
    • 2021
  • 인간활동으로 인해 서식처의 변화, 서식처의 파편화를 비롯하여 기후변화, 토지이용의 변화 등으로 생태계 생물 다양성은 빠르게 손실되고있는 상황이다. 특히 생물 다양성은 생태계 복원력에 중요한 인자로서 유역의 건전성 회복을 위해 생물 다양성을 중요한 인자로 고려하려는 경향이 커지고 있다. 유역 건전성은 주로 큰 하천에서의 친수성, 서식처, 유량 및 수질 등에 적용되어왔고 국내에서는 최근 들어 유역 건전성을 확보하기 위해 수량 및 수질관리, 환경문제 등의 해결을 위해 유역관리 차원에서 접근하려는 시도가 시작되었으나 어떠한 수단을 통해 생물다양성과 서식처 관리를 접근할 수 있는지에 대한 연구는 아직 부족한 실정이다. 이에 본 연구에서는 최근 20년 동안 도시화, 댐 건설 등 토지이용변화가 크게 발생한 금강유역(9,865 km2)을 대상으로 InVest 모델 중 서식처 가치평가 모델 (Habitat Quality Model)을 이용하여 유역의 서식처 가치를 평가하고 이를 수생태계 건강성 모니터링 자료와 비교하여 모형의 적용성을 평가하고자 한다.

  • PDF

데이터베이스에 기반한 UML 모델 관리시스템 (Database Supported System for UML Models Management)

  • 이성대;박휴찬
    • 한국시뮬레이션학회:학술대회논문집
    • /
    • 한국시뮬레이션학회 2002년도 춘계학술대회논문집
    • /
    • pp.73-80
    • /
    • 2002
  • UML(Unified Modeling Language)은 소프트웨어 설계뿐만 아니라 네트워크 상에서의 데이터 전송, 가상데이터를 이용한 물리현상, 회로 분석 및 설계 등 다양한 형태의 시뮬레이션에서도 사용되고 있는 모델링 언어이다. 이러한 UML로 개발된 소프트웨어 설계 모델이나 시뮬레이션 모델들을 효율적으로 저장하고 관리할 수 있는 통합 시스템의 필요성이 제기되고 있다. 이를 위하여 본 논문에서는 UML 모델들의 저장과 관리의 효율성을 높이기 위해서 저장하부 구조를 데이터베이스화할 수 있는 방법을 제안한다. 제안한 방법을 적용한 시스템은 UML 모델들을 다수의 사용자들이 서로 공유할 수 있으며 모델의 재사용성을 높이고 모델 정보의 효율적인 검색을 지원할 것이다.

  • PDF

대규모 언어 모델의 언어 패턴 다양화를 위한 반복적 피드백 기반 성격 페르소나 생성법 (Iterative Feedback-based Personality Persona Generation for Diversifying Linguistic Patterns in Large Language Models)

  • 황태호;송호윤;신지수;조석민;박종철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.454-460
    • /
    • 2023
  • 대규모 언어 모델(Large Language Models, LLM)의 발전과 더불어 대량의 학습 데이터로부터 기인한 LLM의 편향성에 관심이 집중하고 있다. 최근 선행 연구들에서는 LLM이 이러한 경향성을 탈피하고 다양한 언어 패턴을 생성하게 하기 위하여 LLM에 여러가지 페르소나를 부여하는 방법을 제안하고 있다. 일부에서는 사람의 성격을 설명하는 성격 5 요인 이론(Big 5)을 이용하여 LLM에 다양한 성격 특성을 가진 페르소나를 부여하는 방법을 제안하였고, 페르소나 간의 성격의 차이가 다양한 양상의 언어 사용 패턴을 이끌어낼 수 있음을 보였다. 그러나 제한된 횟수의 입력만으로 목표하는 성격의 페르소나를 생성하려 한 기존 연구들은 세밀히 서로 다른 성격을 가진 페르소나를 생성하는 데에 한계가 있었다. 본 연구에서는 페르소나 부여 과정에서 피드백을 반복하여 제공함으로써 세세한 성격의 차이를 가진 페르소나를 생성하는 방법론을 제안한다. 본 연구의 실험과 분석을 통해, 제안하는 방법론으로 형성된 성격 페르소나가 다양한 언어 패턴을 효과적으로 만들어 낼 수 있음을 확인했다.

  • PDF

일반화와 데이터 삽입을 이용한 익명화 처리 기법 (A de-identification technique using generalization and insert a salt data)

  • 박준범;조진만;최대선;진승헌
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.351-353
    • /
    • 2015
  • 공공정보 공유 및 개방, 소셜네트워크서비스의 활성화 그리고 사용자 간의 공유 데이터 증가 등의 이유로 인터넷상에 노출되는 사용자의 개인 정보가 증가하고 있다. 인터넷상에 노출된 사용자들의 개인정보들은 연결공격(linkage attack), 배경지식 공격(background attack)으로 프라이버시를 침해할 수 있다. 이를 막기 위해 관계형 데이터베이스에서는 대표적으로 k-익명성(k-anonymity)을 시작으로 l-다양성(l-diversity), t-밀집성(t-closeness)이라는 익명화 모델이 제안되었으며 계속해서 익명화 알고리즘의 성능은 개선되고 있다. 하지만 k-익명성, l-다양성, t-밀집성 모델의 조건을 만족하기 위해서는 준식별자(quasi-identifier)를 일반화(generalization)처리 해주어야 하는데 이 과정에서 준식별자의 가치를 손실된다는 단점이 있다. 본 논문에서 준식별자의 정보 손실을 최소화하기 위해 k-익명성 모델을 만족시키는 과정에서 일반화와 데이터를 삽입을 사용하는 익명화 처리하는 방법을 제안한다.

온라인저장소, 클라우드기반 JupyterHub와 모델 APIs를 활용한 수자원 모델링의 재현성 개선 (Advancing Reproducibility in Hydrological Modeling: Integration of Open Repositories, Cloud-Based JupyterHub, and Model APIs)

  • 최영돈
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2022년도 학술발표회
    • /
    • pp.118-118
    • /
    • 2022
  • 지속적인 학문의 발전을 위해서는 선행연구에 대한 재현성이 무엇보다도 중요하다고 할 수 있다. 하지만 컴퓨터와 소프트웨어의 급속한 발달로 인한 컴퓨터 환경의 다양화, 분석 소프트웨어의 지속적 최신화로 인해서 최근 구축된 모델도 짧게는 몇 달, 길게는 1~2년후면 다양한 에러로 인하여 재현성이 불가능해지고 있다. 이러한 재현성의 극복을 위해서 온라인을 통한 데이터와 소스코드의 공유의 필요성이 제시되고 있으나, 실제로는 개인마다 컴퓨터 환경, 버전, 소프트웨어 설치에 필요한 라이브러리의 버전 또는 디렉토리 등이 달라 단순히 온라인을 통한 데이터와 소스코드의 공유만으로 재현성을 개선하기는 힘든 것이 현실이다. 따라서 이러한 컴퓨터 모델링 환경의 공유는 과거의 형태와 같이 데이터, 소스코드와 매뉴얼의 공유만으로 불가능하다고 할 수 있다. 따라서 본 연구에서는 수자원 모델링의 재현성 개선을 위해 1) 온라인 저장소, 2) 클라우드기반 JupyterHub 모델링 환경과 3) 모델 APIs 3개의 핵심 구성요소를 제시하고, 최근 미국에서 개발된SUMMA(Structure for Unifying Multiple Modeling Alternative) 수자원 모델에 적용하여 재현성 달성을 위한 3개의 핵심 구성요소의 필요성과 용이성을 검증하였다. 첫 번째, 데이터와 모델의 온라인 공유는 FAIR(Findable, Accessible, Interoperable, Reusable) 원칙으로 개발된 수자원분야의 대표적인 온라인 저장소인 HydroShare를 활용하여 모델입력자료를 메타데이터와 함께 공유하였다. 두 번째, HydroShare에서 Web App의 형태로 제공되는 클라우드기반 JupyterHub환경인 CUAHSI JupyterHub(CJH)와 일루노이대학에서 제공하는 CyberGIS-Jupyter for water JupyterHub(CJW)환경에 수자원모델링 환경을 컨테이너(Docker) 환경을 통해 구축·공유하였다. 마지막으로, 클라우드에서 수자원모델의 효율적 이용을 위해 Python기반의SUMMA모델 API인 pySUMMA를 개발·공유하였다. 이와같이 구축된 3개의 핵심 구성요소를 이용하여 2015년 Water Resources Research에 게재된 SUMMA 논문의 9개 Test Cases 중에서 5개를 누구나 쉽게 재현할 수 있음을 증명하였다. 재현성의 중요성에 대한 인식의 증가로 Open과 Transparent Hydrology에 대한 요구가 증대되고 있으며, 이를 위해서 클라우드 기반의 모델링 환경구축 및 제공이 확대되고 있다. 본 연구에서 제시한 HydroShare와 같은 온라인 저장소, CJH와 CJW와 같은 클라우드기반 모델링환경, 모델의 효율적 이용을 위한 모델 APIs는 급속도로 발달하고 있는 컴퓨터 및 소프트웨어 환경에서 핵심구성요소이며, 연구의 재현성 개선을 통해 수자원공학 발전에 기여할 것으로 기대된다.

  • PDF

정성적 평가항목을 고려한 콘크리트 보수용 단면복구재료의 AHP 기반 최적선정 모델링 (AHP Based-Optimal Selection of Concrete Patching Repair Materials Considering Qualitative Evaluation Criteria)

  • 도정윤;송훈;김두기
    • 한국콘크리트학회:학술대회논문집
    • /
    • 한국콘크리트학회 2008년도 춘계 학술발표회 제20권1호
    • /
    • pp.965-968
    • /
    • 2008
  • 본 연구는 보수재료의 다양한 요구성능 중 정성적 측면을 고려하여 최적의 보수재료를 선정하기위한 평가모델을 구축하고자 하였다. 다양한 보수 대안에 대한 평가모델을 구축하기위해서 본여구에서는 위계분석기법(AHP)가 적용되었다. 평가모델의 평가항목에는 미적성능, 환경성, 작업성, 경제성으로 크게 분류되었으며, 미적성능은 마감성과 변동성, 작업성은 품질관리난이, 구성재료수, 시공성으로, 경제성은 시공비용, 보수공기, 소요장비의 항목으로 세분되어 구성되었다. AHP기법의 상대적 평가방법에 따라서 각 평가항목별 쌍대비교를 한 결과, 환경성과 시공비용이 가장 가중치가 높은 중요한 평가항목으로 산정되었다. 본 연구에서 제시한 정성적 평가항목에 대한 평가모델은 다양한 보수대안 중에서 정성적 평가항목을 고려하여 최적의 보수대안을 선정할 때 매우 유용하게 활용될 수 있다.

  • PDF

소셜 네트워크 데이터의 프라이버시 보호 배포를 위한 모델 (A Model for Privacy Preserving Publication of Social Network Data)

  • 성민경;정연돈
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제37권4호
    • /
    • pp.209-219
    • /
    • 2010
  • 최근 빠르게 확산되고 있는 온라인 소셜 네트워크 서비스는 수많은 데이터를 저장하고 이를 분석하여 여러 연구 분야에 활용하고 있다. 정보의 효율성을 높이기 위해 기업이나 공공기관은 자신들이 가진 데이터를 배포하고, 배포된 데이터를 이용하여 여러 목적에 사용한다. 그러나 배포되는 소셜 네트워크에는 개인과 관련된 정보가 포함되어 있으므로 개인 프라이버시가 노출될 수 있는 문제가 있다. 배포되는 소셜 네트워크에서 단순히 이름 등의 식별자를 지우는 것으로는 개인 프라이버시 보호에 충분하지 않으며, 소셜 네트워크가 가진 구조적 정보에 의해서도 개인 프라이버시가 노출될 수 있다. 본 논문에서는 내용 정보를 포함하고 있는 소셜 네트워크 배포 시 개인 프라이버시 노출에 이용되는 복합된 공격법을 제시하고 이를 방지할 수 있는 새로운 모델인 $\ell$-차수 다양성($\ell$-degree diversity)을 제안한다. $\ell$-차수 다양성은 소셜 네트워크 데이터 배포에서 $\ell$-다양성을 최초로 적용한 모델이며 높은 정보 보존율을 가짐을 실험을 통해 볼 수 있다.