Search | Korea Science

Data Augmentation and Preprocessing to Improve Automated Essay Scoring Model (에세이 자동 평가 모델 성능 향상을 위한 데이터 증강과 전처리)

Kanghee Go;Doguk Kim
- Annual Conference on Human and Language Technology
- /
- 2023.10a
- /
- pp.327-332
- /
- 2023
데이터의 품질과 다양성은 모델 성능에 지대한 영향을 끼친다. 본 연구에서는 Topic을 활용한 데이터 전처리와 BERT 기반 MLM, T5, Random Masking을 이용한 증강으로 데이터의 품질과 다양성을 높이고자 했으며, 이를 KoBERT 기반 에세이 자동 평가 모델에 적용했다. 데이터 전처리만 진행했을 때, Quadratic Weighted Kappa Score(QWK)를 기준으로 모델이 에세이의 모든 평가 항목에 대해 베이스라인보다 더욱 높은 일치도를 보였으며 평가항목별 일치도의 평균을 기준으로 0.5368029에서 0.5483064(+0.0115035)로 상승했다. 여기에 제안하는 증강 방식을 추가 할 경우 MLM, T5, Random Masking 모두 성능 향상 효과를 보였다. 특히, MLM 데이터 증강 방식을 추가로 적용하였을 때 최종적으로 0.5483064에서 0.55151645(+0.00321005)으로 상승해 가장 높은 일치도를 보였으며, 에세이 총점으로 QWK를 기준으로 성능을 평가하면 베이스라인 대비 0.4110809에서 0.4380132(+0.0269323)로의 성능 개선이 있었다.
PDF

A Study On Mathematical Model of Manoeuvring Motions of Twin-propeller Twin-rudder Ship for Construction of Real-time Ship-handling Simulator (시뮬레이터 구축을 위한 2축2타선박의 조종운동 수학모델에 관한 연구)

손경호;김용민
- Proceedings of KOSOMES biannual meeting
- /
- 2001.05a
- /
- pp.53-77
- /
- 2001
선박의 항행안전의 문제가 중요시됨에 따라 선박조종시뮬레이터에 의한 안전성 검토의 필요성이 크게 인식되고 있다. 또한 조종성능을 향상시킬 목적으로 다양한 선종이 출현하고 있고, 이에 따라 선박조종시뮬레이터의 개발에 있어서 선박의 데이터베이스는 필수적이라고 할 수 있다. 따라서 선종에 따른 수학모델을 각각 선박조종시뮬레이터에 적용시킴으로써 다양성이라는 가상현실의 잇점을 한층 부각시킬 수 있다. 본 연구에서는 우수한 추진성능을 목적으로 한 2축2타선박을 대상으로 조종운동 수학모델을 정식화하였다. 구체적으로 항만내에서의 저속시 조종운동을 구현할 수 있는 수학모델에 대해서 검토하였으며, 선체·프로펠러·타의 상호간섭에 대해서도 고려하였다. 또한, 수치시뮬레이션을 수행함으로써 2축2타선박의 기본적인 조종성능을 확인할 수 있었다.
PDF

A Study on the Efficacy of Edge-Based Adversarial Example Detection Model: Across Various Adversarial Algorithms

Jaesung Shim;Kyuri Jo
- Journal of the Korea Society of Computer and Information
- /
- v.29 no.2
- /
- pp.31-41
- /
- 2024
Deep learning models show excellent performance in tasks such as image classification and object detection in the field of computer vision, and are used in various ways in actual industrial sites. Recently, research on improving robustness has been actively conducted, along with pointing out that this deep learning model is vulnerable to hostile examples. A hostile example is an image in which small noise is added to induce misclassification, and can pose a significant threat when applying a deep learning model to a real environment. In this paper, we tried to confirm the robustness of the edge-learning classification model and the performance of the adversarial example detection model using it for adversarial examples of various algorithms. As a result of robustness experiments, the basic classification model showed about 17% accuracy for the FGSM algorithm, while the edge-learning models maintained accuracy in the 60-70% range, and the basic classification model showed accuracy in the 0-1% range for the PGD/DeepFool/CW algorithm, while the edge-learning models maintained accuracy in 80-90%. As a result of the adversarial example detection experiment, a high detection rate of 91-95% was confirmed for all algorithms of FGSM/PGD/DeepFool/CW. By presenting the possibility of defending against various hostile algorithms through this study, it is expected to improve the safety and reliability of deep learning models in various industries using computer vision.
https://doi.org/10.9708/jksci.2024.29.02.031 인용 PDF HTML

Application of InVest-Habitat Quality Model for Assessing Watershed Health (유역 건전성평가를 위한 InVest-Habitat quality 모형의 적용)

Lee, Jiwan;Park, Jongyoon;Woo, Soyoung;Lee, Younggwan;Kim, Seongjoon
- Proceedings of the Korea Water Resources Association Conference
- /
- 2021.06a
- /
- pp.451-451
- /
- 2021
인간활동으로 인해 서식처의 변화, 서식처의 파편화를 비롯하여 기후변화, 토지이용의 변화 등으로 생태계 생물 다양성은 빠르게 손실되고있는 상황이다. 특히 생물 다양성은 생태계 복원력에 중요한 인자로서 유역의 건전성 회복을 위해 생물 다양성을 중요한 인자로 고려하려는 경향이 커지고 있다. 유역 건전성은 주로 큰 하천에서의 친수성, 서식처, 유량 및 수질 등에 적용되어왔고 국내에서는 최근 들어 유역 건전성을 확보하기 위해 수량 및 수질관리, 환경문제 등의 해결을 위해 유역관리 차원에서 접근하려는 시도가 시작되었으나 어떠한 수단을 통해 생물다양성과 서식처 관리를 접근할 수 있는지에 대한 연구는 아직 부족한 실정이다. 이에 본 연구에서는 최근 20년 동안 도시화, 댐 건설 등 토지이용변화가 크게 발생한 금강유역(9,865 km²)을 대상으로 InVest 모델 중 서식처 가치평가 모델 (Habitat Quality Model)을 이용하여 유역의 서식처 가치를 평가하고 이를 수생태계 건강성 모니터링 자료와 비교하여 모형의 적용성을 평가하고자 한다.
PDF

Database Supported System for UML Models Management (데이터베이스에 기반한 UML 모델 관리시스템)

이성대;박휴찬
- Proceedings of the Korea Society for Simulation Conference
- /
- 2002.05a
- /
- pp.73-80
- /
- 2002
UML(Unified Modeling Language)은 소프트웨어 설계뿐만 아니라 네트워크 상에서의 데이터 전송, 가상데이터를 이용한 물리현상, 회로 분석 및 설계 등 다양한 형태의 시뮬레이션에서도 사용되고 있는 모델링 언어이다. 이러한 UML로 개발된 소프트웨어 설계 모델이나 시뮬레이션 모델들을 효율적으로 저장하고 관리할 수 있는 통합 시스템의 필요성이 제기되고 있다. 이를 위하여 본 논문에서는 UML 모델들의 저장과 관리의 효율성을 높이기 위해서 저장하부 구조를 데이터베이스화할 수 있는 방법을 제안한다. 제안한 방법을 적용한 시스템은 UML 모델들을 다수의 사용자들이 서로 공유할 수 있으며 모델의 재사용성을 높이고 모델 정보의 효율적인 검색을 지원할 것이다.
PDF

Iterative Feedback-based Personality Persona Generation for Diversifying Linguistic Patterns in Large Language Models (대규모 언어 모델의 언어 패턴 다양화를 위한 반복적 피드백 기반 성격 페르소나 생성법)

Taeho Hwang;Hoyun Song;Jisu Shin;Sukmin Cho;Jong C. Park
- Annual Conference on Human and Language Technology
- /
- 2023.10a
- /
- pp.454-460
- /
- 2023
대규모 언어 모델(Large Language Models, LLM)의 발전과 더불어 대량의 학습 데이터로부터 기인한 LLM의 편향성에 관심이 집중하고 있다. 최근 선행 연구들에서는 LLM이 이러한 경향성을 탈피하고 다양한 언어 패턴을 생성하게 하기 위하여 LLM에 여러가지 페르소나를 부여하는 방법을 제안하고 있다. 일부에서는 사람의 성격을 설명하는 성격 5 요인 이론(Big 5)을 이용하여 LLM에 다양한 성격 특성을 가진 페르소나를 부여하는 방법을 제안하였고, 페르소나 간의 성격의 차이가 다양한 양상의 언어 사용 패턴을 이끌어낼 수 있음을 보였다. 그러나 제한된 횟수의 입력만으로 목표하는 성격의 페르소나를 생성하려 한 기존 연구들은 세밀히 서로 다른 성격을 가진 페르소나를 생성하는 데에 한계가 있었다. 본 연구에서는 페르소나 부여 과정에서 피드백을 반복하여 제공함으로써 세세한 성격의 차이를 가진 페르소나를 생성하는 방법론을 제안한다. 본 연구의 실험과 분석을 통해, 제안하는 방법론으로 형성된 성격 페르소나가 다양한 언어 패턴을 효과적으로 만들어 낼 수 있음을 확인했다.
PDF

A de-identification technique using generalization and insert a salt data (일반화와 데이터 삽입을 이용한 익명화 처리 기법)

Park, Jun-Bum;Cho, Jin-Man;Choi, Dae-Seon;Jin, Seung-Hun
- Proceedings of the Korea Information Processing Society Conference
- /
- 2015.04a
- /
- pp.351-353
- /
- 2015
공공정보 공유 및 개방, 소셜네트워크서비스의 활성화 그리고 사용자 간의 공유 데이터 증가 등의 이유로 인터넷상에 노출되는 사용자의 개인 정보가 증가하고 있다. 인터넷상에 노출된 사용자들의 개인정보들은 연결공격(linkage attack), 배경지식 공격(background attack)으로 프라이버시를 침해할 수 있다. 이를 막기 위해 관계형 데이터베이스에서는 대표적으로 k-익명성(k-anonymity)을 시작으로 l-다양성(l-diversity), t-밀집성(t-closeness)이라는 익명화 모델이 제안되었으며 계속해서 익명화 알고리즘의 성능은 개선되고 있다. 하지만 k-익명성, l-다양성, t-밀집성 모델의 조건을 만족하기 위해서는 준식별자(quasi-identifier)를 일반화(generalization)처리 해주어야 하는데 이 과정에서 준식별자의 가치를 손실된다는 단점이 있다. 본 논문에서 준식별자의 정보 손실을 최소화하기 위해 k-익명성 모델을 만족시키는 과정에서 일반화와 데이터를 삽입을 사용하는 익명화 처리하는 방법을 제안한다.
https://doi.org/10.3745/PKIPS.y2015m04a.351 인용 PDF

Advancing Reproducibility in Hydrological Modeling: Integration of Open Repositories, Cloud-Based JupyterHub, and Model APIs (온라인저장소, 클라우드기반 JupyterHub와 모델 APIs를 활용한 수자원 모델링의 재현성 개선)

Choi, Young Don
- Proceedings of the Korea Water Resources Association Conference
- /
- 2022.05a
- /
- pp.118-118
- /
- 2022
지속적인 학문의 발전을 위해서는 선행연구에 대한 재현성이 무엇보다도 중요하다고 할 수 있다. 하지만 컴퓨터와 소프트웨어의 급속한 발달로 인한 컴퓨터 환경의 다양화, 분석 소프트웨어의 지속적 최신화로 인해서 최근 구축된 모델도 짧게는 몇 달, 길게는 1~2년후면 다양한 에러로 인하여 재현성이 불가능해지고 있다. 이러한 재현성의 극복을 위해서 온라인을 통한 데이터와 소스코드의 공유의 필요성이 제시되고 있으나, 실제로는 개인마다 컴퓨터 환경, 버전, 소프트웨어 설치에 필요한 라이브러리의 버전 또는 디렉토리 등이 달라 단순히 온라인을 통한 데이터와 소스코드의 공유만으로 재현성을 개선하기는 힘든 것이 현실이다. 따라서 이러한 컴퓨터 모델링 환경의 공유는 과거의 형태와 같이 데이터, 소스코드와 매뉴얼의 공유만으로 불가능하다고 할 수 있다. 따라서 본 연구에서는 수자원 모델링의 재현성 개선을 위해 1) 온라인 저장소, 2) 클라우드기반 JupyterHub 모델링 환경과 3) 모델 APIs 3개의 핵심 구성요소를 제시하고, 최근 미국에서 개발된SUMMA(Structure for Unifying Multiple Modeling Alternative) 수자원 모델에 적용하여 재현성 달성을 위한 3개의 핵심 구성요소의 필요성과 용이성을 검증하였다. 첫 번째, 데이터와 모델의 온라인 공유는 FAIR(Findable, Accessible, Interoperable, Reusable) 원칙으로 개발된 수자원분야의 대표적인 온라인 저장소인 HydroShare를 활용하여 모델입력자료를 메타데이터와 함께 공유하였다. 두 번째, HydroShare에서 Web App의 형태로 제공되는 클라우드기반 JupyterHub환경인 CUAHSI JupyterHub(CJH)와 일루노이대학에서 제공하는 CyberGIS-Jupyter for water JupyterHub(CJW)환경에 수자원모델링 환경을 컨테이너(Docker) 환경을 통해 구축·공유하였다. 마지막으로, 클라우드에서 수자원모델의 효율적 이용을 위해 Python기반의SUMMA모델 API인 pySUMMA를 개발·공유하였다. 이와같이 구축된 3개의 핵심 구성요소를 이용하여 2015년 Water Resources Research에 게재된 SUMMA 논문의 9개 Test Cases 중에서 5개를 누구나 쉽게 재현할 수 있음을 증명하였다. 재현성의 중요성에 대한 인식의 증가로 Open과 Transparent Hydrology에 대한 요구가 증대되고 있으며, 이를 위해서 클라우드 기반의 모델링 환경구축 및 제공이 확대되고 있다. 본 연구에서 제시한 HydroShare와 같은 온라인 저장소, CJH와 CJW와 같은 클라우드기반 모델링환경, 모델의 효율적 이용을 위한 모델 APIs는 급속도로 발달하고 있는 컴퓨터 및 소프트웨어 환경에서 핵심구성요소이며, 연구의 재현성 개선을 통해 수자원공학 발전에 기여할 것으로 기대된다.
PDF

AHP Based-Optimal Selection of Concrete Patching Repair Materials Considering Qualitative Evaluation Criteria (정성적 평가항목을 고려한 콘크리트 보수용 단면복구재료의 AHP 기반 최적선정 모델링)

Do, Jeong-Yun;Song, Hun;Soh, Yang-Seob
- Proceedings of the Korea Concrete Institute Conference
- /
- 2008.04a
- /
- pp.965-968
- /
- 2008
This study is interested in modeling the selection of optimal repair materials in view of the qualitative evaluation. In order to architecting the evaluation model of various repair alternatives, Analytical hierarchy process techniques was applied to this study. It is composed of aesthetics, easy-to-application, economical efficiency, and environment-friendly properties in upper level. Among the qualitative evaluation items, Environment-friendly properties and execution cost included in economical efficiency is highly weighted. It was concluded that the evaluation model by this study is very useful to choose the best alternative among various repair materials.
PDF

A Model for Privacy Preserving Publication of Social Network Data (소셜 네트워크 데이터의 프라이버시 보호 배포를 위한 모델)

Sung, Min-Kyung;Chung, Yon-Dohn
- Journal of KIISE:Databases
- /
- v.37 no.4
- /
- pp.209-219
- /
- 2010
Online social network services that are rapidly growing recently store tremendous data and analyze them for many research areas. To enhance the effectiveness of information, companies or public institutions publish their data and utilize the published data for many purposes. However, a social network containing information of individuals may cause a privacy disclosure problem. Eliminating identifiers such as names is not effective for the privacy protection, since private information can be inferred through the structural information of a social network. In this paper, we consider a new complex attack type that uses both the content and structure information, and propose a model, $\ell$-degree diversity, for the privacy preserving publication of the social network data against such attacks. $\ell$-degree diversity is the first model for applying $\ell$-diversity to social network data publication and through the experiments it shows high data preservation rate.
PDF KSCI

Search Result 5,933, Processing Time 0.059 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)