• 제목/요약/키워드: 모델의 평가

검색결과 12,589건 처리시간 0.04초

재해예방 및 복구사업 경제성 평가모델 개발 (Development of BCA Model about Accident Prevention and Disaster Recovery Program)

  • 김한태;한종수;장문엽;권정호
    • 한국재난정보학회:학술대회논문집
    • /
    • 한국재난정보학회 2015년 정기학술대회
    • /
    • pp.103-105
    • /
    • 2015
  • 본 논문에서는 재해 예방 및 복구사업 경제성평가 모델 개발을 위해 경제성 평가 활용현황 및 문제점을 정리하고 경제성 평가모델개발방안 도출 등의 연구를 수행한다. 경제성 평가기법의 연구개발 현황 파악과 경제성 평가방법의 당면 과제 도출로부터 조사 범위 및 방법을 결정하고 성과물에 대한 활용방안 또한 결정에 참고하도록 한다. 기존 연구 및 풍수해 관련 자료의 분석결과 경제성 평가는 BCA가 일반적으로 사용되여 Benefit과 Cost의 고려범위에 따라 연구방법과 내용이 각기 다른 실정이었다. 또한 대부분의 연구는 정량화가 쉬운 직접비용에 치중되어 있으며, 고려 범위가 추상적인 경우는 과다하게 측정되는 경향이 있었다. 한편, 피해 발생 시 현재는 NDMS에 피해액관련 데이터 입력하여 활용하고 있으며 이는 관련보상 법규가 없던 과거조사자료와 최근의 조사자료사이에 큰 차이를 보이고 있다.

  • PDF

방사성폐기물처분장 주변 균열 암반에서의 핵종이동 모델의 검토 및 평가방법론

  • 이연명;강철형;한필수;박헌휘
    • Nuclear Engineering and Technology
    • /
    • 제26권4호
    • /
    • pp.578-599
    • /
    • 1994
  • 방사성 폐기물 처분장의 건설에 가장 중요한 부분중의 하나는 처분안전성의 확보일 것이다. 처분장 안전성평가는 처분장이 입지하는 환경에 대한 실험실적 자료 또는 현장 자료의 충분한 데이타베이스와 처분시스템에서 일어날 수 있는 주요한 프로세스를 기술하는 수학적 모델을 통하여 이루어지게 된다. 처분시스템의 기본적인 기능은 처분된 폐기물고화체를 인간환경으로 부터 완벽하게 고립시켜 처분장내에 영구적으로 격리시키는 것이다. 그렇지만 정상적이든 비정상적이든 핵종은 항상 유출될 가능성이 있고 설사 이러한 경우라도 충분히 안전한 것을 입증하는 것이 처분장 성능 평가와 안전성평가의 주요한 목적이 된다. 한편 장기간에 걸친 처분 안전성 평가는 전산 프로그램을 통한 이론적 예측에 의해서만 가능하므로, 처분안전성 평가도구의 개발 및 확보의 중요성은 매우 크다고 할 수 있다. 이 연구에서는 처분장이 입지하는 암반 매질에서의 핵종의 이동을 기술할 수 있는 여러 모델을 검토하고, 특정 처분부지에 대한 종합적 안전성 평가를 수행할 수 있는 방법론을 제시할 목적으로 임의의 1개 부지의 지형도및 추정가능한 지질관련 자료를 이용하여 해당 부지에 대한 가상의 핵종 유출 시나리오를 설정하여 부지특성적인 예비 종합 안전성 평가를 수행하여 보았다.

  • PDF

FubaoLM : 연쇄적 사고 증류와 앙상블 학습에 의한 대규모 언어 모델 자동 평가 (FubaoLM : Automatic Evaluation based on Chain-of-Thought Distillation with Ensemble Learning)

  • 김희주;전동현;권오준;권순환;김한수;이인권;김도현;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.448-453
    • /
    • 2023
  • 대규모 언어 모델 (Large Language Model, LLM)을 인간의 선호도 관점에서 평가하는 것은 기존의 벤치마크 평가와는 다른 도전적인 과제이다. 이를 위해, 기존 연구들은 강력한 LLM을 평가자로 사용하여 접근하였지만, 높은 비용 문제가 부각되었다. 또한, 평가자로서 LLM이 사용하는 주관적인 점수 기준은 모호하여 평가 결과의 신뢰성을 저해하며, 단일 모델에 의한 평가 결과는 편향될 가능성이 있다. 본 논문에서는 엄격한 기준을 활용하여 편향되지 않은 평가를 수행할 수 있는 평가 프레임워크 및 평가자 모델 'FubaoLM'을 제안한다. 우리의 평가 프레임워크는 심층적인 평가 기준을 통해 다수의 강력한 한국어 LLM을 활용하여 연쇄적 사고(Chain-of-Thought) 기반 평가를 수행한다. 이러한 평가 결과를 다수결로 통합하여 편향되지 않은 평가 결과를 도출하며, 지시 조정 (instruction tuning)을 통해 FubaoLM은 다수의 LLM으로 부터 평가 지식을 증류받는다. 더 나아가 본 논문에서는 전문가 기반 평가 데이터셋을 구축하여 FubaoLM 효과성을 입증한다. 우리의 실험에서 앙상블된 FubaoLM은 GPT-3.5 대비 16% 에서 23% 향상된 절대 평가 성능을 가지며, 이항 평가에서 인간과 유사한 선호도 평가 결과를 도출한다. 이를 통해 FubaoLM은 비교적 적은 비용으로도 높은 신뢰성을 유지하며, 편향되지 않은 평가를 수행할 수 있음을 보인다.

  • PDF

CFD를 활용한 자율운항선박의 자율제어성능 평가에 관한 연구

  • 김대정;임정빈
    • 한국항해항만학회:학술대회논문집
    • /
    • 한국항해항만학회 2023년도 추계학술대회
    • /
    • pp.100-102
    • /
    • 2023
  • 항로추종성능은 자율운항선박(MASS)의 중요한 자율제어기능 중 하나이다. 이는 선박의 안전성을 보장하기 위해 중요하며, 자율운항선박의 설계 단계에서 사전 평가가 필수적이다. 본 연구는 자율운항선박의 항로추종성능 평가를 위한 전산유체역학(CFD) 모델과 LOS 알고리즘 연계 방안을 제안한다. 먼저, 자율운항선박의 정수 중 거리 이탈 편차를 이용한 항로 추종 성능 평가 모델 개발에 관하여 기술했다. 먼저, 항로 추종을 수행하는 선박 주변의 난류 흐름은 비압축성 뉴턴 유체의 가정하에 비정상 RANS(Reynolds Averaged Navier-Stokes) 법을 이용하여 수치적으로 계산되었다. 중첩격자계법을 CFD 모델에 적용함으로써 거리 이탈 편차를 이용하는 LOS(Line-of-Sight) 가이던스 알고리즘에 의한 타의 회전 및 이에 따른 선체의 6 자유도 움직임을 CFD 환경에서 구현하였다. 개발된 자유 항주 선박 CFD 모델을 이용하여 항로 추종 시뮬레이션 평가 결과, 설정된 항로에서 선박의 정수 중 항로 추종 제어는 파도, 조류, 및 바람과 같은 외부 교란의 부재로 LOS 알고리즘에 의한 우현/좌현 측 변침뿐만 아니라 직진 경로의 추종도 성공적으로 수행됨을 확인하였다. 선체, 프로펠러, 타의 복잡한 상호작용을 정도 높게 해석할 수 있는 자유 항주 선박 CFD 모델과 LOS 알고리즘의 결합은 자율운항선박의 항로 추종 성능 평가를 정량적으로 평가하는 데 기여할 것으로 기대된다.

  • PDF

L-THIA 시단위 유량-수질 예측 시스템 개발 (Development of L-THIA sub-daily flow-water quality prediction system)

  • 이관재;최용훈;이서로;임경재
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.262-262
    • /
    • 2023
  • 기후변화 및 도시화에 따른 강우 패턴의 변화는 수문 변화를 야기시키며, 이에 따른 영향을 평가하고 예측하기 위해서는 수문학적 모델을 통해 정량화하는 과정이 필요하다. 그러나 기존에 개발되어 사용되고 있는 대부분의 수문학적 모델은 해외에서 개발되어 국내 유역 특성을 반영하지 못하는 한계가 있다. 이러한 한계점을 극복하기 위해서 L-THIA ACN-WQ 2016과 2018 모델이 개발되어 적용성이 평가된 바 있다. 하지만 L-THIA ACN-WQ 모델의 경우 시단위 유량 및 수질 모의가 불가능한 한계점이 있다. 소규모 유역이나 도시화된 지역에서는 하루에 여러 번의 강우 이벤트가 발생하거나 단기간에 많은 양의 강우가 발생하는 경우가 많기 때문에, 이러한 강우-유출을 평가하기 위해서는 시단위 모의가 필요하다. 본 연구에서는 시단위 유량-수질 모의가 가능한 L-THIA sub-daily WQ 모델을 개발하였으며, 갑천 유역과 복하천 유역에서 적용성을 평가하였다. L-THIA sub-daily WQ 모델은 SCS-CN 방법과 Green-Ampt 방법을 함께 고려할 수 있도록 개발하였으며, 국내의 토지이용 및 강우 특성을 고려할 수 있도록 점근 CN과 강우 계급별 EMC를 활용하였다. 갑천 유역과 복하천 유역에서 시단위 유량 예측 결과 R2는 0.61~0.69, NSE는 0.61~0.65, PBIAS는 -4.0~-7.3으로 모의된 시단위 유량이 자연현상을 잘 모의하는 것으로 나타났으며, 수질 예측 결과 T-P와 SS가 자연현상을 잘 모의하는 것으로 나타났다. 따라서, 본 연구에서 개발된 L-THIA sub-daily WQ 모델은 점오염원을 포함하고 있는 도시유역에서 비점오염원에 평가에 활용될 수 있을 것으로 사료된다.

  • PDF

KFREB: 생성형 한국어 대규모 언어 모델의 검색 기반 생성 평가 데이터셋 (KFREB: Korean Fictional Retrieval-based Evaluation Benchmark for Generative Large Language Models)

  • 이정섭;손준영;이태민;박찬준;강명훈;박정배;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.9-13
    • /
    • 2023
  • 본 논문에서는 대규모 언어모델의 검색 기반 답변 생성능력을 평가하는 새로운 한국어 벤치마크, KFREB(Korean Fictional Retrieval Evaluation Benchmark)를 제안한다. KFREB는 모델이 사전학습 되지 않은 허구의 정보를 바탕으로 검색 기반 답변 생성 능력을 평가함으로써, 기존의 대규모 언어모델이 사전학습에서 보았던 사실을 반영하여 생성하는 답변이 실제 검색 기반 답변 시스템에서의 능력을 제대로 평가할 수 없다는 문제를 해결하고자 한다. 제안된 KFREB는 검색기반 대규모 언어모델의 실제 서비스 케이스를 고려하여 장문 문서, 두 개의 정답을 포함한 골드 문서, 한 개의 골드 문서와 유사 방해 문서 키워드 유무, 그리고 문서 간 상호 참조를 요구하는 상호참조 멀티홉 리즈닝 경우 등에 대한 평가 케이스를 제공하며, 이를 통해 대규모 언어모델의 적절한 선택과 실제 서비스 활용에 대한 인사이트를 제공할 수 있을 것이다.

  • PDF

WCAG2.0 기반의 특정 사용자 집단을 위한 웹 접근성 평가 모델 개발 (Web Accessibility Evaluation Model Development for Specific user group based on WCAG 2.0)

  • 김초이;홍소연;김소라;한혁수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.417-418
    • /
    • 2009
  • 웹이 대중화되면서, 사용자 계층도 어린이, 노인, 장애인 등으로 다양해졌다. 인지적, 신체적 특징에 상관없이 모든 사람에게 동등한 웹 기회를 제공하고 있는가를 나타내는 지표가 웹 접근성이다. 웹 사이트들이 특정 수준의 웹 접근성을 준수하도록 유도하기 위해 W3C(World Wide Web Consourtium)의 WAI(Web Accessiability Initiative)는 웹 콘텐츠 접근성 가이드라인 WCAG (Web Content Accessibility Guideliens)를 개발하였다. 현재, WCAG2.0까지 발표된 가이드라인은, 4개의 원칙(Principle), 12개의 지침(Guideline), 그리고 61개의 성공기준(Success Criteria)으로 구성 되어 있다. 평가자들은 WCAG2.0에서 제시하는 성공 기준에 맞춰, 웹 사이트가 웹 접근성을 어느 수준으로 준수하고 있는지 평가한다. 하지만, WCAG2.0을 기준으로 웹 사이트를 평가할 경우, 성공기준의 준수여부는 평가가 가능하지만, 특정 사용자 집단의 특성을 반영한, 우선순위가 포함되지 않아, 특정 사용자 집단을 위한 개선 사항을 도출하는데 어려움이 있다. 이에, 본 논문에서는 이러한 점을 고려하여 WCAG2.0 기반의, 특정 사용 집단을 위한 웹 접근성 평가 모델을 제안한다. 사용자 특성에 따라 성공지침들의 중요도가 달라 질 수 있으므로, AHP 기법을 활용하여 성공지침들의 상대적 중요도를 평가하고, 우선순위화 하였다. 평가 모델의 효용성을 입증하기 위해, 특정 사용집단으로 노인 집단을 선정하여, 웹 접근성 평가 모델을 개발하였다.

데이터 품질관리 프로세스 평가를 위한 프로세스 참조모델 (The Process Reference Model for the Data Quality Management Process Assessment)

  • 김선호;이창수
    • 한국전자거래학회지
    • /
    • 제18권4호
    • /
    • pp.83-105
    • /
    • 2013
  • 데이터의 품질을 평가하기 위해서 데이터 자체의 품질을 측정하는 방법과 데이터 품질을 관리하는 프로세스를 측정하는 방법이 활용되고 있다. 최근에는 조직의 데이터 품질을 보장 및 인증하기 위해 데이터 품질관리 프로세스의 성숙도를 측정하는 방법을 활용하고 있다. 이러한 추세에 따라 본 논문에서는 데이터 품질관리의 프로세스 성숙도를 평가하는데 필요한 프로세스 참조모델을 제시한다. 우선 데이터 품질관리 프로세스 성숙도 평가 모델의 개요를 제시한다. 그리고, 프로세스 성숙도 평가에 기본이 되는 프로세스 참조모델을 제시한다. 여기서는 프로세스 도출 방안, 데이터 품질관리의 기본 원칙, SPICE 프로세스 참조 모델의 기본 개념을 기초로 하여 프로세스 참조모델의 구성과 세부 프로세스를 개발하였다. 그리고 본 모델의 특징 및 개선점을 ISO 8000-150의 프로세스와 비교하여 설명하였다.

한국어 대화 모델 학습을 위한 디노이징 응답 생성 (Denoising Response Generation for Learning Korean Conversational Model)

  • 김태형;노윤석;박성배;박세영
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2017년도 제29회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.29-34
    • /
    • 2017
  • 챗봇 혹은 대화 시스템은 특정 질문이나 발화에 대해 적절한 응답을 해주는 시스템으로 자연어처리 분야에서 활발히 연구되고 있는 주제 중 하나이다. 최근에는 대화 모델 학습에 딥러닝 방식의 시퀀스-투-시퀀스 프레임워크가 많이 이용되고 있다. 하지만 해당 방식을 적용한 모델의 경우 학습 데이터에 나타나지 않은 다양한 형태의 질의문에 대해 응답을 잘 못해주는 문제가 있다. 이 논문에서는 이러한 문제점을 해결하기 위하여 디노이징 응답 생성 모델을 제안한다. 제안하는 방법은 다양한 형태의 노이즈가 임의로 가미된 질의문을 모델 학습 시에 경험시킴으로써 강건한 응답 생성이 가능한 모델을 얻을 수 있게 한다. 제안하는 방법의 우수성을 보이기 위해 9만 건의 질의-응답 쌍으로 구성된 한국어 대화 데이터에 대해 실험을 수행하였다. 실험 결과 제안하는 방법이 비교 모델에 비해 정량 평가인 ROUGE 점수와 사람이 직접 평가한 정성 평가 모두에서 더 우수한 결과를 보이는 것을 확인할 수 있었다.

  • PDF

ACT-R 모델을 이용한 메뉴 인터페이스의 사용성 평가 : 수행도 예측을 중심으로 (The Usability Evaluation of Menu Interfaces using ACT-R : Focusing on Performance Prediction)

  • 조성식;차연주;명노해
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.1064-1068
    • /
    • 2009
  • 인지모델(Cognitive Model)에 의한 사용성 평가는 실제 실험에 의한 방법에 비해 시간, 노력, 비용을 절감할 수 있다. 여러 인지모델 중 ACT-R(Adaptive Control of Thought Rational)은 인간의 모든 인지과정을 상세하게 묘사할 수 있어 다른 모델보다 정확히 인간의 과제 수행을 정량적으로 예측할 수 있다. 그러나 ACT-R 모델을 수립하기 위해서는 인간의 지각, 주의, 기억 인출 등의 처리 과정과 행동 선택 및 수행에 필요한 과제 수행 규칙을 매우 상세하게 분석 및 기술해야 하기 때문에, GUI(Graphic User Interface) 환경에서 운용되는 메뉴 인터페이스와 같이 다양한 시각적 정보의 처리가 요구되는 과제에 대한 모델을 수립하는데는 많은 시간과 노력이 요구된다. 이에 본 연구에서는 GUI 환경에서 전문가 수준의 과제 수행을 예측할 수 있는 간략화한 ACT-R 모델 수립 방안을 제안하고, 이를 이용하여 상용 통계 분석 소프트웨어의 과제 수행도를 예측하였다. 그 결과 실제 실험을 통한 측정 결과와 간략화한 ACT-R 모델의 예측 결과가 잘 일치하였으며 본 연구에서 제시한 간략화한 ACTR 모델이 메뉴 인터페이스의 사용성 평가에 효율적으로 적용될 수 있음을 확인하였다.

  • PDF