• 제목/요약/키워드: 산업도메인

검색결과 125건 처리시간 0.036초

KoCheckGPT: 한국어 초거대언어모델 작성 글 판별기 (KoCheckGPT: Korean LLM written document detector)

  • 강명훈;이정섭;이승윤;홍성태;박정배;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.432-436
    • /
    • 2023
  • 초거대언어모델(LLM)의 도래에 따라 다양한 과업들이 도메인 관계 없이 제로샷으로 추론이 가능해짐에 따라서 LLM이 다양한 산업분야에 적용되고 있다. 대표적으로 ChatGPT와 GPT-4는 상용 API로 서비스를 제공하여 용이한 서비스 접근으로 다양한 이용층을 끌어들이고 있다. 그러나 현재 상용 API로 제공되고 있는 ChatGPT 및 GPT-4는 사용자의 대화 내역 데이터를 수집해 기업의 보안 문제를 야기할 수 있고 또한 생성된 결과물의 환각 문제로 인한 기업 문서의 신뢰성 저하를 초래할 수 있다. 특히 LLM 생성 글은 인간의 글과 유사한 수준으로 유창성을 확보한만큼 산업현장에서 LLM 작성 글이 판별되지 못할 경우 기업 활동에 큰 제약을 줄 수 있다. 그러나 현재 한국어 LLM 작성 글 탐지 서비스가 전무한 실정이다. 본 논문에서는 한국어 초거대언어모델 작성 글 판별기: KoCheckGPT 를 제안한다.KoCheckGPT는 산업현장에서 자주 사용되는 문어체, 개조식 글쓰기로 작성된 문서 도메인을 목표로 하여 글 전체와 문장 단위의 판별 정보를 결합하여 주어진 문서의 LLM 작성 여부를 효과적으로 판별한다. 다국어 LLM 작성 글 판별기 ZeroGPT와의 비교 실험 결과 KoCheckGPT는 우수한 한국어 LLM 작성 글 탐지 성능을 보였다.

  • PDF

데이터 웨어하우스 환경에서의 설명기반 데이터 마이닝 (Explanation-based Data Mining in Data Warehouse)

  • 김현수;이창호
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 1999년도 춘계공동학술대회-지식경영과 지식공학
    • /
    • pp.115-123
    • /
    • 1999
  • 산업계 전반에 걸친 오랜 정보시스템 운용의 결과로 대용량의 데이터들이 축적되고 있다. 이러한 데이터로부터 유용한 지식을 추출하기 위해 여러 가지 데이터 마이닝 기법들이 연구되어왔다. 특히 데이터 웨어하우스의 등장은 이러한 데이터 마이닝에 있어 필요한 데이터 제공 환경을 제공해 주고 있다. 그러나 전문가의 적절한 판단과 해석을 거치지 않은 데이터 마이닝의 결과는 당연한 사실이거나, 사실과 다른 가짜이거나 또는 관련성 없는(trivial, spurious and irrelevant)내용만 무수히 쏟아낼 수 있다. 그러므로 데이터 마이닝의 결과가 비록 통계적 유의성을 가진다 하더라도 그 정당성과 유용성에 대한 검증과정과 방법론의 정립이 필요하다. 데이터 마이닝의 가장 어려운 점은 귀납적 오류를 없애기 위해 사람이 직접 그 결과를 해석하고 판단하며 아울러 새로운 탐색 방향을 제시해야 한다는 것이다. 본 논문에서는 데이터 마이닝 기법 중 연관규칙탐사로 얻어진 결과를 설명가능성 여부의 판단을 통해 검증하는 기법을 제안하며, 이를 통해 얻어진 검증된 지식을 토대로 일반화를 통한 새로운 가설을 생성하여 데이터 웨어하우스로부터 연관규칙을 검증하는 일련의 아텍쳐(architecture)를 제시하고다 한다. 먼저 데이터 마이닝 결과에 대한 설명의 필요성을 제시하고, 데이터 웨어하우스와 데이터 마이닝 기법들에 대한 간략한 설명과 연관규칙탐사에 대한 정의 및 방법을 보이고, 대상 영역에 대한 데이터 웨어하우스으 스키마를 보였다. 다음으로 도메인 지식(domain knowledge)과 연관규칙탐사를 통해 얻어진 결과를 표현하기위한 지식표현 방법으로 Relational Predicate Logic을 제안하였다. 연관규칙탐사로 얻어진 결과를 설명하기 위한 방법으로는 연관규칙탐사로 얻어진 연관규칙에 대해 Relational Predicate Logic으로 표현된 도메인 지식으로서 설명됨을 보이게 한다. 또한 이러한 설명(explanation)을 토대로 검증된 지식을 일반화하여 새로운 가설을 연역적으로 생성하고 이를 연관규칙탐사를 통해 검증한 후 새로운 지식을 얻는 반복적인 Explanation-based Data Mining Architecture를 제시하였다. 본 연구의 의의로는 데이터 마이닝을 통한 귀납적 지식생성에 있어 귀납적 오류의 발생을 도메인 지식을 통해 설명가능 함을 보임으로 검증하고 아울러 이러한 설명을 통해 연역적으로 새로운 가설지식을 생성시켜 이를 가설검증방식으로 검증함으로써 귀납적 접근과 연역적 접근의 통합 데이터 마이닝 접근을 제시하였다는데 있다.

  • PDF

6-도메인 스마트팩토리 성숙도 평가 모델 기반 도입기업 군집분석 (Cluster analysis of companies introducing smart factory based on 6-domain smart factory maturity assessment model)

  • 정도현;안정현;최상현
    • 한국융합학회논문지
    • /
    • 제11권9호
    • /
    • pp.219-227
    • /
    • 2020
  • 스마트팩토리는 가장 빠르게 발전하고 변화하는 4차 산업혁명 분야 중 하나이다. 스마트팩토리에서 도입정도와 성숙도 수준 평가는 중요한 부분에 해당한다. 본 논문에서는 국내 스마트팩토리를 도입한 중소기업들을 대상으로 설문 조사를 진행한 데이터를 바탕으로 스마트팩토리 도입 현황과 새로운 성숙도 평가 모델 기반 군집분석을 진행하였다. 설문에 응한 스마트팩토리 도입 기업의 약 68% 기업들이 기초수준에 해당하였고, 21% 정도만이 중간1 수준이었다. 대다수 중소기업들이 중간1로 진입하지 못한 가장 큰 이유로 자금부족을 꼽았다. 군집분석 결과, 군집별 패턴은 유사하지만 정도의 차이에 따라 '상, 중, 하' 3개로 군집됨을 확인할 수 있었고, 6 도메인 중 프로세스가 상대적으로 성숙도가 가장 높았고, 데이터가 가장 낮은 수준을 보였다. 이를 통해 6개 도메인 기반 새로운 스마트팩토리 성숙도 평가 모델을 활용하여, 보다 구체적이고 정량적인 성숙도 수준 측정 및 분석이 가능함을 보였다.

지하수 수량 및 수질 관리를 위한 ChatGPT의 활용 (Groundwater Resources Management with ChatGPT: Harnessing AI for Quantitative and Qualitative Approaches)

  • 박은규
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.12-12
    • /
    • 2023
  • 지하수자원 관리의 정량적 및 정성적 측면에 있어, 최첨단 인공지능 언어 모델인 ChatGPT의 혁신적인 기능이 활용될 수 있다. 본 발표에서는 지하수 자료에 대한 분석과 도출된 문제의 중요도에 따른 목표를 설정, 그리고 지하수 관리 전략 개발에 있어서의 ChatGPT 활용 방법을 논의할 것이다. 이를 위한 구체적 사례로, 지하수자원 관리에 활용될 수 있는 다양한 도구들의 개발과 고도화에 ChatGPT가 기여하는 방식을 살펴볼 것이다. 이러한 개별 도구들은 지하수자원 관리 결정에 있어 더 나은 예측 및 평가를 제공하여, 지하수 자원 관리의 효율성을 도모할 수 있다. 또한, ChatGPT의 문제 발견 및 해결책 제안 능력에 대해서도 다룰 것이다. 이를 통해 지하수 관리에 있어서의 다양한 문제를 식별하고, 이해당사자들이 보다 효과적으로 대응할 수 있는 방안을 찾아낼 수 있을 것이다. 또한 ChatGPT가 제공하는 다양한 정보 및 문제에 대한 솔루션 접근 방식을 활용한 브레인스토밍 방법을 설명할 것이다. 추가적으로, 일반 인공지능(AGI)의 개발에 근접하면서 지하수 관리의 자동화 및 가속화 그리고 산업 및 환경에 미칠 수 있는 영향에 대해 고찰해 볼 것이다. 이를 위하여, ChatGPT와 같은 인공지능 기술이 더욱 고도화되고 향상되면서, 지하수 관리 및 관련 분야에서의 의사결정, 계획 수립, 그리고 모니터링과 같은 작업들이 어떻게 변화할지에 대하여 토의할 것이다. 본 발표는 지하수 자원 관리 분야에서 ChatGPT와 같은 인공지능 기반 접근법의 가치를 보여주며, 복잡한 지하수 환경 문제를 해결하는 데 있어 첨단 기술의 활용 가능성을 강조할 것이다. 또한, AGI가 등장할 때까지 여전히 요구되는 지하수 분야 도메인 지식과 전문기술의 중요성을 강조할 것이다. 지하수 관리자들의 도메인 지식과 전문적 기술은 인공지능 기반 도구와 결합되어 보다 정확한 분석, 예측 및 해결책 도출을 가속화하며 정교화할 것이다. 결론적으로, 지하수 관리에 대한 종합적인 이해와 전문성을 갖춘 전문가들의 인공지능 기술활용은 지속가능한 지하수의 첨단 관리 효과적 달성에 중요한 계기가 될 것으로 판단한다.

  • PDF

MDA기반 모델 변환 기법을 이용한 컴포넌트 생산성 향상에 대한 사례연구 (A Case Study for Improving Component Productivity using MDA based Model Transformation Technique)

  • 김학인;최오훈
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (2)
    • /
    • pp.463-465
    • /
    • 2004
  • 소프트웨어 산업 사회에서는 현재까지 생산성 향상이라는 문제에 대한 여러 가지 방안들을 제시하고 있으며, 컴포넌트 기반 개발 프로세스 역시 생산성 향상에 대한 않은 가능성을 제시하고 있다. 하지만 현실적으로 컴포넌트간의 호환 및 상호 운용에 대한 않은 문제점들을 내포하고 있으며, 본 논문에서는 이러한 문제점들을 해결하기 위한 노력들 중의 하나로 OMG의 MDA(Model Driven Architecture) 기술을 이용하여 특정 도메인의 모델 변환(Model Transformation) 구조를 구현하고, 최적화된 개발 방법론을 적용한 실제 사례를 통하여 컴포넌트의 생산성 향상에 대한 결과를 측정하여 그 효과에 대해서 검증한다

  • PDF

데이터웨어하우스 환경에서의 설명기반 데이터마이닝 (Explanation-Based Data Mining in Data Warehouse)

  • 김현수;이창호
    • 지능정보연구
    • /
    • 제5권2호
    • /
    • pp.15-27
    • /
    • 1999
  • 산업계 전반에 걸친 오랜 정보시스템 운용의 결과로 대용량의 데이터들이 축적되고 있다. 이러한 데이터로부터 유용한 지식을 추출하기 위해 여러 가지 데이터마이닝 기법들이 연구되어 왔다. 특히 데이터웨어하우스의 등장은 이러한 데이터마이닝에 있어 필요한 데이터 제공 환경을 주고 있다. 그러나 전문가의 적절한 판단과 해석을 거치지 않은 데이터마이닝의 결과는 당연한 사실이거나, 사실과 다른 가짜이거나 또한 관련성 없는(Trivial, Spurious and Irrelevant) 내용만 무수히 쏟아낼 수 있다. 그러므로 데이터마이닝의 결과가 비록 통계적 유의성을 가진다 하더라고 그 정당성과 유용성에 대한 검증과정과 방법론의 정립이 필요하다. 데이터마이닝의 가장 어려운 점은 귀납적 오류를 없애기 위해 사람이 직접 그 결과를 해석하고 판단하며 아울러 새로운 탐색 방향을 제시해야 한다는 것이다. 본 논문의 목적인 이러한 데이터마이닝에서 추출된 결과를 검증하고 아울러 새로운 지식 탐색 방향을 제시하는 방법론을 정립하는데 있다. 본 논문에서는 데이터마이닝 기법 중 연관규칙탐사(Associations)로 얻어진 결과를 설명가능성 여부의 판단을 통해 검증하는 기법을 제안하였고, 이를 위해 도메인 지식(Domain Knowledge)과 연관규칙탐사를 통해 얻어진 결과를 표현하기 위한 지식표현방법으로 관계형 술어논리(RPL : Relational Predicate Logic)를 개발하였다. 연관규칙탐사로 얻어진 결과를 설명하기 위한 방법으로는 연관규칙탐사로 얻어진 연관규칙에 대한 RPL로 표현된 도메인 지식으로서 설명됨을 보이게 한다. 또한 이러한 설명(Explanation)을 토대로 검증된 지식을 일반화하여 새로운 가설을 연역적으로 생성하고 이를 연관규칙탐사를 통해 검증한 후 새로운 지식을 얻는 설명기반 데이터마이닝 구조(Explanation-based Data Mining Architecture)를 제시하였다.

  • PDF

국가 지능형 교통체계를 위한 아키텍쳐 연구 (모형 및 방법론) (A Study of Architecture for national Intelligent Transportation Systems (Methodology and Model))

  • 백인섭;이승환;이시복
    • 대한교통학회지
    • /
    • 제19권6호
    • /
    • pp.19-31
    • /
    • 2001
  • 우리 나라 환경에 적합한 국가 지능형 교통체계(ITS: Intelligent Transportation Systems)의 구현을 위한 국가 아키텍쳐 수립연구가 국토연구원과 관련 학계와 산업계의 협동연구로 지난 3년간 수행되어 천여 페이지에 달하는 국가 아키텍쳐가 수립된 바 있다. 본 논문에서는 이를 위해서 고안된 도메인 수준과 논리 수준 및 물리 수준의 아키텍쳐 모형과 방법론을 제시한다. 도메인 수준의 아키텍쳐는 ITS를 구현함에 있어 관계되는 영역간의 국가적 협동체계를 이룩하기 위한 국가적 기본 틀이고 논리수준의 아키텍쳐는 서비스의 중복/사각/상충을 방지하기 위한 국가적 기본 틀이며 물리수준의 아키텍쳐는 서비스 시스템을 구축함에 있어 물리적 정보기술 자원을 효율적으로 할당하여 시스템 구축의 경제성과 효율성을 도모하기 위한 시스템의 물리적 구성 틀이다. 이를 위한 모델과 기법은 고전적 컴퓨터 기반 시스템공학에서의 프로세스 지향적 사고와 기법을 수정 보완하고 확장한 것으로 고 수준(High Level)에서의 아키텍쳐 구상에 적절한 것이다. 저 수준(Low Level)의 아키텍쳐는 설계 수준에서 이루어지는 것으로 전제하였다.

  • PDF

단순 웹브라우저의 설계와 구현 사례 (Case Study of Building Special-Purpose Simple Browser)

  • 우원택
    • 한국산업정보학회논문지
    • /
    • 제7권3호
    • /
    • pp.43-53
    • /
    • 2002
  • 본 연구는 인터넷 익스플로러 컨트롤을 사용하여 자신만의 웹브라우저를 만들어 봄으로써 브라우저에 대한 이해를 높이고 자신만의 고유목적의 브라우저를 제작하여 사용함으로써 특정인의 특정도메인 이외의 검색을 지양한다든지 청소년과 같은 어린이의 경우 특정도메인에 대한 접속을 방지한다든지 하는 기법들을 활용 할 수 있는 능력을 제고하고자 함에 있다. 이를 위해 첫째로 웹브라우저는 어떠한 것이며 어떻게 작용하는지를 알아보기 위해 약간의 문헌조사를 하였고 둘째로 하나의 단순한 웹브라우저를 비주얼 베이직을 이용하여 직접 설계하여 구현해 보았다. 웹브라우저 설계는 이미지컨트롤, 상태바, 이미지컨트롤을 담을 픽쳐박스, 커맨드버턴, 메뉴등의 컨트롤들과 프로그램코딩을 종합적으로 하나의 폼에 삽입하여 구현하였고 그 결과는 잘 실행되었다. 셋째로 본 웹브라우저에 필터링 기능을 삽입하여 유해 사이트를 차단할 수 있는 특수웹브라우저 기능도 테스트 해 보았다. 본 연구는 프로그램의 구조나 기능이 다소 단순하다는 제한점은 있으나 웹브라우저와 그 특수기능을 이해하는 데는 상당히 유익하였다.

  • PDF

기존 시스템 기반의 소프트웨어 제품라인 공학기법: 케이블 셋톱박스 소프트웨어 사례 (Legacy System-Based Software Product Line Engineering: A Case Study on Cable Set-Top Box Software)

  • 최현식;이혜선;조윤호;강교철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권7호
    • /
    • pp.539-547
    • /
    • 2009
  • 산업 및 가전 제품에서 소프트웨어의 중요성이 커지면서 소프트웨어 재사용과 제품라인 방법론에 대한 관심이 높아지고 있다. 그러나 대부분의 제품라인 방법론은 초기 비용과 시간이 많이 들고 구체적인 절차나 성공 사례가 부족하여 산업체에서 적용하기에는 어려운 한계가 있다. 본 논문에서는 산업체에서 제품라인 기법을 쉽게 적용할 수 있도록, 기존에 개발된 소프트웨어 자산과 해당 도메인의 휘처모델을 활용하여 제품라인을 쉽게 구축할 수 있는 추출식 접근법의 구체적인 방법을 제시하고 이를 케이블 셋톱박스 소프트웨어에 적용한 사례를 소개한다. 또한, 제품라인으로의 전환 효과를 확인할 수 있는 평가 기준을 제안하고, 사례 연구를 통해 얻은 교훈을 정리하여 다른 산업 및 가전 제품의 소프트웨어에 적용할 수 있는 지침을 제공한다.

지역특화 IT 인력양성 프로그램 성과분석 사례연구 (A Case Study on Performance Evaluation of IT Human Resource Program in Regional Industry)

  • 박정환;김국보
    • 한국전자거래학회지
    • /
    • 제19권1호
    • /
    • pp.79-93
    • /
    • 2014
  • 미래 신 성장동력이며 융합산업의 핵심 도메인인 IT 산업은 타 산업과의 융합을 통하여 국가 발전의 기반이 되는 산업이지만, IT 고급인력의 부족 현상은 지방과 수도권에 한정되지 않고 지속되고 있다. 그러나, 그간의 연구들은 포괄적인 인력양성에 대한 연구가 주를 이루고 있으며, 사업수행 지역의 특성화를 이룰 수 있는 인력양성 정책에 대한 성과분석에 대한 연구들은 미흡한 실정이다. 이에 따라, 지역의 IT 고급 인력을 양성하여 IT 융합을 기반으로 지역산업을 활성화하고 이를 통하여 지역을 발전시키기 위한 제도적 개선방안에 대한 필요성이 나타나고 있다. 따라서 본 연구에서는 지역의 IT 인력양성 활성화를 위하여 지역 기반 인력양성사업의 IT 분야 성과분석을 통하여 제도개선방안을 설계하고자 한다.